Anda di halaman 1dari 2187

"La simplicité est le sceau de la vérité et celle-ci resplendit de beauté"

Dernière mise-à-jour de cette page: 05.03.2010 11:05


Version: 2.0 Revision 1

Omniprésentes dans l'industrie (aérospatiale, imagerie, cryptographie, tranports, chimie,…), ou dans les
services (banques, assurances, ressourches humaines, projets, logistique, architectuure, télécom…), les
mathématiques appliquées apparaissent aussi dans de nombreux autres secteurs : sondages, modélisation des
risques, protection des données… Elles interviennent dans notre vie quotidienne (télécommunications,
transports, médecine, météorologie, musique…) et contribuent à la résolution de problématiques actuelles :
énergie, santé, environnement, climatologie, optimisation, développement durable… Leur grand succès est
donc leur fantastique dispersion dans le monde réel, évolutif et contingent, et leur intégration croissante à toutes
les activités humaines. Nous allons donc vers une situation où les mathématiques n'auront plus le monopole des
mathématiques, mais où des économistes, gestionnaires et marchands feront tous des mathématiques.

À ce titre, ancien étudiant dans le domaine de l'ingénierie, j'ai souvent regretté l'absence d'un ouvrage assez
complet, détaillé (sans aller dans l'extrême des puristes...) et pédagogique si possible gratuit (!) et portatif
contenant au moins une idée de l'ensemble du programme de mathématique appliquée des écoles d'ingénieurs et
présentant une vue d'ensemble de ce qui est utilisé dans la réalité des entreprises avec démonstrations plus
intuitives que rigoureuses. Un ouvrage aussi qui ne nécessite pas non plus à devoir s'adapter chaque fois à une
nouvelle notation ou au vocabulaire spécifique à l'auteur quand il ne s'agit pas de changer carrément de
langue... et ou tout à chacun peut proposer des améliorations ou des compléments.

J'ai été de plus aussi frustré pendant mes études à devoir ingurgiter assez souvent des "formules" ou des "lois"
soit disant (et à tort) indémontrables ou trop compliquées selon mes professeurs ou même déçu de livres
d'auteurs renommés (dont les développements sont laissés au soin du lecteur ou comme exercice...). Bien
qu'aujourd'hui je doive admettre effectivement que la démonstration de certaines relations présentées dans le
cadre des cursus des écoles d'ingénieurs ne puisse se faire faute de temps dans le planning scolaire ou de place
dans un livre, je ne peux accepter qu'un professeur ou un auteur dise à son étudiant (respectivement, son
lecteur) que certaines lois sont indémontrables (car la plupart du temps c'est faux) ou que telle ou telle
démonstration est trop compliquée sans lui donner une référence bibliographique (où l'étudiant puisse trouver
l'information nécessaire à sa curiosité) ou au moins une démonstration infiniment simplifiée et satisfaisante.

Par ailleurs, j'estime totalement archaïque que certains professeurs continuent de faire prendre des notes de
cours de manière massive à leurs étudiants. Il serait beaucoup plus favorable et optimal de distribuer un support
de cours contenant tous les détails et ce afin de pouvoir se concentrer sur l'essentiel avec les élèves c'est-à-dire
les explications orales, l'interprétation, la compréhension et la mise en pratique plutôt que la copie de tableau
noir à outrance... Bien évidemment donner un cours complet fait que certains étudiants brillent par leur absence
mais... c'est tant mieux! Ainsi, ceux qui sont passionnées peuvent approfondir les sujets à la maison ou à la
bibliothèque universitaire, les médiocres feront ce qu'ils ont à faire et pour le reste (élèves en difficultés mais
travailleurs) ils suivront le cours donné par le professeur pour profiter de poser des questions plutôt que de
recopier bêtement un tableau noir.

Alors, dans mon esprit, ce site doit pouvoir se substituer, gratuitement, à de nombreuses références (150
références payantes pour être exact en ce jour de juillet 2009!) et lacunes du système, permettant ainsi à tout
étudiant curieux de ne pas être frustré pendant de longues années durant son cursus de formation. Sans quoi, la
science de l'ingénieur prend alors l'aspect rébarbatif d'une science figée, à l'écart de l'évolution scientifique et
technique, d'une accumulation hétéroclite de connaissances et surtout de formules qui la font considérer comme
un sous-produit insipide des mathématiques et qui amène dans les entreprises à de nombreux faux résultats...
Ceux qui voient la mathématique appliquée que comme un outil (ce qu'elle est aussi), ou comme l'ennemi des
croyances religieuses, ou encore comme un domaine scolaire rébarbatif, sont légion. Il est cependant peut-être
utile de rappeler que, comme le disait Galilée, "le livre de la Nature est écrit dans le langage des
mathématiques" (sans vouloir faire de scientisme!). C'est dans cet esprit que ce site aborde la mathématique
appliquée pour les étudiants en sciences de la Nature, de la Terre et de la Vie, ainsi que pour tous ceux qui
exercent une profession liée à ces diverses matières y compris la philosophie ou pour toute personne curieuse
de s'informer de l'implication des sciences dans la vie quotidienne.

La frontière entre la philosophie et les sciences pures et exactes est très ténue. Effectivement, comme le relate
Platon dans le Phédon, Socrate à ses dernières heures s'est entouré de ses amis et disciples, dont Cébès et
Simmias (deux pythagoriciens) considérés par Socrate comme interlocuteurs privilégiés. Ce n'est pas un hasard
puisqu'il convient alors de philosopher, déjà, en s'inspirant du modèle pythagoricien qui fait des mathématiques
une voie nécessaire d'accès à la vérité, seule capable de se frayer un chemin fiable pour aborder des sujets aussi
importants que ceux de l'âme et de sa destinée...

Le choix de traiter l'ingénierie ici comme une branche de la mathématique appliquée provient certainement du
fait que l'ensemble des domaines de la physique (anciennement dénommée "philosophie naturelle") et la
mathématique sont à ce jour tellement peu discernables que la médaille de Fields (la plus haute récompense de
nos jours dans le domaine de la mathématique) a été décernée en 1990 au physicien Edward Witten, qui a
utilisé des idées physiques pour redémontrer un théorème mathématique. Cette tendance n'est certainement pas
fortuite, car nous pouvons observer que toute science, dès qu'elle cherche à atteindre une compréhension plus
détaillée du sujet qu'elle étudie, voit finalement toujours sa course aboutir dans les mathématiques pures (la
voie absolue par excellence...). Ainsi, pouvons-nous présager dans un futur lointain, la convergence de toutes
les sciences (pures, exactes ou sociales) vers la mathématique pour la modélisation (lire à titre d'exemple le
document PDF "L'explosion des mathématiques" disponible dans la rubrique Téléchargement du site).

Il peut parfois nous paraître difficile (à cause d'une crainte aussi obscure et irrationnelle que non justifiée des
sciences pures chez une importante fraction de nos contemporains) de transmettre le sentiment de beauté
mathématique de la nature, de son harmonie la plus profonde et de la mécanique parfaitement huilée de
l'Univers, à ceux qui ne connaissent que les rudiements du calcul formel. Le physicien R. Feynmann a parlé une
fois de "deux cultures": les gens qui ont, et ceux qui n'ont pas eu une compréhension suffisante des
mathématiques pour apprécier la structure scientifique de la nature. Il est bien dommage qu'il y faille cependant
des mathématiques et que celles-ci aient aussi mauvaise réputation. Pour l'anecdote, on prétend qu'un roi ayant
demandé à Euclide de lui enseigner la géométrie se plaignit de sa difficulté. Euclide répondit: "il n'y a pas de
voie royale". Les physiciens et mathématiciens ne peuvent se convertir à un autre langage. Si vous voulez
apprendre à connaître la nature, à l'apprécier à sa juste valeur, vous devez comprendre son langage. Elle ne se
révèle que sous cette forme et nous ne pouvons être prétentieux au point de lui demander de changer afin que
nous ne consentions à nous occuper d'elle.

Au même titre, aucune discussion intellectuelle ne vous permettra de communiquer à un sourd ce que vous
ressentez vraiment en écoutant de la musique. De même, toutes les discussions du monde resteront
impuissantes à transmettre une compréhension intime de la nature à ceux de "l'autre culture". Les philosophes
et théologiens peuvent essayer de vous donner des idées qualitatives sur l'Univers. Le fait que la méthode
scientifique (au sens plein du terme) ne puisse convaincre le monde entier de sa justesse et de sa pureté, trouve
peut-être sa cause dans l'horizon limité de certaines gens qui sont amené à s'imaginer que l'homme ou qu'un
autre concept intuitif, sentimental ou arbitraire est le centre de l'Univers (principe anthropocentrique).

Certes, dans le but de partager ce savoir mathématique, il est paradoxal de vouloir augmenter, avec notre
travail, la liste déjà longue des ouvrages disponibles dans les bibliothèques, dans le commerce et sur l'Internet.
Néanmoins, il faut être en mesure de présenter une argumentation solide qui justifie la création d'un tel site en
comparaison à des ouvrages comme ceux de Feynmann, Landau ou de Bourbaki. Voici donc les quelques
arguments qui paraissent cependant susceptibles d'être présentés:
1. Le grand plaisir que je prends à cette entreprise ("garder la main" et progresser).

2. La passion du partage gratuit et sans frontières de la connaissance (et en français...)

3. Le caractère évolutif et pratique d'un document électronique libre (outils de recherche efficaces).

4. Le contenu évolutif en fonction de la demande !!!

5. La présentation rigoureuse avec des démonstrations simplifiées de beaucoup de concepts.

6. La présentation du plus grand nombre d'outils mathématiques utilisés dans les entreprises.

7. La possibilité pour les étudiants et professeurs de réutiliser le contenu par copier/coller.

8. Une notation constante et fixe, dans tout l'ouvrage, pour les opérateurs mathématiques, un langage clair,
rigoureux sur tous les sujets abordés (critère des 3.C. : clair, complet et concis)

9. Rassembler le maximum d'informations sur les sciences pures et exactes en un seul ouvrage électronique
(portatif), homogène et rigoureux.

10. Dégager, de toutes les pseudo-vérités, les seules vérités qui se démontrent.

11. Tirer bénéfice de l'évolution des méthodes pédagogiques scolaires qui utilisent l'Internet pour chercher la
solution à des problèmes de mathématiques.

12. L'amélioration spectaculaire des logiciels automatiques de traduction et de la puissance des ordinateurs qui
feront de ce site, je le souhaite, une référence dans les domaine des sciences dures.

Et aussi... je considère que les résultats de la recherche individuelle sont la propriété de l'humanité et qu'ils
doivent être mis à la disposition de tous ceux qui explorent où que ce soit les phénomènes de la nature. De cette
façon le travail de chacun profite à tous, et c'est pour toute l'humanité que s'amassent nos connaissances ce qui
est dans la tendance que permet l'Internet.

Je ne cache pas, que ma contribution se limite en grande partie à ce jour à celle d'un collectionneur qui glane
ses informations dans les ouvrages des maîtres ou dans les publications ou pages Internet d'anonymes et qui
complète et argumente les développements en les améliorant quand ceci est encore possible. Quant à ceux qui
voudraient m'accuser de plagiat , ils devraient réfléchir au fait que les théorèmes présentés dans la plupart des
ouvrages payants et disponibles dans le commerce ont été découverts et rédigés par leurs illustres prédécesseurs
et que leur propre apport personnel a aussi constitué, comme le mien, à mettre toutes ces informations sous une
forme claire et moderne quelques centaines d'années plus tard. De plus, il peut être vu comme douteux que l'on
fasse payer l'accès à une culture qui est certainement la seule véritablement valable et juste dans ce bas monde
et sur lequel il n'y a ni brevet, ni droit à la propriété intelectuelle.

Après avoir tenté un ordre de présentation rigoureux du sujet, j'ai décidé d'arranger ce document dans un ordre
plus pédagogique (thématique). Il est à mon avis très difficile de parler d'un si vaste sujet dans un ordre
purement mathématique en une seule vie, c'est-à-dire lorsque les notions sont introduites une à une, à partir de
celles déjà connues (où chaque théorie, opérateur, outil, etc. n'apparaîtrait pas avant sa définition dans le
document). Un tel plan nécessiterait de couper le document, en morceaux qui ne sont plus thématiques. J'ai
donc pris la décision de présenter les choses par ordre logique et non par ordre de nécessité.
Les conséquences de ce choix sont les suivantes :

1. Il faudra parfois admettre provisoirement certaines choses, quitte à les comprendre plus tard.

2. Il sera certainement nécessaire pour le lecteur de parcourir au moins deux fois l'ensemble de l'ouvrage. Lors
de la première lecture, on appréhende l'essentiel et lors de la deuxième lecture, on comprend les détails (je
félicite celui qui comprendrait toutes les subtilités du premier coup).

3. Il faut accepter le fait que certains sujets se répètent et qu'il y ait de nombreuses références croisées ainsi que
remarques complémentaires.

Certains savent que pour chaque théorème et modèle mathématique, il existe quasiment toujours plusieurs
méthodes de démonstration. J'ai toujours tenté de choisir celle qui me semblait la plus simple (par exemple en
relativité il y a la présentation algébrique et matricielle et idem en physique quantique). L'objectif étant d'arriver
de toute façon au même résultat.

Ce site étant encore en cours de finalisation, il manque forcément des vérifications de convergences, de
continuité et autres... (ce qui fera grimper au plafond les mathématiciens...) ! J'ai cependant évité (ou, dans le
cas contraire, je le signale) les approximations habituelles de la physique et l'utilisation de l'analyse
dimensionnelle, en y ayant recours le moins possible. J'essaie également d'éviter autant que possible des sujets
dont les outils mathématiques n'ont au préalable été présentés et démontrés avec rigueur dans le corps de
l'ouvrage.

Enfin, cet exposé, perfectible, n'est pas une référence absolue et contient des erreurs. Toute remarque est donc
la bienvenue. Je m'appliquerai, dans la mesure du possible, à corriger les faiblesses signalées et à apporter les
modifications nécessaires au plus vite.

En revanche, alors que les mathématiques sont exactes et indiscutables, la physique théorique (ses modèles),
reste interprétable dans le vocabulaire commun (mais pas dans le vocabulaire mathématique) et ses conclusions
toutes relatives. Je ne peux que conseiller, lorsque vous parcourrez ce site, de lire par vous-même et de ne pas
subir d'influences extérieures. Il faut avoir l'esprit très (très) critique, ne rien prendre pour acquis et tout
remettre en cause sans hésitation. Par ailleurs, le mot d'ordre du bon scientifique doit être : "Doute, doute,
doute..., doute encore, et vérifie toujours.". Nous tenons aussi à rappeler que "rien de ce que l'on peut voir,
entendre, sentir, toucher ou goûter, n'est ce qu'il a l'air d'être", ne vous fiez dès lors pas à votre expérience
quotidienne pour tirer des conclusions trop hâtives, soyez critique, cartésien, rationnel et rigoureux dans vos
développements, raisonnements et conclusions !

Je tiens à préciser à ceux qui tenteraient de trouver par eux-mêmes les résultats de certains développements
présents sur ce site, de ne pas s'inquiéter s'ils n'y arrivent pas ou s'ils doutent d'eux à cause du temps passé à la
résolution d'une équation ou problème: certaines théories qui nous semblent évidentes ou simples aujourd'hui,
ont mis parfois plusieurs semaines, plusieurs mois, voire plusieurs années, pour êtres élaborées par des
mathématiciens ou physiciens de renom !

J'ai également tenté de faire en sorte que ce site soit agréable à l'oeil et à parcourir. Les concepteurs web
professionnels voudront cependant bien excuser la mauvaise qualité du code HTML / PHP (qu'ils ne verront
pas en partie..) / Javascript / CSS et l'abus de l'utilisation du biseautage et estampage de Photoshop ainsi que le
choix d'une interface optimisée pour une résolution de 1024 x 768 et supérieure, mais le temps me manque pour
épurer le code et réaliser des finitions graphiques correctes (de plus, je privilégie plutôt la qualité du contenu
que le contenant).

Enfin, j'ai choisi d'écrire cet exposé à la première personne du pluriel ("nous"). Effectivement, la mathématique-
physique n'est pas une science qui s'est faite ou évoluera grâce à un travail individuel mais à l'aide d'une
collaboration intensive entre personnes reliées par la même passion et le même désir du Savoir.

Ainsi, en faisant usage du "nous", il est rendu hommage aux hommes de science disparus, aux contemporains et
aux futurs chercheurs pour le travail qu'ils effectueront dans le but de s'approcher de la vérité et de la sagesse.
MÉTHODES

La science est l'ensemble des efforts systématiques pour acquérir des connaissances sur notre environnement
monde, pour les organiser et les synthétiser en lois et théories vérifiables et ayant pour principal objectif
d'expliquer le "comment" des choses. Les scientifiques doivent soumettre leurs idées et résultats à la
vérification et la reproduction indépendante de leurs pairs. Ils doivent abandonner ou modifier leurs conclusions
lorsque confrontées à des évidences plus complètes ou différentes. La crédibilité de la science s'appuie sur ce
mécanisme d'autocorrection. L'histoire de la science montre que ce système fonctionne depuis très longtemps et
ce même très bien par rapport à tous les autres. Dans chaque domaine, les progrès ont été spectaculaires.
Toutefois, le système a parfois des ratés qu'il faut corriger avant que les petites dérives ne s'accumulent.

Le bémol est que les scientifiques sont des hommes. Ils ont les défauts de tous les hommes et, en particulier, la
vanité, l'orgueil et la fatuité. De nos jours, il arrive que plusieurs personnes travaillant sur un même sujet depuis
un certain temps développent une foi commune et croient qu'ils détiennent la vérité. Le chef de file de cette foi
devient le Pape et distille des grands-messes. Le Pape qui se prend au jeu, prend sa mitre et son bâton de pèlerin
pour évangéliser ses collègues hérétiques. Jusque-là, cela prête à sourire. Mais, comme dans les vraies religions,
ils ont parfois la fâcheuse tendance de vouloir s'étendre au détriment de ceux qui ne croient pas. Certaines de
ces "Eglises" n'hésitent pas à se comporter comme l'Inquisition. Ceux qui osent émettre une opinion différente
se font incendier à chaque occasion, lors des congrès, voire sur leur lieu de travail. Certains jeunes chercheurs,
en mal d'inspiration, préfèrent se convertir à cette religion dominante, pour devenir plus rapidement des
dignitaires religieux à peu de frais, plutôt que des chercheurs innovants, voire iconoclastes. Le grand Pape écrit
sa Bible pour diffuser sa pensée, l'impose à lire aux étudiants et aux nouveaux venus. Il formate ainsi la pensée
des jeunes générations et assure son trône. C'est une attitude moyenâgeuse qui peut bloquer le progrès. Certains
Papes vont jusqu'à croire que le fait d'être pris pour le pape dans un domaine leur donne automatiquement le
même trône dans tous les autres domaines...

Cet avertissement, et les rappels qui vont suivre, doivent servir le scientifique à se remettre en question en
faisant un bon usage de ce que nous pouvons considérer aujourd'hui comme les bonnes méthodes de travail
(nous parlerons des principes de la méthode de Descartes plus loin) pour résoudre des problèmes ou développer
des modèles théoriques.

Dans ce but, voici un tableau récapitulatif qui propose les différentes étapes que le scientifique devrait suivre
lors de ses travaux en mathématique ou physique théorique (pour les définitions, voir juste après) :

MATHÉMATIQUE PHYSIQUE
1. Poser "l'hypothèse", la "conjecture" la "propriété" à 1. Poser correctement et de manière détaillée le ou les
démontrer de manière formelle ou en langage commun "problèmes" à résoudre de manière formelle ou en
(les hypothèses étant notées H1., H2., ... les conjectures langage commun (les problèmes étant notés P1., P2.,
CJ1., CJ2.,... et les propriétés P1., P2., ...)) ...)
2. Définir les "axiomes" (sous-entendu non- 2. Définir (ou énoncer) les "postulats" ou "principes"
démontrables, indépendants et non-contradictoires) qui ou encore les "hypothèses" et "suppositions" (supposés
vont donner les points de départ et établir des non démontrables...) qui vont donner les points de
restrictions aux développements (les axiomes étant départ et établir des restrictions aux développements
notés A1., A2, ...). (habituellement, les postulats et principes sont notés
P1., P2., ... et les hypothèses H1., H2., ... en essayant
Remarque: Parfois par abus, "propriétés", "conditions" d'éviter pour les postulats et principes, une confusion
et "axiomes" sont confondus alors que le concept possible avec l'énoncé du ou des problèmes qui sont
d'axiome est beaucoup plus précis et notés de la même manière).
profond.
Remarque: Il ne faut pas cependant oublier que la
Dans la même idée, le mathématicien définit le validité d'un modèle ne dépend pas du réalisme de ses
vocabulaire spécialisé relié à des opérateurs hypothèses mais bien de la conformité de ses
mathématiques qui seront notés par D1., D2., D3., ... implications avec la réalité.
3. Des axiomes posés, tirer directement des "lemmes" 3. Une fois le "modèle théorique" développé vérifier
ou des "propriétés" dont la validité en découle les équations dimensionnelles pour déceler une
directement et qui préparent au développement du éventuelle erreur dans les développements (ces
théorème censé valider l'hypothèse ou la conjecture de vérifications étant notées VA1., VA2., ...).
départ (les lemmes étant notés L1., L2., ... et les
propriétés P1., P2.,...).
4. Une fois le ou les "théorèmes" (notés T1., T2., ...) 4. Chercher les cas limites (dont les "singularités" font
démontrés en tirer des "corollaires" (notés C1., C2., ...) partie) du modèle pour en vérifier la validité intuitive
et encore des propriétés (notées P1., P2., P3.,...). (ces contrôles aux limites étant notés CL1., CL2., ...).
5. Ttester la force ou l'utilité de sa ou ses conjectures 5. Tester expérimentalement le modèle théorique
ou hypothèses en démontrant la réciproque du obtenu et soumettre le travail à comparaison avec
théorème ou en la comparant avec des exemples à d'autres équipes de recherche indépendantes. Le
d'autres théories mathématiques pour voir si l'ensemble nouveau modèle doit prévoir des résultats
forme un tout cohérent (les exemples étant notés E1., expérimentaux observés et jamais observés
E2., ...). (prédictions permettant de la falsifier). Si le modèle est
validé alors il prend officiellement le statut de
"Théorie".
6. D'éventuelles remarques peuvent être indiquées dans 6. D'éventuelles remarques peuvent être indiquées dans
un ordre structuré et notées hiérarchiquement R1., R2., un ordre structuré et notées hiérarchiquement R1., R2.,
... ...

Procéder comme dans le tableau ci-dessus est une base de travail possible pour travailler en mathématique et
physique. Évidemment, procéder de façon propre et traditionnelle comme ci-dessus prend un petit plus de
temps qu'en faisant un peu n'importe quoi, n'importe comment (c'est pour cela que la plupart des professeurs ne
suivent pas ces règles, le temps leur manque cruellement pour couvrir tout le programme scolaire).

Remarques:

R1. Attention, il est très facile de faire des nouvelles théories physiques en alignant des mots. Cela s'appelle de
la "philosophie" et les grecs ont pensé aux atomes comme cela. Ca peut donc mener à une vraie théorie. Par
contre il est bien plus difficile de faire une "théorie prédictive", c'est-à-dire avec des équations qui permettent
de prédire le résultat d'une expérience.
R2. Toutefois ce qui sépare la mathématique de la physique est que, en mathématique, l'hypothèse est toujours
vraie. Le discours mathématique n'est pas une démonstration d'une vérité extérieure à chercher, mais vise
uniquement la cohérence. Ce qui doit être juste est le raisonnement.

MÉTHODE DE DESCARTES

Présentons maintenant les quatre principes de la méthode de Descartes qui, rappelons-le, est considéré comme
le premier scientifique de l'histoire de par sa méthode d'analyse :

P1. Ne recevoir jamais aucune chose pour vraie que je ne la connusse évidemment être telle. C'est-à-dire,
d'éviter soigneusement la précipitation et la prévention, et de ne comprendre rien de plus en mes jugements que
ce qui se présenterait si clairement et si distinctement à mon esprit, que je n'eusse aucune occasion de le mettre
en doute.

P2. De diviser chacune des difficultés que j'examinerais, en autant de parcelles qu'il se pourrait, et qu'il serait
requis pour les mieux résoudre.

P3. De conduire par ordre mes pensées, en commençant par les objets les plus simples et les plus aisés à
connaître, pour monter peu à peu comme par degrés jusques à la connaissance des plus composés, et supposant
même de l'ordre entre ceux qui ne se précèdent point naturellement les uns les autres.

P4. Et le dernier, de faire partout des dénombrements si entiers et des revues si générales, que je fusse assuré de
ne rien omettre.

VOCABULAIRE

La physique-mathématique, comme tout domaine de spécialisation, a son vocabulaire propre. Afin que le
lecteur ne soit pas perdu dans la compréhension de certains textes qu'il pourra lire sur ce site, nous avons choisi
d'exposer ici les quelques termes, abréviations et définitions fondamentaux à connaître.

Ainsi, le mathématicien aime bien terminer ses démonstrations (quand il pense qu'elles sont justes) par
l'abréviation "C.Q.F.D" qui signifie "Ce Qu'il Fallait Démontrer" ou encore dans les hautes écoles par souci
d'esthétisme et de traditions certains professeurs (et mêmes élèves) notent cela en latin "Q.E.D" qui signifie
"Quod Erat Demonstrandum" (cela en jette...).

Et lors de définitions (elles sont nombreuses en mathématique et physique...) le scientifique fait souvent usage
des terminologies suivantes :

- ... il suffit que ...

- ... si et seulement si ...

- ... nécessaire et suffisant ...

- ... signifie que ...

Les quatre ne sont pas équivalentes (identiques au sens strict). Car "il suffit que" correspond à une condition
suffisante, mais pas à une condition nécessaire.

SUR LES SCIENCES

Il est important que nous définissions rigoureusement les différents types de sciences auxquelles l'être humain
fait souvent référence. Effectivement, il semble qu'au 21ème siècle un abus de langage malsain s'instaure et
qu'il ne devienne plus possible pour la population de distinguer la "qualité intrinsèque" d'une science d'une
autre.
Remarque: Etymologiquement le mot "science" vient du latin "scienta" (connaissance) dont la racine est le
verbe "scire" qui veut dire "savoir".

Cet abus de langage vient probablement du fait que les sciences pures et exactes perdent leurs illusions
d'universalité et d'objectivité, dans le sens où elles s'auto-corrigent. Ceci ayant pour conséquence que certaines
sciences sont reléguées au second plan et tentent d'en emprunter les méthodes, les principes et les origines pour
créer une confusion quant à leurs distinctions.

En soi, la science cependant ne produit pas de vérité absolue. Par principe, une théorie scientifique est valable
tant qu'elle permet de prédire des résultats mesurables et reproductibles. Mais les problèmes d'interprétation de
ces résultats font partie de la philosophie naturelle.

Étant donné la diversité des phénomènes à étudier, au cours des siècles s'est constitué un nombre grandissant de
disciplines comme la chimie, la biologie, la thermodynamique, etc. Toutes ces disciplines à priori hétéroclites
ont pour socle commun la physique, pour langage les mathématiques et comme principe élémentaire la méthode
scientifique.

Ainsi, un petit rafraîchissement semble nécessaire :

Définitions:

D1. Nous définissons par "science pure", tout ensemble de connaissances fondées sur un raisonnement
rigoureux valable quel que soit le facteur (arbitraire) élémentaire choisi (nous disons alors "indépendant de la
réalité sensible") et restreint au minimum nécessaire. Il n'y a que la mathématique (appelée souvent "reine des
sciences") qui peut être classifiée dans cette catégorie.

D2. Nous définissons par "science exacte" ou "science dure", tout ensemble de connaissances fondées sur
l'étude d'une observation, observation qui aura été transcrite sous forme symbolique (physique théorique).
Principalement, le but des sciences exactes est non d'expliquer le "pourquoi" mais le "comment".

Remarque: Les deux définitions précédentes sont souvent incluses dans la définition de "sciences déductives"
ou encore de "sciences phénoménologiques".

D3. Nous définissons par "science de l'ingénieur", tout ensemble de connaissances théoriques ou pratiques
appliquées aux besoins de la société humaine tels que : l'électronique, la chimie, l'informatique, les
télécommunications, la robotique, l'aérospatiale, biotechnologies...

D4. Nous définissons par "science" tout ensemble de connaissances fondées sur des études ou observations de
faits dont l'interprétation n'a pas encore été retranscrite ni vérifiée avec la rigueur mathématique caractéristique
des sciences qui précèdent, mais qui applique des raisonnements comparatifs statistiques. Nous incluons dans
cette définition: la médecine (il faut cependant prendre garde au fait que certaines parties de la médecine
étudient des phénomènes descriptifs sous forme mathématique tels que les réseaux de neurones ou autres
phénomènes associés à des causes physiques connues), la sociologie, la psychologie, l'histoire, la biologie...

Selon le philosophe Karl Popper, une théorie n'est scientifiquement acceptable que si, telle qu'elle est présentée,
elle peut être falsifiable, c'est à dire soumise à des tests expérimentaux.

La "connaissance scientifique" est ainsi par définition l'ensemble des théories qui ont jusqu'alors résisté à la
falsification. La science est donc par nature soumise en permanence à la remise en question.

D5. Nous définissons par "science molle" ou "para-sciences", tout ensemble de connaissances ou de pratiques
qui sont actuellement fondées sur des faits invérifiables (non reproductibles scientifiquement) ni par
l'expérience, ni par la mathématique. Nous incluons dans cette définition: l'astrologie, la théologie, le
paranormal (qui est démolie par la science zététique), la graphologie...
D6. Nous définissons par "sciences phénoménologiques" ou "sciences naturelles", toute science qui n'est pas
inclue dans les définitions précédentes (histoire, sociologie, psychologie, zoologie, biologie,...)

D7. Le "scientisme" est la doctrine fondamentale suivant laquelle il n'y a de vérité que dans la science.

Ce qui est intéressant dans cette doctrine, c'est que c'est certainement une des seules qui demande aux gens de
devoir réfléchir par eux-mêmes et de comprendre l'environnement qui les entoure en remettant continuellement
tout en question et sans ne jamais rien accepter comme acquis (...)

TERMINOLOGIE

Le tableau méthodique que nous avons présrnté plus haut contient des termes qui peuvent peut-être vous
sembler inconnus ou barbares. C'est la raison pour laquelle il nous semble fondamental de présenter les
définitions de ces derniers, ainsi que de quelques autres tout aussi importants qui peuvent éviter des confusions
malheureuses.

Définitions:

D1. Au-delà de son sens négatif, l'idée de "problème" renvoie à la première étape de la démarche scientifique.
Formuler un problème est ainsi essentiel à sa résolution et permet de comprendre correctement ce qui fait
problème et de voir ce qui doit être résolu.

Le concept de problème est intimement relié au concept "d'hypothèse" dont nous allons voir la définition ci-
dessous.

D2. Une "hypothèse" est toujours, dans le cadre d'une théorie déjà constituée ou sous-jacente, une supposition
en attente de confirmation ou d'infirmation qui tente d'expliquer un groupe de faits ou de prévoir l'apparition de
faits nouveaux.

Ainsi, une hypothèse peut être à l'origine d'un problème théorique qu'il faudra formellement résoudre.

D3. Le "postulat" en physique correspond fréquemment à un principe (voir définition ci-dessous) dont
l'admission est nécessaire pour établir une démonstration (nous sous-entendons que cela est une proposition
non-démontrable).

L'équivalent mathématique (mais en plus rigoureux) du postulat est "l'axiome" dont nous verrons la définition
plus loin.

D4. Un "principe" (parent proche du "postulat") est donc une proposition admise comme base d'un
raisonnement ou une règle générale théorique qui guide la conduite des raisonnements qu'il faudra effectuer. En
physique, il s'agit également d'une loi générale régissant un ensemble de phénomènes et vérifiée par l'exactitude
de ses conséquences.

Remarque: le mot "principe" est utilisé avec abus dans les petites classes ou écoles d'ingénieurs par les
professeurs ne sachant (ce qui est très rare), ou ne voulant (plutôt fréquent), ou ne pouvant faute de temps
(quasi exclusivement), pas démontrer une relation.
L'équivalent du postulat ou du principe en mathématiques est "l'axiome" que nous définissons ainsi :

D5. Un "axiome" est une vérité ou proposition évidente par elle-même dont l'admission est nécessaire pour
établir une démonstration

Remarques:

R1. Nous pourrions dire que c'est quelque chose que nous posons comme une vérité pour le discours que nous
nous proposons de tenir, comme une règle du jeu, et qu'elle n'a pas forcément par ailleurs une valeur de vérité
universelle dans le monde sensible qui nous entoure)

R2. Les axiomes doivent toujours êtres indépendants entre eux (on ne doit pas pouvoir démontrer l'un à partir
de l'autre), non contradictoires (nous disons également parfois qu'ils doivent être "consistants").

D6. Le "corollaire" est un terme malheureusement quasi inexistant en physique (à tort !) et qui est en fait une
proposition résultant d'une vérité déjà démontrée. Nous pouvons également dire qu'un corollaire est une
conséquence nécessaire et évidente d'un théoroème (ou parfois d'un postulat en ce qui concerne la physique).

D7. Un "lemme" constitue une proposition déduite d'un ou de plusieurs postulats ou axiomes et dont la
démonstration prépare celle d'un théorème.

Remarque: Le concept de "lemme" est lui aussi (et c'est malheureux) quasi réservé aux mathématiques.

D8. Une "conjecture" constitue une supposition ou opinion fondée sur la vraisemblance d'un résultat
mathématique.

Remarque: Beaucoup de conjectures jouent un rôle un peu comparable à des lemmes, car elles sont des
passages obligés pour obtenir d'importants résultats.

D8. Par-delà son sens faible de conjecture, une "théorie" ou "théorème" est un ensemble articulé autour d'une
hypothèse et étayé par un ensemble de faits ou développements qui lui confèrent un contenu positif et rendent
l'hypothèse bien fondée (ou tout au moins plausible dans le cas de la physique théorique)

D9. Une "singularité" est une indétermination d'un calcul qui intervient par l'apparition d'une division par le
nombre zéro. Ce terme est aussi bien utilisé en mathématique qu'en physique.

D10. Une "démonstration" constitue un ensemble de procédures mathématiques à suivre pour démontrer le
résultat déjà connu ou non d'un théorème.

D11. Si le mot "paradoxe" signifie étymologiquement : contraire à l'opinion commune, ce n'est cependant pas
par pur goût de la provocation, mais bel et bien pour des raisons solides. Le "sophisme" quant à lui, est un
énoncé volontairement provocateur, une proposition fausse reposant sur un raisonnement apparemment valide.
Ainsi parle-t-on du fameux "paradoxe de Zénon", alors qu'il ne s'agit que d'un sophisme. Le paradoxe ne se
réduit pas à de la fausseté, mais implique la coexistence de la vérité et de la fausseté, au point qu'on ne parvient
plus à discriminer le vrai et le faux. Le paradoxe apparaît alors problème insoluble ou "aporie".

Remarque: Ajoutons que les grands paradoxes, par les interrogations qu'ils ont suscitées, ont fait progresser la
science et amené des révolutions conceptuelles de grande ampleur, en mathématique comme en physique
théorique (les paradoxes sur les ensembles et sur l'infini en mathématique, ceux à la base de la relativité et de la
physique quantique).
SCIENCE ET FOI

Nous verrons qu'en science, une théorie est normalement incomplète, car elle ne peut décrire exhaustivement la
complexité du monde réel. Il en est ainsi de toutes les théories, comme celle du Big Bang (cf. chapitre
d'Astrophysique) ou de l'évolution des espèces (cf. chapitre de Dynamique Des Populations ou de Théorie Des
Jeux).

Il convient de distinguer différents courants scientifiques :

- Le "réalisme" est une doctrine selon laquelle les théories physiques ont pour objectif de décrire la réalité telle
qu'elle est en soi, dans ses composantes inobservables.

-"L'instrumentalisme" est une doctrine selon les théories sont des outils servant à prédire des observations mais
qui ne décrivent pas la réalité en soi.

- Le "fictionnalisme" est le courant selon lequel le contenu référentiel (principes et postulats) des théories est un
leurre, utile seulement pour assurer l'articulation linguistique des équations fondamentales.

Même si aujourd'hui les théories scientifiques ont le soutien de beaucoup de spécialistes, les théories
alternatives ont des arguments valables et nous ne pouvons totalement les écarter. Pour autant, la création du
monde en 7 jours décrite par la Bible ne peut plus être perçue comme un possible, et bien des croyants
reconnaissent qu'une lecture littérale est peu compatible avec l'état actuel de nos connaissances et qu'il est plus
sage de l'interpréter comme une parabole. Si la science ne fournit jamais de réponse définitive, il n'est plus
possible de ne pas en tenir compte.

La foi (qu'elle soit religieuse, superstitieuse, pseudo-scientifique ou autre) a au contraire pour objectif de donner
des vérités absolues d'une toute autre nature puisqu'elle relève d'une conviction personnelle invérifiable. En fait,
l'une des fonctions des religions est de fournir du sens à des phénomènes qui ne sont pas explicables
rationnellement. Les progrès de la connaissance entraînent donc parfois une remise en cause des dogmes
religieux par la science.

A contrario, sauf à prétendre imposer sa foi (qui n'est autre qu'une conviction intimement personnelle et
subjective) aux autres, il faut se défier de la tentation naturelle de qualifier de fait scientifiquement prouvé les
extrapolations des modèles scientifiques au-delà de leur champ d'application.

Le mot "science" est comme nous l'avons déjà mentionné plus haut de plus en plus utilisé pour soutenir qu'il
existe des preuves scientifiques là où il n'y a que croyance (certaines pages web de ce genre prolifèrent de plus
en plus). Selon ses détracteurs c'est le cas du mouvement de scientologie. Selon ces derniers, nous devrions
plutôt parler de "sciences occultes".

Les sciences occultes et sciences traditionnelles existent depuis l'Antiquité, elles consistent en un ensemble de
connaissances et de pratiques mystérieuses ayant pour but de pénétrer et dominer les secrets de la nature. Au
cours des derniers siècles, elles ont été progressivement exclues du champ de la science. Le philosophe Karl
Popper s'est longuement interrogé sur la nature de la démarcation entre science et pseudo-science. Après avoir
remarqué qu'il est possible de trouver des observations pour confirmer à peu près n'importe quelle théorie, il
propose une méthodologie fondée sur la réfutabilité. Une théorie doit selon lui, pour mériter le qualificatif de
"scientifique", doit pouvoir garantir l'impossibilité de certains événements. Elle devient dès lors réfutable, donc
(et alors seulement) apte à intégrer la science. Il suffirait en effet d'observer un de ces événements pour
invalider la théorie, et orienter par conséquent sur une amélioration de celle-ci.
1. THÉORIE DE LA DÉMONSTRATION

N ous avons choisi de commencer l'étude de la mathématique appliquée par la théorie qui nous semble la
plus fondamentale et la plus importante dans le domaine des sciences pures et exactes.

La théorie de la démonstration et du calcul propositionnel (logique) a trois objectifs dans le cadre de ce site :

1. Apprendre au lecteur comment raisonner et à démontrer et cela indépendamment de la spécialisation étudiée

2. Montrer que le processus d'une démonstration est indépendante du langage utilisé

3. Se préparer à la théorie de la logique et au théorème d'incomplétude de Gödel ainsi qu'aux automates (cf.
chapitre d'Informatique Théorique).

Le théorème de Gödel est le point le plus passionnant car si nous définissons une religion comme un système de
pensée qui contient des affirmations indémontrables, alors elle contient des éléments de foi, et Gödel nous
enseigne que les mathématiques sont non seulement une religion, mais que c'est alors la seule religion capable
de prouver qu'elle en est une!

Remarques:

R1. Il est (très) fortement conseillé de lire en parallèle à ce chapitre, ceux sur la théorie des automates et de
l'algèbre de Boole disponibles dans la section d'Informatique Théorique du site.

R2. Il faut prendre cette théorie comme une curiosité sympathique mais qui n'amène fondalement pas grand
chose excepté des méthodes de travail/raisonnement. Par ailleurs, son objectif n'est pas de démontrer que tout
est démontrable mais que toute démonstration peut se faire sur un langage commun à partir d'un certain nombre
de règles.

Souvent, quand un étudiant arrive dans une classe supérieure, il a surtout appris à calculer, à utiliser des
algorithmes mais relativement peu voir pas du tout à raisonner. Pour tous les raisonnements, le support visuel
est un outil puissant, et les personnes qui ne voient pas qu'en traçant telle ou telle courbe droite la solution
apparaît ou qui ne voient pas dans l'espace sont très pénalisées.

Lors des études secondaires, nous manipulons déjà des objets inconnus, mais c'est surtout pour faire des calculs,
et quand nous raisonnons sur des objets représentés par des lettres, nous pouvons remplacer ceux-ci
visuellement par un nombre réel, un vecteur, etc. A partir d'un certain niveau, nous demandons aux personnes
de raisonner sur des structures plus abstraites, et donc de travailler sur des objets inconnus qui sont des
éléments d'un ensemble lui-même inconnu, par exemple les éléments d'un groupe quelconque (cf. chapitre de
Théorie Des Ensembles). Ce support visuel n'existe alors plus.

Nous demandons ainsi souvent aux étudiants de raisonner, de démontrer des propriétés, mais personne ne leur a
jamais appris à raisonner convenablement, à écrire des preuves. Si nous demandons à un étudiant de licence ce
qu'est une démonstration, il a très probablement quelque difficulté à répondre. Il peut dire que c'est un texte
dans lequel on trouve des "mots clés": "donc", "parce que", "si", "si et seulement si", "prenons un x tel que",
"supposons que", "cherchons une contradiction", etc. Mais il est incapable de donner la grammaire de ces textes
ni même ces rudiments, et d'ailleurs, ses enseignants, s'ils n'ont pas suivi de cours, en seraient probablement
incapables aussi.

Pour comprendre cette situation, rappelons que pour parler un enfant n'a pas besoin de connaître la grammaire.
Il imite son entourage et cela marche très bien : un enfant de six ans sait utiliser des phrases déjà compliquées
quant à la structure grammaticale sans avoir jamais fait de grammaire. La plupart des enseignants ne
connaissent pas non plus la grammaire du raisonnement mais, chez eux, le processus d'imitation a bien marché
et ils raisonnent correctement. L'expérience de la majorité des enseignants d'université montre que ce processus
d'imitation marche bien chez les très bons étudiants, et alors il est suffisant, mais il marche beaucoup moins
bien, voire pas du tout, chez beaucoup d'autres.

Tant que le degré de complexité est faible (notamment lors d'un raisonnement de type "équationnel"), la
grammaire ne sert à rien, mais quand il augmente ou quand on ne comprend pas pourquoi quelque chose est
faux, il devient nécessaire de faire un peu de grammaire pour pouvoir progresser. Les enseignants et les
étudiants connaissent bien la situation suivante: dans un devoir, le correcteur a barré toute une page d'un grand
trait rouge et mis "faux" dans la marge. Quand l'étudiant demande ce qui est faux, le correcteur ne peut que dire
des choses du genre "ça n'a aucun rapport avec la démonstration demandée", "rien n'est juste", ..., ce qui n'aide
évidemment pas l'étudiant à comprendre. Cela vient en partie, du fait que le texte rédigé par l'étudiant utilise les
mots voulus mais dans un ordre plus ou moins aléatoire et qu'on ne peut donner de sens à l'assemblage de ces
mots. De plus, l'enseignant n'a pas les outils nécessaires pour pouvoir expliquer ce qui ne va pas. Il faut donc les
lui donner!

Ces outils existent mais sont assez récents. La théorie de la démonstration est une branche de la logique
mathématique dont l'origine est la crise des fondements : il y a eu un doute sur ce que nous avions le "droit" de
faire dans un raisonnement mathématique (voir la "crise des fondements" plus loin). Des paradoxes sont
apparus, et il a alors été nécessaire de préciser les règles de démonstration et de vérifier que ces règles ne sont
pas contradictoires. Cette théorie est apparue au début du 20ème siècle, ce qui est très peu puisque l'essentiel
des mathématiques enseignées en première moitié de l'université est connu depuis le 16ème-17ème siècle.

LA CRISE DES FONDEMENTS

Pour les premiers Grecs, la géométrie était considérée comme la forme la plus haute du savoir, une puissante
clé pour les mystères métaphysiques de l'Univers. Elle était plutôt une croyance mystique, et le lien entre le
mysticisme et la religion était rendu explicite dans des cultes comme ceux des Pythagoriciens. Aucune culture
n'a depuis déifié un homme pour avoir découvert un théorème géométrique! Plus tard, les mathématiques furent
considérées comme le modèle d'une connaissance a priori dans la tradition aristotélicienne du rationalisme.

L'étonnement des Grecs pour les mathématiques ne nous a pas quitté, on le retrouve sous la traditionnelle
métaphore des mathématiques comme "Reine des Science". Il s'est renforcé avec les succès spectaculaires des
modèles mathématiques dans la science, succès que les Grecs (ignorant même la simple algèbre) n'avaient pas
prévus. Depuis la découverte par Isaac Newton du calcul intégral et de la loi du carré inverse de la gravité, à la
fin des années 1600, les sciences phénoménales et les plus hautes mathématiques étaient restées en étroite
symbiose - au point qu'un formalisme mathématique prédictif était devenu le signe distinctif d'une "science
dure".

Après Newton, pendant les deux siècles qui suivirent, la science aspira à ce genre de rigueur et de pureté qui
semblaient inhérentes aux mathématiques. La question métaphysique semblait simple: les mathématiques
possédaient une connaissance a priori parfaite, et parmi les sciences, celles qui étaient capables de se
mathématiser le plus parfaitement étaient les plus efficaces pour la prédiction des phénomènes. La connaissance
parfaite consistait donc dans un formalisme mathématique qui, une fois atteint par la science et embrassant tous
les aspects de la réalité, pouvait fonder une connaissance empirique a postériori sur une logique rationnelle a
priori. Ce fut dans cet esprit que Jean-Antoine Nicolas de Cartitat, marquis de Condorcet (philosophe et
mathématicien français), entreprit d'imaginer la description de l'Univers entier comme un ensemble d'équation
différentielles partielles se résolvant les unes après les autres.

La première faille dans cette image inspiratrice apparut dans la seconde moitié du 19ème siècle, quand
Riemann et Lobachevsky prouvèrent séparément que l'axiome des parallèles d'Euclides pouvait être remplacé
par d'autres qui produisaient des géométries "consistantes" (nous reviendrons sur ce terme plus loin). La
géométrie de Riemann prenait modèle sur une sphère, celle de Lobachevsky, sur la rotation d'un hyperboloïde.

L'impact de cette découverte a été obscurci plus tard par de grands chamboulements, mais sur le moment, il fut
un coup de tonnerre dans le monde intellectuel. L'existence de systèmes axiomatiques mutuellement
inconsistants, et dont chacun pouvait servir de modèle à l'Univers phénoménal, remettait entièrement en
question la relation entre les mathématiques et la théorie physique.

Quand on ne connaissait qu'Euclide, il n'y avait qu'une géométrie possible. On pouvait croire que les axiomes
d'Euclide constituaient un genre de connaissance parfaite a priori sur la géométrie dans le monde phénoménal.
Mais soudain, nous avons eu trois géométries, embarrassantes pour les subtilités métaphysiques.

Pourquoi aurions-nous à choisir entre les axiomes de la géométrie plane, sphérique et hyperbolique comme
descriptions de la géométrie du réel? Parce que toutes les trois sont consistantes, nous ne pouvons en choisir
aucune comme fondement a priori - le choix doit devenir empirique, basé sur leur pouvoir prédictif dans une
situation donnée.

Bien sûr, Les théoriciens de la physique ont longtemps été habitués à choisir des formalismes pour poser un
problème scientifique. Mais il était admis largement, si ce n'est inconsciemment, que la nécessité de procéder
ainsi était fonction de l'ignorance humaine, et qu'avec de la logique ou des mathématiques assez bonnes, on
pouvait déduire le bon choix à partir de premiers principes, et produire des descriptions à priori de la réalité, qui
devaient être confirmées après coup par une vérification empirique.

Cependant, la géométrie euclidienne, considérée pendant plusieurs centaines d'années comme le modèle de la
perfection axiomatique des mathématiques, avait été détrônée. Si l'on ne pouvait connaître a priori quelque
chose d'aussi fondamental que la géométrie dans l'espace, quel espoir restait-il pour une pure théorie rationnelle
qui embrasserait la totalité de la nature ? Psychologiquement, Riemann et Lobachevsky avaient frappé au coeur
de l'entreprise mathématique telle qu'elle avait été conçue jusqu'alors.

De plus, Riemann et Lobachevsky remettaient la nature de l'intuition mathématique en question. Il avait été
facile de croire implicitement que l'intuition mathématique était une forme de perception - une façon d'entrevoir
le monde platonicien derrière la réalité. Mais avec deux autres géométries qui bousculaient celle d'Euclide,
personne ne pouvait plus être sûr de savoir à quoi le monde ressemblait.

Les mathématiciens répondirent à ce double problème avec un excès de rigueur, en essayant d'appliquer la
méthode axiomatique à toutes les mathématiques. Dans la période pré-axiomatique, les preuves reposaient
souvent sur des intuitions communément admises de la "réalité" mathématique, qui ne pouvaient plus être
considérées automatiquement comme valides.

La nouvelle façon de penser les mathématiques conduisait à une série de succès spectaculaires. Pourtant cela
avait aussi un prix. La méthode axiomatique rendait la connexion entre les mathématiques et la réalité
phénoménale toujours plus étroite. En même temps, des découvertes suggéraient que les axiomes
mathématiques qui semblaient être consistants avec l'expérience phénoménale pouvait entraîner de
vertigineuses contradictions avec cette expérience.

La majorité des mathématiciens devinrent rapidement des "formalistes", soutenant que les mathématiques pures
ne pouvaient qu'être considérées philosophiquement comme une sorte de jeu élaboré qui se jouait avec des
signes sur le papier (c'est la théorie qui sous-tend la prophétique qualification des mathématiques de "système à
contenu nul" par Robert Heinlein). La croyance "platonicienne" en la réalité des objets mathématiques, à
l'ancienne manière, semblait bonne pour la poubelle, malgré le fait que les mathématiciens continuaient à se
sentir comme les platoniciens durant le processus de découverte des mathématiques.

Philosophiquement, donc, la méthode axiomatique conduisait la plupart des mathématiciens à abandonner les
croyances antérieures en la spécificité métaphysique des mathématiques. Elle produisit aussi la rupture
contemporaine entre les mathématiques pures et appliquées. La plupart des grands mathématiciens du début de
la période moderne - Newton, Leibniz, Fourier, Gauss et les autres - s'occupaient aussi de science phénoménale.
La méthode axiomatique avait couvé l'idée moderne du mathématicien pur comme un super esthète, insoucieux
de la physique. Ironiquement, le formalisme donnait aux purs mathématiciens un mauvais penchant à l'attitude
platonicienne. Les chercheurs en mathématiques appliquées cessèrent de côtoyer les physiciens et apprirent à se
mettre à leur traîne.
Ceci nous emmène au début du 20ème siècle. Pour la minorité assiégée des platoniciens, le pire était encore à
venir. Cantor, Frege, Russell et Whitehead montrèrent que toutes les mathématiques pures pouvaient être
construites sur le simple fondement axiomatique de la théorie des ensembles. Cela convenait parfaitement aux
formalistes: les mathématiques se réunifiaient, du moins en principe, à partir d'un faisceau de petits jeux
détachés d'un grand. Les platoniciens aussi étaient satisfaisaits, sil en survenait une grande structure, clé de
voûte consistante pour toutes les mathématiques, la spécificité métaphysique des mathématiques pouvait encore
être sauvée.

D'une façon négative, pourtant, un platonicien eut le dernier mot. Kurt Gödel mit son grain de sable dans le
programme formaliste d'axiomatisation quand il démontra que tout système d'axiomes assez puissant pour
inclure les entiers devait être soit inconsistant (contenir des contradictions) soit incomplet (trop faible pour
décider de la justesse ou de la fausseté de certaines affirmations du système). Et c'est plus ou moins où en sont
les choses aujourd'hui. Les mathématiciens savent que de nombreuses tentatives pour faire avancer les
mathématiques comme une connaissance a priori de l'Univers doivent se heurter à de nombreux paradoxes et à
l'impossibilité de décider quel système axiomatique décrit les mathématiques réelles. Ils ont été réduits à
espérer que les axiomatisations standard ne soient pas inconsistantes mais incomplètes, et à se demander
anxieusement quelles contradictions ou quels théorèmes indémontrables attendent d'être découverts ailleurs.

Cependant, sur le front de l'empirisme, les mathématiques étaient toujours un succès spectaculaire en tant
qu'outil de construction théorique. Les grands succès de la physique du 20ème siècle (la relativité générale et la
physique quantique) poussaient si loin hors du royaume de l'intuition physique, qu'ils ne pouvaient être compris
qu'en méditant profondément sur leurs formalismes mathématiques, et en prolongeant leurs conclusions
logiques, même lorsque ces conclusions semblaient sauvagement bizarres. Quelle ironie! Au moment même où
la perception mathématique en venait à paraître toujours moins fiable dans les mathématiques pures, elle
devenait toujours plus indispensable dans les sciences phénoménales.

À l'opposé de cet arrière-plan, l'applicabilité des mathématiques à la science phénoménale pose un problème
plus épineux qu'il n'apparaît d'abord. Le rapport entre les modèles mathématiques et la prédiction des
phénomènes est complexe, pas seulement dans la pratique mais dans le principe. D'autant plus complexe que,
comme nous le savons maintenant, il y a des façons d'axiomatiser les mathématiques qui s'excluent!

Mais pourquoi existe-t-il seulement de bons choix de modèle mathématique ? C'est à dire, pourquoi y a-t-il un
formalisme mathématique, par exemple pour la physique quantique, si productif qu'il prédit réellement la
découverte de nouvelles particules observables ?

Pour répondre à cette question nous observerons qu'elle peut, aussi bien, fonctionner comme une sorte de
définition. Pour beaucoup de système phénoménaux, de tels formalismes prédictifs exacts n'ont pas été trouvés,
et aucun ne semble plausible. Les poètes aiment marmonner sur le coeur des hommes, mais on peut trouver des
exemples plus ordinaires : le climat, où le comportement d'une économie supérieure à celle d'un village, par
exemple - systèmes si chaotiquement interdépendants que la prédiction exacte est effectivement impossible (pas
seulement dans les faits mais en principe).

PARADOXES

Dès l'antiquité, certains logiciens avaient constaté la présence de nombreux paradoxes au sein de la rationalité.
En fait, nous pouvons dire que malgré leur nombre, ces paradoxes ne sont que les illustrations d'un petit nombre
de structures paradoxales. Attardons nous à exposer à titre de culture générale les plus connus.

Exemples:

E1. Le paradoxe de la classe des classes (Russell)

Il existe deux types de classes : celles qui se contiennent elles-mêmes (ou classes réflexives : la classe des
ensembles non-vides, la classe des classes,...) et celles qui ne se contiennent pas elles-mêmes (ou classes
irréflexives : la classe des travaux à rendre, la classe des oranges sanguines, ...). La question posée est la
suivante : la classe des classes irréflexives est-elle elle même réflexive ou irréflexive? Si elle est réflexive, elle
se contient et se trouve rangée dans la classe des classes irréflexives qu'elle constitue, ce qui est contradictoire.
Si elle est irréflexive, elle doit figurer dans la classe des classes irréflexives qu'elle constitue et devient ipso
facto réflexive, nous sommes face à une nouvelle contradiction.

E2. Le paradoxe du bibliothécaire (Gonseth)

Dans une bibliothèque, il existe deux types de catalogues. Ceux qui se mentionnent eux-mêmes et ceux qui ne
se mentionnent pas. Un bibliothécaire doit dresser le catalogue de tous les catalogues qui ne se mentionnent pas
eux-mêmes. Arrivé au terme de son travail, notre bibliothécaire se demande s'il convient ou non de mentionner
le catalogue qu'il est précisément en train de rédiger. A ce moment, il est frappé de perplexité. Si ne le
mentionne pas, ce catalogue sera un catalogue qui ne se mentionne pas et qui devra dès lors figurer dans la liste
des catalogues ne se mentionnant pas eux-mêmes. D'un autre côté, s'il le mentionne, ce catalogue deviendra un
catalogue qui se mentionne et qui ne doit donc pas figurer dans ce catalogue, puisque celui-ci est le catalogue
des catalogues qui ne se mentionnent pas.

E3. Le paradoxe du menteur (variante)

Définissons provisoirement le mensonge comme l'action de formuler une proposition fausse. Le poète crétois
Epiménide affirme : "Tous les Crétois sont des menteurs", soit la proposition P. Comment décider de la valeur
de vérité de P ? Si P est vraie, comme Epiménide est Crétois, P doit être fausse. Il faut donc que P soit fausse
pour pouvoir être vraie, ce qui est contradictoire. P est donc fausse. Remarquons qu'on ne peut pas en déduire,
comme dans le véritable paradoxe du menteur, que P doit aussi être vraie.

RAISONNEMENT HYPOTHETICO-DEDUCTIF

Le raisonnement hypothético-déductif est, nous le savons, la capacité qu'a l'apprenant de déduire des
conclusions à partir de pures hypothèses et pas seulement d'une observation réelle. C'est un processus de
réflexion qui tente de dégager une explication causale d'un phénomène quelconque (nous y reviendrons lors de
nos premiers pas en physique). L'apprenant qui utilise ce type de raisonnement commence par formuler une
hypothèse et essaie ensuite de confirmer ou d'infirmer son hypothèse selon le schéma synoptique ci-dessous :

(1.1)
La procédure déductive consiste à tenir pour vrai, à titre provisoire, cette proposition première que nous
appelons, en logique "le prédicat" (voir plus bas) et à en tirer toutes les conséquences logiquement nécessaires,
c'est-à-dire à en rechercher les implications.

Exemple:

Soit la proposition P : "X est un homme", elle implique la proposition suivante Q : X est mortel.

L'expression (si c'est un homme il est nécessairement mortel) est un implication prédicative (d'où le
terme "prédicat"). Il n'y a pas dans cet exemple de cas où nous puissions énoncer P sans Q. Cet exemple est
celui d'une implication stricte, telle que nous la trouvons dans le "syllogisme" (figure logique du raisonnement).

Remarque: Des spécialistes ont montré que le raisonnement hypothético-déductif s'élabore progressivement
chez l'enfant, à partir de 6-7ans, et que ce type de raisonnement n'est utilisé systématiquement, en partant d'une
fonction propositionnelle stricte qu'à partir de 11-12 ans.

CALCUL PROPOSITIONNEL

Le "calcul propositionnel" (ou "logique propositionnelle") est un préliminaire absolument indispensable pour
aborder une formation en sciences, philosophie, droit, politique, économie, etc. Ce type de calcul autorise des
procédures de décisions ou tests. Ceux-ci permettent de déterminer dans quel cas une expression (proposition)
logique est vraie et en particulier si elle est toujours vraie.

Définitions:

D1. Une expression toujours vraie quel que soit le contenu linguistique des variables qui la composent est
appelée une "expression valide", une "tautologie", ou encore une "loi de la logique propositionnelle".

D2. Un expression toujours fausse est appelée une "contradiction" ou "antologie"

D3. Une expression qui est parfois vraie, parfois fausse est appelée une "expression contingente"

D4. Nous appelons "assertion" une expression dont nous pouvons dire sans ambiguïté s'il elle est vraie ou
fausse.

D5. Le "langage objet" est le langage utilisé pour écrire les expressions logiques.

D6. Le "métalangage" est le langage utilisé pour parler du langage objet dans la langue courante

Remarques:

R1. Il existe des expressions qui ne sont effectivement pas des assertions. Par exemple, l'énoncé : "cet énoncé
est faux", est un paradoxe qui ne peut être ni vrai, ni faux.

R2. Soit un expression logique A. Si celle-ci est une tautologie, nous la notons fréquemment et s'il
l'expression est une contradiction, nous la notons .

PROPOSITIONS

Définition: En logique, une "proposition" est une affirmation qui a un sens. Cela veut dire que nous pouvons
dire sans ambiguïté si cette affirmation est vraie (V) ou fausse (F). C'est ce que nous appelons le "principe du
tiers exclu".
Exemple:

"Je mens" n'est pas une proposition. Si nous supposons que cette affirmation est vraie, elle est une affirmation
de sa propre invalidité, donc nous devrions conclure qu'elle est fausse. Mais si nous supposons qu'elle est
fausse, alors l'auteur de cette affirmation ne ment pas, donc il dit la vérité, aussi la proposition serait vraie.

Définition: Une proposition en logique binaire (où les propositions sont soit vraies, soit fausses) n'est donc
jamais vraie et fausse à la fois. C'est que nous appelons le "principe de non-contradiction".

Ainsi, une propriété sur l'ensemble E des propositions est une application P de E dans l'ensemble des "valeurs
de vérité" :

(1.2)

Nous parlons de "sous-ensemble associé", lorsque la proposition engendre uniquement une partie E' de E et
inversement.

Exemple:

Dans , si P(x) s'énonce "x est pair" , alors ce qui est bien seulement un sous-
ensemble associé de E mais de même cardinal (cf. chapitre Théorie Des Ensembles).

Définition: Soit P une propriété sur l'ensemble E. Une propriété Q sur E est une "négation" de P si et seulement
si, pour tout :

- est F si P(x) est V

- est V si P(x) est F

Nous pouvons rassembler ces conditions dans une table dite "table de vérité" :

P Q
V F
F V
Tableau: 1.1 - Table de vérité des valeurs

En d'autres termes, P et Q ont toujours des valeurs de vérité contraires. Nous noterons ce genre d'énoncé "Q est
une négation de P" :

(1.3)

où le symbole est le "connecteur de négation".

Remarque: Les expressions doivent être des expressions bien formées (souvent abrégé "ebf"). Par définition,
toute variable est une expression bien formée, alors est une expression bien formée. Si P,Q sont des
expressions bien formées, alors est une expression bien formée (l'expression "je mens" n'est pas bien
formée car elle se contredit elle-même).
CONNECTEURS

Il y a d'autres types de connecteurs en logique :

Soit P et Q deux propriétés définies sur le même ensemble E. (lire "P ou Q") est une propriété sur
E définie par :

- est vraie si au moins l'une des propriétés P, Q est vraie

- est fausse sinon

Nous pouvons créer la table de vérité du "connecteur OU" ou "connecteur de disjonction" :

P Q
V V V
V F V
F V V
F F F
Tableau: 1.2 - Table de vérité de OU

Il est facile de se convaincre que, si les parties P, Q de E sont respectivement associées aux propriétés P, Q que
(cf. chapitre Théorie Des Ensembles) est associé à .

(1.4)

Le connecteur est associatif. Pour s'en convaincre, il suffit de faire une table vérité où nous vérifions que :

(1.5)

Il existe également le "connecteur ET" ou "connecteur de conjonction" pour quel que soient P, Q deux
propriétés définies sur E, est une propriété sur E définie par :

- est vraie si toutes les deux propriétés P, Q sont vraies

- est fausse sinon

Nous pouvons créer la table de vérité du connecteur :

P Q
V V V
V F F
F V F
F F F
Tableau: 1.3 - Table de vérité de ET
Il est également facile de se convaincre que, si les parties P, Q de E sont respectivement associées aux
propriétés P, Q que (cf. chapitre Théorie Des Ensembles) est associé à :

(1.6)

Le connecteur est associatif. Pour s'en convaincre, il suffit aussi de faire une table vérité où nous vérifions
que:

(1.7)

Les connecteurs sont distributifs l'un sur l'autre. A l'aide d'une simple table de vérité, nous prouvons que:

(1.8)

ainsi que:

(1.9)

Une négation de est une négation de est tel que pour résumer:

(1.10)

A nouveau, ces propriétés peuvent se démontrer par une simple table de vérité.

Remarque: Pour voir les détails de tous les opératures logiques, le lecteur devra se rendre dans le chapitre
d'Algèbre De Boole (cf. section d'Informatique Théorique) où l'identité, la double négation, l'idempotence,
l'associativité, la distributivité, les relations de De Morgan sont présentées plus formellement.

Revenons maintenant sur le "connecteur d'implication logique" appelé aussi parfois le "conditionnel" noté " "

Remarque: Dans certains ouvrages sur le calcul propositionnel, ce connecteur est noté " " et dans le cadre de
la théorie de la démonstration nous lui préférons souvent le symbole " ".

Soient P, Q deux propriétés sur E. est une propriété sur E définie par:

- est fausse si P est vraie et Q fausse

- est vraie sinon

En d'autres termes, P implique logiquement Q signifie que Q est vrai pour toute évaluation pour laquelle P est
vraie. L'implication représente donc le "si... alors.."

Si nous écrivons la table de vérité de l'implication (attention à l'avant dernière ligne !!!) :

P Q
V V V
V F F
F V V
F F V
Tableau: 1.4 - Table de vérité de l'implication

Si , nous pouvons dire que pour que Q soit vraie, il suffit que P soit vraie (effectivement l'implication
sera vraie si P est vraie ou fausse selon la table de vérité). Donc P est une condition suffisante de Q (mais non
nécessaire!). D'un autre côté, est équivalent à . Donc, si Q est fausse, il est impossible que
P soit vraie (pour que l'implication reste vraie bien sûr!). Donc finalement Q est une condition nécessaire de P.

Exemples:

E1. Soit la proposition : "Si tu obtiens ton diplôme, je t'achète un ordinateur"

Parmi tous les cas, un seul correspond à une promesse non tenue: celui où l'enfant à son diplôme, et n'a toujours
pas d'ordinateur (deuxième ligne dans le tableau).

Et le cas où il n'a pas le diplôme, mais reçoit quand même un ordinateur? Il est possible qu'il ait été longtemps
malade et a raté un semestre, et le père a le droit d'être bon.

Que signifie cette promesse, que nous écrirons aussi : "Tu as ton diplôme je t'achète un ordinateur" ?
Exactement ceci:

- Si tu as ton diplôme, c'est sûr, je t'achète un ordinateur (je ne peux pas ne pas l'acheter)

- Si tu n'as pas ton diplôme, je n'ai rien dit

E2. De toute proposition fausse nous pouvons déduire toute proposition (deux dernières lignes)

C'est un exemple plutôt anecdotique : dans un cours de Russell portant sur le fait que d'une proposition fausse,
toute proposition peut être déduite, un étudiant lui posa la question suivante :

- "Prétendez-vous que de 2 + 2 = 5, il s'ensuit que vous êtes le pape ? "

- "Oui", fit Russell

- "Et pourriez-vous le prouver !", demanda l'étudiant sceptique

- "Certainement", réplique Russell, qui proposa sur le champ la démonstration suivante.

(1) Supposons que 2 + 2 = 5

(2) Soustrayons 2 de chaque membre de l'égalité, nous obtenons 2 = 3

(3) Par symétrie, 3 = 2

(4) Soustrayant 1 de chaque côté, il vient 2 =1

Maintenant le pape et moi sommes deux. Puisque 2 = 1, le pape et moi sommes un. Par suite, je suis le pape.

Sur ce ...

Le connecteur d'implication est essentiel en mathématiques, philosophie, etc. C'est un des fondements de toute
démonstration, preuve ou déduction.

Le connecteur d'implication a comme propriétés (vérifiables à l'aide de la table de vérité ci-dessous) :


(1.11)

conséquence de la dernière propriété (à nouveau vérifiable par une table de vérité) :

(1.12)

Le "connecteur d'équivalence logique" ou "bi-conditionnel" noté " " ou " " signifiant par définition que :

(1.13)

en d'autres termes, la première expression a la même valeur pour toute évaluation de la deuxième.

Ce que nous pouvons vérifier à l'aide d'une table de vérité:

P Q
V V V V V
V F F V F
F V V F F
F F V V V
Tableau: 1.5 - Table de vérité de l'équivalence logique

signifie bien (lorsqu'il est vrai!) que "P et Q ont toujours la même valeur de vérité" ou encore "P et
Q sont équivalents". C'est vrai si P et Q ont même valeur, faux dans tout cas contraire.

Bien évidemment (c'est une tautologie) :

(1.14)

La relation équivaut donc à ce que P soit une condition nécessaire et suffisante de Q et à ce que Q soit
une condition nécessaire et suffisante de P.

La conclusion, est que les conditions de type "nécessaire, suffisant, nécessaire et suffisant" peuvent être
reformulés avec les termes "seulement si", "si", "si et seulement si".

Ainsi :

1. traduit le fait que Q est une condition nécessaire pour P ou dit autrement, P est vraie seulement si Q
est vraie (dans le table de vérité, lorsque prend la valeur 1 on constate bien que P vaut 1 seulement si Q
vaut 1 aussi). On dit aussi, si P est vraie alors Q est vraie.

2. ou ce qui reviens au même traduit le fait que Q est une condition suffisante pour P ou dit
autrement, P est vraie si Q est vraie (dans le table de vérité, lorsque prend la valeur 1 on constate bien
que P vaut 1 si Q vaut 1 aussi).

3. traduit le fait que Q est une condition nécessaire et suffisante pour P ou dit autrement, P est vraie si
et seulement si Q est vraie (dans le table de vérité, lorsque prend la valeur 1 on constate bien que P vaut
1 si Q vaut 1 et seulement si Q vaut 1).
Remarque: L'expression "si et seulement si" correspond donc à une équivalence logique et ne peut être utilisée
pour décrire un implication!!

La première étape du calcul propositionnel est donc la formalisation des énoncés du langage naturel. Pour
réaliser ce travail, le calcul propositionnel fournit finalement trois types d'outils :

1. Les "variables propositionnelles" (P, Q, R,...) symbolisent des propositions simples quelconques. Si la même
variable apparaît plusieurs fois, elle symbolise chaque fois la même proposition.

2. Les cinq opérateurs logiques :

3. Les signes de ponctuation se réduisent aux seules parenthèses ouvrante et fermante qui organisent la lecture
de manière à éviter toute ambiguïté.

Voici un tableau récapitulatif :

Description Symbole Utilisation


La "négation" est un opérateur qui ne porte que sur
une proposition, il est unaire ou monadique. "Il ne
pleut pas" s'écrit . Cet énoncé est vrai si et
seulement si P est faux (dans ce cas s'il est faux qu'il
pleut). L'usage classique de la négation est caractérisé
par la loi de double négation : est équivalent à P.
La "conjonction" ou "produit logique" est un opérateur
binaire, elle met en relation deux propositions. "Tout
homme est mortel ET Ma voiture perd de l'huile"
s'écrit . Cette dernière expression est vraie si
et seulement si P est vrai et Q est vrai.
La "disjonction" ou "somme logique" est, elle aussi,
un opérateur binaire. est vrai si et seulement si
P est vrai ou Q est vrai. Nous pouvons comprendre ce
OU de deux façons : soit de manière inclusive, soit de
manière exclusive. Dans le premier cas est
vrai si P est vrai, si Q est vrai ou si P et Q sont tous
deux vrais. Dans le second cas, est vrai si P
est vrai ou si Q est vrai mais pas si les deux le sont. La
disjonction du calcul propositionnel est le OU inclusif
et on donne au OU exclusif le nom "d'alternative".
"L'implication" est également un opérateur
binaire. Elle correspond, en gros, au schéma
linguistique "Si...alors...". "Si j'ai le temps, j'irai au
cinéma" s'écrit . est faux si P est vrai et
Q est faux. Si le conséquent (ici Q) est vrai,
l'implication est vraie. Lorsque l'antécédent
(ici P) est faux, l'implication est toujours vraie. Cette
dernière remarque peut être comprise si l'on se réfère à
des énoncés de type : "Si on pouvait mettre Paris en
bouteille, on utiliserait la tour Eiffel comme bouchon."
En résumé, une implication est fausse si et seulement
si son antécédent est vrai et son conséquent est faux.
La "bi-implication" est, elle aussi, binaire : elle
symbolise les expressions "... si et seulement si..." et
"... est équivalent à..." L'équivalence entre deux
propositions est vraie si celles-ci ont la même valeur
de vérité. La bi-implication exprime donc aussi une
forme d'identité et c'est pourquoi elle est souvent
utilisée dans les définitions.
Tableau: 1.6 - Récapitulatif des opérateurs

Il est possible d'établir des équivalences entre ces opérateurs. Nous avons déjà vu comment le bi-conditionnel
pouvait se définir comme un produit de conditionnels réciproques, voyons maintenant d'autres équivalences :

(1.15)

Remarque: Les opérateurs classiques peuvent donc être définis à l'aide de grâce aux lois
d'équivalence entre opérateurs.

Sont à noter également les deux relations de De Morgan (cf. chapitre d'Algèbre de Boole) :

(1.16)

Elles permettent de transformer la disjonction en conjonction et vice-versa :

(1.17)

PROCÉDURES DE DÉCISION

Nous avons introduit précédemment les éléments de base nous permettant d'opérer sur des expressions à partir
de propriétés (variables propositionnelles) sans toutefois dire grand chose quant à la manipulation de ces
expressions. Alors, il convient maintenant de savoir qu'en calcul propositionel qu'il existe deux manières
d'établir qu'une proposition est un loi de la logique propositionnelle. Nous pouvons soit :

1. Employer des procédures non axiomatisées

2. Recourir à des procédures axiomatiques et démonstratives

Remarque: Dans de nombreux ouvrages ces procédures sont présentées avant même la structure du langage
propositionnel. Nous avons choisi de faire le contraire pensent que l'approche serait plus aisée.

PROCÉDURES DE DÉCISIONS NON AXIOMATISÉES

Plusieurs de ces méthodes existent mais nous nous limiterons ici à la plus simple et à la plus parlante d'entre
elles, celle du calcul matriciel, souvent appelée aussi "méthodes des tables de vérité".
La procédure de construction est comme nous l'avons vu précédemment assez simple. Effectivement, la valeur
de vérité d'une expression complexe est fonction de la valeur vérité des énoncés plus simples qui la composent,
et finalement fonction de la valeur de vérité des variables propositionelles qui la composent. En envisageant
toutes les combinaisons possibles des valeurs de vérité des variables de propositionnelles, nous pouvons
déterminer les valeurs de vérité de l'expression complexe.

Les tables de vérité, comme nous l'avons vu, permettent donc de décider, à propos de toute proposition, si celle-
ci est une tautologie (toujours vraie), une contradiction (toujours fausse) ou une expression contingente (parfois
vraie, parfois fausse).

Nous pouvons ainsi distinguer quatre façons de combiner les variables propositionnelles, les paranthèses et les
connecteurs :

Nom Description Exemple


1 Enoncé mal formé Non-sens. Ni vrai, ni faux
2 Tautologie Enoncé toujours vrai
3 Contradiction Enoncé toujours faux

4 Enoncé contingent Enoncé parfois vrai, parfois faux


Tableau: 1.7 - Combinaison de variables propositionnelles

La méthode des tables de vérité permet de déterminer le type d'expression bien formée face auquel nous nous
trouvons. Elle n'exige en principe aucune invention, c'est une procédure mécanique. Les procédures
axiomatisées, en revanche, ne sont pas entièrement mécaniques. Inventer une démonstration dans le cadre d'un
système axiomatisé demande parfois de l'habilité, de l'habitude ou de la chance. Pour ce qui est des tables de
vérité, voici la marche à suivre :

Lorsqu'on se trouve face à un expression bien formée, ou fonction de vérité, nous commencons par déterminer à
combien de variables propositionnelles distinctes nous avons affaire. Ensuite, nous examinons les différents
arguments qui constituent cette expression. Nous construisons alors un tableau comprenant rangées (n étant
le nombre de variables) et un nombre de colonnes égal au nombre d'arguments plus des colonnes pour
l'expression elle-même et ses autres composantes. Nous attribuons alors aux variables les différentes
combinaisons de vérité et de fausseté qui peuvent leur être conférées (la vérité est exprimée dans la table par un
1 et la fausseté par un 0). Chacune des rangées correspond à un monde possible et la totalité des rangées
constitue l'ensemble des mondes possibles. Il existe, par exemple, un monde possible dans lequel P est une
proposition vraie tandis que Q est fausse.

PROCÉDURES DE DÉCISIONS AXIOMATISÉES

L'axiomatisation d'une théorie implique, outre la formalisation de celle-ci, que nous partions d'un nombre fini
d'axiomes et que, grâce à la transformation réglée de ces derniers, que nous puissions obtenir tous les théorèmes
de cette théorie. Nous pardons donc de quelques axiomes dont la vérité est posée (et non démontrée). Nous
déterminons des règles de déduction permettant de manipuler les axiomes ou toute expression obtenue à partir
de ceux-ci. L'enchaînement de ces déductions est une démonstration qui conduit à un théorème, à une loi.

Nous allons sommairement présenter deux systèmes axiomatiques, chacun étant constitué d'axiomes utilisant
deux règles dites "règles d'inférence" (règles intuitives) particulières :

1. Le "modus ponens" : si nous avons prouvé A et , alors nous pouvons déduire B. A est appelé la
"prémisse mineure" et la prémisse majeure de la règle du modus ponens.

Exemple: De et nous pouvons déduire


2. La "substitution" : nous pouvons dans un schéma d'axiome remplacer une lettre par une formule quelconque,
pourvue que toutes les lettres identiques soient remplacées par des formules identiques.

Donnons à titre d'exemple, deux systèmes axiomatiques : le système axiomatique de Whithead et Rusell, le
système axiomatique de Lukasiewicz.

1. Le système axiomatique de Whitehead et Russel adopte comme symboles primitifs et définit à


partir de ces derniers de la manière suivante (relations facilement vérifiables à l'aide de tables de vérité) :

(1.18)

nous avions déjà présenté plus haut quelque uns de ces éléments.

Ce système comprend cinq axiomes, assez évidents en soi plus les deux règles d'inférence. Les axiomes sont
donnés ici en utilisant des symboles non primitifs, comme le faisaient Whitehead et Russel :

A1.

A2.

A3.

A4.

A5.

Remarque: Ces cinq axiomes ne sont pas indépendants les uns des autres. Le quatrième peut être obtenu à partir
des quatre autres.

Exemple:

Pour prouver , nous pouvons procéder ainsi :

(1.19)
2. Le système axiomatique Lukasiewicz comprend les trois axiomes suivants, plus les deux règles d'inférences
(modus ponens et substitution):

A1.

A2.

A3.

Voici des preuves des deux premiers axiomes, dans le système de Whitehead et Russel. Ce sont les formules (6)
et (16) de la dérivation suivante :

(1.20)

Ces axiomatisations permettent de retrouver comme théorème toutes les tautologies ou lois de la logique
propositionnelle. De par tout ce qui a été dit jusqu'à maintenant, nous pouvons tenter de définir ce qu'est une
preuve.

Définition: Une suite finie de formules est appelée "preuve" à partir des hypothèses si
pour chaque i :

- est l'une des hypothèses


- ou est une variante d'un axiome
- ou est inférée (par application de la règle du modus ponens) à partir de la prémisse majeure et de la
prémisse mineure où
- ou est inférée (par application de la règle de substitution) à partir d'une prémisse antérieure , la variable
remplacée n'apparaissant pas dans

Une telle suite de formules, étant la formule finale de la suite, est appelée plus explicitement "preuve de "
à partir des hypothèses , ce que nous notons par :

(1.21)

Remarque: Il faut noter que lorsque nous essayons de prouver un résultat à partir d'un certain nombre
d'hypothèses, nous essayons pas de prouver les hypothèses elles-mêmes.

QUANTIFICATEURS

Nous devons compléter l'utilisation des connecteurs du calcul propositionnel par ce que nous appelons des
"quantificateurs" si nous souhaitons pouvoir résoudre certains problèmes. Effectivement, le calcul
propositionnel ne nous permet pas d'affirmer des choses générales sur les éléments d'un ensemble par exemple.
Dans ce sens, la logique propositionnelle ne reflète qu'une partie du raisonnement. Le "calcul des prédicats" au
contraire permet de manipuler formellement des affirmations telles que "il existe un x tel que [x a une voiture
américaine]" ou "pour tous les x [si x est une teckel, alors x est petit]"; en somme, nous étendons les formules
composées afin de pouvoir affirmer des quantifications existentielles ("il existe...") et des quantifications
universelles ("pour tout...."). Les exemples que nous venons de donner font intervenir des propositions un peu
particulières comme "x a une voiture américaine". Il s'agit ici de propositions comportant une variable. Ces
propositions sont en fait l'application d'une fonction à x. Cette fonction, c'est celle qui associe "x a une voiture
américaine" à x. Nous dénoterons cette fonction par "... a une voiture américaine" et nous dirons que c'est une
fonction propositionnelle, car c'est une fonction dont la valeur est une proposition. Ou encore un "prédicat".

Les quantificateurs existentiels et universels vont donc de pair avec l'emploi de fonctions propositionnelles. Le
calcul des prédicats est cependant limité dans les formules existentielles et universelles. Ainsi, nous nous
interdisons des formules comme "il existe une affirmation de x telle que...". En fait, nous ne nous autorisons à
quantifier que des "individus". C'est pour cela que la logique des prédicats est dite une "logique de premier
ordre".

Avant de passer à l'étude du calcul des prédicats nous devons définir :

D1. Le "quantificateur universel" : (pour tout)

D2. Le "quantificateur existentiel" : (il existe)

Remarque: Nous utilisons parfois le symbole pour dire brièvement : "il existe un et un seul":

(1.22)

Nous allons voir que la théorie de la démonstration et des ensembles est l'exacte transcription des principes et
résultats de la Logique (celle avec un "L" majuscule).
CALCUL DES PRÉDICATS

Dans un cours de mathématiques (d'algèbre, d'analyse, de géométrie, ...), nous démontrons les propriétés de
différents types d'objets (entiers, réels, matrices, suites, fonctions continues, courbes, ...). Pour pouvoir prouver
ces propriétés, il faut bien sûr que les objets sur lesquels nous travaillons soient clairement définis (qu'est-ce
qu'un entier, un réel, ...?).

En logique du premier ordre et, en particulier, en théorie de la démonstration, les objets que nous étudions sont
les formules et leurs démonstrations. Il faut donc donner une définition précise de ce que sont ces notions. Les
termes et les formules forment la grammaire d'une langue, simplifiée à l'extrême et calculée exactement pour
dire ce que nous voulons sans ambiguïté et sans détour inutile.

GRAMMAIRE

Définitions:

D1. Les "termes", désignent les objets dont nous voulons prouver des propriétés (nous reviendrons un peu plus
loin beaucoup plus en détail sur ces derniers) :

- En algèbre, les termes désignent les éléments d'un groupe (ou anneau, corps, espace vectoriel, etc.). Nous
manipulons aussi des ensembles d'objets (sous-groupe, sous-espace vectoriel, etc). Les termes qui désignent ces
objets, d'un autre type, seront appelés "termes du second ordre".

- En analyse, les termes désignent les réels ou (par exemple, si nous nous plaçons dans des espaces
fonctionnels) des fonctions.

D2. Les "formules", représentent les propriétés des objets que nous étudions (nous reviendrons également
beaucoup plus en détail sur ces dernières) :

- En algèbre, nous pourrons écrire des formules pour exprimer que deux éléments commutent, qu'un sous-
espace vectoriel est de dimension 3, etc.

- En analyse, nous écrirons des formules pour exprimer la continuité d'une fonction, la convergence d'une suite,
etc.

- En théorie des ensembles, les formules pourront exprimer l'inclusion de deux ensembles, l'appartenance d'un
élément à un ensemble,...

D3. Les "démonstrations", elles permettent d'établir qu'une formule est vraie. Le sens précis de ce mot aura lui
aussi besoin d'être défini. Plus exactement, elles sont des déductions sous hypothèses, elles permettent de
"mener du vrai au vrai", la question de la vérité de la conclusion étant alors renvoyée à celle des hypothèses,
laquelle ne regarde pas la logique mais repose sur la connaissance que nous avons des choses dont nous
parlons.

LANGAGES

En mathématique, nous utilisons, suivant le domaine, différents langages qui se distinguent par les symboles
utilisés. La définition ci-dessous exprime simplement qu'il suffit de donner la liste de ces symboles pour
préciser le langage.

Définition: Un "langage" est la donnée d'une famille (pas nécessairement finie) de symboles. Nous en
distinguons trois sortes : symboles, termes et formules.
Remarques:

R1. Nous utilisons quelques fois le mot "vocabulaire" ou le mot "signature" à la place du mot "langage".

R2. Le mot "prédicat" peut être utilisé à la place du mot "relation". Nous parlons alors de "calcul des prédicats"
au lieu de "logique du premier ordre" (ce que nous avons étudié précédemment).

SYMBOLES

Il existe différents types de symboles que nous allons tâcher de définir :

D1. Les "symboles de constante" (voir remarque plus bas)

Exemple:

Le n pour l'élément neutre en théorie des ensembles (cf. chapitre de Théorie Des Ensembles)

D2. Les "symboles de fonction" ou "foncteurs" . A chaque symbole de fonction est associé un entier strictement
positif que nous appelons son "arité" : c'est le nombre d'arguments de la fonction. Si l'arité est 1 (resp. 2, ...,n),
nous disons que la fonction est unaire (resp. binaire, ..., n-aire)

Exemple:

Le foncteur binaire de multiplication * dans les groupes (cf. chapitre de Théorie Des Ensembles).

D3. Les "symboles de relation". De la même manière, à chaque symbole de relation est associé un entier positif
ou nul (son arité) qui correspond à son nombre d'arguments et nous parlons de relation unaire, binaire, n-aire
(comme par exemple le symbole de relation "=").

D4. Les "variables individuelles". Dans toute la suite, nous nous donnerons un ensemble infini V de variables.
Les variables seront notées comme il l'est par tradition : x, y, z (éventuellement indexées: ).

D5. A cela il faut rajouter les connecteurs et quantificateurs que nous avons longuement présenté plus haut et
sur lesquels il est pour l'instant inutile de revenir.

Remarques:

R1. Un symbole de constante peut être vu comme un symbole de fonction à 0 argument (d'arité nulle).

R2. Nous considèrons (sauf mention contraire) que chaque langage contient le symbole de relation binaire =
(lire "égal") et le symbole de relation à zéro argument dénoté (lire "bottom" ou "absurde") qui représente le
faux. Dans la description d'un langage, nous omettrons donc souvent de les mentionner. Le symbole est
souvent redondant. Nous pouvons en effet, sans l'utiliser, écrire une formule qui est toujours fausse. Il permet
cependant de représenter le faux d'une manière canonique et donc d'écrire des règles de démonstration
générales.

R3. Le rôle des fonctions et des relations est très différent. Comme nous le verrons plus loin, les symboles de
fonction sont utilisés pour construire les termes (les objets du langage) et les symboles de relation pour
construire les formules (les propriétés de ces objets).
TERMES

Les termes (nous disons aussi "termes du premier ordre") représentent les objets associés au langage.

Définitions:

Soit un langage :

D1. L'ensemble des termes sur est le plus petit ensemble contenant les variables, les constantes et stable
(on ne sort pas de l'ensemble) par l'application des symboles de fonction de à des termes.

D2. Un "terme clos" est un terme qui ne contient pas de variables (donc par extension, seulement des
constantes).

D3. Pour obtenir une définition plus formelle, nous pouvons écrire :

(1.23)

où t est une variable ou un symbole de constante et, pour tout :

(1.24)

où f est une fonction d'arité n (rappelons que l'arité est le nombre d'arguments de la fonction). Ainsi, pour
chaque arité, il y a un degré d'ensemble de termes. Nous avons finalement :

(1.25)

D4. Nous appellerons "hauteur" d'un terme t le plus petit k tel que

Remarques :

R1. la définition D4 signifie que les variables et les constantes sont des termes et que si f est un symbole de
fonction n-aire et sont des termes alors est un terme en soi aussi. L'ensemble des termes
est défini par la grammaire:

(1.26)

Cette expression se lit de la manière suivante : un élément de l'ensemble que nous sommes en train de
définir est soit un élément de V (variables), soit un élément de (l'ensemble des symboles de constantes), soit
l'application d'un symbole de fonction à n éléments (constantes ou variables) de .

Attention : le fait que f soit de la bonne arité est seulement implicite dans cette notation. De plus, l'écriture
ne signifie pas que tous les arguments d'une fonction sont identiques mais simplement que ces
arguments sont des éléments de .

R2. Il est souvent commode de voir un terme (expression) comme un arbre dont chaque noeud est étiqueté par
un symbole de fonction (opérateur ou fonction) et chaque feuille par une variable ou une constante.

Dans la suite, nous allons sans cesse définir des notions (ou prouver des résultats) "par récurrence" sur la
structure ou la taille d'un terme.
Définitions:

D1. Pour prouver une propriété P sur les termes, il suffit de prouver P pour les variables et les constantes et de
prouver à partir de . Nous faisons ainsi ici une "preuve par induction sur la
"hauteur"" d'un terme. C'est une technique que nous retrouverons dans les chapitres suivants.

D2. Pour définir une fonction sur les termes, il suffit de la définir sur les variables et les constantes et de dire
comment nous obtenons à partir de . Nous faisons ici encore une "définition par
induction sur la hauteur d'un terme".

Exemple:

La taille (nous disons aussi la "longueur") d'un terme t (notée ) est le nombre de symboles de fonction
apparaissant dans t. Formellement:

- si x est une variable et c est une constante

Remarque: La preuve par induction sur la hauteur d'un terme sera souvent insuffisante. Nous pourrons alors
prouver une propriété P sur les termes en supposant la propriété vraie pour tous les termes de taille et en
la démontrant ensuite pour les termes de taille n. Il s'agira alors d'une "preuve par récurrence sur la taille du
terme" (voir de tels exemples dans le chapitre de Théorie Des Nombres).

FORMULES

Les formules sont construites à partir de "formules atomiques" en utilisant des connecteurs et des
quantificateurs. Nous utiliserons les connecteurs et les quantificateurs suivants (qui nous sont déjà connus) :

- connecteur unaire de négation :

- connecteurs binaires de conjonction et disjonction ainsi que d'implication : , ,

- quantificateurs : qui se lit "il existe" et qui se lit "pour tout"

Cette notation des connecteurs est standard (elle devrait du moins). Elle est utilisée pour éviter les confusions
entre les formules et le langage courant (le métalangage).

Définitions:

D1. Soit un langage, les "formules atomiques" de sont les formules de la forme où R est un
symbole de relation n-aire de et sont des termes de . Nous notons "Atom" l'ensemble des formules
atomiques. Si nous notons l'ensemble des symboles de relation, nous pouvons écrire l'ensemble des termes
mis en relations par l'expression :

(1.27)

L'ensemble F des formules de la logique du premier ordre de est donc défini par la grammaire (où x est une
variable) :
(1.28)

où il faut lire : l'ensemble des formules est le plus petit ensemble contenant les formules et tel que si et
sont des formules alors , etc. sont des formules et qu'elles peuvent être en relation entre elles.

Exemple:

Les symboles de relation du langage propositionnel sont des relations d'arité 0 (même le symbole "=" est
absent), les quantificateurs sont alors inutiles (puisqu'une formule propositionnelle ne peut pas contenir des
variables). Nous obtenons alors le calcul propositionnel défini par :

(1.29)

Remarquons la présence du symbole "botton" signifiant le "faux" que nous n'avions pas mentionné lors de notre
étude de la logique propositionnelle.

Nous ferons attention à ne pas confondre termes et formules. est un terme (fonction), est une
formule. Mais n'est rien : nous ne pouvons, en effet, mettre un connecteur entre un terme et une
formule (aucun sens).

Remarques:

R1. Pour définir une fonction sur les formules, il suffit de définir sur les formules atomiques.

R2. Pour prouver une propriété P sur les formules, il suffit de prouver P pour les formules atomiques.

R3. Pour prouver une propriété P sur les formules, il suffit de supposer la propriété vraie pour toutes les
formules de taille et de la démontrer pour les formules de taille n.

D2. Une "sous-formule" d'une formule (ou expression) F est l'un de ses composants, in extenso une formule à
partir de laquelle F est construite. Formellement, nous définissons l'ensemble SF(F) des sous-formules F par:

- Si F est atomique:

- Si (soit une composition!) avec

- Si ou avec

D3. Une formule F de n'utilise qu'un nombre fini de symboles de . Ce sous-ensemble est appelé le
"langage de la formule" et noté .

D4. La "taille (ou la longueur) d'une formule" F (notée ) est le nombre de connecteurs ou de
quantificateurs apparaissant dans F. Formellement :

- si F est une formule atomique

- où

- avec
D5. "L'opérateur principal" (nous disons aussi le "connecteur principal") d'une formule est défini par :

- Si A est atomique, alors elle n'a pas d'opérateur principal

- Si , alors est l'opérateur principal de A

- Si où , alors est l'opérateur principal de A

- Si où , alors est l'opérateur principal de A

D6. Soit F une formule. L'ensemble des variables libres de F et l'ensemble des variables muettes
(ou liées) de F sont définis par récurrence sur .

Une occurrence d'une variable donnée est dite "variable liée" ou "variable muette" dans une formule F si dans
cette même formule, un quantificateur y fait référence. Dans le cas contraire, nous disons avoir une "variable
libre".

Remarque: Une occurrence d'une variable x dans une formule F est une position de cette variable dans la
formule F. Ne pas confondre avec l'objet qu'est la variable elle-même.

Pour préciser les variables libres possibles d'une formule F, nous noterons . Cela signifie que les
variables libres de F sont parmi in extenso si y est libre dans F, alors y est l'un des mais les
n'apparaissent pas nécessairement dans F.

Nous pouvons définir les variables muettes ou libre de manière plus formelle :

1. Si est atomique alors est l'ensemble des variables libres apparaissant dans les et nous
avons alors pour les variables muettes

2. Si où : alors

3. si alors et

4. si avec et

Exemples:

E1. Soit F : alors et

E2. Soit G : alors et

D7. Nous disons que les formules F et G sont " -équivalentes" si elles sont (syntaxiquement) identiques à un
renommage près des occurrences liées des variables.

D8. Une "formule close" est une formule sans variables libres.

D9. Soit F une formule, x une variable et t un terme. est la formule obtenue en remplaçant dans F
toutes les occurrences libres de x par t, après renommage éventuel des occurrences liées de F qui apparaissent
libres dans t.
Remarques:

R1. Nous noterons dans les exemples vus qu'une variable peut avoir à la fois des occurrences libres et des
occurrences liées. Nous n'avons donc pas toujours

R2. Nous ne pouvons pas renommer y en x dans la formule et obtenir la formule


: la variable x serait "capturée". Nous ne pouvons donc pas renommer des variables liées sans
précautions : il faut éviter de capturer des occurrences libres.

DÉMONSTRATIONS

Les démonstrations que l'on trouve dans les ouvrages de mathématiques sont des assemblages de symboles
mathématiques et de phrases contenant des mots clés tels que: "donc", "parce que", "si", "si et seulement si", "il
est nécessaire que", "il suffit de", "prenons un x tel que", "supposons que", "cherchons une contradiction", etc.
Ces mots sont supposés être compris par tous de la même manière, ce qui n'est en fait, pas toujours le cas.

Dans tout ouvrage, le but d'une démonstration est de convaincre le lecteur de la vérité de l'énoncé. Suivant le
niveau du lecteur, cette démonstration sera plus ou moins détaillée : quelque chose qui pourra être considéré
comme évident dans un cours de licence pourrait ne pas l'être dans un cours de niveau inférieur.

Dans un devoir, le correcteur sait que le résultat demandé à l'étudiant est vrai et il en connaît la démonstration.
L'étudiant doit démontrer (correctement) le résultat demandé. Le niveau de détail qu'il doit donner dépend donc
de la confiance qu'aura le correcteur : dans une bonne copie, une "preuve par une récurrence évidente" passera
bien, alors que dans une copie où il y eu auparavant un "évident", qui était évidemment... faux, ça ne passera
pas!

Pour pouvoir gérer convenablement le niveau de détail, il faut savoir ce qu'est une démonstration complète. Ce
travail de formalisation a été fait qu'au début de 20ème siècle!!

Plusieurs choses peuvent paraître surprenantes:

- il n'y a qu'un nombre fini de règles: deux pour chacun des connecteurs (et l'égalité) plus trois règles générales.
Il n'était pas du tout évident à piori qu'un nombre fini de règles soit suffisant pour démontrer tout ce qui est vrai.
Nous montrerons ce résultat (c'est essentiellement, le théorème de complétude). La preuve n'en est pas du tout
triviale.

- ce sont les mêmes règles pour toutes les mathématiques et la physique: algèbre, analyse, géométrie, etc. Cela
veut dire que nous avons réussi à isoler tout ce qui est général dans un raisonnement. Nous verrons plus loin
qu'une démonstration est un assemblage de couples, où est un ensemble de formules (les hypothèses) et A
une formule (la conclusion). Quand nous faisons de l'arithmétique, de la géométrie ou de l'analyse réelle, nous
utilisons, en plus des règles, des hypothèses que l'on appelle des "axiomes". Ceux-ci expriment les propriétés
particulières des objets que nous manipulons (pour plus de détails sur les axiomes voir la page d'introduction du
site).

Nous démontrons donc, en général, des formules en utilisant un ensemble d'hypothèses, et cet ensemble peut
varier au cours de la démonstration: quand nous disons "supposons F et montrons G", F est alors une nouvelle
hypothèse que nous pourrons utiliser pour montrer G. Pour formaliser cela, nous introduisons le concept de
"séquent":

Définitions:

D1. Un "séquent" est un couple (noté ) où :

- est un ensemble fini de formules qui représente les hypothèses que nous pouvons utiliser. Cet ensemble
s'appelle aussi le "contexte du séquent".
- F est une formule. C'est la formule que nous voulons montrer. Nous dirons que cette formule est la
"conclusion du séquent".

Remarques:

R1. Si nous pourrons noter au lieu de . Le signe se lit "thèse" ou


"démontre".

R2. Nous noterons un séquent dont l'ensemble d'hypothèses est vide et un séquent dont

l'ensemble d'hypothèses est .

R3. Nous noterons que dans le séquent la formule A peut-être dans (elle devient alors un
hypothèse).

R4. Nous écrirons pour dire que " est non prouvable".

D2. Un séquent est "prouvable" (ou démontrable, dérivable) s'il peut être obtenu par une application
finie de règles. Une formule F est prouvable si le séquent est prouvable.

RÈGLES DE DÉMONSTRATION

Les règles de démonstration sont les briques qui permettent de construire les dérivations. Une dérivation
formelle est un assemblage fini (et correct!) de règles. Cet assemblage n'est pas linéaire (ce n'est pas une suite)
mais un "arbre". Nous sommes en effet souvent amenés à faire des branchements.

Nous allons présenter un choix de règles. Nous aurions pu en présenter d'autres (à la place ou en plus) qui
donneraient la même notion de prouvabilité. Celles que l'on a choisies sont "naturelles" et correspondent aux
raisonnements que l'on fait habituellement en mathématique. Dans la pratique courante nous utilisons, en plus
des règles ci-dessous, beaucoup d'autres règles mais celles-ci peuvent se déduire des précédentes. Nous les
appellerons "règles dérivées".

Il est de tradition d'écrire la racine de l'arbre (le séquent conclusion) en bas, les feuilles en haut: la nature est
ainsi faite... Comme il est également de tradition d'écrire, sur une feuille de papier, de haut en bas, il ne serait
pas déraisonnable d'écrire la racine en haut et les feuilles en bas. Il faut faire un choix !

Une règle se compose:

- d'un ensemble de "prémisses": chacune d'elles est un séquent. Il peut y en avoir zéro, un ou plusieurs

- du séquent conclusion de la règle

- d'une barre horizontale séparant les prémisses (en haut) de la conclusion (en bas). Sur la droit de la barre, nous
indiquerons le nom de la règle.

Exemple:

(1.30)

Cette règle à deux prémisses ( et ) et une conclusion ( ). Le nom abrégé de cette règle
est .
Cette règle peut se lire de deux manières :

- de bas en haut: si nous voulons prouver la conclusion, il suffit par utilisation de la règle de prouver les
prémisses. C'est ce qu'on fait quand nous cherchons une démonstration. Cela correspond à "l'analyse".

- de haut en bas: si nous avons prouvé les prémisses, alors nous avons aussi prouvé la conclusion. C'est ce que
nous faisons fait quand nous rédigons une démonstration. Cela correspond à la "synthèse".

Pour les démonstrations il existe un nombre fini de règles au nombre de 17 que nous allons définir ci-après:

1. Axiome:

(1.31)

De bas en haut : si la conclusion du séquent est une des hypothèses, alors le séquent est prouvable.

2. Affaiblissement:

(1.32)

Explications :

- De haut en bas : si nous démontrons A sous les hypothèses , en ajoutant d'autres hypothèses on peut encore
démontrer A.

- De bas en haut : il y a des hypothèses qui peuvent ne pas servir

3. Introduction de l'implication:

(1.33)

- De bas en haut: pour montre que nous supposons A (c'est-à-dire que nous l'ajoutons aux hypothèses)
et nous démontrons B.

4. Elimination de l'implication:

(1.34)

- De bas en haut : pour démontrer B, si nous connaissons un théorème de la forme et si nous pouvons
démontrer le lemme , il suffit de démontrer A.

5. Introduction à la conjonction:

(1.35)

- De bas en haut : pour montrer , il suffit de montrer A et de montrer B.


6. Elimination de la conjonction:

(1.36) et (1.37)

- De haut en bas: de , nous pouvons déduire A (élimination gauche) et B (élimination droite).

7. Introduction de la disjonction:

(1.38) ou (1.39)

- De bas en haut: pour démontrer , il suffit de démontrer A (disjonction gauche) ou de démontrer B


(disjonction droite).

8. Elimination de la disjonction:

(1.40)

- De bas en haut : si nous voulons montrer C et que nous savons que nous avons , il suffit de le montrer
d'une part en supposant A, d'autre part en supposant B. C'est un raisonnement par cas.

9. Introduction de la négation:

(1.41)

- De bas en haut: pour montrer , nous supposons A et nous démontrons l'absurde ( ).

10. Elimination de la négation:

(1.42)

- De haut en bas : si nous avons montré et A, alors nous avons montré l'absurde ( )

11. Absurdité classique:

(1.43)

- De bas en haut: pour démontrer A, il suffit de démontrer l'absurde en supposant .

Cette règle, est équivalente à dire : A est vraie si et seulement si il est faux que A soit fausse. Cette règle ne va
pas de soi : elle est nécessaire pour prouver certains résultats (il y a des résultats que nous ne pouvons pas
prouver si nous n'avons pas cette règle). Contrairement, à beaucoup d'autres, cette règle peut par ailleurs être
appliquée à tout moment. Nous pouvons, en effet, toujours dire : pour prouver A je suppose et je vais
chercher une contradiction.
12. Introduction au quantificateur universel:

(1.44)

- De bas en haut: pour démontrer , il suffit de montrer A en ne faisant aucune hypothèse sur x.

Remarque: pour des démonstrations cette vérification (aucune hypothèse sur x) est souvent source d'erreur.

13. Elimination du quantificateur universel:

(1.45)

- De haut en bas: de , nous pouvons déduire pour n'import quel terme t. Ce que nous pouvons
dire aussi sous la forme: si nous avons prouvé A pour tout x, alors nous pouvons utiliser A avec n'importe quel
objet t (!!).

14. Introduction du quantificateur existentiel:

(1.46)

- De bas en haut: pour démontrer , il suffit de trouver un objet (in extenso un terme t) pour lequel nous
savons montrer .

15. Elimination du quantificateur existentiel:

(1.47)

- De bas en haut: nous démontrons qu'il existe bien un ensemble d'hypothèses tel que et partant de ce
résultat comme nouvelle hypothèse, nous démontrons C. Cette formule C hérite alors de la formule et dès
lors x n'est pas libre dans C car il ne l'était déjà pas dans .

16. Introduction de l'égalité: (1.48)

De bas en haut: nous pouvons toujours montrer t=t. Cette règle signifie que l'égalité est réflexive (cf. chapitre
Opérateurs).

17. Elimination de l'égalité:

(1.49)

- De haut en bas: si nous avons démontré et t=u, alors nous avons démontré . Cette règle
exprime que les objets égaux ont les mêmes propriétés. Nous noterons cependant que les formules (ou
relations) t=u et u=t ne sont pas, formellement, identiques. Il nous faudra démontrer que l'égalité est symétrique
(nous en profiterons aussi pour démontrer que l'égalité est transitive).
Exemples:

E1. Cet exemple montre que l'égalité est symétrique (un petit peu non trivial mais bon pour commencer) :

(1.50)

- De haut en bas: nous introduisons l'égalité et prouvons à partir de l'hypothèse la formule . En


même temps, nous définissons l'axiome comme quoi . Ensuite à partir de ces prémisses, nous éliminons
l'égalité en substituant les termes de façon à ce que à partir de la supposition (venant de l'axiome)
nous obtenions . Ensuite, l'élimination de l'égalité implique automatiquement sans aucune hypothèse que
. Dès lors, il nous suffit d'introduire le quantificateur universel pour chacune des variables
(donc deux fois) sans aucune hypothèse afin d'obtenir que l'égalité est symétrique.

E2. Cet exemple montre que l'égalité est transitive (c'est-à-dire si et alors ) . En notant F
la formule :

(1.51)

Que faisons, nous ici ? Nous introduisons d'abord la formule F deux fois en tant qu'axiome afin de la
décortiquer plus tard à gauche et à droite (nous n'introduisons pas l'égalité supposée déjà introduite en tant que
règle). Une fois ceci fait, nous éliminons à gauche et à droite la conjonction sur la formule pour travailler sur les
termes gauches et droites seuls et introduisons l'égalité sur les deux termes ce qui fait qu'à partir de la formule
nous avons l'égalité transitive. Il s'ensuit que sans aucune hypothèse cela implique automatiquement que
l'égalité est transitive et finalement nous disons que ceci est valable pour tout valeur des différentes variables (si
la formule est vraie, alors l'égalité est transitive).

E3. L'objectif sera de démontrer que toute involution est une bijection (cf. chapitre de Théorie Des Ensembles).
Soit f un symbole de fonction unaire (à une variable), nous notons (pour plus de détails voir le chapitre de
Théorie Des Ensembles) :

- la formule: (1.52)

qui signifie que f est injective.

- la formule: (1.53)

qui signifie que f est surjective


- la formule: (1.54)

qui signifie que f est bijective.

- la formule: (1.55)

qui signifie que f est une involution (nous notons également cela c'est-à-dire que la composition de f
est l'identité).

Nous aimerions savoir si : (1.56)

Nous allons présenter (en essayant que ce soit au plus clair) cette démonstration de quatre manières différentes :
classique (informelle), classique (pseudo-formelle) et formelle en arbre et formelle en ligne.

Méthode classique :

Nous devons montrer que si f est involutive alors elle est donc bijective. Nous avons donc deux choses à
montrer (et les deux doivent être satisfaites en même temps) : que la fonction est injective et surjective.

1. Montrons que l'involution est injective. Nous supposons pour cela, puisque f est involutive elle est donc
injective, tel que :

(1.57)

implique:

(1.58)

Or, cette supposition découle automatiquement de la définition de l'involution que:

(1.59)

et de l'application de f à la relation : (1.60)

(soit trois égalités) tel que: (1.61)

nous avons donc: (1.62)

2. Montrons que l'involution est surjective : si elle est surjective, alors nous devons avoir:

(1.63)

Or, définissons la variable x par définition de l'involution elle-même:

(1.64)

(puisque ...) un changement de variables après nous obtenons:

(1.65)

et donc la surjectivité est assurée.


Méthode pseudo-formelle :

Nous reprenons la même chose et nous y injectons les règles de la théorie de la démonstration :

Nous devons montrer que f involutive est donc bijective. Nous avons donc deux choses à montrer (et les
deux doivent être satisfaites en même temps) : que la fonction est injective et surjective:

(1.66)

1. Montrons d'abord que l'involution est injective. Nous supposons pour cela, puisque f est involutive et donc
injective, que:

(1.67)

implique: (1.68)

Or, cette supposition découle automatiquement de la définition de l'involution que:

(1.69)

et de l'application de f à la relation: (1.70)

(soit trois égalités ) tel que:

(1.71)

nous avons donc:

(1.72)

2. Montrons que l'involution est surjective. Si elle est surjective, alors nous devons avoir:

(1.73)

Or, définissons la variable x par définition de l'involution elle-même:

(1.74)

(puisque ...) un changement de variables après nous obtenons:

(1.75)

et donc: (1.76)

la surjectivité est assurée.


Méthode formelle en arbre :

Faisons cela avec la méthode graphique que nous avons déjà présentée plus haut.

1. Montrons que l'involution est injective :

Pour cela, d'abord montrons que

(1.77)

Remarque: Cette dernière relation est abrégée et appelée (comme d'autres existantes) "règle dérivée" car c'est
un raisonnement qui est très souvent fait lors de démonstrations et un peu long à développer à chaque fois...

Dès lors :

(1.78)

2. Montrons que l'involution est surjective :

(1.79)

Il s'ensuit :

(1.80)

Méthode formelle en ligne :


Nous pouvons faire la même chose sous une forme un peu moins... large... et plus tabulée... (cela n'en est pas
moins indigeste) :

(1.81)
2. NOMBRES

L a base des mathématiques, mis à part le raisonnement (cf. chapitre Théorie De La Démonstration), est sans
nul doute pour le commun des personnes l'arithmétique. Il est donc obligatoire que nous y fassions étape pour
étudier sa provenance, quelques unes de ses propriétés et conséquences.

Les nombres, comme les figures géométriques, constituent les bases de l'arithmétique. Ce sont aussi les bases
historiques car les mathématiques ont certainement commencé par l'étude de ces objets, mais aussi les bases
pédagogiques, car c'est en apprenant à compter que nous entrons dans le monde des mathématiques.

L'histoire des nombres, appelés également parfois "scalaires", est beaucoup trop longue pour être relatée ici,
mais nous ne pouvons que vous conseiller un des meilleurs ouvrages francophones sur le sujet : Histoire
Universelle des chiffres (~2'000 pages), Georges Ifrah, ISBN: 2221057791.

Cependant voici une petite bride de cette dernière qui nous semble fondamentale:

Notre système décimal actuel, de base 10, utilise les chiffres de 0 à 9, dits "chiffres arabes", mais au fait
d'origine indienne (hindous). Effectivement, les chiffres arabes (d'origine indienne...) sont différents :

Tableau: 2.1 - Chiffres arabes

Il faut lire dans ce tableau: 0 "zéro", 1 "un", 2 "deux", 3 "trois", 4 "quatre", 5 "cinq", 6 "six", 7 "sept", 8 "huit",
9 "neuf". Ce système est beaucoup plus efficace que les chiffres romains (essayez de faire un calcul avec le
système de notation romain vous allez voir...).

Ces chiffres ne furent introduits en Europe que vers l'an 1000. Utilisés en Inde, ils furent transmis par les
Arabes au monde occidental par le pape Gerbert d'Aurillac lors de son séjour en Andalousie à la fin du 9ème
siècle.

Remarque: Le mot français "chiffre" est une déformation du mot arabe "sifr" désignant "zéro". En italien,
"zéro" se dit "zero", et serait une contraction de "zefiro", on voit là encore la racine arabe. Ainsi nos termes
"chiffre" et "zéro" ont la même origine.

L'usage précoce d'un symbole numérique désignant "rien", au sens de "aucune quantité" ou "absence de
quantité", c'est à dire notre zéro, provient du fait que les Indiens utilisèrent un système dit "système
positionnel". Dans un tel système, la position d'un chiffre dans l'écriture d'un nombre exprime la puissance de
10 et le nombre de fois qu'elle intervient.

L'absence d'une puissance est notée par un petit rond... : c'est le zéro. Notre système actuel est donc le "système
décimal et positionnel".

Exemple : Description du système décimal et positionnel :

(2.1)
Le nombre 324 s'écrit de gauche à droite comme étant trois centaines : 3 fois 100, deux dizaines : 2 fois 10 et
quatre unités : 4 fois 1.

Remarques:

R1. Attention!! Nous différencions un chiffre d'un nombre... Le nombre est composé de chiffres et non
inversement. Par ailleurs, nous différencions la partie entière de la partie décimale du nombre.

R2. Un "nombre décimal" est un nombre qui a une écriture finie en base 10.

Nous voyons parfois (et c'est conseillé) un séparateur de milliers représenté par une apostrophe ' en Suisse (posé
tous les trois chiffres à partir du premier en partant de la droite pour les nombres entier). Ainsi, nous écrirons
1'034 au lieu de 1034 ou encore 1'344'567'569 au lieu de 1344567569. Les séparateurs de milliers permettent de
rapidement quantifier l'ordre de grandeur des nombres lus.

Ainsi:

- Si nous voyons uniquement une apostrophe nous saurons que le nombre est de l'ordre du millier
- Si nous voyons voit deux apostrophes nous saurons que le nombre est de l'ordre du million
- Si nous voyons trois apostrophes nous saurons que le nombre est de l'ordre du milliard

et ainsi de suite...

Au fait, tout nombre entier, autre que l'unité, peut être pris pour base d'un système de numérotation. Nous avons
ainsi les systèmes de numérotation binaire, ternaire, quaternaire,..., décimal, duodécimal qui correspondent
respectivement aux bases deux, trois quatre,..., dix, douze.

Une généralisation de ce qui a été vu précédemment, peut s'écrire sous la forme suivante :

Tout nombre entier positif peut être représenté dans une base b sous forme de somme, où les coefficients
sont multipliés chacun par leur poids respectif . Tel que :

(2.2)

Plus élégamment écrit : (2.3)

avec et .

Remarques:

R1. Comme très fréquemment en mathématique, nous remplacerons l'écriture des chiffres ou des nombres par
des lettres latines ou grecques afin de généraliser leur représentation. Ainsi, lorsque nous parlons d'une base b la
valeur b peut prendre n'importe quelle valeur entière 1, 2, 3, ...

R2. Lorsque nous prenons la valeur 2 pour b, N aura pour valeur maximale . Les nombres qui s'écrivent
sous cette forme s'appellent les "nombres de Mersenne". Ces nombres ne peuvent être premiers (voir plus bas
ce qu'est un nombre premier) que si n est premier.

Effectivement, si nous prenons (par exemples) et la plus grande valeur que nous pourrons avoir
sera alors :

(2.4)
R3. Lorsque qu'un nombre est le même lu de gauche à droite ou de droite à gauche, nous parlons de "nombre
palindrome".

BASES NUMÉRIQUES

Pour écrire un nombre dans un système de base b, nous devons commencer par adopter b caractères destinés à
représenter les b premiers nombres {0, 1, 2, 3, 4, 5, 6, 7, 9}. Ces caractères sont comme nous les avons déjà
définis, les "chiffres" que nous énonçons comme à l'ordinaire.

Pour la numérotation écrite, nous faisons cette convention, qu'un chiffre, placé à gauche d'un autre représente
des unités de l'ordre immédiatement supérieur, ou b fois plus grandes. Pour tenir la place des unités qui peuvent
manquer dans certains ordres, nous nous servons du zéro (0) et par suite, le nombre de chiffres employés peut
varier.

Définition: Pour la numérotation parlée, nous convenons d'appeler "unité simple", "dizaine", "centaine",
"millier", etc., les unités du premier ordre, du second, du troisième, du quatrième, etc. Ainsi les nombres 10, 11,
..., 19 se liront de même dans tous les systèmes de numérotation. les nombres 1a, 1b, a0, b0, ... se liront dix-a,
dix-bé, a-dix, bé-dix, etc. Ainsi, le nombre 5b6a71c se lira :

cinq millions bé-cent soixant-a mille sept cent dix-cé

Cet exemple est pertinent car il nous montre l'expression générale de la langue parlée que nous utilisons
quotidiennement et intuitivement en base dix (faute à notre éducation).

Remarques:

R1. Les règles des opérations définies pour les nombres écrits dans le système décimal sont les mêmes pour les
nombres écrits dans un système quelconque de numérotation.

R2. Pour opérer rapidement dans un système quelconque de numérotation, il est indispensable de savoir par
coeur toutes les sommes et tous les produits de deux nombres d'un seul chiffre.

R3. Le fait que la base décimale ait été choisie est semblerait t'il due au fait que l'humain a dix doigts.

Voyons comment nous convertissons un système de numérotation dans un ordre:

Exemple :

En base dix nous savons que 142'713 s'écrit:

(2.5)

En base deux (base binaire) le nombre 0110 s'écrirait en base 10:

(2.6)

et ainsi de suite...

L'inverse (pour l'exemple de la base deux) est toujours un peu plus délicat. Par exemple la conversion du
nombre décimal 1'492 en base deux se fait par divisions successives par 2 des restes et donne (le principe est à
peu près identique pour toutes les autres bases):
(2.7)

Ainsi, pour convertir le nombre 142'713 (base décimale) en base duodécimale (base douze) nous avons
(notation : q est le "quotient", et r le "reste") :

(2.8)

(2.9)

(2.10)

(2.11)

(2.12)

Ainsi nous avons les restes 6, 10, 7, 0, 9 ce qui nous amène à écrire : (2.13)

Nous avons choisi pour ce cas particulier la symbolique que nous avions définie précédemment (a-dix) pour
éviter toute confusion.

TYPES DE NOMBRES

Il existe en mathématiques une très grande variété de nombres (naturels, rationnels, réels, irrationnels,
complexes, p-adiques, quaternions, transcendants, algébriques, constructibles...) puisque le mathématicien peut
à loisirs en créer en ayant uniquement à poser les axiomes (règles) de manipulations de ceux-ci (cf. chapitre de
Théorie Des Ensembles).

Cependant, il y en a quelques uns que nous retrouvons plus souvent que d'autres et certains qui servent de base
de construction à d'autres et qu'il conviendrait de définir suffisamment rigoureusement (sans aller dans les
extrêmes) pour pouvoir savoir de quoi nous parlerons lorsque nous les utiliserons.
NOMBRES ENTIERS NATURELS

L'idée du "nombre entier" (nombre pour lequel il n'y a pas de chiffres après la virgule) est le concept
fondamental de la mathématique et nous vient à la vue d'un groupement d'objets de même espèce (un mouton,
un autre mouton, encore un autre, etc.). Lorsque la quantité d'objets d'un groupe est différente de celle d'un
autre groupe nous parlons alors de groupe numériquement supérieur ou inférieur quelque soit l'espèce d'objets
contenus dans ces groupes. Lorsque la quantité d'objets d'un ou de plusieurs groupes est équivalente, nous
parlons alors "d'égalité". A chaque objet correspond le nombre "un" ou "unité" noté "1".

Pour former des groupements d'objets, nous pouvons opérer ainsi : à un objet, ajouter un autre objet, puis
encore un et ainsi de suite... chacun des groupements, au point de vue de sa collectivité, est caractérisé par un
nombre. Il résulte de là qu'un nombre peut être considéré comme représentant un groupement d'unités tel que
chacune de ces unités corresponde à un objet de la collection.

Définition: Deux nombres sont dits "égaux" si à chacune des unités de l'un nous pouvons faire correspondre
une unité de l'autre et inversement. Si ceci ne se vérifie pas alors nous parlons "d'inégalité".

Prenons un objet, puis un autre, puis au groupement formé, ajoutons encore un objet et ainsi de suite. Les
groupements ainsi constitués sont caractérisés par des nombres qui, considérés dans le même ordre que les
groupements successivement obtenus, constituent la "suite naturelle" notée et notée :

(2.14)

Remarque: La présence du 0 (zéro) dans notre définition de est discutable étant donné qu'il n'est ni positif ni
négatif. C'est la raison pour laquelle dans certains ouvrages vous pourrez trouver une définition de sans le 0.

Les constituants de cet ensemble peuvent être définis par (nous devons cette définition au mathématicien
Gottlob) les propriétés (avoir lu au préalable le chapitre de Théorie Des Ensembles est recommandé...)
suivantes :

P1. 0 (lire "zéro") est le nombre d'éléments (défini comme une relation d'équivalence) de tous les ensembles
équivalents à (en bijection avec) l'ensemble vide.

P2. 1 (lire "un") est le nombre d'éléments de tous les ensembles équivalents à l'ensemble dont le seul élément
est 1.

P3. 2 (lire "deux") est le nombre d'éléments de tous les ensembles équivalents à l'ensemble dont tous les
éléments sont 0 et 1.

P4. En général, un nombre entier est le nombre d'éléments de tous les ensembles équivalents à l'ensemble des
nombres entiers le précédent!

La construction de l'ensemble des entiers naturels s'est faite de la manière la plus naturelle et cohérente qui soit.
Les naturels doivent leur nom à ce qu'ils avaient pour objet, aux prémices de leur existence, de dénombrer des
quantités et des choses de la nature ou qui intervenaient dans la vie de l'homme. L'originalité de l'ensemble
réside dans la manière empirique dont il s'est construit car il ne résulte pas réellement d'une définition
mathématique, mais davantage d'une prise de conscience par l'homme du concept de quantité dénombrable, de
nombre et de lois qui traduisent des relations entre eux.

La question de l'origine de est dès lors la question de l'origine des mathématiques. Et de tout temps des
débats confrontant les pensées des plus grands esprits philosophiques ont tenté d'élucider ce profond mystère, à
savoir si les mathématiques sont une pure création de l'esprit humain ou si au contraire l'homme n'a fait que
redécouvrir une science qui existait déjà dans la nature. Outre les nombreuses questions philosophiques que cet
ensemble peut susciter, il n'en est pas moins intéressant d'un point de vue exclusivement mathématique.
Du fait de sa structure, il présente des propriétés remarquables qui peuvent se révéler d'une grande utilité
lorsque l'on pratique certains raisonnements ou calculs.

Remarquons immédiatement que la suite naturelle des nombres entiers est illimitée (cf. chapitre de Théorie Des
Nombres) mais dénombrable (nous verrons cela plus bas), car, à un groupement d'objets qui se trouve
représenté par un certain nombre n, il suffira d'ajouter un objet pour obtenir un autre groupement qui sera défini
par un nombre entier immédiatement supérieur n + 1.

Définition: Deux nombres entiers qui différent d'une unité positive sont dits "consécutifs".

AXIOMES DE PEANO

Lors de la crise des fondements des mathématiques, les mathématiciens ont bien évidemment cherché à
axiomatiser l'ensemble et nous devons l'axiomatisation actuelle à Peano et à Dedekind.

Les axiomes de ce système comportent les symboles < et = pour représenter les relations "plus petit" et "égal"
(cf. chapitre sur les Opérateurs). Ils comprennent d'autre part les symboles 0 pour le nombre zéro et s pour
représenter le nombre "successeur". Dans ce système, 1 est noté:

(2.15)

dit "successeur de zéro", 2 est noté: (2.16)

Les axiomes de Peano qui construisent sont les suivants (voir le chapitre de la Théorie de la Démonstration
pour certains symboles) :

A1. 0 est un entier naturel (permet de poser que n'est pas vide).

A2. Tout entier naturel a un successeur, noté s(n).

Donc s est une application injective, c'est- à-dire : (2.17)

si deux successeurs sont égaux, ils sont les successeurs d'un même nombre.

A3. , le successeur d'un entier naturel n'est jamais égal à zéro (ainsi à un premier élément)

A4. , "axiome de récurrence" qui se doit se lire de la manière


suivante : si l'on démontre qu'une propriété est vraie pour un x et son successeur, alors cette propriété est vraie
pout tout x.

Donc l'ensemble de tous les nombres vérifiant les 4 axiomes sont : (2.18)

Remarque: Les axiomes de Peano permettent de construire très rigoureusement les deux opérations de base de
l'arithmétique que sont l'addition et la multiplication (cf. chapitre sur les Opérateurs) et ainsi tous les autres
ensembles que nous verrons par la suite.

NOMBRES PAIRS, IMPAIRS ET PARFAITS

En arithmétique, étudier la parité d'un entier, c'est déterminer si cet entier est ou non un multiple de deux. Un
entier multiple de deux est un entier pair, les autres sont les entiers impairs.
Définitions:

D1. Les nombres obtenus en comptant par deux à partir de zéro, (soit 0, 2, 4, 6, 8, ...) dans cette suite naturelle
sont appelés "nombres pairs".

Le nombre pair est donné par la relation : (2.19)

D2. Les nombres que nous obtenons en comptant par deux à partir de un (soit 1, 3, 5, 7,... ) dans cette suite
naturelle s'appellent "nombres impairs".

Le nombre impair est donné par : (2.20)

Remarque: Nous appelons "nombres parfaits", les nombres égaux à la somme de leurs diviseurs entiers
strictement plus petits qu'eux mêmes (concept que nous verrons en détail plus tard) comme par exemple:
6=1+2+3 et 28=1+2+4+7+14.

NOMBRES PREMIERS

Définition: Un "nombre premier" est un entier possédant exactement 2 diviseurs (ces deux diviseurs sont donc
"1" et le nombre lui-même). Dans le cas où il y a plus de 2 diviseurs on parle de "nombre composé".

Voici l'ensemble des nombres premiers inférieurs à 60: {2,3,5,7,11,13,17,19,23,29,31,37,41,43,47,53,59}

Remarque: A noter que la définition de nombre premier exclut le chiffre "1" de l'ensemble des nombres
premiers car il a un unique diviseur (lui-même) et pas deux comme le veut la définition.

Nous pouvons nous demander s'il existe une infinité de nombres premiers ? La réponse est positive et en voici
une démonstration (parmi tant d'autres) par l'absurde.

Démonstration:

Supposons qu'il existe qu'un nombre fini de nombres premiers qui seraient : (2.21)

Nous formons un nouveau nombre à partir du produit de tous les nombres premiers auquel nous ajoutons "1":

(2.22)

Selon notre hypothèse initiale et le théorème fondamental de l'arithmétique (cf. chapitre de Théorie Des
Nombres) ce nouveau nombre devrait être divisible par l'un des nombres premiers existants selon:

(2.23)

Nous pouvons effectuer la division: (2.24)

Le premier terme se simplifie, car est dans le produit. Nous notons E cet entier: (2.25)

Or, q et E sont deux entiers, donc doit être un entier. Mais est par définition supérieur à 1. Donc
n'est pas un entier.

Il y a alors contradiction et nous en concluons que les nombres premiers ne sont pas en nombre fini, mais infini.
Remarques:

R1. (le produit des n premiers nombres premiers) est appelé "primorielle n".

R2. Nous renvoyons le lecteur au chapitre de Cryptographie de la section d'Informatique Théorique pour
étudier quelques propriétés remarquables des nombres premiers dont la non moins fameuse fonction phi d'Euler
(ou appelé aussi "fonction indicatrice").

R3. L'étude des nombres premiers est un sujet immensément vaste et certains théorèmes y relatifs sortent
largement du cadre d'étude de ce site.

NOMBRES ENTIERS RELATIFS

L'ensemble à quelques défauts que nous n'avons pas énoncés tout à l'heure. Par exemple, la soustraction de
deux nombres dans n'a pas toujours un résultat dans (les nombres négatifs n'y existent pas). Autre défaut,
la division de deux nombres dans n'a également pas toujours un résultant dans (les nombres fractionnaires
n'y existent pas).

Nous pouvons dans un premier temps résoudre le problème de la soustraction en ajoutant à l'ensemble des
entiers naturels, les entiers négatifs (concept révolutionnaire pour ceux qui en sont à l'origine) nous obtenons
"l'ensemble des entiers relatifs" noté (pour "Zahl" de l'allemand) : (2.26)

L'ensemble des entiers naturels est donc inclus dans l'ensemble des entiers relatifs. C'est ce que nous notons
sous la forme : (2.27)

et nous avons par définition (c'est une notation qu'il faut apprendre) : (2.28)

Cet ensemble a été créé à l'origine pour faire de l'ensemble des entiers naturels un objet que nous appelons un
"groupe" (cf. chapitre Théorie Des Ensembles) par rapport à l'addition.

Définition: Nous disons qu'un ensemble E est un "ensemble dénombrable", s'il est équipotent à . C'est-à-dire
s'il existe une bijection de (cf. chapitre Théorie Des Ensembles) sur E. Ainsi, grosso modo, deux ensembles
équipotents ont "autant" d'éléments au sens de leurs cardinaux (cf. chapitre de Théorie Des Ensembles), ou tout
au moins la même infinité.

L'objectif de cette remarque est de faire comprendre que les ensembles sont dénombrables.

Démonstration:

Montrons que est dénombrable en posant : et (2.29)

pour tout entier . Ceci donne l'énumération suivante: 0,-1,1,-2,2,-3,3, ... (2.30)

de tous les entier relatifs à partir des entiers naturles seuls.

NOMBRES RATIONNELS

L'ensemble à aussi un défaut. Ainsi, la division de deux nombres dans n'a également pas toujours un
résultat dans (les nombres fractionnaires n'y existent pas). Nous disons alors dans le langage de la théorie des
ensembles que: la division n'est pas une opération interne dans .
Nous pouvons ainsi définir un nouvel ensemble qui contient tous les nombres qui peuvent s'écrire sous forme
de "fraction", c'est-à-dire du rapport d'un dividende et d'un diviseur. Quand un nombre peut se mettre sous cette
forme, nous disons que c'est une "nombre fractionnaire":

(2.31)

Une fraction peut être employée pour exprimer une partie, ou une part, de quelque chose
(d'un objet, d^'une distance, d'un terrain, d'une somme d'argent…).

Par définition, "l'ensemble des nombres rationnels" est donné par: (2.32)

et où p et q sont des entiers sans facteurs communs.

Nous supposerons par ailleurs comme évident que : (2.33)

La logique de la création de l'ensemble des nombres rationnels est similaire à celle des entiers relatifs.
Effectivement, les mathématiciens ont souhaité faire de l'ensemble des nombres relatifs un "groupe" par rapport
à la loi de multiplication et de division (cf. chapitre de Théorie Des Ensembles).

De plus, contrairement à l'intuition, l'ensemble des nombres entiers et nombres rationnels sont équipotents.
Nous pouvons nous persuader de cette équipotence en rangeant comme le fit Cantor, les rationnels dans un
premier temps de la façon suivante:

(2.34)

Ce tableau est construit de telle manière que chaque rationnel n'apparaît qu'une seule fois (au sens de sa valeur
décimale) par diagonale d'où le nom de la méthode : "diagonale de Cantor".

Si nous éléminons de chaque diagonale les rationnels qui apparaissent plus d'une fois (les "fractions
équivalentes") pour ne garder plus que ceux qui sont irréductibles (donc ceux dont le PGCD du numérateur et
dénominateur est égal à 1), nous pouvons alors ainsi grâce à cette distinction définir une application
qui est injective (deux rationnels distincts admettent des rangs distincts) et surjective (à toute place
sera inscrit un rationnel).
L'application f est donc bijective: et sont donc bien équipotents !

La définition un peu plus rigoureuse (et donc moins sympathique) de se fait à partir de en procédant
comme suit (il est intéressant d'observer les notations utilisées) :

Sur l'ensemble , qu'il faut lire comme étant l'ensemble construit à partir de deux éléments entiers
relatifs dont on exclut le zéro pour le deuxième, on considère la relation R entre deux couples d'entiers relatifs
définie par : (2.35)

Nous vérifions facilement ensuite que R est une relation d'équivalence (cf. chapitre sur les Opérateurs) sur
.

L'ensemble des classes d'équivalences pour cette relation R noté alors est par définition .
C'est-à-dire que nous posons alors plus rigoureusement : (2.36)

La classe d'équivalence de est explicitement notée par: (2.37)

conformément à la notation que tout le monde a l'habitude d'employer.

Nous vérifions facilement que l'addition et la multiplication qui étaient des opérations définies sur passent

sans problèmes à en posant : (2.38)

De plus ces opérations munissent d'une structure de corps (cf. chapitre de Théorie Des Ensembles) avec

comme élément neutre additif et comme élément neutre multiplicatif. Ainsi, tout élément non nul de est

inversible, en effet : (2.39)

ce qui s'écrit aussi plus techniquement : (2.40)

Remarque: Même si nous aurions envie de définir comme étant l'ensemble où représente les
numérateurs et les dénominateurs des rationnels, ceci n'est pas possible car autrement nous aurions par
exemple tandis que nous nous attendons à une égalité.

D'où le besoin d'introduire une relation d'équivalence qui nous permet d'identifier, pour revenir à l'exemple
précédent, (1,2) et (2,4). La relation R que nous avons définie ne tombe pas du ciel, en effet le lecteur qui a
manipulé les rationnels jusqu'à présent sans jamais avoir vu leur définition formelle sait que :

(2.41)

Il est donc naturel de définir la relation R comme nous l'avons fait. En particulier, en ce qui concerne l'exemple

ci-dessus, car (1,2)R(2,4) et le problème est résolu.


Outre les circonstances historiques de sa mise en place, ce nouvel ensemble se distingue des ensembles d'entiers
relatifs car il induit la notion originale et paradoxale de quantité partielle. Cette notion qui à priori n'a pas de
sens, trouvera sa place dans l'esprit de l'homme notamment grâce à la géométrie où l'idée de fraction de
longueur, de proportion s'illustre plus intuitivement.

NOMBRES IRRATIONNELS

L'ensemble des rationnels est limité et non suffisant lui aussi. Effectivement, nous pourrions penser que tout
calcul mathématique numérique avec les opérations communément connues se réduisent à cet ensemble mais ce
n'est pas le cas.

Exemples :

E1. Prenons le calcul de la racine carrée de deux que nous noterons . Supposons que cette dernière
racine soit un rationnel. Alors, nous devrions pouvoir l'exprimer comme a/b, où a et b sont des entiers sans
facteurs commun. Pour cette raison, a et b ne peuvent tous les deux êtres pairs. Il y a deux possibilités :

1. a est impair (b est alors pair)

2. a est pair (b est alors impair)

En mettant au carré, nous avons : (2.42)

qui peut s'écrire : (2.43)

Puisque le carré d'un nombre impair est impair et le carré d'un nombre pair est pair, le cas (1) est impossible,
car serait impair et serait pair.

Le cas (2) est aussi est aussi impossible, car alors nous pourrions écrire , où c est un entier quelconque,
et donc si nous le portons au carré nous avons où nous avons un nombre pair des deux côtés de
l'égalité. En remplaçant dans nous obtenons après simplification que . serait impair alors
que serait pair. Il n'y a pas de solution! C'est donc que l'hypothèse de départ est fausse et qu'il n'existe pas
deux entiers a et b tels que .

E2. Démontrons, aussi par l'absurde, que le fameux nombre d'Euler e est irrationnel. Pour cela, rappelons que e
(cf. chapitre d'Analyse Fonctionnelle) peut aussi être défini par la série de Taylor (cf. chapitre sur les Suites Et
Séries):

(2.44)

Alors si e est rationnel, il doit pouvoir s'écrire sous la forme p/q (avec , car nous savons que e n'est pas
entier). Multiplions les deux côtés de côtés de l'égalité par q! :

(2.45)

Le premier membre q!e serait alors un entier, car par définition de la factorielle: (2.46)
est un entier.
Les premiers termes du seconde membre de la relation antéprécédente, jusqu'au terme q!/q!=1 sont aussi des
entiers car q!/m! se simplifie si q>m. Donc par soustraction nous trouvons :

(2.47)

où la série à droite devrait aussi être un entier!

Après simplification, le second membre de l'égalité devient : (2.48)

le premier terme de cette somme est strictement inférieur à 1/2, le deuxième inférieur à 1/4, le troisième
inférieur à 1/8, etc.

Donc, vu que chaque terme est strictement inférieur aux termes de la série harmonique suivante qui converge
vers 1: 1/2+1/4+1/8+...=1 (2.49)

alors par conséquent, la série n'est pas un entier puisque étant strictement inférieure à 1. Ce qui constitue une
contradiction!

Ainsi, les nombres rationnels ne satisfont pas à l'expression numérique de comme de e (pour citer seulement
ces deux exemples particuliers).

Il faut donc les compléter par l'ensemble de tous les nombres qui ne peuvent s'écrire sous forme de fraction
(rapport d'un dividende et d'un diviseur entiers sans facteurs communs) et que nous appelons des "nombres
irrationnels".

NOMBRES RÉELS

Définition: La réunion des nombres rationnels et irrationnels donne "l'ensemble des nombres réels".

Ce que nous notons: (2.50)

Remarque: Les mathématiciens dans leur rigueur habituelle ont différentes techniques pour définir les nombres
réels. Ils utilisent pour cela des propriétés de la topologie (entre autres) et en particulier les suites de Cauchy
mais c'est une autre histoire qui dépasse le cadre formel du présent chapitre.

Nous sommes évidemment amenés à nous poser la question si est dénombrable ou non. La démonstration
est assez simple.

Démonstration:

Par définition, nous avons vu plus haut qu'il doit y avoir une bijection entre et pour dire que soit
dénombrable.

Pour simplifier, nous allons montrer que l'intervalle [0,1[ n'est alors pas dénombrable. Ceci impliquera bien sûr
par extension que ne l'est pas!

Les éléments de cet intervalle sont représentés par des suites infinies entre 0 et 9 (dans le système décimal) :

- Certaines de ces suites sont nulles à partir d'un certain rang, d'autres non
- Nous pouvons donc identifier [0,1[ à l'ensemble de toutes les suites (finies ou infinies) d'entiers compris entre
0 et 9

n°1 ... ...

n°2 ... ...

n°3 ... ...

n°4 ... ...

n°5 ... ...

n°6 ... ...

...
...
...
n°k ... ...

...
Tableau: 2.2 - Identification et classement de nombres réels

Si cet ensemble était dénombrable, nous pourrions classer ces suites (avec une première, une deuxième, etc.).
Ainsi, la suite serait classée première et ainsi de suite... comme le propose le tableau ci-
dessus.

Nous pourrions alors modifier cette matrice infinie de la manière suivante : a chaque élément de la diagonale,
rajouter 1, selon la règle : 0+1=1, 1+1=2, 8+1=9 et 9+1=0

n°1 ... ...


+1

n°2 ... ...


+1

n°3 ... ...


+1

n°4 ... ...


+1

n°5 ... ...

n°6 ... ...

...
...
...
n°k ... ...

...
Tableau: 2.3 - Identification et classement de nombres réels
Alors considérons la suite infinie qui se trouve sur la diagonale :

- Elle ne peut être égale à la première car elle s'en distingue au moins par le premier élément

- Elle ne peut être égale à la deuxième car elle s'en distingue au moins par le deuxième élément

- Elle ne peut être égale à la troisième car elle s'en distingue au moins par le troisième élément

et ainsi de suite... Elle ne peut donc être égale à aucune des suites contenues dans ce tableau!

Donc, quel que soit le classement choisi des suites infinies de 0...9, il y en a toujours une qui échappe à ce
classement! C'est donc qu'il est impossible de les numéroter... tout simplement parce qu'elles ne forment pas un
ensemble dénombrable..

La technique qui nous a permis d'arriver à ce résultat est connue sous le nom de "procédé diagonal de Cantor"
(car similaire à celle utilisée pour l'équipotence entre ensemble naturel et rationnel) et l'ensemble des nombres
réels est dit avoir "la puissance du continu" de par le fait qu'il est indénombrable.

Remarque: Nous supposerons intuitif pour le lecteur que tout nombre réel peut être approché infiniment près
par un nombre rationnel (pour les nombres irrationnels il suffit de s'arrêter à un nombre de décimales données
et d'en trouver le rationnel correspondant). Les mathématiciens disent alors que est "dense" dans et
notent cela : (2.51)

NOMBRES TRANSFINIS

Nous nous retrouvons donc avec un "infini" des nombres réels qui est différent de celui des nombres naturels.
Cantor osa alors ce que personne n'avait osé depuis Aristote : la suite des entiers positifs est infinie, l'ensemble
, est donc un ensemble qui a une infinité dénombrable d'éléments, alors il affirma que le cardinal (cf.
chapitre de Théorie Des Ensembles) de cet ensemble était un nombre qui existait comme tel sans que l'on utilise
le symbole fourre tout , il le nota: (2.52)

Ce symbole est la première lettre de l'alphabet hébreu, qui se prononce "aleph zéro". Cantor allait appeler ce
nombre étrange, un nombre "transfini".

L'acte décisif est d'affirmer qu'il y a, après le fini, un transfini, c'est-à-dire une échelle illimitée de modes
déterminés qui par nature sont infinis, et qui cependant peuvent êtres précisés, tout comme le fini, par des
nombres déterminés, bien définis et distinguables les uns des autres !!

Après ce premier coup d'audace allant à l'encontre de la plupart des idées reçues depuis plus de deux mille ans,
Cantor allait poursuivre sa lancée et établir des règles de calcul, paradoxales à première vue, sur les nombres
transfinis. Ces règles se basaient, comme nous l'avons précisé tout à l'heure, sur le fait que deux ensembles
infinis sont équivalents s'il existe une bijection entre les deux ensembles.

Ainsi, nous pouvons facilement montrer que l'infini des nombres pairs est équivalent à l'infini des nombres
entiers : pour cela, il suffit de montrer qu'à chaque nombre entier, nous pouvons associer un nombre pair, son
double, et inversement.

Ainsi, même si les nombres pairs sont inclus dans l'ensemble des nombres entiers, il y en a une infinité égal,
les deux ensembles sont donc équipotents. En affirmant qu'un ensemble peut être égal à une de ses parties,
Cantor va à l'encontre ce qui semblait être une évidence pour Aristote et Euclide: l'ensemble de tous les
ensembles est infini ! Cela va ébranler la totalité des mathématiques et va amener à l'axiomatisation de
Zermelo-Frankel que nous verrons dans le chapitre de Théorie Des Ensembles.
A partir de ce qui précède, Cantor établit les règles de calculs suivants sur les cardinaux:

(2.53)

À première vue ces règles semblent non intuitives mais en fait elles le sont bien! En effet, Cantor définit
l'addition de deux nombres transfinis comme le cardinal de l'union disjointe des ensembles correspondants.

Exemples:

E1. En notant donc le cardinal de nous avons qui est équivalent à dire que nous sommons le
cardinal de union disjointe . Or union disjointe est équipotent à donc (il suffit pour
s'en convaincre de prendre l'ensembles des entiers pairs et impairs tout deux dénombrables dont l'union
disjointe est dénombrable).

E2. Autre exemple trivial : correspond au cardinal de l'ensemble union un point. Ce dernier ensemble
est encore équipotent à donc .

Nous verrons également lors de notre étude du chapitre de Théorie Des Ensembles que le concept de produit
cartésien de deux ensembles dénombrables est tel que nous ayons :

(2.54)

et donc : (2.55)

De même (cf. chapitre de Théorie Des Ensembles), puisque nous avons: (2.56)

et en identifiant à (rapport d'un numérateur sur un dénominateur), nous avons immédiatement:

(2.57)

Nous pouvons d'ailleurs démontrer un énoncé intéressant : si nous considérons le cardinal de l'ensemble de tous
les cardinaux, il est nécessairement plus grand que tous les cardinaux, y compris lui-même (il vaut mieux avoir
lu le chapitre de Théorie Des Ensembles au préalable)! En d'autres termes: le cardinal de l'ensemble de tous les
ensembles de A est plur grand que le cardinal de A lui-même.

Ceci implique qu'il n'existe aucun ensemble qui contient tous les ensembles puisqu'il en existe toujours un qui
est plus grand (c'est une forme équivalent du fameux ancien paradoxe de Cantor).

Dans un langage technique cela revient à considérer un ensemble non vide A et alors d'énoncer que:

(2.58)

où est l'ensemble des parties de A (voir le chapitre de Théorie des Ensembles pour le calcul général du
cardinal de l'ensemble des parties d'un ensemble dénombrable).

C'est-à-dire par définition de la relation d'ordre < (strictement inférieur), qu'il suffit de montrer qu'il n'existe pas
d'application surjective , en d'autres termes qu'à chaque élément de l'ensemble des parties de A il
ne correspond pas au moins une pré-image dans A.
Remarque: est par exemple constitué de l'ensemble des nombres impairs, pairs, premiers, et l'ensemble
des naturels, ainsi que l'ensemble vide lui-même, etc. est donc l'ensemble de toutes les "patates" (pour
emprunter le vocabulaire de la petite école...) possibles qui forment .

Démonstration (par l'absurde):

L'idée maintenant est de supposer que nous pouvons numéroter chacune des patates de avec au moins un
élément de A (imaginez cela avec ou allez voir l'exemple dans le chapitre de Théorie Des Ensembles). En
d'autres termes cela revient à suppoer que est surjective et considérons un sous-ensemble E de A
tel : (2.59)

c'est-à-dire l'ensemble d'éléments x de A qui n'appartiennent pas à l'ensemble numéro x (l'élément x n'appartient
pas à la patate qu'il numérote... en d'autres termes).

Or, si f est surjective il doit alors exister aussi un pour ce sous-ensemble E tel que :

(2.60)

puisque E est aussi une partie de A.

Si alors mais de par la définition de E , et nous avons donc une absurdité de par
l'hypothèse de la surjectivité!

NOMBRES COMPLEXES

Inventés au 18ème siècle entre autres par Jérôme Cardan et Rafaello Bombelle, ces nombres permettent de
résoudre des problèmes n'ayant pas de solutions dans ainsi que de formaliser mathématiquement certaines
transformations dans le plan tel que la rotation, la similitude, la translation, etc. Pour les physiciens, les
nombres complexes constituent surtout un moyen très commode de simplifier les notations. Il est ainsi très
difficile d'étudier les phénomènes ondulatoires, la relativité générale ou la mécanique quantique sans recourir
aux nombres et expressions complexes.

Il existe plusieurs manières de construire les nombres complexes. La première est typique de la construction
telle que les mathématiciens en ont l'habitude dans le cadre de la théorie des ensembles. Ils définissent un
couple de nombres réels et définissent des opérations entre ces couples pour arriver enfin à une signification du
concept de nombre complexe. La deuxième est moins rigoureuse mais son approche est plus simple et consiste
à définir le nombre imaginaire pur unitaire i et ensuite de construire les opérations arithmétiques à partir de sa
définition. Nous allons opter pour cette deuxième méthode.

Définitions:

D1. Nous définissons le "nombre imaginaire unitaire pur" que nous notons i par la propriété suivante :

(2.61)

D2. Un "nombre complexe" est un couple d'un nombre réel a et d'un nombre imaginaire ib et s'écrit
généralement sous la forme suivante :

z = a+ib (2.62)

a et b étant des nombres appartenant à .


Nous notons l'ensemble des nombres complexes et avons donc par construction : (2.63)

Remarque: L'ensemble est identifié au plan euclidien orienté E (cf. chapitre de Calcul Vectoriel) grâce au
choix d'une base orthonormée directe (nous obtenons ainsi le "plan d'Argand-Cauchy" ou plus communément
"plan de Gauss" que nous verrons un peu plus loin).

L'ensemble des nombres complexes qui constitue un corps (cf. chapitre de Théorie Des Ensembles), et noté ,
est défini (de manière simple pour commencer) dans la notation de la théorie des ensembles par :

(2.64)

En d'autres termes nous disons que le corps est le corps auquel nous avons "adjoint" le nombre
imaginaire i. Ce qui se note formellement : (2.65)

L'addition et la multiplication de nombres complexes sont des opérations internes à l'ensemble des complexes
(nous reviendrons beaucoup plus en détail sur certaines propriétés des nombres complexes dans le chapitre
traitant de la Théorie Des Ensembles) et définies par:

(2.66)

La "partie réelle" de z est traditionnellement notée: (2.67)

La "partie imaginaire" de z est traditionnellement notée: (2.68)

Le "conjugué" ou "conjugaison" de z est défini par: (2.69)

et est aussi parfois noté (en particulier en physique quantique dans certains ouvrages!).

A partir d'un complexe et de son conjugué, il est possible de trouver ses parties réelles et imaginaires. Ce sont

les relations évidentes suivantes : et (2.70)

Le "module" de z (ou "norme") représente la longueur par rapport au centre du plan de Gauss (voir un peu plus
bas ce qu'est le plan de Gauss) et est simplement calculé avec l'aide du théorème de Pythagore:

(2.71)

et est donc toujours un nombre positif ou nul.

Remarque: La notation pour le module n'est pas innocente puisque coïncide avec la valeur absolue de z
lorsque z est réel.

La division entres deux complexes se calcule comme (le dénominateur étant évidemment non nul):

(2.72)
L'inverse d'un complexe se calculant de façon similaire :

(2.73)

Nous pouvons aussi énumérer 8 importantes propriétés du module et du conjugué complexe:

P1. Nous affirmons que : (2.74)

Démonstration:

Par définition du module , pour que la somme soit nulle, la condition nécessaire est que:

(2.75)

P2. Nous affirmons que : (2.76)

Démonstration: (2.77)

P3. Nous affirmons que :

(2.78)

Démonstration:

Les deux inégalités ci-dessus peuvent s'écrire: (2.79)

donc équivalent respectivement à: (2.80)

qui sont triviales. La suite est alors triviale...

P4. Nous avons: (2.81)

et si: (2.82)

Démonstrations: (2.83)

et: (2.84)
P5. Nous affirmons (à nouveau...) que : (2.85)

Démonstration: (2.86)

P6. Nous affirmons que : (2.87)

Démonstrations: (2.88)

et : (2.89)

et : (2.90)

Remarques:

R1. En des termes mathématiques, la première démonstration permet de montrer que la conjugaison complexe
est ce que l'on appelle "involutive" (dans le sens qu'elle ne fait rien évoluer...).

R2. En des termes tout aussi mathématiques (ce n'est que du vocabulaire!), la deuxième démonstration montre
que la conjugaison de la somme de deux nombres complexes est ce que nous appelons un "automorphisme du
groupe" (cf. chapitre de Théorie Des Ensembles).

R3. Encore une fois, pour le vocabulaire..., la troisième démonstration montre que la conjugaison du produit de
deux nombres complexes est ce que nous appelons un "automorphisme du corps" (cf. chapitre de
Théorie Des Ensembles).

P7. Nous affirmons que pour z différent de zéro: (2.91)

Nous nous restreindrons à la démonstration de la seconde relation qui est un cas général de la première (pour
).

Démonstration:

(2.92)
P8. Nous avons : (2.93)

pour tous complexes (rigoureusement non nuls car sinon le concept d'argument du nombre complexe que
nous verrons plus loin est alors indéterminé). De plus l'égalité a lieu si et seulement si et sont colinéaires
(les vecteurs sont "sur la même droite") et de même sens, autrement dit .... s'il existe tel que .

Démonstration: (2.94)

Cette inégalité peut ne pas paraître évidente à tout le monde alors développons un peu et supposons-la vraie:

(2.95)

Après simplification: (2.96)

et encore après simplification: (2.97)

donc comme la paranthèse au carré est forcément positive ou nulle il s'ensuit: (2.98)

Cette dernière relation démontre donc que l'inégalité est vraie.

Remarque: Il existe une forme plus générale de cette inégalité appelée "inégalité de Minkowski" présentée dans
le chapitre de Calcul Vectoriel (les nombres complexes peuvent effectivement s'écrire sous la forme de vecteurs
comme nous allons le voir de suite.

INTERPRÉTATION GÉOMÉTRIQUE

Nous pouvons aussi représenter un nombre complexe ou dans un plan délimité par deux axes
(deux dimensions) de longueur infinie et orthogonaux entres eux. L'axe vertical représentant la partie
imaginaire d'un nombre complexe et l'axe horizontal la partie réelle (voir figure ci-après).

Il y donc bijection entre l'ensemble des nombres complexes et l'ensemble des vecteurs du plan de Gauss (notion
d'affixe).

Nous nommons parfois ce type de représentation "plan de Gauss":


(2.99)

et nous écrivons alors: (2.100)

Nous voyons sur ce diagramme qu'un nombre complexe a donc une interprétation vectorielle (cf. chapitre de

Calcul Vectoriel) donnée par : (2.101)

où la base canonique est définie telle que: (2.102)

avec: (2.103)

Ainsi, est le vecteur de la base unitaire porté par l'axe horizontal et est le vecteur de la base unitaire
porté par l'axe imaginaire et r est le module (la norme) positif ou nul.

Ceci est a comparer avec les vecteurs de (cf. chapitre de Calcul Vectoriel):

(2.104)

avec: (2.105)

ce qui fait que nous pouvons identifier le plan complexe avec la plan euclidien.

Par ailleurs, la définition du cosinus et sinus (cf. chapitre de Trigonométrie) nous donne :

(2.106)

Finalement : (2.107)
Ainsi : (2.108)

complexe qui est toujours égal à la lui-même modulo de par les propriétés des fonctions trigonométriques :

(2.109)

avec et où est appelé "l'argument de z" et est noté traditionnellement : (2.110)

Les propriétés du cosinus et du sinus (cf. chapitre de Trigonométrie) nous amènent directement à écrire pour
l'argument : et (2.111)

Nous démontrons entre autres avec les séries de Taylor (cf. chapitre des Suites Et Séries) que :

(2.112)

et: (2.113)

dont la somme est semblable à: (2.114)

mais par contre parfaitement identique au développement de Taylor de :

(2.115)

Donc finalement, nous pouvons écrire : (2.116)

relation nommée "formule d'Euler".

Grâce à la forme exponentielle d'un nombre complexe, très fréquemment utilisée dans de nombreux domaines
de la physique et de l'ingénierie, nous pouvons très facilement tirer des relations telles que (cis est une vieille
notation qui est l'abréviation du cos i sin se trouvant dans la paranthèse):

(2.117)

et en supposant connues les relations trigonométriques de bases (cf. chapitre de Trigonométrie) nous avons les
relations suivantes pour la multiplication de deux nombres complexes :

(2.118)

dès lors : (2.119)


et donc si n est un entier positif: (2.120)

Pour le module de la multiplication (nous changeons de notation pour la lisibilité é):

(2.121)

d'où : (2.122)

Pour la division de deux nombres complexes : (2.123)

Le module de leur division vient alors immédiatement : (2.124)

dès lors nous avons pour l'argument :

(2.125)

ainsi il vient immédiatement : (2.126)

Pour la mise en puissance d'un nombre complexe (ou la racine):

(2.127)

ce qui nous donne immédiatement un résultat déjà mentionné plus haut: (2.128)

et pour l'argument : (2.129)

Dans le cas où nous avons un module unité tel que nous avons alors la relation :

(2.130)

appelée "formule de Moivre".

Pour le logarithme népérien d'un nombre complexe, nous avons trivialement la relation suivante sur laquelle

nous reviendrons dans le chapitre d'Analyse Complexe: (2.131)

où ln( z ) est souvent dans le cas complexe écrit Log( z ) avec un "L" majusucule.
Toutes les relations précédentes pourraient bien sûr être obtenues avec la forme trigonométrique des nombres
complexes mais nécessiteraient alors quelques lignes supplémentaires de développements.

Remarque: Une variation sinusoïdale peut être représentée comme la projection (cf. chapitre de
Trigonométrie) sur l'axe vertical y (axe des imaginaires de l'ensemble ) d'un vecteur tournant à vitesse
angulaire autour de l'origine dans le plan xOy :

(2.132)

Un tel vecteur tournant s'appelle "vecteur de Fresnel" et peut très bien être interprété comme la partie
imaginaire d'un nombre complexe donné par :

(2.133)

Nous retrouverons les vecteurs tournants de façon explicite lors de notre étude de la mécanique ondulatoire et
optique géométrique (dans le cadre de la diffraction).

TRANSFORMATIONS DANS LE PLAN

Il est habituel de représenter les nombres réels comme points d'une droite graduée. Les opérations algébriques y
ont leur interprétation géométrique: l'addition est une translation, la multiplication une homothétie centrée à
l'origine.

En particulier nous pouvons parler de la "racine carrée d'une transformation". Une translation d'amplitude a
peut être obtenue comme l'itération d'une translation d'amplitude a/2. De même une homothétie de rapport a
peut être obtenue comme l'itérée d'une homothétie de rapport . En particulier une homothétie de rapport 9
est la composée de deux homothéties de rapport 3 ( ou -3).

La racine carrée prend alors un sens géométrique. Mais qu'en est-il de la racine carrée de nombres négatifs? En
particulier la racine carrée de -1?

Une homothétie de rapport -1 peut être vue comme une symétrie par rapport à l'origine. Toutefois si nous
voulons voir cette transformation d'une manière continue, force nous est de placer la droite dans un plan. Dès
lors une homothétie de rapport -1 peut être vue comme une rotation de radians autour de l'origine.

Du coup, le problème de la racine carrée négative se simplifie. En effet, il n'est guère difficile de décomposer
une rotation de radians en deux transformations: nous pouvons répéter soit une rotation de soit une
rotation de . L'image de 1 sera la racine carrée de -1 et i est située sur une perpendiculaire à l'origine à
une distance 1 soit vers le haut soit vers le bas.

Ayant réussi à positionner le nombre i il n'est plus guère difficile de disposer les autres nombres complexes
dans un plan de Gauss. Nous pouvons ainsi associer à 2i le produit de l'homothétie (cf. chapitre de Géométrie
Euclidienne) de rapport 2 par la rotation de centre O et d'angle , soit une similitude centrée à l'origine.
C'est ce que nous allons nous efforcer à montrer maintenant.
Soient : (2.134)

et .

Nous avons les propriétés de transformations géométriques suivantes pour les nombres complexes (voir le
chapitre de Trigonométrie pour les propriétés du sinus et cosinus) que nous pouvons joyeusement combiner
selon notre bon vouloir :

P1. La multiplication de par un réel dans le plan de Gauss correspond (trivial) à une homothétie
(agrandissement) de centre O (l'intersection des axes imaginaires et réels), de rapport .

Démonstration : (2.135)

P2. La multiplication de par un nombre complexe de module unitaire :

(2.136)

correspond à une rotation de centre O et d'angle du complexe .

Démonstration: (2.137)

Remarque: Nous voyons alors immédiatement, par exemple, que multiplier un nombre complexe par i (c'est-à-
dire ) correspond à une rotation de .

Il est intéressant d'observer que sous forme vectorielle la rotation de centre O de par peut s'écrire à l'aide

de la matrice suivante : (2.138)

Démonstration:

Nous savons que est une rotation de centre O et d'angle . Il suffit de l'écrire à l'ancienne :

(2.139)

ce qui donne sous forme vectorielle : (2.140)

donc l'application linéaire est équivalent à: (2.141)

ou encore (nous retombons sur la matrice de rotation dans le plan que nous avons dans le chapitre de Géométrie
Euclidienne ce qui est un résultat remarquable!) en utilisant:

(2.142)
dans le cas particulier et arbitraire où r serait unitaire (afin d'avoir une rotation pure!) nous avons
immédiatement (nous avons repris les notations de l'angle tel que nous l'avons dans le chapitre de Géométrie):

(2.143)

Remarquons que la matrice de rotation peut aussi s'écrire sous la forme :

(2.144)

de même : (2.145)

Ainsi nous remarquons que ces matrices de rotation ne sont pas que des applications mais sont des nombres
complexes aussi (bon c'était évident dès le début mais fallait le montrer de manière esthétique et simple).

Ainsi, nous avons pour habitude de poser que : (2.146)

Le corps des nombres complexes est donc isomorphe au corps des matrices réelles carrées de dimension 2 du

type: (2.147)

C'est un résultat que nous réutiliserons de nombreuses fois dans divers chapitres de ce site pour des études
particulières en algèbre, géométrie et en physique quantique relativiste.

P3. La multiplication de deux complexes correspond à une homothétie ajoutée d'une rotation. En d'autres
termes, d'une "similitude directe".

Démonstration: (2.148)

il s'agit donc bien d'une similitude de rapport b et d'angle .

Au contraire, l'opération suivante : (2.149)

sera appelée une "similitude linéaire rétrograde".

Par ailleurs, il en retourne trivialement la relation déjà connue suivante: (2.150)

Remarques:

R1. La somme de deux nombres complexes ne pouvant avoir une écriture mathématique simplifiée sous
quelque forme que ce soit, nous disons alors que la somme équivaut à une "translation d'amplitude".

R2. La combinaison d'une similitude linéaire (multiplication de deux nombres complexes) directe et d'une
translation d'amplitude (sommation par un troisième nombre complexe) correspond à ce que nous appelons une
"similitude linéaire directe".
P4. Le conjugué d'un nombre complexe est géométriquement son symétrique par rapport à l'axe tel que :

(2.151)

sans oublier que : (2.152)

Ce qui nous donne un résultat déjà connu: (2.153)

D'où nous pouvons tirer la propriété suivante :

(2.154)

d'où: (2.155)

P5. La négation du conjugué d'un nombre complexe est géométriquement son symétrique par rapport à l'axe des
imaginaires tel que : (2.156)

Remarques:

R1. La combinaison de P4, P5 est appelée une "similitude rétrograde".

R2. L'opération géométrique qui consiste à prendre l'inverse du conjugué d'un nombre complexe (soit ) est
appelé une "inversion de pôle".

P6. La rotation de centre c et d'angle est donnée par : (2.157)

Explications: Le complexe c donne un point dans le plan de Gauss qui sera le centre de rotation. La différence
donne le rayon r choisi. La multiplication par est la rotation du rayon par rapport à l'origine du plan de
Gauss dans le sens inverse des aiguilles d'une montre. Finalement, l'addition par c la translation nécessaire pour
ramener le rayon r tourné à l'origine du centre c. Ce qui donne schématiquement:
(2.158)

P7. Sur la même idée, nous obtenons une homothétie de centre c, de rapport par l'opération :

(2.159)

Explications :

La différence donne toujours le rayon r et c un point dans le centre de Gauss. donne l'homothétie
du rayon par rapport à l'origine du plan de Gauss et finalement l'addition par c la translation nécessaire pour que
l'homothétie soit vue comme étant faite de centre c.

NOMBRES QUATERNIONS

Appelés aussi "hypercomplexes", les nombres quaternions ont été inventés en 1843 par William Rowan
Hamilton pour généraliser les nombres complexes.

Définition: Un quaternion est un élément et dont nous notons l'ensemble qui le contient et
que nous appelons "ensemble des quaternions".

Un "quaternion" peut aussi bien être représenté en ligne ou en colonne tel que :

(2.160)
Nous définissons la somme de deux quaternions (a,b,c,d) et (a',b',c',d') par :

(2.161)

Il est évident (du moins nous l'espérons pour le lecteur) que est un groupe commutatif (cf. chapitre de
Théorie Des Ensembles), d'élément neutre (0,0,0,0), l'opposé d'un élément (a,b,c,d) étant (-a,-b,-c,-d)

Remarque: C'est l'addition naturelle dans vu comme -espace vectoriel (cf. chapitre de Théorie Des
Ensembles).

L'associativité se vérifie en appliquant les propriétés correspondantes des opérations sur .

Nous définissons également la multiplication : (2.162)

de deux quaternions (a,b,c,d) et (a ',b ',c 'd ') par l'expression : (2.163)

C'est peut-être difficile à accepter mais nous verrons un peu plus loin qu'il y a un air de famille avec les
nombres complexes.

Nous pouvons remarquer que la loi de multiplication n'est pas commutative. Effectivement, en prenant la
définition de la multiplication ci-dessous, nous avons:

(2.164)

Mais nous pouvons remarquer que : (2.165)

Remarque: La loi de multiplication est distributive avec la loi d'addition mais c'est un excellent exemple où il
faut quand même prendre garde à démontrer la distributivité à gauche et à droite, puisque le produit n'est pas
commutatif !

La multiplication à pour élément neutre: (1,0,0,0) (2.166)

Effectivement : (2.167)

Tout élément: (2.168)

est inversible.

En effet, si (a,b,c,d) est un quaternion non nul, nous avons alors nécessairement:

(2.169)

sinon les quatre nombres a, b, c, d sont de carré nul, donc tous nuls. Soit alors le quaternion défini
par :
(2.170)

alors en appliquant machinalement la définition de la multiplication des quaternions, nous vérifions que :

(2.171)

ce dernier quaternion est donc l'inverse pour la multiplication!

Montrons maintenant (pour la culture générale) que le corps des complexes est un sous-corps de
.

Remarque: Nous aurions pu mettre cette démonstration dans le chapitre de Théorie Des Ensembles car nous
faisons usage de beaucoup de concepts qui y sont vus mais il nous a semblé un peu plus pertinent de la mettre
ici.

Soit l'ensemble des quaternions de la forme (a,b,0,0). Si est non vide, et si (a,b,0,0), (a',b',0,0) sont des
éléments de alors est un corps. Effectivement :

P1. Pour la soustraction (et donc l'addition): (2.172)

P2. La multiplication: (2.173)

P3. L'élément neutre: (2.174)

P4. Et finalement l'inverse: (2.175)

de (a,b,0,0) est encore dans .

Donc est un sous-corps de . Soit alors l'application :

(2.176)

f est bijective, et nous vérifions aisément que pour tous complexes , nous avons :

(2.177)
Donc f est un isomorphisme de sur .

Cet isomorphisme a pour intérêt (provoqué) d'identifier à et d'écrire , les lois d'addition et de
soustraction sur prolongeant les opérations déjà connues sur .

Ainsi, par convention, nous écrirons tout élément de (a,b,0,0) de sous la forme complexe a+ib. En
particulier 0 est l'élément (0,0,0,0), 1 l'élément (1,0,0,0) et i l'élément (0,1,0,0).

Nous notons par analogie et par extension j l'élément (0,0,1,0) et k l'élément (0,0,0,1). La famille {1,i,j,k} forme
une base de l'ensemble des quaternions vu comme un espace vectoriel sur ., et nous écrirons ainsi
le quaternion (a,b,c,d).

La notation des quaternions sous forme définie avant est parfaitement adaptée à l'opération de multiplication.
Pour le produit de deux quaternions nous obtenons en développant l'expression :

(2.178)

16 termes que nous devons identifier à la définition d'origine de la multiplication des quaternions pour obtenir

les relations suivantes : (2.179)

Ce qui peut se résumer dans un tableau :

· 1 i j k
1 1 i j k
i i -1 k -j
j j -k -1 i
k k j -i -1
Tableau: 2.4 - Multiplication des composantes d'un quaternion

Nous pouvons constater que l'expression de la multiplication de deux quaternions ressemble en partie beaucoup
à un produit vectoriel (noté sur ce site) et scalaire (noté sur ce site) :

(2.180)

Si ce n'est pas évident (ce qui serait tout à fait compréhensible), faisons un exemple concret.

Exemple : Soient deux quaternions sans partie réelle : (2.181)

et les vecteurs de de coordonnées respectives (x, y, z) et (x', y', z'). Alors le produit :

(2.182)
est :

Nous pouvons aussi par curiosité nous intéresser au cas général... Soient pour cela deux quaternions:

(2.183)

Nous avons alors : (2.184)

Définition: Le centre du corps non-commutatif est l'ensemble des éléments de commutant pour la
loi de multiplication avec tous les éléments de .

Nous allons montrer que le centre de est l'ensemble des réels!

Soit le centre de , et (x, y, z, t) un quaternion. Nous devons avoir les conditions suivantes qui soient
satisfaites :

Soit alors pour tout nous cherchons :

(2.185)

ce qui donne en développant : (2.186)

après simplification (la première ligne du système précédent est nulle des deux côtés de l'égalité) :

(2.187)

la résolution de ce système, nous donne : (2.188)

Donc pour que le quaternion (x, y, z, t) soit le centre de il doit être réel (sans parties imaginaires)!

Au même titre que pour les nombres complexes, nous pouvons définir un conjugué des quaternions :

Définition: Le conjugué d'un quaternion est le quaternion

Au même titre que pour les complexes, nous remarquons que :

1. D'abord de manière évidente que si alors cela signifie que .

2. Que
3. Qu'en développant le produit nous avons :

(2.189)

que nous adopterons, par analogie avec les nombres complexes, comme une définition de la norme (ou module)

des quaternions tel que : (2.190)

Dès lors nous avons aussi immédiatement (relation qui nous sera utile plus tard):

(2.191)

Comme pour les nombres complexes (voir plus loin), il est aisé de montrer que la conjugaison est un
automorphisme du groupe .

Effetivement, soient et alors :

(2.192)

Il est aussi aisé de montrer qu'elle est involutive. Effectivement :

(2.193)

La conjugaison n'est par contre pas un automorphisme multiplicatif du corps . En effet, si nous
considérons la multiplication de Z, Z' et en prenons le conjugué :

(2.194)

nous voyons immédiatement (ne serait-ce que pour la deuxième ligne) que nous avons:

(2.195)

Revenons maintenant sur notre norme (ou module).... Pour cela, calculons le carré de la norme de :

(2.196)

Nous savons (par définition) que : (2.197)


notons ce produit de manière telle que : (2.198)

Nous avons alors : (2.199)

en substituant il vient : (2.200)

après un développement algébrique élémentaire (honnêtement ennuyeux), nous trouvons :

(2.201)

Donc : (2.202)

Remarque: La norme est donc un homomorphisme de dans . Par la suite, nous noterons G
l'ensemble des quaternions de norme 1.

INTERPRETATION MATRICIELLE

Soit q et p deux quaternions donnés, soit l'application:

La multiplication (à gauche) peut être faite avec une application linéaire (cf. chapitre d'Algèbre Linéaire) sur
.

Si q s'écrit: (2.203)

cette application a pour matrice, dans la base 1, i, j, k : (2.204)

Ce que nous vérifions bien : (2.205)

En fait, nous pouvons alors définir les quaternions comme l'ensemble des matrices ayant la structure visible ci-
dessus si nous le voulions. Cela les réduirait alors à un sous espace vectoriel de .

En particulier, la matrice de 1 (la partie réelle du quaternion q) n'est alors rien d'autre que la matrice identité :

(2.206)
de même : (2.207)

ROTATIONS

Nous allons maintenant voir que la conjugaison par un élément du groupe G des quaternions de norme unité
peut s'interpréter comme une rotation pure dans l'espace!

Définition: La "conjugaison" par un quaternion q non nul et de norme unité est l'application définie sur
par : (2.208)

et nous affirmons que cette application est une rotation.

Remarques:

R1. Comme q est de norme 1, nous avons bien évidemment donc . Ce quaternion peut être
vu comme la valeur propre (unitaire) de l'application (matricielle) p sur le vecteur (on se retrouve avec un
concept en tout point similaire aux matrices orthogonales de rotation vues en algèbre linéaire).

R2. est une application linéaire (donc si c'est bien une rotation, la rotation peut être décomposée en plusieurs
rotations). Effectivement, prenons deux quaternions et des réels, alors nous avons :

(2.209)

Vérifions maintenant que l'application est bien une rotation pure. Comme nous l'avons vu lors de notre étude de
l'algèbre linéaire et en particulier des matrices orthogonales (cf. chapitre d'Algèbre Linéaire), une première
condition est que l'application conserve la norme.

Vérifions : (2.210)

Par ailleurs, nous pouvons vérifier qu'une rotation d'un quaternion purement complexe (tel qu'alors nous nous
restreignons à ) et la même rotation inverse sommées est nul (le vecteur sommé à son opposé s'annulent) :

(2.211)

nous vérifions trivialement que si nous avons deux quaternions q,p alors dès lors :

(2.212)

pour que cette opération soit nulle, nous voyons immédiatement que nous devons restreindre p aux quaternions
purement complexes. Dès lors :

(2.213)
Nous en déduisons alors que p doit être purement complexe pour que l'application soit une rotation et que
est un quaternion pur. En d'autres termes, cette application est stable (en d'autres termes : un quaternion
pur par cette application reste un quaternion pur).

restreint à l'ensemble des quaternions est donc une isométrie vectorielle, c'est-à-dire une symétrie ou une
rotation. Nous avons vu également lors de notre étude des matrices de rotation dans le chapitre d'Algèbre
Linéaire que l'application A devait être de déterminant 1 pour que nous ayons une rotation. Voyons si c'est le
cas de : Pour cela, nous calculons explicitement en fonction de : (2.214)

la matrice (dans la base canonique ) de et nous en calculons le déterminant. Ainsi, nous obtenons les

coefficients des colonnes de A en se rappelant que : (2.215) et ensuite en calculant :

(2.216)
Il faut alors calculer le déterminant de la matrice (pfff...) :

(2.217)

en se souvenant que (ce qui permet aussi de simplifier l'expression des termes de la diagonale comme nous
pouvons le voir dans certains ouvrages): (2.218)

nous trouvons que le déterminant vaut bien 1. Sinon, nous pouvons vérifier cela avec Maple:

>with(linalg):
> A:=linalg[matrix](3,3,[a^2+b^2-c^2-d^2,2*(a*d+b*c),2*(b*d-a*c),2*(b*c-a*d),a^2-b^2+c^2-
d^2,2*(a*b+c*d),2*(a*c+b*d),2*(c*d-a*b),a^2-b^2-c^2+d^2]);
> factor(det(A));

Montrons maintenant que cette rotation est un demi-tour d'axe (l'exemple qui peut sembler particulier est
général!) :

D'abord, si: (2.219)

nous avons : (2.220)

ce qui signifie que l'axe de rotation (x, y, z) est fixé par l'application elle-même !

D'autre part, nous avons vu que si q est un quaternion purement complexe de norme 1 alors et aussi
. Ce qui nous donne la relation: (2.221)

Ce résultat nous amène à calculer la rotation d'une rotation :

(2.222)

Conclusion : Puisque la rotation d'une rotation est un tour complet, alors est nécessairement un demi-tour
par rapport (!) à l'axe (x, y, z).

A ce stade, nous pouvons affirmer que toute rotation de l'espace peut se représenter par (la conjugaison par
un quaternion q de norme 1). En effet, les demi-tours engendrent le groupe des rotations, c'est-à-dire que toute
rotation peut s'exprimer comme le produit d'un nombre fini de demi-tours, et donc comme la conjugaison par
un produit de quaternions de norme 1 (produit qui est lui-même un quaternion de norme 1 ...).

Nous allons tout de même donner une forme explicite reliant une rotation et le quaternion qui la représente, au
même titre que nous l'avons fait pour les nombres complexes.

Soit un vecteur unitaire et un angle. Alors nous affirmons que la rotation d'axe et d'angle
correspond à l'application , où q est le quaternion :
(2.223)

Pour que cette affirmation soit vérifiée, nous savons qu'il faut que : la norme de q soit unitaire, le déterminant
de l'application soit égal à l'unité, que l'application conserve la norme, que l'application renvoie tout
vecteur colinéaire à l'axe de rotation sur l'axe de rotation.

1. La norme du quaternion proposé précédemment vaut effectivement 1 :

(2.224)

2. Le fait que q soit un quaternion de norme 1 amène immédiatement à ce que le déterminant de l'application
soit unitaire. Nous l'avons déjà montré plus haut dans le cas général de n'importe quel quaternion de norme 1
(condition nécessaire et suffisante).

3. Il en est de même pour la conservation de la norme. Nous avons déjà montré plus haut que c'était de toute
façon le cas dès que le quaternion q était de norme 1 (condition nécessaire et suffisante).

4. Voyons maintenant que tout vecteur colinéaire à l'axe de rotation est projeté sur l'axe de rotation. Notons q' le
quaternion purement imaginaire et unitaire . Nous avons alors :

(2.225)

Alors: (2.226)

mais comme q' est la restriction de q à ces éléments purs qui le constituent, cela revient à écrire:

(2.227)

Montrons maintenant le choix de l'écriture . Si désigne un vecteur unitaire orthogonal à


(perpendiculaire à l'axe de rotation donc), et p le quaternion alors nous avons :

(2.228)

Nous avons montré lors de la définition de la multiplication de deux quaternions que . Nous
obtenons alors :
(2.229)

Nous avons également montré que: (2.230)

(le demi-tour d'axe (x, y, z)). Donc : (2.231)

Remarque: Nous commençons à entrevoir ici déjà l'utilité d'avoir écrit dès le début pour l'angle.

Nous savons que p est le quaternion pur assimilé à un vecteur unitaire orthogonal à l'axe de rotation , lui-
même assimilé à la partie purement imaginaire de q'. Nous remarquons alors de suite que la partie imaginaire
du produit (défini!) des quaternions est alors égal au produit vectoriel . Ce produit vectoriel
engendre donc un vecteur perpendiculaireà et donc .

Le couple forme donc un plan perpendiculaire à l'axe de rotation (c'est comme pour les nombres
complexes simples dans lequel nous avons le plan de Gauss et perpendiculairement à celui-ci un axe de
rotation!).

Alors finalement : (2.232)

Nous nous retrouvons avec une rotation dans le plan identique à celle présentée plus haut avec les nombres
complexes normaux dans le plan de Gauss.

Nous savons donc maintenant comment faire n'importe quel type de rotation dans l'espace en une seule
opération mathématique et ce en plus par rapport à un libre choix de l'axe !

Nous pouvons aussi maintenant mieux comprendre pourquoi l'algèbre des quaternions n'est pas commutative.
Effectivement, les rotations vectorielles du plan sont commutatives mais celles de l'espace ne le sont pas
comme nous le montre l'exemple ci-dessous :

Soit la configuration initiale :

(2.233)
Alors une rotation autour de l'axe X suivie d'une rotation autour de l'axe Y :

(2.234)

n'est pas égale à une rotation autour de l'axe Y suivie d'une rotation autour de l'axe X :

(2.235)

Les résultats obtenus seront fondamentaux pour notre compréhension des spineurs (cf. chapitre de Calcul
Spinoriel) !

NOMBRES ALGÉBRIQUES ET TRANSCENDANTS

Définitions:

D1. Nous appelons "nombre entier algébrique de degré n", tout nombre qui est solution d'une équation
algébrique de degré n, à savoir: un polynôme de degré n (concept que nous aborderons dans la section
d'Algèbre) dont les coefficients sont des entiers relatifs et dont le coefficient dominant vaut 1.

D2. Nous appelons "nombre algébrique de degré n", tout nombre qui est solution d'une équation algébrique de
degré n, à savoir: un polynôme de degré n dont les coefficients sont des rationnels.

Un premier résultat intéressant et particulier dans ce domaine d'étude (curiosité mathématique...) est qu'un
nombre rationnel est un "nombre entier algébrique de degré n" si et seulement si c'est un entier relatif (lisez
plusieurs fois au besoin...). En termes savants, nous disons alors que l'anneau est "intégralement clos".

Démonstration:

Nous supposons que le nombre p/q, où p et q sont deux entiers premiers entre eux (c'est-à-dire dont le rapport
ne donne pas un entier ou plus rigoureusement... que le plus petit dénominateur commun est 1!), est une racine
du polynôme (cf. chapitre de Calcul Algébrique) suivant à coefficients entiers relatifs et dont le coefficient
dominant est unitaire: (2.236)

où l'égalité avec zéro du polynôme est implicite.

Dans ce cas: (2.237)

Puisque les coefficients sont par définition tous entiers et leurs multiples aussi dans la paranthèse, alors la
paranthèse à nécessairement une valeur dans .

Ainsi, q (à droite de la paranthèse) divise une puissance de p (à gauche de l'égalité), ce qui n'est possible, dans
l'ensemble (car notre paranthèse a une valeur dans cet ensemble pour rappel...), que si q vaut (puisqu'ils
étaient premiers entre eux).
Donc parmi tous les nombres rationnels, les seuls qui sont solutions d'équations polynômiales à coefficients
entiers relatifs et dont le coefficient dominant est unitaire sont des entiers relatifs!

Pour prendre un autre cas intéressant et particulier, il est facile de montrer qu'absolument tout nombre rationnel
est un "nombre algébrique". Effectivement, si nous prenons le plus simple polynôme suivant:

(2.238)

où q et p sont premiers entre eux et où q est différent de 1. Alors comme il s'agit d'une polynôme à coefficients

rationnels simple, après remaniement nous avons: (2.239)

Donc puisque q et p sont premiers entre eux et que q est différent de l'unité, nous avons bien que tout nombre
rationnel est un "nombre algébrique de degré 1".

Ainsi, la quantité de nombres rationnels "algébriques" est plus grand que le nombre de rationnels qui sont des
"entiers algébriques".

Nous avons aussi le nombre réel (et irrationnel) qui est un "nombre entier algébrique de degré 2", car il est
racine de: (2.240)

et le nombre complexe i qui est aussi un "nombre entier algébrique de degré 2", car il est racine de l'équation:

(2.241)

etc...

Définition: Les nombres qui ne sont pas algébriques (entiers ou non!) sont transcendants.

L'ensemble de tous les nombres transcendants est non dénombrable. La preuve est simple et ne nécessite aucun
développement mathématique difficile.

Effectivement, puisque les polynômes à coefficients entiers sont dénombrables, et puisque chacun de ces
polynômes possède un nombre fini de zéros (voir le théorème de factorisation dans le chapitre de Calcul
Algébrique), l'ensemble des nombres algébriques est dénombrable! Mais l'argument de la diagonale de Cantor
(cf. chapitre de Théorie des Ensembles) établit que les nombres réels (et par conséquent les nombres complexes
aussi) sont non dénombrables, donc l'ensemble de tous les nombres transcendants doit être non dénombrable.

En d'autres termes, il y a beaucoup plus de nombres transcendants que de nombres algébriques.

Les transcendants les plus connus sont et . Les démonstrations de leur transcendance est en cours de
rédaction. Nous devrions pouvoir vous les fournir fin 2014.

NOMBRES ABSTRAITS

Le nombre peut être envisagé en faisant abstraction de la nature des objets qui constituent le groupement qu'il
caractérise et ainsi qu'à la façon de codifier (chiffre arabe, romain, ou autre système universel). Nous disons
alors que le nombre est "abstrait".

Remarque: Arbitrairement, l'être humain a adopté un système numérique majoritairement utilisé de par le
monde et représenté par les symboles 1, 2, 3, 4, 5, 7, 8, 9 du système décimal et qui seront supposés connus
aussi bien en écriture qu'oralement par le lecteur (apprentissage du langage).
Pour les mathématiciens, il n'est pas avantageux de travailler avec ces symboles car ils représentent uniquement
des cas particuliers. Ce que cherchent les physiciens théoriciens ainsi que les mathématiciens, se sont des
"relations littérales" applicables dans un cas général et que les ingénieurs puissent en fonction de leurs besoins
changer ces nombres abstraits par les valeurs numériques qui correspondent au problème qu'ils ont besoin de
résoudre.

Ces nombres abstraits appelés aujourd'hui communément "variables" ou "inconnues" et utilisées dans le cadre
du "calcul littéral" sont très souvent représentés par:

1. L'alphabet latin : a, b, c, d, e...x, y, z ; A, B, C, D, E... (2.242)

où Les lettres minuscules du début l'alphabet latin (a, b, c, d, e...) sont souvent utilisées pour représenter de
manière abstraite des constantes, alors que les lettres minuscules de la fin de l'alphabet latin (...x, y, z) sont
utilisées pour représenter des entités (variables ou inconnues) dont nous recherchons la valeur.

2. L'alphabet grec :

Alpha Lambda
Beta Mu
Gamma Nu
Delta Xi
Epsilon Omicron
Zeta Pi
Eta Rho
Theta Sigma
Iota Tau
Kappa Upsilon
Phi Chi
Psi Omega
Tableau: 2.5 - Alphabet Grec

qui est particulièrement utilisé pour représenter soit des opérateurs mathématiques plus ou moins complexes
(comme la somme indexée , le variationnel , l'élément infinitésimal , le différentiel partiel , etc.) soit des
variables dans le domaine de la physique (comme pour la pulsation, la fréquence v, la densité , etc.).

3. L'alphabet hébraïque (à moindre mesure)

Remarque: Comme nous l'avons vu, les nombres transfinis sont par exemples donnés par la lettre "aleph".

Bien que ces symboles puissent représenter n'importe quel nombre il en existe quelques uns qui peuvent
représenter en physique des valeurs dites "constantes Universelles" comme la vitesse de la lumière c, la
constante gravitationnelle G, la constante de Planck h, etc.

Nous utilisons très souvent encore d'autres symboles que nous introduirons et définirons au fur et à mesure.

Remarque: Les lettres pour représenter les nombres auraient été employées pour la première fois par Viète au
16ème siècle.
DOMAINES DE DÉFINITION

Une variable est un nombre abstrait susceptible de prendre des valeurs numériques différentes. L'ensemble de
ces valeurs peut varier suivant le caractère du problème considéré.

Définitions:

D1. Nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques qu'elle est
susceptible de prendre entre deux valeurs finies ou infinies appelées "bornes".

Soit a et b deux nombres tel que . Alors :

D2. Nous appelons "intervalle fermé d'extrémité a et b", l'ensemble de tous les nombres x compris entre ces
deux valeurs comprises et nous le désignons de la façon suivante : (2.243)

D3. Nous appelons "intervalle ouvert d'extrémité a et b", l'ensemble de tous les nombres x compris entre ces
deux valeurs non comprises et nous le désignons de la façon suivante: (2.244)

D4. Nous appelons "intervalle fermé à gauche, ouvert à droite" l'ensemble suivant:

(2.245)

D5. Nous appelons "intervalle ouvert à gauche, fermé à droite" l'ensemble suivant:

(2.246)

Soit sous forme résumée et imagée:

[a,b] Intervalle fermé borné


Intervalle borné semi-fermé en a et
[a,b[ semi-ouvert en b (ou semi-fermé à
gauche et semi-ouvert à droite)
Intervalle borné semi-ouvert en a
]a,b] et semi-fermé en b (ou semi-ouvert
à gauche et semi-fermé à droite)
]a,b[ Intervalle ouvert borné.

Intervalle non borné fermé en b


]- ,b]
(ou fermé à droite)
Intervalle non borné ouvert en b
]- ,b[
(ou ouvert à droite)
Intervalle non borné fermé en a
[a ,+ [
(ou fermé à gauche)
Intervalle non borné ouvert en a
]a,+ [
(ou ouvert à gauche)
Tableau: 2.6 - Types d'intervalles et de bornes
Remarques:

R1. La notation {x tels que } désigne l'ensemble des réels x tels qui sont strictement plus grand que a
et strictement inférieur à b.

R2. Le fait de dire qu'un intervalle est par exemple ouvert en b signifie que le réel b ne fait pas partie de celui-
ci. Par contre, s'il y avait été fermé alors il en aurait fait partie.

R3. Si la variable peut prendre toutes les valeurs négatives et positives possibles nous écrivons dès
lors: où le symbole " " signifie une "infinité". Evidemment il peut y avoir des combinaisons
d'intervalles ouverts et infinis à droite, fermé et limité gauche et réciproquement.

R4. Nous rappellerons ces concepts avec une autre approche lorsque nous étudierons l'algèbre (calcul littéral).

Nous disons que la variable x est "ordonnée" si en représentant son domaine de définition par un axe horizontal
où chaque point de l'axe représente une valeur de x, alors que pour chaque couple de valeurs, nous pouvons
indiquer celle qui est "antécédente" (qui précède) et celle qui est "conséquente" (qui suit). Ici la notion
d'antécédente ou de conséquente n'est pas liée au temps, elle exprime juste la façon d'ordonner les valeurs de la
variable.

Définitions:

D1. Une variable est dite "croissante" si chaque valeur conséquente est plus grande que chaque valeur
antécédente.

D2. Une variable est dite "décroissante" si chaque valeur conséquente est plus petite que chaque valeur
antécédente.

D3. Les variables croissantes et les variables décroissantes sont appelées "variables à variations monotones" ou
simplement "variables monotones".
3. OPÉRATEURS ARITHMÉTIQUES

P arler des nombres comme nous l'avons fait dans le chapitre précédent amène naturellement à considérer les
opérations de calculs. Il est donc logique que nous fassions une description non exhaustive des opérations qui
peuvent exister entre les nombres. Ce sera l'objectif de ce chapitre.

Nous considérerons sur ce site qu'il existe deux types d'outils fondamentaux en arithmétique (nous ne parlons
pas de l'algèbre mais de l'arithmétique!) :

1. Les opérateurs arithmétiques :

Il existe deux opérateurs de base (addition et soustraction) à partir desquels nous pouvons construire d'autres
opérateurs : la "multiplication" et la "division".

Ces quatre opérateurs sont couramment appelés "opérateurs rationnels". Nous verrons ces derniers plus en
détails après avoir défini les relations binaires.

Remarque: Rigoureusement l'addition suffirait si nous considérons l'ensemble commun des réels car dès lors la
soustraction n'est que l'addition d'un nombre négatif.

2. Les opérateurs (relations) binaires :

Il existe 6 relations binaires fondamentales (égal, différent de, plus grand que, plus petit que, plus grand ou
égal, plus petit ou égal) qui permettent de comparer des grandeurs d'éléments se trouvant à gauche et à droite
(donc au nombre de deux, d'où leur nom) afin d'en tirer certaines conclusions.

Il est bien évidemment essentiel de connaître au mieux ses deux outils et leurs propriétés avant de se lancer
dans des calculs plus ardus.

RELATIONS BINAIRES

Le concept de "relation" est la base de toute la mathématique dont le but est d'étudier - par observation et
déduction (raisonnement), calcul et comparaison - des configurations ou relations abstraites ou concrètes de ses
objets (nombres, formes, structures) en cherchant à établir les liens logiques, numériques ou conceptuels entre
ces objets.

Définitions:

D1. Considérons deux ensembles non vides E et F (cf. chapitre de Théorie Des Ensembles) non nécessairement
identiques. Si à certains éléments x de E nous pouvons associer par une règle mathématique précise R (non
ambiguë) un élément y de F, nous définissons ainsi une "relation fonctionnelle" de E vers F et qui s'écrit:

(3.1)

Ainsi, de façon plus générale, une relation fonctionnelle R peut être définie comme une règle mathématique qui
associe à certains éléments x de E, certains éléments y de F.

Alors, dans ce contexte plus général, si xRy, nous disons que y est une "image" de x par R et que x est un
"antécédent" ou "pré-image" de y.

L'ensemble des couples (x, y) tel que xRy soit une assertion vraie forme un "graphe" ou une "représentation" de
la relation R. Nous pouvons représenter ces couples dans un repère adéquatement choisi pour faire une
représentation graphique de la relation R.
Il s'agit d'un type de relations sur lequel nous reviendrons dans le chapitre d'Analyse Fonctionnelle et qui ne
nous intéresse pas directement dans ce chapitre

D2. Considérons un ensemble A non vide, si nous associons à cet ensemble (et à celui-ci uniquement!) des
outils permettant de comparer les éléments le composant alors nous parlons de "relation binaire" ou "relation de
comparaison" et qui s'écrit pour tout élément x et y composant A: xRy (3.2)

Ces relations peuvent aussi être représentées sous forme graphique. Dans le cas des opérateurs binaires
classiques de comparaisons où A est l'ensemble des nombres naturels, relatifs, rationnels ou réels, cette forme
graphique est représentée par une droite horizontale (le plus souvent...) dans le cas de la congruence (cf.
chapitre de Théorie des Nombres) elle est représentée par des droites dans le plan dont les points sont donnés
par la contrainte de la congruence.

Comme nous l'avons déjà dit, il existe 6 relations binaires fondamentales (égal, différent de, plus grand que,
plus petit que, plus grand ou égal, plus petit ou égal). Mais nous verrons un peu plus loin que la définition
rigoureuse des relations binaires permet donc de construire des outils plus abstraits (comme par exemple la
congruence bien connue par les élèves de petites classes et que nous étudierons dans le chapitre de Théorie des
Nombres).

ÉGALITÉS

Il est fort difficile de définir la notion "d'égalité" dans un cas général applicable à toute situation. Pour notre
part, nous nous permettrons pour cette définition de nous inspirer du théorème d'extensionalité de la théorie des
ensembles (que nous verrons plus tard):

Définitions:

D1. Deux éléments sont égaux si, et seulement si, ils ont les mêmes valeurs.

L'égalité est décrite par le symbole = qui signifie "égal à".

Propriété (triviale) : Si nous avons , et c un nombre et une opération quelconque (tel que l'addition, la
soustraction, la multiplication ou la division) alors : (3.3)

Cette propriété est très utilisée pour résoudre ou simplifier des équations de type quelconque.

D2. Si deux éléments ne sont pas égaux (donc sont inégaux...), nous les relions par le symbole et nous disons
qu'ils sont "non égaux"

Il existe encore d'autres symboles d'égalités, qui sont une extension des deux que nous avons définis
précédemment. Malheureusement, ils sont assez souvent mal utilisés (disons plutôt qu'ils sont utilisés aux
mauvais endroits) dans la plupart des ouvrages disponibles sur le marché :

(3.4)

qui correspondent dans l'ordre à : presque égal (plutôt utilisé en ingénierie), asymptotiquement égal à (utilisé en
analyse fonctionnelle), approximativement égal (utilisé en physique lors d'approximation de séries), identique à
(utilisé aussi bien en analyse fonctionnelle qu'en physique), tend vers la limite (idem) et enfin proportionnel à
(utilisé en physique ou en mathématiques financières).

COMPARATEURS

Les comparateurs sont des outils qui nous permettent de comparer et d'ordonner tout couple de nombres (et in
extenso aussi des ensembles!).
La possibilité d'ordonner des nombres est presque fondamentale en mathématique. Dans le cas contraire (s'il
n'était pas possible ou non imposé d'ordonner), il y aurait des tas de choses qui choqueraient nos habitudes, par
exemple (certains des concepts présentés dans la phrase qui suit n'ont pas encore été vus mais nous souhaitons
quand même y faire référence) : plus de fonctions monotones (en particulier de suites) et lié à cela la dérivation
n'indiquerait donc rien sur un "sens de variation", plus d'approche de zéros d'un polynôme par dichotomie
(algorithme classique de recherche dans un ensemble ordonné partagé en deux à chaque itération), en
géométrie, plus de segments ni de demi-droites, plus de demi-espace, plus de convexité, nous ne pouvons plus
orienter l'espace, etc. C'est donc important de pouvoir ordonner les choses comme vous l'aurez compris.

Ainsi, pour tout nous écrivons lorsque a est plus grand ou égal à b : (3.5)

et lorsque a est plus petit ou égal à b : (3.6)

Remarque: Il est utile de rappeler que l'ensemble des réels est un groupe totalement ordonné (cf. chapitre de
Théorie Des Ensembles), sans quoi nous ne pourrions pas définir des relations d'ordre entre ces éléments (ce
qui n'est pas le cas des nombres complexes que nous ne pouvons pas ordonner!).

Définition: Le symbole est une "relation d'ordre" (voir la définition rigoureuse plus bas!) qui signifie "plus
petit que" et inversement le symbole est aussi une relation d'ordre qui signifie "plus grand que".

Nous avons également concernant la relation de comparaison stricte (qui n'appartient pas à la famille des
relations d'ordre pour des raisons que nous préciserons plus loin) les propriétés suivantes qui sont relativement
intuitives:

et (3.7)

implique (ultérieurement noté " ") que : (3.8)

Si : et (3.9)

Si : et (3.10)

inversement : et (3.11)

Nous avons aussi : (3.12)

et inversement : (3.13)

Nous pouvons bien évidemment multiplier, diviser, additionner ou soustraire un terme de chaque côté de la
relation telle que celle-ci soit toujours vraie. Petite remarque cependant, si vous multipliez les deux membres
par un nombre négatif il faudra bien évidemment changer le comparateur tel que si :

(3.14)

et inversement: (3.15)

Nous avons aussi: (3.16)

Soit : (3.17)
Si p est un nombre entier pair alors : (3.18)

sinon si p est impair: (3.19)

Ce résultat provient simplement de la multiplication des signes puisque la puissance lorsqu'elle est non
fractionnaire n'est qu'une multiplication.

Finalement : (3.20)

Les relations d'ordre : (3.21)

correspondent donc respectivement à : (strictement) plus grand que, (strictement) plus petit que, plus petit ou
égal à, plus grand ou égal à, beaucoup plus grand que et enfin beaucoup plus petit que.

Les relations d'ordre peuvent être définies de façon un peu plus subtile et rigoureuse et abstraite et ne
s'appliquent pas seulement aux comparateurs (voir par exemple la relation de congruence dans le chapitre de
Théorie Des Nombres)!

Voyons cela de suite (le vocabulaire qui va suivre est aussi défini dans le chapitre de Théorie Des Ensembles) :

Définition: Soit une relation binaire R d'un ensemble A vers lui-même, une relation R dans A est un sous-
ensemble du produit cartésien (c'est-à-dire que la relation binaire engendre un sous-ensemble de par
les contraintes qu'elle impose aux éléments de A qui satisfont la relation) avec la propriété d'être:

P1. Une "relation réflexive" si : (3.22)

P2. Une "relation symétrique" si : (3.23)

P3. Une "relation antisymétrique" si : (3.24)

P4. Une "relation transitive" si : (3.25)

P5. Une "relation connexe" si : (3.26)

Les mathématiciens ont donné des noms particuliers aux familles de relations satisfaisant certaines de ces
propriétés.

Définitions:

D1. Une relation est appelée "relation d'ordre stricte" si et seulement si elle est uniquement transitive (certains
spécifient alors qu'elle est donc forcément antiréflexive mais on s'en doute...).

D2. Une relation est appelée un "pré-ordre" si et seulement si elle y est réflexive et transitive.

D3. Une relation est appelée "une relation d'équivalence" si et seulement si elle y est réflexive, symétrique et
transitive.

D4. Une relation est appelée "relation d'ordre" si et seulement si elle y est réflexive, transitive et antisymétrique.

D5. Une relation est appelée "relation d'ordre total" si et seulement si elle y est réflexive, transitive, connexe et
antisymétrique.
Pour les autres combinaisons il semblerait (?) qu'il n'y ait pas de désignations particulières chez les
mathématiciens...

Remarque: Les relations d'ordre binaire ont toutes des propriétés similaires dans les ensembles naturels,
rationnels, relatifs et réels (il n'y a pas de relation d'ordre naturelle sur l'ensemble des nombres complexes).

Si nous résumons :

Relation binaire
réflexive oui Non non non oui oui
symétrique oui Oui non non non non
transitive oui Non oui oui oui oui
connexe non Non non non oui oui
antisymétrique oui Non non non oui oui
Tableau: 3.1 - Types de relations binaires

Ainsi, nous voyons que les relations binaires forment avec les ensembles précités, des relations d'ordre total
et qu'il est très facile de voir quelles relations binaires sont des relations d'ordre partiel, total ou d'équivalence.

Définition: Si R est une relation d'équivalence sur A. Pour , la "classe d'équivalence" de x est par
définition l'ensemble: (3.27)

[x] est donc un sous-ensemble de A ( ) que nous noterons aussi... par la suite R (attention donc à ne pas
confondre dans ce qui suit la relation d'équivalence et le sous-ensemble...).

Nous disposons ainsi d'un nouvel ensemble qui est "l'ensemble des classes d'équivalences" ou "ensemble
quotient" noté A/R. Ainsi : (3.28)

Il faut savoir que dans A/R nous ne regardons plus [x] comme un sous-ensemble de A mais comme un élément!

Une relation d'équivalence, de manière vulgarisée sert donc à coller une seule étiquette à des éléments qui
vérifient une même propriété, et à les confondre avec ladite étiquette (en sachant ce que nous faisons avec cette
étiquette).

Exemple:

Dans l'ensemble des entiers relatifs , si nous étudions les restes de la division par 2, nous avons que ceux-ci
valent toujours soit 0 soit 1.

La classe d'équivalence de zéro est alors appelée l'ensemble des nombres entiers pairs, la classe d'équivalence
de 1 est appelée l'ensemble des entiers impairs. Nous avons donc deux classes d'équivalences pour deux
partitions de (gardez toujours cet exemple simple en tête pour les éléments théorique qui suivront cela aide
énormément).

Si nous nommons la première 0 et la deuxième 1, nous retrouvons les règles d'opérations entre nombres pairs et
impairs : (3.29)

ce qui signifie respectivement que la somme de deux entiers pair est pair, que la somme d'un pair et d'un impair
est impair et que la somme de deux impairs est pair.

Et pour la multiplication : (3.30)


ce qui signifie respectivement que le produit de deux pairs est pair, le produit d'un pair et d'un impair est pair et
que le produit de deux impairs est impair.

Et hop, nous avons déplacé les opérations de sur cet ensemble quotient noté .

Maintenant, pour vérifier que nous avons bien affaire à une relation d'équivalence, il faudrait encore vérifier
qu'elle est réflexive (xRx), symétrique (si xRy alors yRx) et transitive (si xRy et yRz alors xRz). Nous verrons
comment vérifier cela quelques paragraphes plus loin car cet exemple constitue un cas très particulier de
relation de congruence.

Définition: L'application définie par est appelée "projection canonique". Tout élément
est alors appelé "représentant de la classe" [x].

Considérons maintenant un ensemble E. Alors nous proposons de démontrer qu'il y a bijection entre l'ensemble
des relations d'équivalences sur E et l'ensemble des partitions de E. En d'autres termes cette proposition dit
qu'une relation d'équivalence sur E n'est rien d'autre qu'une partition de E.

Démonstration:

Soit R une relation d'équivalence sur E. Nous choisissons comme ensemble d'indexation des partitions
et nous posons pour tout , .

Il suffit de vérifier les deux propriétés suivantes de la définition des partitions pour montrer que la famille

est une partition de E :

P1. Soit tels que alors (trivial) .

P2. est évident car si alors .

Encore une fois, il est aisé de vérifier avec l'exemple pratique de la division par 2 donné plus haut que la
partition des nombres pairs et impairs satisfont ces deux propriétés.

Nous avons donc associé à la relation d'équivalence R une partition de E. Réciproquement si est une
partition de E alors nous vérifions facilement que la relation R définie par xRy si et seulement s'il existe tel
que est une relation d'équivalence! Les deux applications ainsi définies sont bijectives et réciproques
l'une de l'autre.

Exemple:

Nous allons à présent appliquer sur un exemple un peu moins trivial que le précédent ce que nous venons de
voir à la construction des anneaux après quelques rappels (pour le concept d'anneau voir le chapitre de
Théorie Des Ensembles).

Rappels :

R1. Soit deux nombres . Nous disons que "n divise m" et nous écrivons si et seulement si il existe
un entier tel que (cf. chapitre de Théorie Des Nombres).
R2. Soit un entier. Nous définissons la relation R par nRm si et seulement si ou dit autrement
nRm si et seulement si il existe tel que . Généralement nous écrivons ceci aussi
(modulo d) au lieu de et nous disons que "n est congru à m modulo d". Rappelons aussi que
(modulo d) si et seulement si d divise n (cf. chapitre de Théorie Des Nombres).

Nous allons maintenant introduire une relation d'équivalence sur . Démontrons que pour tout entier , la
congruence modulo d est une relation d'équivalence sur (nous avons déjà démontré cela dans le chapitre de
théorie des nombres lors de notre étude de la congruence mais refaisons le travail pour le plaisir).

Démonstration (contrôle des trois propriétés de l'équivalence):

P1. Réflexivité : car .

P2. Symétrie : Si alors et donc c'est-à-dire .

P3. Transitivité : Si et alors et donc c'est-à-dire .

Dans la situation ci-dessus, nous notons l'ensemble des classes d'équivalences et noterons la classe
d'équivalence de la congruence d'un entier n donné par :

(3.31)

(chaque différence de deux valeurs se trouvant dans les accolades est divisible par d et c'est ainsi bien un classe
d'équivalence) et ainsi : (3.32)

En particulier (trivial car nous obtenons ainsi tout ): (3.33)

Ainsi, nous voyons que le premier exemple que nous avions donné avec les nombres pairs et impairs est un cas
particulièrement simple des classes d'équivalences de congruence modulo 2 car elle se réduisent toutes à
seulement deux classes.

Remarque: Les opérations d'addition et de multiplication définies sur définissent des opérations d'addition et
de multiplication sur . Nous disons alors que ces opérations sont compatibles avec la relation
d'équivalence et forment alors un anneau (cf. chapitre de Théorie Ensembles).

LOIS FONDAMENTALES DE L'ARITHMÉTIQUE

Comme nous l'avons déjà dit précédemment, il existe un opérateur de base (addition) à partir duquel il possible
de définir la multiplication, la soustraction (à condition que l'ensemble de nombres soit ad hoc) et la division
(même remarque que pour la soustraction) et autour desquels nous pouvons construire toute la mathématique
analytique.

Bien évidemment il y a certains subilités à prendre en compte lorsque le niveau de rigueur augmente. Le lecteur
peut alors se rapport au chapitre de Théorie Des Ensembles où ses lois fondamentales sont redéfinies avec plus
de justesse.

ADDITION

Définition: L'addition de nombres entiers est une opération notée "+" qui a pour seul but de réunir en un seul
nombre toutes les unités contenues dans plusieurs autres. Le résultat de l'opération se nomme "somme" ou
"total". Les nombres à additionner sont appelés "termes de l'addition".
Remarque: Les signes d'addition "+" et de soustraction "-" sont dus à Widmann (1489).

Ainsi, A+B+C... sont les termes de l'addition et le résultat est la somme des termes de l'addition.

Voici une liste de quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération de
l'addition:

P1. La somme de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors que l'addition est
une "opération commutative". Ce qui signifie que nous avons si A est différent de B:

P2. La somme de plusieurs nombres ne change pas si nous remplaçons deux ou plusieurs d'entre eux par leur
résultat intermédiaire. Nous disons alors que l'addition est "opération associative".

P3. Le zéro est l'élément neutre de l'addition car tout nombre additionné à zéro donne ce même nombre.

P4. Suivant l'ensemble dans lequel nous travaillons, l'addition peut comporter un terme de telle façon à ce que
le total soit nul. Nous disons alors qu'il existe un "opposé" pour l'addition.

Nous allons définir plus rigoureusement l'addition en utilisant l'axiomatique de Peano dans le cas particulier de
l'ensemble des nombres entiers naturels comme nous en avons déjà fait mention dans le chapitre traitant des
Nombres. Ainsi, avec ces axiomes il est possible de démontrer qu'il existe (existence) une et une seule
application (unicité), notée "+", de dans vérifiant :

où s signifie: "successeur".

Remarque: Ce site n'ayant pas pour vocation de s'adresser à des mathématiciens, nous nous passerons de la
démonstration (relativement longue) et admettrons intuitivement que l'application "+" existe et est unique... et
qu'il en découle les propriétés susmentionnées.

Soit des nombres quelconques alors nous pouvons noter également la somme ainsi:

(3.34)

en définissant des bornes supérieures et inférieures à la somme indexée (au-dessus et en-dessous de la lettre
grecque majuscule "sigma").

Voici quelques rappels des propriétés relatives à cette notation condensée: (3.35)

où k est une constante et : (3.36) (3.37)


Voyons maintenant quelque cas concrets d'additions de différents nombres simples afin de mettre en pratique
les bases.

Exemples:

L'addition de deux nombres relativement petits est assez facile dès que nous avons appris par coeur à compter
jusqu'au nombre résultant de cette opération. Ainsi (exemples pris sur la base décimale) :

, , (3.38)

Pour les plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par coeur. Ainsi par
exemple:

(3.39)

Démarche : nous additionnons les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la première
colonne nous avons donc 4+5=9 ce qui nous donne :

(3.40)

et nous continuons ainsi pour la deuxième 4+7=11 mais à la différence que comme nous avons un nombre
supérieur à la dizaine, nous reportons le premier chiffre (de gauche) sur la colonne suivante de l'addition. Ainsi:

(3.41)

La troisième colonne se calcule dès lors comme 4+2+1=7 ce qui nous donne:

(3.42)

Pour la dernière colonne nous avons 9+5=14 et à nouveau nous reportons le premier chiffre (de gauche) sur la
colonne suivante de l'addition. Ainsi:

(3.43)

et la dernière colonne donne : (3.44)


Voilà comment nous procédons donc pour l'addition de nombres quelconques : nous faisons une addition par
colonne de droite à gauche et si le résultat d'une addition est supérieure à la dizaine, nous reportons une unité
sur la colonne suivante.

Cette méthodologie d'addition est simple à comprendre et à effectuer. Nous ne étendrons pas plus sur le sujet
pour l'instant.

SOUSTRACTION

Définition: La soustraction du nombre entier A par le nombre entier B notée par le symbole "-", c'est trouver le
nombre C qui, ajouté à B, redonne A.

Remarque: L'opération n'est rigoureusement parlant pas possible dans les entiers naturels que si .

Nous écrivons la soustraction sous la forme : (3.45)

qui doit vérifier : (3.46)

Voici quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération de soustraction
(bon cela découle de l'addition...) :

P1. La soustraction de plusieurs nombres dépend de l'ordre des termes. Nous disons alors que la soustraction est
une "opération non-commutative". Effectivement: (3.47)

P2. La soustraction de plusieurs nombres change si nous remplaçons deux ou plusieurs d'entre eux par leur
résultat intermédiaire. Nous disons alors que la soustraction est une "opération non-associative". Effectivement:

(3.48)

P3. Le zéro n'est pas l'élément neutre de la soustraction. Effectivement, tout nombre à qui nous soustrayons
zéro donne ce même nombre, donc le zéro est neutre à droite... mais pas à gauche car tout nombre que nous
soustrayons à zéro ne donne pas zéro!

P4. Suivant l'ensemble dans lequel nous travaillons, la soustraction peut comporter un terme de telle façon à ce
que le total soit nul. Nous disons alors qu'il existe un "opposé" pour la soustraction.

Exemples:

La soustraction de deux nombres relativement petits est assez facile dès que nous avons appris par coeur à
compter jusqu'à au moins le nombre résultant de cette opération. Ainsi:

, , (3.49)

Pour les plus grands nombres il faut adopter un autre méthode qu'il s'agit d'apprendre par coeur (au même titre
que l'addition). Ainsi par exemple:

(3.50)
nous soustrayons les colonnes (4 colonnes dans cet exemple) de droite à gauche. Pour la première colonne nous
avons ce qui fait que nous reportons -1 sur la colonne suivante et écrivons en bas de la
barre d'égalité :

(3.51)

et nous continuons ainsi pour la deuxième ce qui fait que nous reportons -1 sur la colonne
suivante et comme nous reportons en bas de la barre d'égalité:

(3.52)

La troisième colonne se calcule dès lors comme et nous reportons -1 sur la colonne suivante et
comme nous reportons en bas de la barre d'égalité :

(3.53)

Pour la dernière colonne nous avons nous reportons donc rien sur la colonne suivante et comme
nous reportons 0 en bas de la barre d'égalité:

(3.54)

Voilà comment nous procédons donc pour la soustraction de nombres quelconques. Nous faisons une
soustraction par colonne de droite à gauche et si le résultat d'une soustraction est inférieure à zéro nous faisons
reporter -1 sur la colonne suivante et l'addition du dernier report sur la soustraction obtenue en bas de la barre
d'égalité.

La méthodologie utilisée pour la soustraction se basant sur exactement le même principe que l'addition nous ne
étendrons pas plus sur le sujet. Cette méthode est très simple et nécessite bien sûr une certaine habitude à
travailler avec les chiffres pour être totalement appréhendée.

MULTIPLICATION

Définition: La multiplication de nombres est une opération qui a pour but, étant donné deux nombres, l'un
appelé "multiplicateur", et l'autre "multiplicande", d'en trouver un troisième appelé "produit" qui soit la somme
(donc la multiplication d'écoule de la somme !) d'autant de nombres égaux au multiplicande qu'il y a d'unités au
multiplicateur. Le multiplicande et le multiplicateur sont appelés les "facteurs du produit".
La multiplication s'indique à l'aide du signe " " (anciennement) ou du point de ponctuation surélevé (notation
moderne) ou sans aucun symbole tel que : (3.55)

Remarque: Le signe de croix " " pour la multiplication se trouve pour la première fois dans l'ouvrage
d'Ougtred (1631) quant au point à mi-hauteur (notation moderne pour la multiplication), nous le devons à
Leibniz. Dès 1544, Stiefel, dans un de ses ouvrages n'employait aucun signe et désignait le produit de deux
nombres en les plaçant l'un après l'autre.

Nous pouvons définir la multiplication en utilisant l'axiomatique de Peano dans le cas particulier des nombres
entiers naturels comme nous en avons déjà fait mention dans le chapitre traitant des Nombres. Ainsi, avec ces
axiomes il est possible de démontrer qu'il existe (existence) une et une seule application (unicité), notée " " ou
plus souvent ".", de dans vérifiant :

(3.56)

Remarque: Ce site n'ayant pas pour vocation de s'adresser à des mathématiciens, nous nous passerons de la
démonstration (relativement longue) et admettrons intuitivement que l'application " " existe et est unique...

La puissance est une notation particulière d'un cas précis de multiplications. Lorsque le(s) multiplicateur(s) et
multiplicande(s) sont identique(s) en valeur numérique, nous notons la multiplication (par exemple):

(3.57)

c'est ce que nous nommons la "notation en puissance" ou "l'exponentiation". Le nombre en exposant est ce que
nous nommons la "puissance" ou "l'exposant" du nombre (n en l'occurrence). La notation en exposants se
trouve pour la première fois dans l'ouvrage de Chuquet intitulé "Triparty en la science des nombres" (1484).

Vous pouvez vérifier par vous-même que ses propriétés sont les suivantes (par exemple):

(3.58)

Voici quelques propriétés intuitives que nous admettrons sans démonstrations de l'opération de multiplication :

P1. La multiplication de plusieurs nombres ne dépend pas de l'ordre des termes. Nous disons alors que la
multiplication est une "opération commutative".

P2. La multiplication de plusieurs nombres ne change pas si nous remplaçons deux ou plusieurs d'entre eux par
leur résultat intermédiaire. Nous disons alors que la multiplication est "opération associative".

P3. L'unité est l'élément neutre de la multiplication car tout multiplicande multiplié par le multiplicateur 1 est
égal au multiplicande.

P4. La multiplication peut comporter un terme de telle façon à ce que le produit soit égal à l'unité (l'élément
neutre). Nous disons alors qu'il existe un "inverse pour la multiplication" (mais cela dépend rigoureusement
dans quel ensemble de nombres nous travaillons).

P5. La multiplication est "distributive", c'est-à-dire que : (3.59)

l'opération inverse s'appelant la "factorisation".

Introduisons encore quelques notations particulières relatives à la multiplication :


1. Soit des nombres quelconques (non nécessairement égaux) alors nous pouvons noter le produit

ainsi: (3.60)

en définissant des bornes supérieurs et inférieures au produit indexé (au-dessus et en-dessous de la lettre
grecque majuscule "Pi").

Rappel des propriétés relatives à cette notation: (3.61)

pour tout nombre k tel que: (3.62)

Nous avons aussi par exemple: (3.63)

2. Nous définissons également la "factorielle" simplement (car il existe aussi un manière complexe de la définir
en passant par la fonction Gamma d'Euler comme cela est fait dans le chapitre de Calcul Différentiel Et
Intégral) par : (3.64)

Exemples:

Voyons quelques exemples simples de multiplications élémentaires. La multiplication de deux nombres


relativement petits est assez facile dès que nous avons appris par coeur à compter jusqu'à au moins le nombre
résultant de cette opération. Ainsi:

, , (3.65)

Pour les beaucoup plus grands nombres il faut adopter une autre méthode qu'il s'agit d'apprendre par coeur.
Ainsi par exemple:

(3.66)

nous multiplions colonne par colonne et nous additionnons l'ensemble des résultats décalés d'un chiffre comme
ci-dessous (8x4=32, 8x7=56, 8x5=40, 8x4=32) ainsi nous obtenons :

(3.67)
Cette méthodologie est très logique si vous avez bien compris comment nous construisons un chiffre en base
dix. Ainsi, nous avons (nous supposerons pour l'instant la distributivité comme connue):

(3.68)

Pour ne pas surcharger l'écriture dans la multiplication par la méthode "verticale", nous ne représentons pas les
zéros qui surchargeraient inutilement les calculs (et ce d'autant plus si le multiplicateur le multiplicande sont de
très grands nombres).

DIVISION

Définition: La division de nombres entiers (pour commencer par le cas le plus simple...) est une opération, qui
a pour but, étant donné deux nombres entiers, l'un appelé "dividende", l'autre appelé "diviseur", d'en trouver un
troisième appelé "quotient" qui soit le plus grand nombre dont le produit par le diviseur puisse se retrancher
(donc la division découle de la soustraction!) du dividende (la différence étant nommé le "reste" ou la
"congruence").

Remarque: Dans les cas des nombre réels il n'y a jamais de reste à la fin de l'opération de division (car le
quotient multiplié par le diviseur donne exactement le dividende)!

D'une façon générale dans le cadre des nombres entiers, si nous notons D le dividende, d le diviseur, Q le
quotient et R le reste nous avons la relation: (3.69)

en sachant que la division était initialement notée de la manière suivante: (3.70)

Nous désignons également souvent par "fraction" (au lieu de "quotient"), le rapport de deux nombres ou
autrement dit, la division du premier par le deuxième.

Remarque: Le signe de la division ":" est dû à Leibniz. La barre de fraction se trouve elle pour la première fois
dans les ouvrages de Fibonacci (1202) et elle est probablement due aux Hindous.

Si nous divisons deux nombres entiers et que nous souhaitons un entier comme quotient et comme reste (s'il y
en a un...), alors nous parlons de "division euclidienne".

Nous indiquons l'opération en plaçant entre les deux nombres, le dividende et le diviseur un " : " ou une barre
de division " / ".

Si nous avons : (3.71)

nous appelons l'inverse du dividende. A tout nombre est associé un inverse qui satisfait cette condition.

De cette définition il vient la notation (avec x étant un nombre quelconque différent de zéro) :

(3.72)
Dans le cas de deux nombres fractionnaires, nous disons qu'ils sont "inverses" ou "réciproques", lorsque leur
produit est égal à l'unité (comme la relation précédente) pour toute valeur de x, positive ou négative.

Remarques:

R1. Une division par zéro est ce que nous nommons une "singularité". C'est-à-dire que le résultat de la division
est indéterminé.

R2. Lorsque nous multiplions le dividende et le diviseur d'une division (fraction) par un même nombre, le
quotient ne change pas (il s'agit d'une fraction équivalente), mais le reste est multiplié par ce nombre.

R3. Diviser un nombre par un produit effectué de plusieurs facteurs revient à diviser ce nombre successivement
par chacun des facteurs du produit et réciproquement.

Les propriétés des divisions avec les notations condensées de puissances (exponentation) sont les suivantes
(nous laisserons le soin au lecteur de le vérifier avec des valeurs numériques):

(3.73)

ou : (3.74)

Rappelons qu'un nombre premier (entier relatif) est un nombre qui n'a d'autres diviseurs que lui-même et l'unité
(rappelons 1 n'est pas unn nombre premier). Donc tout nombre qui n'est pas premier a au moins un nombre
premier comme diviseur (excepté 1 par définition!). Le plus petit des diviseurs d'un nombre entier est donc un
nombre premier (nous détaillerons les propriétés des nombres premiers relativement au sujet de la division dans
le chapitre de Théorie des Nombres).

Voyons quelques propriétés de la division (certaines nous sont déjà connues car elles découlent d'un
raisonnement logique des propriétés de la multiplication) :

(3.75)

où la deuxième ligne est ce que nous appelons une "amplification des termes" et la cinquième ligne une "mise
au dénominateur commun".
Nous avons aussi les propriétés suivantes:

P1. La division de plusieurs nombres dépend de l'ordre des termes. Nous disons alors que la division est une
"opération non-commutative". Ce qui signifie que nous avons quant A est différent de B:

(3.76)

P2. La résultat de la division de plusieurs nombres change si nous remplacons deux ou plusieurs d'entre eux par
leur résultat intermédiaire. Nous disons alors que la division est "opération non-associative":

(3.77)

P3. L'unité est l'élément neutre à droite de la division car tout dividende divisé par le diviseur 1 est égal au
dividende mais l'unité n'est par contre pas neutre à gauche.

P4. La division peut comporter un terme de telle façon à ce que la division soit égale à l'unité (l'élément neutre).
Nous disons alors qu'il existe un "symétrique pour la division".

Si a et b sont deux nombres réels positifs et non nuls nous avons :

, (3.78)

(3.79)

Nous pouvons maintenant définir la racine q-ième principale d'un nombre quelconque a : (3.80)

la dernière relation n'étant définie que pour . Au niveau de la terminologie, nous avons : (3.81)

qui est une racine, le nombre a est le "radicante" et q est l'indice de la racine. Le symbol est appelé le
"radical".

De ce qui a déjà été dit pour les puissances, nous pouvons conclure aisément que:

(3.82)

et : (3.83)

il en ressort que : et (3.84)


Nous avons également si : (3.85)

si est impair et : (3.86)

si est pair.

Si et est impair, alors : (3.87)

est le nombre réel négatif b tel que: (3.88)

Si est pair alors bien sûr, comme nous l'avons déjà vu, la racine est complexe (cf. chapitre sur les
Nombres).

Si le dénominateur d'un quotient contient un facteur de la forme avec , en multipliant la numérateur


et le dénominateur par , nous supprimerons la racine au dénominateur, puisque :

(3.89)

Nous appelons communément ce procédé "rendre un dénominateur rationnel". Nous pouvons bien sûr faire de
même avec le numérateur.

POLYNÔMES ARITHMÉTIQUES

Définition: Un "polynôme arithmétique" (à ne pas confondre avec les polynômes algébriques qui seront étudiés
dans la section d'Algèbre) est un ensemble de nombres séparés les uns des autres par les opérations d'addition
ou de soustraction (+ ou -).

Les composants enfermés dans le polynôme sont appelés "termes" du polynôme. Lorsque le polynôme contient
un unique terme, nous parlons alors de "monôme", s'il y a deux termes nous parlons de "binôme", et ainsi de
suite...

La valeur d'un polynôme arithmétique est égale à l'excès de la somme des termes précédés du signe + sur la
somme des termes précédés du signe -.

Démonstration:
(3.90)

quelque soit les valeurs des termes.

Mettre en évidence l'unité négative -1 est ce que nous appelons une "factorisation" ou "mise en facteurs".
L'opération inverse, s'appelant une "distribution".

Le produit de plusieurs polynômes peut toujours être remplacé par un polynôme unique que nous appelons le
"produit effectué". Nous opérons habituellement comme suit: nous multiplions successivement tous les termes
du premier polynôme, en commençant par la gauche, par le premier, le second, ..., le dernier terme du second
polynôme. Nous obtenons ainsi un premier produit partiel. Nous faisons, s'il y a lieu, la réduction des termes
semblables. Nous multiplions ensuite chacun des termes du produit partiel successivement par le premier, le
second, ..., le dernier terme du troisième polynôme en commençant par la gauche et ainsi de suite.
Le produit des polynômes A,B,C, ...L, ... est la somme de tous les produits de n facteurs formés avec un terme
de A, un terme de B, ..., et un terme de L. S'il n'y a aucune réduction, le nombre des termes du produit est égal
au produit des nombres des termes des facteurs.

VALEUR ABSOLUE

Un nombre réel est constitué de deux parties: un signe + ou - et une valeur absolue.

Exemples:

E1. +7 est constitué du signe + et de la valeur absolue 7

E2. -5 est constitué du signe - et de la valeur absolue 5

La valeur absolue de +7 est donc 7, la valeur absolue de -5 est donc 5.

Définition: Pour tout nombre réel x, la "valeur absolue" de x, notée est donnée par:

(3.91)

Nous remarquons que: (3.92)

Ainsi que les expressions équivalentes: (3.93)

et : (3.94)

et encore: (3.95)

ces dernières étant souvent utilisées dans le cadre de la résolution des inéquations.

Indiquons qu'il est aussi utile d'interpréter l'expression comme la distance entre les deux nombres x et y
sur la droite réelle. Ainsi, en munissant l'ensemble des nombres réels de la distance valeur absolue, il devient un
espace métrique.

La résolution d'une inéquation telle que se résout alors simplement à l'aide de la notion de distance.
La solution est l'ensemble des réels dont la distance au réel 3 est inférieure ou égale à 9. C'est l'intervalle de
centre 3 et de rayons 9 ou autrement écrit: (3.96)

La valeur absolue a quelques propriétés triviales que nous énoncerons sans démonstrations:

P1. La valeur absolue de la somme algébrique de plusieurs nombres réels est inférieure ou égale à la somme des
valeurs absolues des composantes de la somme: (3.97)

ce que les mathématiciens appellent parfois la "première inégalité triangulaire".


P2. La valeur absolue de la différence est supérieure ou égale à la valeur absolue de la différence des valeurs

absolues des composantes de la différence: (3.98)

ce que les mathématiciens appellent parfois la "deuxième inégalité triangulaire".

P3. La valeur absolue du produit (multiplication) est égale au produit des valeurs absolues:

(3.99)

P4. La valeur absolue du rapport est égale au rapport des valeurs absolues: (3.100)

RÉGLES DE CALCUL

Fréquemment en informatique (dans le développement en particulier), nous parlons de "priorité des opérateurs".
En mathématiques nous parlons de "priorité des ensembles d'opérations et des règles des signes". De quoi
s'agit-il exactement?

Nous avons déjà vu quelles étaient les propriétés des opérations d'addition, soustraction, multiplication, mise en
puissance et division. Nous tenons donc à ce que le lecteur différencie la notion de "propriété" de celle ce de
"priorité" (que nous allons tout de suite voir) qui sont des choses complètement différentes.

En mathématiques, en particulier, nous définissons les priorités des symboles: {[( )]}

Autrement dit:

1. Les opérations qui sont entre parenthèses ( ) doivent êtres effectuées en premier dans le polynôme.

2. Les opérations qui sont entre crochets [ ] doivent êtres effectuées en second à partir des résultats obtenus des
opérations qui se trouvaient entre les parenthèses ( ).

3. Finalement, à partir des résultats intermédiaires des opérations qui se trouvaient entre parenthèses ( ) et
crochets [ ], nous calculons les opérations qui se situent entre les accolades { }.

Faisons un exemple, ceci sera plus parlant.

Exemple:

Soit à calculer le polynôme: (3.101)

Selon les règles que nous avons définies tout à l'heure, nous calculons d'abord tous les éléments qui sont entre
parenthèses ( ), c'est-à-dire: , , (3.102)

ce qui nous donne: (3.103)

Toujours selon le règles que nous avons définies tout à l'heure, nous calculons maintenant tous les éléments
entre crochets en commençant toujours à calculer les termes qui sont dans les crochets [ ] au plus bas niveau des
autres crochets [ ]. Ainsi, nous commencons par calculer l'expression qui se trouve dans le crochet
de niveau supérieur: .

Cela nous donne et donc: (3.104)


Il nous reste à calculer maintenant et donc: (3.105)

Nous calculons maintenant l'unique terme entre accolades, ce qui nous donne : (3.106)

Finalement il nous reste: (3.107)

Evidemment il s'agit d'un cas particulier... Mais le principe est toujours le même.

La priorité des opérateurs arithmétiques est une notion spécifique aux langages informatiques (comme nous en
avons déjà fait mention) du fait qu'on ne peut dans ces derniers écrire des relations mathématiques que sur une
ligne unique.

Ainsi, en informatique l'expression: (3.108)

s'écrit (à peu de choses près) : (3.109)

Un non-initié pourrait y lire: ou ou (3.110)

ou : (3.111)

et encore quelques autres... ce qui vous en conviendrez, est fort dangereux car nous arriverons à des résultats
différents à chaque fois (cas particuliers mis à part...) !

Ainsi, il a logiquement été défini un ordre de priorité des opérandes tel que les opérations soient effectuées dans
l'ordre suivant:

1. - Négation

2. ^ Puissance

3. * / Multiplication et division

4. \ division entière (spécifique à l'informatique)

5. Mod Modulo (cf. chapitre de Théorie Des Nombres)

6. + - Addition et soustraction

Evidemment les règles des parenthèses ( ), crochets [ ], et accolades { } qui ont été définies en mathématiques
s'appliquent à l'informatique.

Ainsi, nous obtenons dans l'ordre (nous remplaçons chaque opération effectuée par un symbole):

D'abord les termes entre parenthèses: (3.112)

Ensuite les règles de priorité des opérateurs s'appliquent dans l'ordre défini précédemment:

D'abord (1): (3.113)


ensuite (2) : (3.114)

nous appliquons la multiplication (3): (3.115)

et finalement la division (3): (3.116)

Les règles (4) et (5) ne s'appliquent pas à cet exemple particulier.

Finalement (6) : (3.117)

Ainsi, en suivant ces règles, ni l'ordinateur, ni l'être humain ne peuvent (ne devraient) se tromper lors de
l'interprétation d'une équation écrite sur une ligne unique.

En informatique, il existe cependant plusieurs opérateurs que nous ne retrouvons pas en mathématiques et qui
changent souvent de propriétés d'un langage informatique à un autre. Nous ne nous attarderons pas trop là-
dessus cependant, nous avons mis ci-dessous un petit descriptif:

L'opérateur de concaténation " & " est évalué avant les opérateurs de comparaisons.

Les opérateurs de comparaison (=, <, >, ...) possèdent tous une priorité identique.

Cependant, les opérateurs les plus à gauche dans une expression, détiennent une priorité plus élevée.

Les opérateurs logiques sont évalués dans l'ordre de priorité suivant:

1. Not - 2. And - 3. Or - 4. Xor - 5. Eqv - 6. Imp

Maintenant que nous avons vu les priorités des opérateurs, quelles sont les règles des signes en vigueur en
mathématiques?

D'abord, il faut savoir que ces dernières ne s'appliquent que dans le cas de la multiplication et la division. Soit
deux nombres positifs . Nous avons: (3.118)

Autrement dit, la multiplication de deux nombres positifs est un nombre positif et ceci est généralisable à la
multiplication de n nombres positifs.

Nous avons: (3.119)

Autrement dit, la multiplication d'un nombre positif par un nombre négatif est négatif. Ce qui est généralisable
à un résultat positif de la multiplication s'il y a un nombre pair de nombres négatifs et à un résultat négatif pour
un nombre impair de nombres négatifs sur la totalité n des nombres de la multiplication.

Nous avons: (3.120)

Autrement dit, la multiplication de deux nombres négatifs est positif. Ce qui est généralisable à un résultat
positif de la multiplication s'il y a un nombre pair de nombre négatifs et à un résultat négatif pour un nombre
impair de nombres négatifs.

Pour ce qui est des divisions, le raisonnement est identique: et (3.121)

Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la division sera positif.
Nous avons: et (3.122)

Autrement dit, si soit le numérateur ou le dénominateur est négatif, alors le résultat de la division sera
forcément négatif.

Nous avons: et (3.123)

Autrement dit, si le numérateur et le dénominateur sont positifs, alors le résultat de la division, sera forcément
positif.

Evidemment, si nous avons une soustraction de termes, il est possible de la récrire sous la forme :

(3.124)
4. THÉORIE DES NOMBRES

T raditionnellement, la théorie des nombres est une branche des mathématiques qui s'occupe des
propriétés des nombres entiers, qu'ils soient entiers naturels ou entiers relatifs. Plus généralement, le champ
d'étude de cette théorie concerne une large classe de problèmes qui proviennent naturellement de l'étude des
entiers. La théorie des nombres peut être divisée en plusieurs branches d'étude (théorie algébrique des
nombres, théorie calculatoire des nombres, etc.) en fonction des méthodes utilisées et des questions traitées.

Remarque: Le terme "arithmétique" était aussi utilisé pour faire référence à la théorie des nombres mais c'est
un terme assez ancien, qui n'est plus aussi populaire que par le passé.

Nous avons choisi de présenter dans cet exposé que les sujets qui sont indispensables à l'étude de la
mathématique et de la physique théorique ainsi que ceux devant faire absolument partie de la culture
générale de l'ingénieur.

PRINCIPE DU BON ORDRE

Nous tiendrons acquis ce principe qui dit que que tout ensemble non vide contient un plus petit
élément.

Nous pouvons utiliser ce théorème pour démontrer une propriété importante des nombres appelée "propriété
archimédienne" ou "axiome d'Archimède" qui s'énonce ainsi :

Pour où a est non nul, il existe au moins un entier positif n tel que: (4.1)

En d'autres termes, pour deux grandeurs inégales, il existe toujours un multiple entier de la plus petite,
supérieur à la plus grande. Nous appelons "archimédien" des structures dont les éléments vérifient une
propriété comparable (cf. chapitre de Théorie Des Ensembles).

Même si cela est trivial à comprendre faisons la démonstration car elle permet de voir le type de démarches
utilisés par les mathématiciens quand ils doivent démontrer des éléments triviaux de ce type...

Démonstration:

Supposons le contraire en disant que pour nous avons : (4.2)

Si nous démontrons que cela est absurde pour tout n alors nous aurons démontré la propriété archimédienne.

Considérons alors l'ensemble: (4.3)

En utilisant le principe du bon ordre, nous déduisons qu'il existe tel que pour tout .
Posons donc que ce plus petit élément est: (4.4)

et nous avons donc aussi: (4.5)

Comme par hypothèse nous devons alors avoir: (4.6)

et si nous réarrangeons et simplifions: (4.7)


et que nous simplifions le signe négatif nous devions donc avoir...: (4.8)

d'où une contradiction évidente!

Cette contradiction amène que l'hypothèse initiale comme quoi pour tout n alors est fausse et donc
que la propriété archimédienne est démontrée par l'absurde.

PRINCIPE D'INDUCTION

Soit S un ensemble de nombres naturels qui possède les deux propriétés suivantes :

P1.

P2. Si , alors

Alors : (4.9)

Nous construisons ainsi l'ensemble des nombres naturels (se référer au chapitre de Théorie des Ensembles
pour voir la construction rigoureuse de l'ensemble des nombres entiers avec les axiomes de Zermelo-
Fraenkel).

Soit maintenant: (4.10)

le symbole " \ " signifiant "excluant". Nous voulons démontrer que : (4.11)

A nouveau, même si cela est trivial à comprendre faisons la démonstration car elle permet de voir le type de
démarches utilisés par les mathématiciens quand ils doivent démontrer des éléments triviaux de ce type...

Démonstration:

Supposons le contraire, c'est-à-dire: (4.12)

Par le principe du bon ordre, puisque , B doit posséder un plus petit élément que nous noterons .

Mais puisque de par (P1), nous avons que et bien évidemment aussi que , c'est-à-dire
aussi . En faisant appel à (P2), nous avons finalement que , c'est-à-dire que , donc
une contradiction.

Exemple:

Nous souhaitons montrer à l'aide du principe d'induction, que la somme des n premiers carrés est égale à
, c'est-à-dire que pour nous aurions (cf. chapitre de Suites Et Séries):

(4.13)

D'abord la relation ci-dessus est facilement vérifiée pour nous allons montrer que vérifie
aussi cette relation. En vertu de l'hypothèse d'induction:
(4.14)

nous retrouvons bien l'hypothèse de la validité de la première relation mais avec , d'où le résultat.

Ce procédé de démonstration est donc d'une très grande importance dans l'étude de l'arithmétique; souvent
l'observation et l'induction ont permis de soupçonner des lois qu'il eût été plus difficile de trouver par a
priori. Nous nous rendons compte de l'exactitude des formules par la méthode précédente qui a donné
naissance à l'algèbre moderne par les études de Fermat et de Pascal sur le triangle de Pascal (voir la section
d'Algèbre)

DIVISIBILITÉ

Définition: Soit avec . Nous disons que "A divise B (sans restes)" s'il existe un entier q (le
quotient) tel que : (4.15)

auquel cas nous écrivons : A|B (4.16)

Dans le cas contraire, nous écrivons et nous lisons "A ne divise pas B".

Remarques:

1. Se rappeler que le symbole | est une relation alors que le symbole / est une opération!

2. Il ne faut pas confondre l'expression "A divise B" qui signifie que le reste est obligatoirement nul est "A
est le diviseur de la division de B" qui indique que le reste n'est pas forcément nul!

Par ailleurs, si A|B, nous dirons aussi que "B est divisible par A" ou que "B est un multiple de A".

Dans le cas où A|B et que , nous dirons que A est un "diviseur propre" de B.

De plus, il est clair que A|0 quel que soit sinon quoi nous avons une singularité.

Voici maintenant quelques théorèmes élémentaires se rattachant à la divisibilité:

T1. Si A|B, alors A|BC quel que soit

Démonstration:

Si A|B, alors il existe un entier q tel que . Alors, et ainsi A|BC.

T2. Si A|B et B|C, alors A|C.

Démonstration: Si A|B et B|C, alors il existe des entiers q et r tels que et . Donc,
et ainsi A|C.

T3. Si A|B et A|C, alors : , (4.17)


Démonstration: Si A|B et A|C, alors il existe des entiers q et r tels que et . Il s'ensuit que:

(4.18) et ainsi que .

T4. Si A|B et B|A, alors

Démonstration: Si A|B et B|A, alors il existe des entiers q et r tels que et . Nous avons
donc et ainsi ; c'est pourquoi nous pouvons avoir si et qu'ainsi

T5. Si A|B et alors

Démonstration: Si A|B et , alors il existe un entier tel que . Mais alors,


, puisque .

DIVISION EUCLIDIENNE

La division euclidienne est une opération qui, à deux entiers naturels appelés dividende et diviseur, associe
deux entiers appelés quotient et reste. Initialement définie aux entiers naturels non nuls, elle se généralise
aux entiers relatifs et aux polynômes, par exemple.

Définition: Nous appelons "division euclidienne" ou "division entière" de deux nombres A et B l'opération
consistant à diviser B par A en s'arrêtant quand le reste devient strictement inférieur à A.

Rappelons que tout nombre qui n'a pas de diviseur euclidien autre 1 et lui-même est dit "nombre premier" et
que tout couple de nombres qui n'ont que 1 comme diviseur euclidien commun sont dits "premiers entre
eux".

Soit avec . Le "théorème de la division euclidienne" affirme qu'il existe des entiers uniques
q et r tels que : (4.19)

où . De plus, si , alors .

Démonstration: Considérons l'ensemble: (4.20)

Il est facile de voir que et que , d'où, d'après le principe du bon ordre, nous concluons
que S contient un plus petit élément . Soit q l'entier satisfaisant donc à (4.21)

Nous voulons d'abord montrer que en supposant le contraire (démonstration par l'absurde), c'est-à-dire
que . Alors, dans ce cas, nous avons : (4.22)

ce qui est équivalent à: (4.23)

mais et: (4.24)

ce qui contredit le fait que : (4.25)


est le plus petit élément de S. Donc, . Enfin, il est clair que si , nous avons A|B, d'où la seconde
affirmation du théorème.

Remarque: Dans l'énoncé de la division euclidienne, nous avons supposé que . Qu'obtenons-nous
lorsque ? Dans cette situation, -A est positif, et alors nous pouvons appliquer la division euclidienne à
B et -A. Par conséquent, il existe des entiers q et r tels que: où (4.26)

Or, cette relation peut s'écrire , où bien sûr, -q est un entier. La conclusion est que la division
euclidienne peut s'énoncer sous la forme plus générale :

Soit , alors il existe des entiers q et r tels que , où . De plus, si , alors


.

Les entiers q et r sont dans la division euclidienne uniques. En effet, s'il existe deux autres entiers et
tels que avec toujours , alors et ainsi . En vertu de
(T5) nous avons, si , . Or, cette dernière inégalité est impossible puisque
. Donc, et, puisque , alors ; d'où l'unicité.

PLUS GRAND COMMUN DIVISEUR

Soit tels que . Le "plus grand commun diviseur" (noté "PGCD" par la suite) de a et b, noté :

(4.27)

est l'entier naturel d non nul qui satisfait aux deux propriétés suivantes :

P1. d|a et d|b (donc sans reste r dans la division!)

P2. si c|a et c|b alors et c|d (par définition!)

Notons que 1 est toujours un diviseur commun de deux entiers arbitraires.

Exemple: Considérons les entiers positifs 36 et 54. Un diviseur commun de 36 et 54 est un entier positif
qui divise 36, et aussi 54. Par exemple, 1 et 2 sont des diviseurs communs de 36 et 54.

(4.28)

Nous avons alors l'intersection représentée par le diagramme de Venn suivant:

(4.29)
avec l'ensemble des diviseurs communs suivant: (4.30)

et donc le PGCD est: (4.31)

et nous constatons que l'ensemble des diviseurs communs de 36 et 54 est aussi l'ensemble des
diviseurs de 18.

Cependant, il n'est pas forcément évident que le PGCD autre qu'unitaire (c'est-à-dire différent 1) de deux
entiers a et b qui ne sont pas premier entre eux existe toujours. Ce fait est démontré dans le théorème suivant
(cependant, si le PGCD existe, il est de par sa définition unique!) dit "théorème de Bézout" qui permet aussi
de démontrer d'autres propriétés intéressantes de deux nombres comme nous le verrons plus tard.

Démonstration:

Soit tels que . Si d divise a et d divise b (pour les deux sans reste r!) il existe alors
obligatoirement des entiers relatifs x et y tels que: (4.32)

Cette relation est appelée "identité de Bézout" et il s'agit d'une équation diophantienne linéaire (cf. chapitre
de Calcul Algébrique).

Evidemment, si a et b sont premiers entre eux nous savons que d vaut alors 1.

Pour démontrer l'identité de Bézout considérons d'abord l'ensemble:

(4.33)

Comme et , nous pouvons utiliser le principe du bon ordre et conclure que S possède un plus
petit élément d. Nous pouvons alors écrire: (4.34)

pour un certain choix . Il suffit donc de montrer que pour démontrer l'identité de
Bézout!

Procédons via une démonstration par l'absurde en posant supposant . Alors si c'est le cas, d'après la
division euclidienne, il existe tels que , où . Mais alors:

(4.35)

Ainsi, nous avons que et , ce qui contredit le fait que d est le plus petit élément possible de S.
Donc nous avons démontré ainsi non seulement que d|a mais qu'en plus d existe toujours et, de la même
façon, nous démontrons que d|b.

Comme corollaire important montrons maintenant que si tels que , alors :

(4.36)

constitue l'ensemble de tous les multiples de :


Comme d|a et d|b, alors pour tout . Soit . Nous voulons montrer que
.

Soit d'abord ce qui signifie que d|s et qui implique . Soit un , cela voudrait donc dire
que pour un certain .

Comme pour un choix d'entiers quelconques , alors:

(4.37)

Les hypothèses peuvent sembler compliquées mais portez plutôt votre attention un certain temps sur la
dernière relation. Vous allez tout de suite comprendre!

Remarque: Si au lieu de définir le PGCD de deux entiers non nuls, nous permettons à l'un d'entre eux d'être
égal à 0, disons , ? Dans ce cas, nous avons a|b et , selon notre définition du PGCD, il est clair
que .

Soit et soit , alors nous avons les propriétés suivantes du PGCD :

P1.

P2. où

P3.

P4. Si tel que g|a et g|b alors

Dans certains ouvrages, ces quatre propriétés sont démontrées en utilisant intrinsèquement la propriété elle-
même. Personnellement nous nous en abstiendrons car faire cela est plus ridicule qu'autre chose à notre goût
car la propriété est une démonstration en elle-même.

Elaborons maintenant une méthode qui s'avérera très importante pour calculer le plus grand commun
diviseur de deux entiers (utile en informatique parfois).

ALGORITHME D'EUCLIDE

L'algorithme d'Euclide est un algorithme permettant de déterminer le plus grand commun diviseur de deux
entiers.

Pour aborder cette méthode de manière intuitive, il faut savoir que vous devez comprendre un nombre entier
comme une longueur, un couple d'entiers comme un rectangle (côtés) et leur PGCD est la taille du plus
grand carré permettant de carreler (paver) ce rectangle par définition (oui si vous réfléchissez un petit
moment c'est assez logique!).

L'algorithme décompose le rectangle initial en carrés, de plus en plus petits, par divisions euclidiennes
successives, de la longueur par la largeur, puis de la largeur par le reste, jusqu'à un reste nul. Il faut bien
comprendre cette démarche géométrique pour comprendre ensuite l'algorithme.
Exemple:

Considérons que nous cherchons le PGCD (a,b) où b vaut 21 et a vaut15 et gardons à l'esprit que le PGCD,
outre le fait qu'il divise a et b, doit laisser un reste nul! En d'autres termes il doit pouvoir diviser le reste de
la division de b par a aussi!

Nous avons donc le rectangle de 21 par 15 suivant:

(4.38)

D'abord nous regardons si 15 est le PGCD (on commence toujours par le plus petit). Nous divisons alors 21
par 15 ce qui équivaut géométriquement à:

(4.39)

15 n'est donc pas le PGCD (on s'en doutait...). Nous voyons immédiatement que nous n'arrivons pas à paver
le rectangle avec un carré de 15 par 15.

Nous avons donc un reste de 6 (rectange de gauche). Le PGCD comme nous le savons doit, s'il existe, par
définition pouvoir diviser ce reste et laisser un reste nul.

Il nous reste donc un rectangle de 15 par 6. Nous cherchons donc maintenant à paver ce nouveau rectangle
car nous savons que le PGCD est par construction inférieur ou égal à 6. Nous avons alors:
(4.40)

Et nous divisons donc 15 par le reste 6 (ce résultat sera inférieur à 6 et permet immédiatement de tester si le
reste sera le PGCD). Nous obtenons:

(4.41)

A nouveau, nous n'arrivons pas à paver ce rectangle rien qu'avec des carrés. En d'autres termes, nous avons
un reste non nul qui vaut 3. Soit un rectangle de 6 par 3. Nous cherchons donc maintenant à paver ce
nouveau rectangle car nous savons que le PGCD est par construction inférieur ou égal à 3 et qu'il laissera un
reste nul si il existe. Nous avons alors géométriquement:

(4.42)

Nous divisons 6 par 3 (ce qui sera inférieur à 3 et permet immédiatement de tester si le reste sera le PGCD):

(4.43)

et c'est tout bon! Nous avons 3 qui laisse donc un reste nul et divise le reste 6 il s'agit donc du PGCD. Nous
avons donc au final:
Maintenant, voyons l'approche formelle équivalente:

Soit , où . En appliquant successivement la division euclidienne (avec b>a), nous obtenons la

suite d'équations: (4.44)

Si , alors .

Sinon de manière plus formelle:

Démonstration:

Nous voulons d'abord montrer que . Or, d'après la propriété :

(4.45)

nous avons : (4.46)

Pour démontrer la deuxième propriété de l'algorithme d'Euclide, nous écrivons l'avant dernière équation du
système sous la forme: (4.47)

Or, en utilisant l'équation qui précède cette avant dernière équation du système, nous avons :

(4.48)

En continuant ce processus, nous arrivons à exprimer comme une combinaison linéaire de a et b.

Exemple:

Calculons le plus grand commun diviseur de (966,429) et exprimons ce nombre comme une combinaison
linéaire de 966 et de 429.

Nous appliquons bien évidemment l'algorithme d'Euclide: (4.49)

Nous en déduisons donc que : (4.50)

et, de plus, que: (4.51)


Donc le PGCD est bien exprimé comme une combinaison linéaire de a et b et constitue à ce titre le PGCD.

Définition: Nous disons que les entiers sont "relativement premiers" si :

(4.52)

PLUS PETIT COMMUN MULTIPLE

Définitions:

D1. Soit , nous disons que m est un "commun multiple" de si pour


.

D2. Soit , nous appelons "plus petit commun multiple" (PPCM) de , noté :

(4.53)

le plus petit entier positif par tous les communs multiples de .

Exemple :

Considérons les entiers positifs 3 et 5. Un multiple commun de 3 et 5 est un entier positif qui est à la fois un
multiple de 3, et un multiple de 5. Autrement dit, qui est divisible par 3 et aussi par 5. Nous avons donc:

(4.54)

Nous avons alors l'intersection représentée par le diagramme de Venn suivant:

(4.55)

avec l'ensemble des communes multiples suivant: (4.56)

et le PPCM est alors: (4.57)


On constate que l'ensemble des multiples communs de 3 et 5 est aussi l'ensemble des multiples de 15.

Remarque: Soit . Alors, le plus petit commun multiple existe. En effet, considérons
l'ensemble: (4.58)

Puisque , alors l'ensemble est non vide et, d'après l'axiome du bon ordre, l'ensemble E contient
un plus petit élément positif.

Voyons maintenant quelques théorèmes relatifs au PPCM :

T1. Si m est un commun multiple de alors

Démonstration:

Soit . Alors, d'après la division euclidienne, il existe des entiers q et r tels que:

(4.59)

Il suffit de montrer que . Supposons (démonstration par l'absurde). Puisque et ,


alors on a et cela pour . Donc, r est un commun multiple de plus petit que le
PPCM On vient d'obtenir une contradiction, ce qui prouve le théorème.

T2. Si , alors

La démonstration sera supposée évidente (dans le cas contraire contactez-nous et cela sera détaillé!)

T3.

Démonstration:

Pour la démonstration, nous allons utiliser le "lemme d'Euclide" qui dit que si a|bc et alors a|c.

Effectivement cela se vérifie aisément car nous avons vu qu'il existe tels que et alors
. Mais a|ac et a|bc impliquent que , c'est-à-dire également que .

Revenons à notre théorème:

Puisque et , il suffit de prouver le résultat pour des entiers positifs a et b. En


tout premier lieu, considérons le cas où . L'entier [a,b] étant un multiple de a, nous pouvons écrire
. Ainsi, nous avons et, puisque , il s'ensuit, d'après le lemme d'Euclide, que b | m.
Donc, et alors . Mais ab est un commun multiple de a et b qui ne peut être plus petit que le
PPCM. c'est pourquoi .

Pour le cas général, c'est-à-dire , nous avons, d'après la propriété : (4.60)


et avec le résultat obtenu précédemment que: (4.61)

Lorsque nous multiplions des deux côtés de l'équation par , le résultat suit et la démonstration est
effectuée.

THÉORÈME FONDAMENTAL DE L'ARITHMÉTIQUE

Le théorème fondamental de l'arithmétique dit que tout nombre naturel peut s'écrire comme un produit
de nombres premiers, et cette représentation est unique, à part l'ordre dans lequel les facteurs premiers sont
disposés.

Le théorème établit l'importance des nombres premiers. Essentiellement, ils sont les briques élémentaires de
construction des entiers positifs, chaque entier positif contenant des nombres premiers d'une manière unique.

Remarque: Ce théorème est parfois appelé "théorème de factorisation" (un peu à tort... car d'autres
théorèmes portent le même nom...).

Démonstration:

Si n est premier, alors la preuve est terminée. Supposons que n n'est pas premier et considérons l'ensemble:

(4.62)

Alors, et , puisque n est composé, nous avons que . D'après le principe du bon ordre, D
possède un plus petit élément qui est premier, sans quoi le choix minimal de serait contredit. Nous
pouvons donc écrire . Si est premier, alors la preuve est terminée. Si est composé, alors nous
répétons le même argument que précédemment et nous en déduisons l'existence d'un nombre premier et
d'un entier tels que . En poursuivant ainsi nous arrivons forcément à la conclusion que
sera premier.

Donc finalement nous avons bien démontré qu'un nombre quelconque est décomposable en facteurs de
nombres premiers à l'aide du principe du bon ordre.

Nous ne connaissons pas à ce jour de loi simple qui permette de calculer le n-ième facteur premier .
Ainsi, pour savoir si un entier m est premier, il est pratiquement plus facile à ce jour de vérifier sa présence
dans une table de nombres premiers.

En fait, nous utilisons aujourd'hui la méthode suivante :

Soit un nombre m, si nous voulons déterminer s'il est premier ou non, nous calculons s'il est divisible par les

nombres premiers qui appartiennent à l'ensemble : (4.63)

Exemple:

L'entier 223 n'est divisible par 2, ni par 3, ni par 5, ni par 7, ni par 11, ni par 13. Il est inutile de continuer
avec le prochain nombre premier, car . Nous en déduisons dès lors que le nombre 223 est
premier.
CONRUENCES

Définition: Soit . Si a et b ont même reste dans la division euclidienne par m nous disons que "a
est congru à b modulo m", et nous écrivons : (4.64)

ou de manière équivalente il existe un nombre entier relatif k tel que : (4.65)

Le lecteur pourra vérifier que cela impose que (4.66)

soit en français.... que m divise la différence entre a et b. Dans le cas contraire, nous disons que "a est non
congru à b modulo m".

Une autre manière de dire tout cela si ce n'est pas clair... :

L'étude de ces propriétés qui relient trois nombres entre eux est appelée communément "l'arithmétique
modulaire".

Remarques:

R1. Que nous soyons bien d'accord, la congruence implique un reste nul pour la division !

R2. Nous excluons en plus de 0 aussi 1 et -1 pour les valeurs que peut prendre m dans la définition de la
congruence dans certains ouvrages.

R3. Derrière le terme de congruence se cachent des notions semblables mais de niveaux d'abstraction
différents :

- En arithmétique modulaire, nous disons donc que "deux entiers relatifs a et b sont congrus modulo m s'ils
ont même reste dans la division euclidienne par m". Nous pouvons aussi dire qu'ils sont congrus modulo m
si leur différence est un multiple de m.

- Dans la mesure des angles orientés, nous disons que "deux mesures sont congrues modulo si et
seulement si leur différence est un multiple de ". Cela caractérise deux mesures d'un même angle
(cf. chapitre de Trigonométrie).

- En algèbre, nous parlons de congruence modulo I dans un anneau commutatif (cf. chapitre de Théorie Des
Ensembles) dont I est un idéal : "x est congru à y modulo I si et seulement si leur différence appartient I".
Cette congruence est une relation d'équivalence, compatible avec les opérations d'addition et multiplication
et permet de définir un anneau quotient de l'ensemble parent avec son idéal I.

- Nous trouvons parfois, dans l'étude de la géométrie (cf. chapitre de Géométrie Euclidienne) le terme de
congru mis à la place de semblable. Il s'agit alors d'une simple relation d'équivalence sur l'ensemble des
figures planes.

La relation de congruence est une relation d'équivalence (cf. chapitre sur les Opérateurs), en d'autres
termes , soient alors la relation de congruence est :

P1. Réflexive : (4.67)

P2. Symétrique : (4.68)

P3. Transitive : (4.69)


Démonstration:

Les propriétés P1 et P2 sont évidentes (si ce n'est pas le cas faites le nous savoir nous développerons!). Nous
démontrerons P3. Les hypothèses impliquent que . Mais alors :

(4.70)

ce qui montre que a et c sont congrus modulo m.

La relation de congruence est compatible avec la somme et le produit (se rappeler que la puissance n'est
finalement qu'une extension du produit!).

Effectivement, soient tel que et alors :

P1.

P2.

Démonstrations:

Nous avons: (4.71)

par hypothèse. Mais alors : (4.72)

ce qui démontre P1. Nous avons également : (4.73)

ce qui démontre P2.

Remarque: La relation de congruence se comporte sur de nombreux points comme la relation d'égalité.
Néanmoins une propriété de la relation d'égalité n'est plus vraie pour celle de congruence, à savoir la
simplification : si , nous n'avons pas nécessairement .

Exemple : mais

Jusqu'ici, nous avons vu des propriétés des congruences faisant intervenir un seul modulus. Nous allons
maintenant étudier le comportement de la relation de congruence lors d'un changement de modulus.

P1. Si et d|m, alors

P2. Si et alors a et b sont congrus modulo [r,s]

Ces deux propriétés sont évidentes. Inutile d'aller dans les détails pour P1. Pour P2, puisque b-a est un
multiple de r et de s puisque par hypothèse :

(4.74)

b-a est donc un multiple du PPCM de r et s, ce qui démontre P2.


De ces propriétés il vient que si nous désignons par f(x) un polynôme à coefficient entiers (positifs ou
négatifs): (4.75)

La congruence donnera aussi .

Si nous remplaçons x successivement par tous les nombres entiers dans un polynôme f(x) à coefficients
entiers, et si nous prenons les résidus pour le module m, ces résidus se reproduisent de m en m (dans le sens
où la congruence se vérifie), puisque nous avons, quel que soit l'entier m et x:

(4.76)

Nous en déduisons alors l'impossibilité de résoudre la congruence suivante : (4.77)

en nombres entiers, si r désigne l'un quelconque des non-résidus (un résidu qui ne satisfait pas la
congruence).

CLASSES DE CONGRUENCE

Définition: Nous appelons "classe de congruence modulo m", le sous-ensemble de l'ensemble défini par
la propriété que deux éléments a et b de sont dans la même classe si et seulement si ou
qu'un ensemble d'éléments entre eux sont congrus par ce même modulo.

Remarque: Nous avons vu dans le chapitre traitant des opérateurs qu'il s'agit en fait d'une classe
d'équivalence car la congruence modulo m est, comme nous l'avons démontré plus haut, une relation
d'équivalence.

Exemple:

Soit . Nous divisons l'ensemble des entiers en classes de congruence modulo 3. Exemple de trois
ensembles dont tous les éléments sont congrus entre eux sans reste (observez bien ce que donne l'ensemble

des classes!) : (4.78)

Ainsi, nous voyons que pour chaque couple d'élément d'une classe de congruence, la congruence modulo 3
existe. Cependant, nous voyons que nous ne pouvons pas prendre où -9 se trouve dans le
première classe et -8 dans le seconde.

Le plus petit nombre non négatif de la première classe est 0, celui de la deuxième est 1 et celui de la dernière
est 2. Ainsi, nous noterons ces trois classes respectivement , le chiffre 3 en indice indiquant le
modulus.

Il est intéressant de noter que si nous prenons un nombre quelconque de la première classe et un nombre
quelconque de la deuxième, alors leur somme est toujours dans la deuxième classe. Ceci se généralise et
permet de définir une somme sur les classes modulo 3 en posant :

(4.79)
Ainsi que : (4.80)

Ainsi, pour tout , la classe de congruence de : (4.81)

est l'ensemble des entiers congrus à a modulo m (et congrus entre eux modulo m). Cette classe est notée :

(4.82)

Remarque: Le fait d'avoir mis entre parenthèse l'expression "et congrus entre eux modulo m" est du au fait
que la congruence, étant une relation d'équivalence nous avons comme nous l'avons démontré plus haut que
si , alors .

Définition: L'ensemble des classes de congruences (qui forment par le fait que la congruence est une
relation d'équivalence des : "classes d'équivalences"), pour un m fixe donne ce que nous appelons un
"ensemble quotient" (cf. chapitre Opérateurs). Plus rigoureusement, nous parlons de "l'ensemble quotient de
par la relation de congruence" dont les éléments sont les classes de congruences (ou : classes
d'équivalences) et qui forment alors l'anneau .

Nous déduisons de la définition les deux propriétés triviales suivantes :

P1. Le nombre b est dans la classe si et seulement si

P2. Les classes et sont égales si et seulement si

Montrons maintenant qu'il y a exactement m différentes classes de congruence modulo m, à savoir


.

Démonstration:

Soit , alors tout nombre entier a est congru modulo m à un et un seul entier r de l'ensemble
(remarquez bien, c'est important, que nous nous restreignons aux entiers positifs ou nuls
sans prendre en compte les négatifs!). De plus, cet entier r est exactement le reste de la division de a par m.
En d'autres termes, si , alors : (4.83)

si et seulement si où q est le quotient de a par m et r le reste. La démonstration est donc une


conséquence immédiate de la définition de la congruence et de la division euclidienne.

Définition: Un entier b est dans une classe de congruence modulo m est appelé "représentant de cette classe"
(il est claire que par la relation d'équivalence que deux représentants d'une même classe sont donc congrus
entre eux modulo m).

Nous allons pouvoir maintenant définir une addition et une multiplication sur les classes de congruences.
Pour définir la somme de deux classes , il suffit de prendre un représentant de chaque classe, de
faire leur somme et de prendre la classe de congruence du résultat. Ainsi (voir les exemples plus haut) :

(4.84)
et de même pour la multiplication : (4.85)

Par définition de la somme et du produit, nous constatons que la classe de 0 est l'élément neutre pour
l'addition : (4.86)

et la classe de l'entier 1 est l'élément neutre pour la multiplication :

(4.87)

Définition: Un élément de est "une unité" s'il existe un élément tel que

Le théorème suivant permet de caractériser les classes modulo m qui sont des unités dans :

Théorème : Soit [a] un élément . Alors [a] est une unité si et seulement si .

Démonstration: Supposons d'abord que . Alors par Bézout, nous avons son identité :
(4.88)

Autrement dit, as est congru à 1 modulo m. Mais ceci est équivalent à écrire par définition que ce
qui montre que [a] est une unité. Réciproquement, si [a] est une unité, ceci implique qu'il existe une classe
[s] telle que .

Ainsi, nous venons de démontrer que constitue bien un anneau puisqu'il possède une addition, une
multiplication, un élément neutre et un inverse.

FRACTIONS CONTINUES

La notion de fraction continue remonte à l'époque de Fermat et atteint son apogée avec les travaux de
Lagrange et Legendre vers la fin du 18ème siècle. Ces fractions sont importantes en physique car nous les
retrouvons en acoustique ainsi que dans la démarche intellectuelle qui a amené Galois à créer sa théorie des
groupes. Considérons dans un premier temps le nombre rationnel a/b avec avec et .
Nous savons que tous les quotients et les restes sont dans le cadre de la division euclidienne des entiers
positifs.

Rappelons l'algorithme d'Euclide vu plus haut (mais noté de manière un peu différente):

(4.89)
Par substitutions successives, nous obtenons:

(4.90)

Ce qui est aussi parfois noté: (4.91)

Ainsi, tout nombre rationnel positif peut s'exprimer comme une fraction continue finie où .

Exemples:

E1. Cherchons l'expression de 17/49. Nous savons déjà que donc que . Nous avons
alors:

(4.92)

Nous voyons bien dans cet exemple que nous avons effectivement . Nous pouvons également
remarquer que par construction:

(4.93)

où les crochets représentent la partie entière et nous avons aussi:

(4.94)

E2. Voyons comment extraire la racine carrée d'un nombre A par la méthode des fractions continues.

Soit a le plus grand nombre entier dont le carré est plus petit que A. On le soustrait de A. Il y a donc un
reste de:

(4.95)
où nous avons utilisé une des identités remarquables vues dans le chapitre d'Algèbre. D'où en divisant les

deux membres par la deuxième parenthèse, nous avons: (4.96)

Soit: (4.97)

Dans le dénominateur, nous remplaçons par:

(4.98)

Cela donne: (4.99)

etc.... on voit ainsi que le système est simple pour déterminer l'expression d'une racine en termes de fraction
continue.

Le développement du nombre a/b s'appelle le "développement du nombre a/b en fraction continue finie" et
est condensé sous la notation suivante: (4.100)

Nous considérerons comme intuitif que tout nombre rationnel peut s'exprimer comme fraction continue finie
et inversement que toute fraction continue finie représente un nombre rationnel. Par extension, un nombre
irrationnel est représenté par une fraction continue infinie!

Considérons maintenant une fraction continue finie. La fraction continue:

(4.101)

où est appelée la "k-ème réduite" ou la "k-ème convergente" ou encore le "k-ème quotient


partiel".

Avec cette notation, nous avons:

(4.102)

Pour simplifier les expressions ci-dessus, nous introduisons les suites (n pour numérateur et d
pour dénominateur) définies par:
(4.103)

à l'aide de cette construction, nous avons une petite inégalité intéressante immédiate pour un peu plus loin:

(4.104)

Avec la définition ci-dessus, nous constatons que:

(4.105)

Soit en généralisant: (4.106)

Maintenant, montrons pour un usage ultérieur que pour , nous avons:

(4.107)

Le résultat est immédiat pour . En supposant que le résultat est vrai pour i montrons qu'il est aussi vrai
pour . Puisque:

(4.108)

alors en utilisant l'hypothèse d'induction, nous obtenons le résultat!

Nous pouvons maintenant établir une relation indispensable pour la suite. Montre que si est la k-ème
réduite de la fraction continue simple finie alors:

(4.109)

Démonstration:

(4.110)

puisque: (4.111)
donc: (4.112)

ce qui nous indique que le signe est le même que celui de .

Il en résulte que pour k impair, et que pour k pair. Il s'ensuit que:

et (4.113)

Ensuite, puisque: (4.114)

Donc pour k pair, nous avons , nous en déduisons donc:

(4.115)

Montrons maintenant que toute fraction continue infinie peut représenter un nombre irrationnel quelconque.

En des termes formels, si est une suite d'entiers tous positifs et que nous considérons
alors celui-ci converge nécessairement vers un nombre réel si .

Effectivement il n'est pas difficile d'observer (c'est assez intuitif) avec un exemple pratique que nous avons:

(4.116)

lorsque .

Maintenant, notons x un nombre réel quelconque et la partie entière de ce nombre réel. Alors nous
avons vu tout au début de notre étude des fractions continues que: (4.117)

Il vient donc que: (4.118)

Attardons nous pour les nécessités du chapitre d'Acoustique sur le calcul d'une fraction continue d'un
logarithme en utilisant la relation précédente!

D'abord rappelons que: (4.119)

Soit (relation démontrée dans le chapitre d'Analyse fonctionnelle): (4.120)

avec et .

Soit défini par: (4.121)


Alors montrons que: (4.122)

En effet, pour nous avons: (4.123)

pour nous avons:

(4.124)

donc: (4.125)

et puisque nous avions montré que:

(4.126)

etc... par récurrence ce qui démontre notre droit d'utiliser ce changement d'écriture.

Exemple:

Cherchons l'expression de la fraction continue de: (4.127)

Nous savons en jouant avec la définition du logarithme que: (4.128)

donc: (4.129)

donc . Nous avons alors: (4.130)

et puisque: (4.131)

il vient: (4.132)

Donc nous avons le premier quotient partiel: (4.133)


Et in extenso nous avons déjà: (4.134)

Simplifions: (4.135)

Donc le premier quotient partiel peut s'écrire: (4.136)

et passons au deuxième quotient partiel. Nous savons déjà pour cela que: (4.137)

donc il est immédiat que et alors:

(4.138)

Il vient alors: (4.139)

etc... etc.
5. THÉORIE DES ENSEMBLES

L ors de notre étude des nombres, des opérateurs, et de théorie des nombres (dans les chapitres du même
nom), nous avons assez souvent utilisé les termes "groupes", "anneaux", "corps", "homomorphisme", etc. et
continuerons par la suite à le faire encore de nombreuses fois. Outre le fait que ces concepts soient d'une
extrême importance, permettant de faire des démonstrations ou de construire des concepts mathématiques
indispensables à l'étude de la physique théorique contemporaine (physique quantique des champs, théories
des cordes, modèle standard,...), ils permettent de comprendre les composants et les propriétés de base de la
mathématique et de ses opérateurs en rangeant ceux-ci par catégories distinctes. Ainsi, choisir de mettre la
théorie des ensembles en tant que cinquième chapitre de ce site est un choix tout à fait discutable puisque
rigoureusement c'est par là que tout commence... Cependant, nous avions besoin d'exposer quand même la
théorie de la démonstration ne serait-ce que pour les notations et les méthodes dont il sera fait usage ici.

Par ailleurs, lors de l'enseignement des mathématiques modernes dans le secondaire, voire primaire (années
70), on introduisit le langage des ensembles et l'étude préalable des relations binaires pour une approche plus
rigoureuse de la notion de fonctions et d'applications (voir la définition plus loin) et de la mathématique en
générale.

Définition: Nous parlons de "diagramme sagittal" (ou de "schéma sagittal" du latin sagitta = flèche) pour
tout schéma représentant une correspondance entre les composantes de deux ensembles reliés totalement ou
partiellement par un ensemble de flèches.

Exemple:

La représentation graphique d'une fonction définie de l'ensemble E={-3,-2,-1,0,1,2,3} vers l'ensemble


F={0,1,2,3,...9} conduirait au diagramme sagittal ci-dessous :

(5.1)

Une relation de E dans E fournirait un diagramme sagittal du type :

(5.2)
Le bouclage de chaque élément montrant une "relation réflexive" et la présence systématique d'une flèche
retour indiquant une "relation symétrique".

Cependant le choix d'introduire la théorie des ensembles dans les classes d'école a une raison aussi un peu
autre. Au fait, dans un souci de rigueur interne (in extenso : non liées à la réalité), une très grande partie des
mathématiques a été reconstruite à l'intérieur d'un seul cadre axiomatique, dénommé donc "théorie des
ensembles", dans le sens où chaque concept mathématique (autrefois indépendant des autres) est ramené à
une définition dont tous les constituants logiques proviennent de ce même cadre : elle est considérée comme
fondamentale. Ainsi, la rigueur d'un raisonnement effectué au sein de la théorie des ensembles est garantie
par le fait que le cadre est "non-contradictoire" ou "consistant". Voyons les définitions qui construisent ce
cadre.

Définitions:

D1. Nous appelons "ensemble" toute liste, collection ou rassemblement d'objets bien définis, explicitement
ou implicitement.

D2. Un "Univers" U est un objet dont les constituants sont des ensembles.

Il faut noter que ce que les mathématiciens appellent "univers" n'est pas un ensemble! En fait il s'agit d'un
modèle qui satisfait aux axiomes des ensembles.

Effectivement, nous verrons que nous ne pouvons pas parler de l'ensemble de tous les ensembles (ce n'est
pas un ensemble), pour désigner l'objet qui est constitué de tous les ensembles ainsi, nous parlons d'univers.

D3. Nous appelons "éléments" ou "membres de l'ensemble" les objets appartenant à l'ensemble et nous
notons : (5.3)

si p est un élément de l'ensemble A et dans le cas contraire : (5.4)

Si B est une "partie" de A, ou sous-ensemble de A, nous notons cela : ou (5.5)

dès lors, si pour tout : (5.6)

Nous identifiions également un ensemble soit en listant ses éléments (pas toujours forcément dénombrable
par ailleurs!), soit en donnant la définition de ses éléments (nombres pairs, impaires, diviseurs entiers de...,
etc.).

Exemples:

E1.

E2.

D3. Nous pouvons munir les ensembles d'un certain nombre de relations qui permettent de comparer ses
éléments (c'est utile parfois...) ou de comparer certaines de leurs propriétés. Ces relations sont appelées
"relations de comparaisons" ou "relations d'ordre" (cf. chapitre sur les Opérateurs).

Remarques:

R1. La structure d'ensemble ordonnée a été mise en place à la base dans le cadre de la théorie des Nombres
par Cantor et Dedekind.
R2. Comme nous l'avons démontré dans le chapitre sur les Opérateurs, sont totalement ordonnées
par les relations usuelles . La relation , souvent dite "d'ordre strict", n'est pas une relation d'ordre car
non réflexive et non antisymétrique (cf. chapitre sur les Opérateurs). Par exemple, dans , la relation "a
divise b", souvent notée par le symbole " | ", est un ordre partiel.

R3. Si R est un ordre sur E et F est une partie de E, la restriction à F de la relation R est un ordre sur F, dit
"ordre induit par R dans F".

R4. Si R est un ordre sur E, la relation R' définie par : (5.7)

est un ordre sur E, dit "ordre réciproque" de R. L'ordre réciproque de l'ordre usuel est l'ordre noté ainsi
que l'ordre réciproque de l'ordre "a divise b" dans est l'ordre "b est multiple de a".

L'ensemble est l'être mathématique de base, dont l'existence est posée : il n'est pas défini en tant que tel,
mais par ses propriétés, données par les axiomes. Il fait appel à une procédure humaine : une sorte de
fonction de catégorisation, qui permet à la pensée de distinguer plusieurs éléments qualifiés d'indépendants.

Nous pouvons démontrer à partir des ces concepts, que le nombre de sous-ensembles d'un ensemble de
cardinal n (nombre d'éléments) est :

Il y a d'abord l'ensemble vide , soit 0 éléments choisi par n, in extenso et ainsi de suite...

Le nombre de sous-ensembles de E correspond donc à la sommation de tous les coefficients binomiaux:

(5.8)

Or, nous avons (cf. chapitre de Calcul Algébrique): (5.9)

Donc: (5.10)

Exemple:

Considérons l'ensemble , nous avons l'ensemble des parties P(S) constitué par :

- "L'ensemble vide" :

- Les "singletons" :

- Les "duets" :

- Lui-même :

Tel que: (5.11)


Ce qui fait bien 8 éléments!

Remarque: L'ordre dans lequel sont différenciés les éléments ne rentre pas en compte lors du comptage des
parties de l'ensemble de départ.

En mathématique appliquée, nous travaillerons presque exclusivement avec des ensembles de nombres.
Nous nous se restreindrons donc à l'étude des définitions et propriétés de ces derniers.

Maintenant, formalisons les concepts de base permettant de travailler avec les ensembles les plus courants
que nous rencontrons dans les cursus scolaires de base.

AXIOMATIQUE DE ZERMELO-FRAENKEL

L'axiomatique de Zermelo-Fraenkel, abrégée "axiomatique ZF-C", présentée ci-dessous a été formulée par
Ernst Zermelo puis précisée par Adolf Abraham au début du 20ème siècle et complétée par l'axiome du
choix (d'où le C majuscule dans ZF-C). Elle est considérée comme la plus naturelle dans le cadre de la
théorie des ensembles.

Remarque: Il existe bien d'autres axiomatiques, basées sur le concept plus général de "classe", comme celle
développée par von Neumann, Bernays et Gödel (pour les notations, voir le chapitre traitant de la Théorie
De La Démonstration).

Strictement et techniquement parlant, les axiomes de ZF sont des énoncés du calcul des prédicats du premier
ordre (cf. chapitre de Théorie De La Démonstration) égalitaire dans un langage ayant un seul symbole
primitif pour l'appartenance (relation binaire). Ce qui suit doit donc seulement être perçu comme une
tentative d'exprimer en français la signification attendue de ces axiomes.

A1. Axiome d'extensionalité:

Deux ensembles sont égaux si, et seulement si ils ont les mêmes éléments. C'est ce que nous notons :

(5.12)

Donc A et B sont égaux si tout élément x de A appartient aussi à B et tout élément x de B appartient aussi à A.

A2. Axiome de l'ensemble vide:

L'ensemble vide existe, nous le notons: (5.13)

et il n'a aucun élément, son cardinal vaut donc 0.

En réalité cet axiome peut être déduit à partir d'un autre axiome que nous verrons un peu plus loin mais il est
pratique à introduire en tant que tel par commodité pédagogique dans les petites classes.

A3. Axiome de la paire:

Si A et B sont deux ensembles, alors, il existe un ensemble C contenant A et B et eux seuls comme éléments.
Cet ensemble C se note alors {A, B}.

Du point de vue des ensembles considérés comme des éléments cela donne:

(5.14)
Cet axiome montre aussi l'existence du "singleton" (single=seul) d'un ensemble noté : {X} (5.15)

qui est un ensemble dont le seul élément est X (donc de cardinal unitaire). Il suffit pour cela d'appliquer
l'axiome en posant l'égalité entre A et B.

A4. Axiome de la somme (dit aussi "axiome de l'union" ou encore "axiome de la réunion"):

Cet axiome permet de construire la réunion d'un ensemble, dit de façon plus commune la réunion de d'un
famille quelconque d'un ensemble, est un ensemble.

Autrement dit, il existe pour tout ensemble quelconque, un ensemble qui contient exactement les éléments
de tout élément de l'ensemble. La formalisation (peu intuitive) de cet axiome est la suivante:

(5.16)

C'est-à-dire qu'étant donné un ensemble quelconque A, il existe un ensemble B tel que, pour tout ensemble C
quelconque, C est élément de B si et seulement s'il existe un ensemble D tel que D soit un élément A et que
C soit un élément de D.

Un petit exemple particulier ne fera peut-être pas de mal... :

(5.17)

Nos voyons que conformément à l'axiome, chaque D est un élément de A et que chaque C est un élément de
D et ce pour chaque C appartenant à B. De même si nous prenons:

(5.18)

L'ensemble B est donc noté: (5.19) ou: (5.20)

A5. Axiome des parties (dit aussi "axiome de l'ensemble des parties") :

Il exprime que pour tout ensemle A, l'ensemble de ses parties P(A) existe.

Donc a tout ensemble A, nous pouvons associer un ensemble B qui contient exactement les parties (in
extenso les sous-ensembles) C du premier: (5.21)

Nous avons vu un tel exemple déjà plus haut avec :

(5.22)
A6. Axiome de l'infini:

Cet axiome exprime le fait qu'il existe un ensemble infini.

Pour le formaliser, nous disons qu'il existe un ensemble, dit "ensemble autosuccesseur" K contenant
(l'ensemble vide) tel que si x appartient à K, alors appartient également à K :

K est autosuccesseur : (5.23)

Cet axiome exprime donc que l'ensemble des entiers existe. Effectivement, est ainsi le plus petit
ensemble autosuccesseur, au sens de l'inclusion et par convention nous notons (où
nous construisons l'ensemble des naturels) :

(5.24)

A7. Axiome de régularité (dit aussi "axiome de fondation"):

Le but principal de cet axiome est d'éliminer la possibilité d'avoir A comme élément de lui-même.

Ainsi, pour tout ensemble non vide A, il existe un ensemble B qui est élément de A tel qu'aucun élément de A
ne soit élément de B (il faut bien différencier le niveau du langage utilisé, un ensemble et ses éléments n'ont
pas le même statut) ce que nous notons : (5.25)

En conséquence : (5.26)

Démonstration:

En effet, soit A un ensemble tel que . Considérons le singleton{A}, ensemble dont le seul élément est
A. D'après l'axiome de fondation, nous devons avoir un élément de ce singleton qui n'a aucun élément en
commun avec lui. Mais le seul élément possible est A lui-même, c'est-à-dire que nous devons avoir:

(5.27)

Or par hypothèse, et par construction . Donc , ce qui contredit l'assertion


précédente. Donc : (5.28)

A8. Axiome de remplacement (dit aussi "schéma de remplacement"):

Cet axiome exprime le fait que si une formule f est une fonctionelle alors pour tout ensemble A, il existe un
ensemble B constitué exactement des images des éléments A par cette fonction.

Soit, de manière un peu plus formelle, que soit l'ensemble A d'éléments a et la relation binaire f (qui est donc
en toute généralité une fonctionnelle), il existe un ensemble B constitué des éléments b tel que f(a,b) soit
vraie. Si f est une fonction où b est non libre cela signifie alors que:

et (5.29)
De manière technique nous écrivons cet axiome sous la forme:

(5.30)

Donc pour tout ensemble A et tout élément qu'il contient, il existe un et un seul b défini par la fonctionelle f
tel qu'il existe un ensemble B où pour tout élément a appartenant à l'ensemble A il existe un b appartenant à
l'ensemble B défini par la fonctionnelle f.

Voyons un exemple avec le prédicat binaire suivant qui pour la valeur de tout a de A détermine la valeur de

tout b de B: (5.31)

Donc de la connaissance que a vaut 1 nous en dérivons que b vaut 2 et de manière similaire (in extenso par
remplacement) si a vaut 3, nous en dérivons que b vaut 4.

Nous voyons bien au travers de ce petit exemple la relation forte qu'il y a à considérer le prédicat P comme
une fonction naïve! Par ailleurs, comme il y une infinité possible de fonctions f, le schéma de remplacement
est considéré comme une infinité d'axiomes.

A9. Axiome de sélection (dit aussi "schéma de compréhension"):

Cet axiome exprime simplement que pour tout ensemble A et toute propriété P exprimable dans le langage
de la théorie des ensembles, l'ensemble des éléments de A qui satisfont la propriété P existe.

Donc de manière plus formelle, à tout ensemble A et toute condition ou proposition P(x), il correspond un
ensemble B dont les éléments sont exactement les éléments x de A pour lesquels P(x) est vraie. C'est ce que
nous notons : (5.32)

De manière plus complète et rigoureuse nous avons en réalité pour toute fonctionelle f ne comportant pas a

comme variable libre: (5.33)

C'est typiquement l'axiome qui nous sert à construire l'ensemble des nombres pairs:

(5.34)

ou à démontrer l'existence de l'ensemble vide (et qui rend cacud l'axiome de l'ensemble vide) car il suffit de
poser qu'il existe un ensemble satisfaisant la propriété: (5.35)

et ce quelque soit l'ensemble A. Et seulement l'ensemble vide satisfait cette propriété de par l'axiome de
sélection.

Le respect des conditions très strictes de cet axiome permet d'éliminer les paradoxes de la "théorie naïve des
ensembles", comme le paradoxe de Russel ou le paradoxe de Cantor qui ont invalidé la théorie naïve des
ensembles.

Considérons par exemple l'ensemble R de Russell de tous les ensembles qui ne s'auto-contiennent pas (notez
bien que nous donnons une propriété de R sans expliciter quel est cet ensemble) :

(5.36)
Le problème est de savoir si R se contient ou non. Si , alors, R s'auto-contient, et, par définition
et inversement. Chaque possibilité est donc contradictoire.

Si maintenant nous désignons par C l'ensemble de tous les ensembles (l'Universel de Cantor), nous avons en
particulier : (5.37)

ce qui est impossible (i.e. par exemple avec la puissance du continu de l'ensemble de réels), d'après le
théorème de Cantor.

Ces "paradoxes" (ou "antinomies syntaxiques") proviennent d'un non respect des conditions d'application de
l'axiome de sélection : pour définir E (dans l'exemple de Russel), il doit exister une proposition P qui porte
sur l'ensemble R, qui doit être explicitée. La proposition définissant l'ensemble de Russell ou celui de Cantor
n'indique pas quel est l'ensemble E. Elle est donc invalide!

Un exemple fort sympathique et fort connu (c'est la raison pour laquelle nous le présentons) permet de
mieux comprendre (il s'agit du paradoxe de Russel) :

Un jeune étudiant se rendit un jour chez son barbier. Il engagea la conversation et lui demanda s'il avait de
nombreux concurrents dans sa jolie cité. De manière apparemment innocente, le barbier lui répondit :"Je n'ai
aucune concurrence. En effet, de tous les hommes de la cité, je ne rase évidemment pas ceux qui se rasent
eux-mêmes, mais j'ai le bonheur de raser tous ceux qui ne se rasent pas eux-mêmes."

En quoi donc, une telle affirmation si simple put-elle mettre en défaut la logique de notre jeune étudiant si
malin ?

La réponse est en effet innocente, jusqu'au moment ou nous décidons de l'appliquer au cas du barbier :

Se rase-t-il lui-même, oui ou non ?

Supposons qu'il se rase lui-même : il entre dans la catégorie de ceux qui se rasent eux-mêmes, dont le
barbier a précisé qu'il ne les rasait évidemment pas. Donc il ne rase pas lui-même.

Très bien ! Supposons alors qu'il ne se rase pas lui-même : il entre alors dans la catégorie de ceux qui ne se
rasent pas eux-mêmes, dont le barbier a précisé qu'il les rasait tous. Donc il se rase lui-même.

Finalement, ce malheureux barbier est dans une position étrange : s'il se rase lui-même, il ne se rase pas, et
s'il ne se rase pas lui-même, il se rase. Cette logique est autodestructrice, stupidement contradictoire,
rationnellement irrationnelle.

Vient alors l'axiome de sélection : Nous excluons le barbier de l'ensemble des personnes auxquelles
s'applique la déclaration. Car en réalité, le problème vient du fait que le barbier est un élément de l'ensemble
de tous les hommes de la cité. Ainsi, ce qui s'applique à tous les hommes ne s'applique pas au cas individuel
du barbier.

A10. Axiome du choix:

Étant donné un ensemble A d'ensembles non vides mutuellement disjoints, il existe un ensemble B
(l'ensemble de choix pour A) contenant exactement un élément pour chaque membre de A.

Indiquons cependant que la question de l'axiomatisation et donc des fondements se trouva quand même
ébranlée de deux questions à l'époque de leur construction: quels axiomes valides doivent être choisis et
dans un système d'axiomes les mathématiques sont-elles cohérentes (ne risque-t-on pas de voir apparaître
une contradiction)?
La première question fut soulevée d'abord par l'hypothèse du continu: si nous pouvons mettre deux
ensembles de nombres en correspondance terme à terme, ils ont le même nombre d'éléments (cardinal).
Nous pouvons mettre en correspondance les entiers avec les rationnels comme nous l'avons démontré dans
le chapitre sur les Nombres, ils ont donc même cardinal, nous ne pouvons par contre mettre en
correspondance les entiers avec les réels. La question est alors de savoir s'il y a un ensemble dont le nombre
d'éléments serait situé entre les deux ou pas? Cette question est importante pour construire la théorie
classique de l'analyse et les mathématiciens choisissent en général de dire qu'il n'y en a pas, mais nous
pouvons aussi dire le contraire.

En fait l'hypothèse du continu est liée de manière plus profonde à l'axiome du choix qui peut aussi être
formulé de la manière suivante: si C est une collection d'ensembles non vides alors nous pouvons choisir un
élément de chaque ensemble de la collection. Si C a un nombre fini d'éléments ou un nombre dénombrable
d'éléments, l'axiome semble assez évident: nous pouvons ranger les ensembles de C en les numérotant, et le
choix d'un élément dans chaque ensemble est simple. Là où ça se complique c'est lorsque l'ensemble C a la
puissance du continu: comment choisir des éléments s'il n'y pas la possibilité de les numéroter?

Finalement en 1938 Kurt Gödel montre que la théorie des ensembles est cohérente sans l'axiome du choix et
sans l'hypothèse du continu aussi bien qu'avec! Et pour clore tout ça Paul Cohen montre en 1963 que
l'axiome du choix et l'hypothèse du continu ne sont pas liés.

CARDINAUX

Définition: Des ensembles sont dits "équipotents" s'il existe une bijection (correspondance biunivoque)
entre ces ensembles. Nous disons qu'ils ont alors même "cardinal".

Ainsi, plus rigoureusement, un cardinal (qui quantifie le nombre d'éléments contenus dans l'ensemble) est
une classe d'équivalence (cf. chapitre sur les Opérateurs) pour la relation d'équipotence.

Remarque: Cantor est le principal créateur de la théorie des ensembles, sous une forme que nous qualifions
aujourd'hui de "théorie naïve des ensembles". Mais, à côté de considérations élémentaires, sa théorie
comportait des niveaux d'abstraction élevés. La vraie nouveauté de la théorie de Cantor, c'est qu'elle permet
de parler de l'infini. Par exemple, une idée importante de Cantor a justement été de définir l'équipotence.

Si nous écrivons en tant qu'égalité de cardinaux, nous entendons alors par là qu'il existe deux
ensembles équipotents A et B tels que : et (5.38)

Les cardinaux peuvent donc êtres comparés. L'ordre ainsi défini est une relation d'ordre total (cf. chapitre sur
les Opérateurs) entre les cardinaux (la preuve que la relation d'ordre est totale utilise l'axiome du Choix et la
preuve qu'elle soit antisymétrique est connue sous le nom de théorème de Cantor-Bernstein que nous
démontrons d'ailleurs plus bas).

Dire que signifie dans un vocabulaire simple que A est équipotent à une partie propre de B, mais B
n'est équipotent à aucune partie propre de A. Si Les mathématiciens diraient que le Card(A) est plus petit ou
égal au Card(B) si il existe une injection de A dans B.

Nous avons vu lors de notre étude des nombres, en particulier des nombres transfinis, qu'un ensemble
équipotent (ou en bijection) à était dit "ensemble dénombrable".

Voyons cette notion un petit peu plus dans les détails:

Soit A un ensemble, s'il existe un entier n tel qu'il y ait au moins à chaque élément de A un correspondant
dans l'ensemble {1,2,...n}(au fait rigoureusement il s'agit d'une bijection... concept que nous définirons plus
tard) nous disons alors que le cardinal de A, noté Card(A), est de "cardinal fini" et vaut n.
Dans le cas contraire, nous disons que l'ensemble A est de "cardinal infini" et nous posons :

(5.39)

Un ensemble A est donc "dénombrable" s'il existe une bijection entre A et . Un ensemble de nombre A est
"au plus dénombrable" s'il existe une bijection entre A et une partie . Un ensemble au plus dénombrable
est donc soit de cardinal fini, soit dénombrable.

Nous vérifions dès lors les propositions suivantes:

P1. Une partie d'un ensemble dénombrable est au plus dénombrable.

P2. Un ensemble contenant un ensemble non-dénombrable n'est lui aussi pas dénombrable

P3. Le produit de deux ensembles dénombrables est dénombrable

Remarque: Nous pouvons restreindre un ensemble de nombres par rapport à l'élément nul et aux éléments
négatifs ou positifs qu'il contient et dès lors nous notons (exemple pour l'ensemble des réels):

(5.40)

Ces notions étant analogues pour (l'ensemble des nombres complexe n'état pas ordonné, la deuxième
et troisième ligne ne s'y applique pas).

Donc tout sous-ensemble infini de est équipotent à lui-même. En particulier, il y a autant d'entier
naturels pairs que d'entiers naturels quelconques (utiliser la bijection ) de vers P, où P désigne
l'ensemble des entiers naturels pairs), autant d'entiers relatifs que d'entiers naturels, autant d'entiers relatifs
que de nombres rationnels (voir le chapitre traitant des nombres pour les démonstrations).

Nous pouvons donc écrire: (5.41)

et plus généralement, toute partie infinie de est dénombrable.

Un résultat important: tout ensemble infini possède donc une partie infinie dénombrable.

Puisque nous avons démontré dans le chapitre traitant des nombres que l'ensemble des réels avait la
"puissance du continu" et que l'ensemble des nombres naturels était de cardinal transfini , Cantor souleva
la question s'il existait un cardinal transfini entre et le cardinal de ? Autrement dit, existe-il un
ensemble infiniment grand qui serait intermédiaire entre l'ensemble des nombres entiers et l'ensemble des
réels?

Le problème se posa en notant bien évidemment le cardinal de et (nouveauté) le cardinal de et


en proposant de démontrer ou de contredire que: (5.42)
selon la loi combinatoire qui donne le nombre d'éléments de l'ensemble que l'on peut obtenir à partir de tous
les sous-ensembles d'un ensemble (tel que nous l'avons démontré précédemment).

Le reste de sa vie, Cantor essaya, en vain, de démontrer ce résultat que l'on nomma "l'hypothèse du continu".
Il n'y réussit pas et sombra dans la folie. En 1900, au congrès international des mathématiciens, Hilbert
estima qu'il s'agissait là d'un des 23 problèmes majeurs qui devraient êtres résolus au 20ème siècle.

Ce problème se résout d'une façon assez étonnante. D'abord, en 1938, un des plus grands logiciens du 20ème
siècle, Kurt Gödel, démontra que l'hypothèse de Cantor n'était pas réfutable, c'est-à-dire qu'on ne pourrait
jamais démontrer qu'elle était fausse. Puis en 1963, le mathématicien Paul Cohen boucla la boucle. Il
démontra qu'on ne pourrait jamais non plus démontrer qu'elle était vraie !!! Nous ne pouvons conclure à
juste raison que Cantor avait perdu la raison à chercher à démontrer un problème qui ne pouvait pas l'être.

PRODUIT CARTÉSIEN

Si E et F sont deux ensembles, nous appelons "produit cartésien de E par F" l'ensemble noté (à ne pas
confondre avec le produit vectoriel) formé de tous les couples possibles où e est un élément de E et f
un élément de F.

Autrement écrit: (5.43)

Nous remarquons facilement que et ne sont pas les mêmes ensembles (sauf bien sur si
).

Nous notons le produit cartésien de E par lui même : (5.44)

et nous disons alors est "l'ensemble des couples d'éléments de E".

Nous pouvons effectuer le produit cartésien d'une suite d'ensembles et ainsi obtenir
l'ensemble des n-uplets où .

Dans le cas où tous les ensembles sont identiques à E, le produit cartésien se note bien
évidemment . Nous disons alors que est "l'ensemble des n-uplets d'éléments de E".

Si E et F sont finis alors le produit cartésien est fini. De plus:

(5.45)

De là, nous voyons que si les ensembles sont finis alors le produit cartésien est

aussi fini et nous avons : (5.46)

En particulier, si E est un ensemble fini.

Exemples:

E1. Si est l'ensemble des nombres réels, est alors l'ensemble des couples de réels. Dans le plan
rapporté à un repère, tout point M admet des coordonnées qui sont un élément de .
E2. Lorsque nous lançons deux dés dont les faces sont numérotées de 1 à 6, chaque dé peut être symbolisé
par l'ensemble . Le résultat d'un lancer est alors un élément de . Le cardinal de
est alors 36. Il y a donc 36 résultats possibles quand nous lançons 2 dés dont les faces sont
numérotées de 1 à 6.

Remarque: La théorie de base des ensembles ainsi que le concept de cardinal sont à la base théorique des
logiciels de bases de données relationnelles.

BORNES

Soit M un ensemble de nombres quelconques de façon à ce que (exemple particulier mais fréquent)
nous avons comme définitions:

D1. est appelé "borne supérieure" ou "majorant" de l'ensemble M, si pour .


Inversement, nous parlons de "borne inférieure" ou de "minorant" (il ne faut donc pas confondre le concept
de borne avec le concept d'intervalle!).

D2. Soit . est appelé "plus petite borne supérieure" noté : (5.47)

de M si x est une borne supérieure de M et si pour toute borne supérieure nous avons
Inversement, nous parlons de "plus petite borne inférieure" que nous notons: (5.48)

Les définitions sont équivalentes dans le cadre de l'analyse fonctionnelle (voir chapitre du même nom)
puisque les fonctions sont définies sur des ensembles.

Effectivement, Soit f une fonction dont le domaine de définition I balaie tout . Ce que nous notons
et soit .

D1. Nous disons que f présente un "maximum global" en si: (5.49)

D2. Nous disons que f présente un "minimum global" en si: (5.50)

Dans l'un de ces deux cas, nous disons que f présente un "extremum global" en (c'est un concept que
nous retrouverons souvent en mécanique analytique!).

D3. f est "majorée" s'il existe un réel M tel que . Dans ce cas, la fonction possède une

borne supérieure de f sur son domaine de définition I notée traditionnellement: (5.51)

et elle représente donc la plus petite borne supérieure (le plus petit majorant).

D4. f est "minorée" s'il existe un réel M tel que . Dans ce cas, la fonction possède une

borne inférieure de f sur son domaine de définition I notée traditionnellement: (5.52)

et elle représente la plus grande borne inférieure (le plus grand minorant).

D5. Nous disons que f est "bornée" si elle est à la fois majorée et minorée (c'est le cas des fonctions
trigonométriques).
OPÉRATIONS ENSEMBLISTES

Nous pouvons construire à partir d'au moins trois ensembles A,B,C, l'ensemble des opérations (dont nous
devons les notations à Dedekind) existant dans la théorie des ensembles (très utiles dans l'étude des
probabilités et statistiques).

Remarque: Certaines des notations présentes ci-dessous se retrouveront fréquemment dans des théorèmes
complexes, il est donc nécessaire de bien comprendre de quoi il en retourne.

Ainsi, nous pouvons construire les opérations ensemblistes suivantes :

INCLUSIONS

Dans le cas le plus simple, nous définissons "l'inclusion" par : (5.53)

En langage non spécialisé voici qu'il faut lire : A est "inclus" (ou "fait partie", ou encore est un "sous-
ensemble") dans B alors pour tout x appartenant à A chacun des ces x appartient aussi à B.

(5.54)

De ceci il en découle les propriétés suivantes:

P1. Si et alors cela implique = et réciproquement

P2. Si et alors cela implique

INTERSECTION

Dans le cas le plus simple, nous avons : (5.55)

En langage non spécialisé voici qu'il faut lire : "L'intersection" des ensembles A et B consiste en l'ensemble
des éléments qui se trouvent à la fois dans A et dans B.

(5.56)
Plus généralement, si est une famille d'ensembles indexés par , l'intersection des est

notée : (5.57)

Cette intersection est donc définie explicitement par : (5.58)

C'est-à-dire que l'intersection de la famille d'ensembles indexés comprend tous les x qui se trouvent dans
chaque ensemble de tous les ensembles de la famille.

Soit deux ensembles A et B, nous disons qu'ils sont "disjoints" si et seulement si:

(5.59)

Par ailleurs, si : (5.60)

Les mathématiciens notent cela : (5.61)

et l'appellent "union disjointe"

Définition: Une collection d'ensembles non vides forment une "partition" d'un ensemble A si les
propriétés suivantes sont vérifiées :

P1. et

P2.

Exemples:

E1. L'ensemble des nombres pairs et l'ensemble des nombres impairs forment une partition de .

E2. La loi d'intersection est une loi commutative (voir plus loin la définition du concept de "loi") telle
que: (5.62)

RÉUNION/UNION

Dans le cas le plus simple, nous avons : (5.63)

En langage non spécialisé voici ce qu'il faut lire: La "réunion" ou "union" des ensembles A et B consiste en
l'ensemble des éléments qui se trouvent dans A et en plus dans B.

(5.64)
Plus généralement, si est une famille d'ensembles indexés par , l'union des est notée

. Cette réunion est définie par: (5.65)

C'est-à-dire que la réunion de la famille d'ensembles indexés comprend tous les x pour lesquels il existe un
ensemble indexé par i tel que x soit inclus dans cet ensemble .

Nous avons les propriétés de distributivité suivantes:

(5.66)

(5.67)

La loi de réunion est une loi commutative (voir plus loin la définition du concept de "loi") telle que:

(5.68)

Nous appelons par ailleurs "lois d'idempotences" les relations (précisons cela pour la culture générale):

(5.69) et "lois d'absorptions" les lois: (5.70)

Les lois de réunion et d'intersection sont associatives telles que:

(5.71)

et distributives telles que: (5.72)

DIFFÉRENCE

Dans le cas le plus simple, nous avons : (5.73)

En langage non spécialisé voici ce qu'il faut lire : La "différence" des ensembles A et B consiste en
l'ensemble des éléments qui se trouvent uniquement dans A (et qui excluent donc les éléments de B).

(5.74)
Si nous nous rappelons du concept de "cardinal" (voir plus haut), nous avons avec les opérations
précédemment définies, la relation suivante:

(5.75)

d'où si : (5.76)

DIFFÉRENCE SYMÉTRIQUE

Soit E un ensemble. Pour tout nous définissons la différence symétrique entre A et B par :

(5.77)

En langage non spécialisé voici que qu'il faut lire: La "différence symétrique" des ensembles A et B consiste
en l'ensemble des éléments qui se trouvent uniquement dans A et de ceux se trouvant uniquement dans B
(nous laissons donc de côté les éléments qui sont communs).

(5.78)

Les propriétés triviales sont les suivantes : P1.

P2.

P3.

PRODUIT

Dans le cas le plus simple, nous avons : (5.79)

En langage non spécialisé voici que qu'il faut lire: "l'ensemble produit" (à ne pas confondre avec la
multiplication ou le produit vectoriel) de deux ensembles A et B est l'ensemble des couples tels que:

(5.80)

L'ensemble produit des réels par exemple forme le plan où chaque élément est défini par une abscisse
et son ordonnée.

COMPLÉMENTARITÉ

Dans le cas le plus simple, nous avons : (5.81)


En langage non spécialisé voici que qu'il faut lire : Le "complémentaire" est défini comme en prenant B un
ensemble et A un sous-ensemble de B alors le complémentaire de A dans B est l'ensemble des éléments qui
sont dans B mais pas dans A.

Par exemple, dans la figure ci-dessous nous avons le complémentaire de A par rapport à U qui est indiqué en
gris (s'il est seul il s'agit donc de l'univers seul qui l'entoure).

(5.82)

Une autre notation très importante de la complémentarité qu'on retrouve parfois dans la littérature est la
suivante: ou (5.83)

ou dans le cas particulier à droit si dessus, nous pourrions aussi écrire B/A (la notation serait rarement
utilisée car elle peut prêter à confusion dans certaines situations).

Nous avons comme propriétés pour tout inclus dans B :

(5.84)

(5.85)

Voici quelques lois triviales relatives aux compléments:

(5.86)

Il existe d'autres lois très importantes en logique booléenne. Si nous considérons trois ensembles A, B, C

comme représentés ci-dessous: (5.87)


nous avons donc: (5.88)

et les fameuses "lois de De Morgan" sous forme ensembliste (cf. chapitre de Systèmes Logiques Formels) et

qui sont données par les relations : (5.89)

FONCTIONS ET APPLICATIONS

Définition: En mathématiques, une "application" (ou "fonction") notée f ou A est la donnée de deux
ensembles, l'ensemble de départ E et l'ensemble d'arrivée F (ou d'image de E), et d'une relation associant à
chaque élément x de l'ensemble de départ un et un seul élément de l'ensemble d'arrivée, que nous appelons
"image de x par f " et que nous notons f(x).

Nous appelons "images" les éléments de f(E) et les éléments de E sont appelés les antécédents.

Nous disons alors que f est une application de E dans F notée: (5.90)

(se rappeler du premier diagramme sagittal présenté au début de ce chapitre), ou encore une application à
arguments dans E et valeurs dans F.

Remarque: Le terme "fonction" est souvent utilisé pour les applications à valeurs numériques, réelles ou
complexes, c'est-à-dire lorsque l'ensemble d'arrivée est ou . Nous parlons alors de "fonction réelle", ou
de "fonction complexe".

Définitions:

D1. Le "graphe" (ou encore "graphique" ou "représentative") d'une application est le sous-
ensemble du produit cartésien constitué des couples (x,f(x)) pour x variant dans E. La donnée du
graphe de f détermine son ensemble de départ (par projection sur la première composante souvent notée x) et
son image (par projection sur la seconde composante souvent notée y).

D2. Si le triplet est une fonction où E et F sont deux ensembles et est un graphe et
donc E et F sont respectivement la source et le but de f. Le "domaine de définition" ou "ensemble de départ"
de f est : = (5.91)

D3. Etant donnés trois ensembles E, F et G (non vides), toute fonction de vers G est appelée "loi de
composition" de à valeurs dans G.

D4. Une "loi de composition interne" (ou simplement "loi interne") dans E est une loi de composition de
à valeurs dans E (cas E=F=G).

Remarque: La soustraction dans n'est pas une loi de composition interne bien qu'elle fasse partie des
quatre opérations élémentaires apprises à l'école. Par contre l'addition sur en est biens une.

D5. Une "loi composition externe" (ou simplement "loi externe") dans E est une loi de composition de
à valeurs dans E, où F est un ensemble distinct de E. En général, F est un corps, dit "corps de
scalaires"
Exemple:

Dans le cas d'un espace vectoriel (voir définition beaucoup plus bas) la multiplication d'un vecteur (dont les
composantes se basent sur un ensemble donné) par un réel est une loi de composition externe.

Remarque: Une loi de composition externe à valeurs dans E est aussi appelée "action de F sur E".
L'ensemble F est alors le domaine d'opérateurs. On dit aussi que F opère sur E (ayez en tête l'exemple des
vecteurs précédemment cité)

D6. Nous appelons "image de f", et nous notons Im(f), le sous-ensemble défini par :

(5.92)

Ainsi, "L'image" d'une application est la collection des f(x) pour x parcourant E , c'est un sous-
ensemble de F.

Et nous appelons "noyau de f", et nous notons Ker(f), le sous-ensemble très important en mathématiques
défini par :

(5.93)

Selon la figure (il faut bien comprendre ce concept de noyau car nous le réutiliserons de nombreuses fois
pour démontrer des théorèmes ayant des applications pratiques importantes) :

(5.94)

Remarques:

R1. Ker(f) provient de l'allemand "Kern", signifiant tout simplement "noyau". En anglais, le noyau se dit
aussi "kernel", signifiant "amande" dans le civil.

R2. Normalement les notations Im et Ker sont réservées aux homomorphismes de groupes, d'anneaux, de
corps et aux applications linéaires entre espaces vectoriels ou modules etc.... (voir plus loin). Nous n'avons
normalement pas l'habitude de les utiliser pour des applications quelconques entre ensembles quelconques.
Mais bon...ça fait rien.

Les applications peuvent avoir une quantité phénoménale de propriétés dont voici celles qui font partie des
connaissances générales du physicien (pour plus de renseignements sur ce qu'est une fonction, voir le
chapitre traitant de l'Analyse Fonctionnelle).
Soit f une application d'un ensemble E à un ensemble F alors nous avons les propriétés suivantes :

P1. Une application est dite "surjective" si :

Tout élément y de F est l'image par f d'au moins (nous insistons sur le "au moins") un élément de E. Nous
disons encore que c'est une "surjection" de E dans F. Il découle de cette définition, qu'une
application est surjective si et seulement si . En d'autres termes, nous écrivons aussi
cette définition ainsi : (5.95)

ce qui s'illustre par: (5.96)

P2. Une application est dite "injective" si :

Tout élément y de F est l'image par f d'au plus (nous insistons sur le "au plus") un seul élément de E. Nous
disons encore que f est une injection de E dans F. Il résulte de cette définition, qu'une application
est injective si et seulement si les relations et impliquent autrement dit :
une application pour laquelle deux éléments distincts ont des images distinctes est dite injective. Ou encore,
une application est injective si l'une aux moins des propriétés équivalentes suivantes est vérifiée :

P2.1

P2.2

P2.3 l'équation en x, a au plus une solution dans E

Tout cela s'illustrant par: (5.97)


P3. Une application est dite "bijective" si :

Une application f de E dans F est à la fois surjective et injective. Dans ce cas, nous avons que pour tout
élément y de F de l'équation admet dans E une unique (ni "au plus", ni "au moins") pré-image x.
Ce que nous écrivons aussi : (5.98)

ce qui s'illustre par: (5.99)

Nous sommes ainsi tout naturellement amené à définir une nouvelle application de F dans E, appelée
"fonction réciproque" de f et notée , qui a tout élément y de F, fait correspondre l'élément x de E pré-
image (ou solution) unique de l'équation . Autrement dit: (5.100)

L'existence d'une application réciproque implique que le graphique d'une application bijective (dans
l'ensemble des réels...) et celui de son application réciproque sont symétriques par rapport à la droite
d'équation .

Effectivement, nous remarquons que si est équivalent à . Ces équations impliquent que
le point (x, y) est sur le graphique de f si et seulement si le point (y, x) est sur le graphique de .

Exemple:

Prenons le cas d'une station de vacances où un groupe de touristes doit être logé dans un hôtel. Chaque façon
de répartir ces touristes dans les chambres de l'hôtel peut être représentée par une application de l'ensemble
des touristes vers l'ensemble des chambres (à chaque touriste est associée une chambre).

- Les touristes souhaitent que l'application soit injective, c'est-à-dire que chacun d'entre eux ait une chambre
individuelle. Cela n'est possible que si le nombre de touristes ne dépasse pas le nombre de chambres.

- L'hôtelier souhaite que l'application soit surjective, c'est-à-dire que chaque chambre soit occupée. Cela
n'est possible que s'il y a au moins autant de touristes que de chambres.

- S'il est possible de répartir les touristes de telle sorte qu'il y en ait un seul par chambre, et que toutes les
chambres soient occupées : l'application sera alors à la fois injective et surjective nous dirons qu'elle est
bijective.

Remarques:

R1. Il vient des définitions ci-dessus qu'une application f est bijective (ou "biunivoque") dans l'ensemble des
réels si et seulement si toute droite horizontale coupe la représentation graphique de la fonction en un seul
point. Nous pouvons donc amener à faire la seconde remarque suivante :

R2. Une application qui vérifie le test de la droite horizontale est continument croissante ou décroissante en
tout point de son domaine de définition.
P4. Une application est dite "fonction composée" si :

Soit une application de E dans F et une fonction de F dans G. L'application qui associe à chaque
élément x de l'élément de E, de G s'appelle "application composée" de et de et se note .

Le symbole " " est appelé "rond". Ainsi, la relation précédente ce lit "psi rond phy". Ainsi:

(5.101)

Soit, de plus, une application de G dans H. Nous vérifions aussitôt que l'opération de composition est
associative: (5.102)

Cela nous permet d'omettre les parenthèses et d'écrire plus simplement:

Dans le cas particulier où serait une application de E dans E, nous notons l'application composée
(k fois).

Ce qui est important dans ce que nous venons de voir dans ce chapitre, c'est que toutes les propriétés
définies et énoncées ci-dessus sont applicables aux ensembles de nombres.

Voyons en un exemple très concret et très puissant:

THÉORÈME DE CANTOR-BERNSTEIN

Attention. Ce théorème, dont le résultat peut sembler évident, n'est pas forcément simple à aborder (son
formalisme mathématique n'est pas très esthétique...). Nous vous conseillons de lire très lentement et de
vous imaginer les diagrammes sagittaux dans la tête lors de la démonstration.

Voici l'hypothèse à démontrer: Soit X et Y deux ensembles. S'il existe une injection (voir la définition d'une
fonction injective ci-dessus) de X vers Y et une autre de Y vers X, alors les deux ensembles sont en bijection
(voir la définition d'une fonction bijective ci-dessus). Il s'agit donc aussi d'une relation antisymétrique.

Ce qui s'illustre par:

(5.103)

Pour la démonstration, nous avons besoin en toute rigueur de démontrer au préalable un lemme (évident à
nouveau intuitivement...) dont l'énoncé est le suivant :

Soit X, Y, Z trois ensembles tels que . Si X et Y sont en bijection, alors X et Z sont en bijection.
Une exemple d'application de ce lemme est l'ensemble des nombres naturels et des nombres rationnels qui
sont en bijection. Dès lors, l'ensemble des entiers relatifs est en bijection avec l'ensemble des nombres
naturels puisque: (5.104)

Démonstration:

D'abord, au niveau formel, créons une fonction f telle quelle soit bijective: (5.105)

Nous avons besoin maintenant de définir l'ensemble A par les images de l'union des fonctions des fonctions
f (du genre f(f(f...))) ) des pré-images de l'ensemble Z dont nous excluons les éléments de X (ce que nous
notons: Z-X ).

En d'autres termes (si la première forme n'est pas claire...) nous définissons l'ensemble A comme étant
l'union des images de (Z-X) par les applications Ce que nous noterons donc:

(5.106)

Nous avons alors bien évidemment (faire un schéma de tête des diagrammes sagittaux peut aider à ce niveau
là...): (5.107)

Nous pouvons démontrer élégamment cette dernière relation:

(5.108)

(sympathique n'est-ce pas...).

Comme Z peut être partitionné en et , nous posons comme une définition l'application
g telle que: (5.109)

tel que pour toute pré-image a nous ayons: (5.110)

(rappelez-vous de la définition des applications notées "f") et: (5.111)

L'application g est alors bijective car ses restrictions à et , (qui forment une partition)
sont f et l'identité qui sont par définition bijectives.

Finalement il existe bien, par construction, une bijection entre X et Z.

Reprenons les hypothèses du théorème de Cantor-Bernstein:

Soit une injection de X vers Y et une injection de Y vers X

Nous avons alors: et (5.112)

donc: (5.113)
Comme est injective, X et sont par définition en bijection et de même, comme est injective,
et sont en bijection (là il est bon de relire...).

Donc: X et sont eux aussi en bijection.

En utilisant le lemme sur et X , il vient donc que est en bijection ce qui nous
donne avec ceux que nous avons vu juste précédemment, que puisque aussi et sont en
bijection, alors que est en bijection avec , alors X et Y sont en injection (ouf! c'est beau mais
c'est aussi vicieux que simple).

Ce théorème s'interprète de la manière suivante : Si nous pouvons compter une partie d'un ensemble avec la
totalité des éléments d'un autre ensemble, et réciproquement, alors ils ont le même nombre d'éléments. Ce
qui est évident pour des ensembles finis. Ce théorème généralise alors cette notion pour des ensembles
infinis et c'est là sa force!

À partir de là, ce théorème représente l'une des briques de base pour généraliser la notion de tailles
d'ensembles à des ensembles infinis.

STRUCTURES ALGÉBRIQUES

L'algèbre dite "algèbre moderne" commence avec la théorie des structures algébriques due en partie à Carl
F. Gauss et surtout à Évariste Galois. Ces structures existent en un très grand nombre mais seulement les
fondamentales nous intéresseront ici. Avant des les détailler, voici un diagramme synoptique des ces
principales grandeurs et de leur hiérarchie :

(5.114)

Remarques: Tout en haut du diagramme, la structure au nombre minimal de contraintes, en bas, un


maximum. Soit, plus nous descendons, plus la structure est en quelque sorte spécialisée.

Soit pour simplifier les écritures, une loi de composition (comme l'addition, la soustraction, la
multiplication ou encore la division,...)...

Remarque: Cette notation généralisée est parfois appelée "notation stellaire".

Définitions: Soit et des symboles de lois internes à un ensemble E (cela pourrait être l'addition et la
multiplication pour prendre le cas le plus connu) alors :
D1. est une "loi commutative" si : (5.115)

D2. est une "loi associative" si : (5.116)

D3. n est "élément neutre"pour si : (5.117)

Nous admettrons par ailleurs sans démonstration (c'est intuitif) que s'il existe un élément neutre, il est
unique.

D4. a' est "l'élément symétrique" (dans le sens général de l'opposé par exemple pour l'addition et l'inverse
pour la multiplication) de a pour si : (5.118)

Nous admettrons également et sans démonstration que le symétrique de tout élément est unique.

D5. est une "loi distributive" par rapport à si : (5.119)

D6. b est "l'élément absorbant" si pour tout a et une loi nous avons: (5.120)

Remarques:

R1. Si a est son propre symétrique par rapport à la loi , les mathématiciens disent que a est "involutif"

R2. Si un élément b de E vérifie , alors b est dit "élément absorbant" pour la loi .

R3. Il faut toujours vérifier que les neutres et les symétriques le soient "à gauche" et "à droite". Ainsi, par
exemple, dans , l'élément 0 n'est un neutre qu'à droite car mais .

MAGMA

Définition: Nous désignons un ensemble par le terme "magma" M , si les composants le constituant sont
opérables par rapport une loi interne . :

est un magma si

Remarques:

R1. Si de plus la loi interne est commutative, nous parlons de "magma commutatif"

R2. Si de plus la loi interne est associative, nous parlons de "magma associatif"

R3. Si de plus la loi interne possède un élément neutre, nous parlons de "magma unitaire"

Il est donc important de se rappeler que si nous désignons une structure algébrique par le terme "magma"
tout court, cela ne signifie en aucun cas que la loi interne est commutative, associative ou même qu'elle
possède un élément neutre !

Définition: Dans un magma , un élément x est dit "élément régulier" (ou "élément simplifiable") à
gauche si pour tout couple nous avons : (5.121)
Remarque: Nous définissons de même un élément régulier à droite.

Ainsi, un élément est dit "régulier" s'il est régulier à droite et à gauche. Si * est commutative (ce qui est le
cas pour un magma commutatif), les notions d'élément régulier à gauche ou à droite coïncident.

Exemple:

Dans tout élément est régulier et dans tout élément non nul est régulier.

Un magma est donc une structure algébrique élémentaire. Il existe des structures plus subtiles
(monoïdes, groupes, anneaux, corps, espace vectoriels, etc.) dans lesquelles un ensemble est muni de
plusieurs lois et de différentes propriétés. Nous allons les voir de suite et les utiliser tout au long de ce site.

MONOÏDE

Définition: Si la loi est associative et possède un élément neutre nous disons alors que le "magma
associatif unitaire" est un "monoïde" :

est un monoïde si

Remarques:

R1. Si de plus la loi interne est en plus commutative alors nous disons alors que la structure forme un
"monoïde abélien" (ou simplement "monoïde commutatif").

R2. Dans certains ouvrages nous trouvons aussi comme définition que le monoïde est un "demi-groupe"
(avec une loi associative) muni d'un élément neutre.

Montrons tout de suite que l'ensemble des entiers naturels est un monoïde abélien totalement ordonné
(comme nous l'avons partiellement vu dans le chapitre des opérateurs) par rapport aux lois d'addition et de
multiplication :

La loi d'addition ( + ) est-elle une opération interne telle que nous ayons : (5.122)

Nous pouvons démontrer que c'est bien le cas en sachant que 1 appartient à tel que :

(5.123)

Donc et l'addition est bien une loi interne (nous disons également que l'ensemble est "stable" par
rapport à l'addition) et en même temps associative puisque 1 peut être additionné à lui-même par définition
dans n'importe quel ordre sans que le résultat en soit altéré. Si vous vous rappelez que la multiplication est
une loi qui se construit sur l'addition, alors la loi de multiplication ( x ) est aussi une loi interne et
associative.

Nous admettrons à partir d'ici qu'il est trivial que la loi d'addition est également commutative et que le zéro
"0" en est l'élément neutre (n). Ainsi, la loi de multiplication est elle aussi commutative et il est trivial que
"1" en est l'élément neutre (n).
Par ailleurs, pour parler déjà de quelque chose qui n'est pas directement en relation avec le monoïde... mais
qui nous sera utile un peu plus loin, existe-t-il en restant dans la lignée de l'exemple précédent pour la loi
d'addition ( + ) un symétrique tel que nous ayons:

(5.124) avec ?

Il est assez trivial que pour que cette égalité soit satisfaite nous ayons: (5.125)

soit: a + b = -c (5.126)

or les nombres négatifs n'existent pas dans . Ce qui nous amène aussi à la conclusion que la loi d'addition
( + ) n'a pas de symétrique et que la loi de soustraction ( - ) n'existe pas dans (la soustraction étant
rigoureusement l'addition d'un nombre négatif).

De même, car cela va aussi nous être utile un peu plus loin, existe-t-il pour la loi de multiplication ( x ) un
symétrique a' tel que nous ayons : (5.127)

avec ?

D'abord il est évident que: (5.128)

Mais excepté pour , le quotient 1/a n'existe pas dans . Donc nous devons conclure qu'il n'existe pas
pour tout élément de de symétriques pour la loi de multiplication et ainsi que la loi de division n'existe pas
dans et que la loi de multiplication ne forme pas un monoïde dans cet ensemble.

Synthèse:

(lois) (+) (-) (x) (/)


Opération interne oui oui
Commutative oui oui
oui oui
Élément neutre
(zéro "0") non (un "1") non
oui
Élément absorbant non
(zéro "0")
Symétrique non non
Tableau: 5.1 - Lois et leurs propriétés dans l'ensemble des entiers naturels

Nous avons par exemple les propriétés suivantes relativement à l'ensemble des entiers naturels et au concept
de monoïde:

P1. est totalement ordonné (attention cette notation est un peu abusive! il suffit qu'il y ait juste une
des deux relations d'ordre R pour que l'ensemble soit totalement ordonné).

P2. et sont des monoïdes abéliens.


P3. L'élément zéro "0" est l'élément absorbant pour le monoïde .

P4. Les lois de soustraction et division n'existent pas dans l'ensemble .

P5. est un monoïde abélien totalement ordonné par rapport aux lois d'addition et de multiplication
(attention la notation suivante est abusive car le monoïde est composé que d'une seule loi interne et d'une
relation d'ordre R ce qui donnerait au total 4 monoïdes): (5.129)

Remarques:

R1. Il est rare d'utiliser les monoïdes; car souvent, lorsque nous nous trouvons face à une structure trop
pauvre pour pouvoir vraiment discuter, nous la prolongeons vers quelque chose de plus riche, comme un
groupe, ou un anneau (voir plus loin) tel que l'ensemble des entiers relatifs.

R2. Dire qu'une structure algébrique est totalement ordonnée par rapport à certaines lois signifie que soit
une loi, et R une relation d'ordre et a,b,c,d quatre éléments de la structure intéressée, alors si aRb et cRd
implique . Nous notons alors cette structure ou simplement (S,R) et en indiquant la
(ou les) loi concernée.

GROUPES

Définition: Nous désignons un ensemble par le terme "groupe", si les composants le constituant satisfont
aux trois conditions de ce que nous nommons la "loi interne de groupe", définie ci-dessous:

est un groupe si

Dans ce cas, la loi de compositions interne sera souvent (mais pas exclusivement!) notée "+" et appelée
"l'addition", le neutre e noté "0" et le symétrique de x noté "-x".

Insistons sur le fait que la structure de groupe est probablement une des plus importantes dans la pratique de
l'ingénieur et de la physique moderne en général. Raison pour laquelle il convient d'y porter une attention
toute particulière (cf. chapitre d'Algèbre Ensembliste)!

Si de plus, la loi interne est également commutative, nous disons alors que le groupe est un "groupe
abélien" ou simplement "groupe commutatif".

S'il existe dans G au moins un élément a tel que tout élément de G est une puissance de a ou du symétrique
a' de a, nous disons que est un "groupe cyclique de générateur a" s'il est fini, sinon nous disons qu'il
est "monogène" (nous reviendrons sur les groupes cycliques dans le chapitre d'Algèbre Ensembliste).

Plus généralement un groupe d'élément neutre e, non réduit uniquement à {e} sera monogène, s'il

existe un élément a de G distinct de e tel que . Un tel groupe sera cyclique, s'il
existe un entier n non nul pour lequel . Le plus petit entier non nul vérifiant cette égalité est alors
"l'ordre du groupe".
Exemple:

Montrons tout de suite que l'ensemble des entiers relatifs est un groupe abélien totalement ordonné
(comme nous l'avons vu dans le chapitre des Opérateurs) par rapport aux lois d'addition et de multiplication.

D'abord pour raccourcir les développements, il est utile de rappeler que l'ensemble est un "prolongement"
de par le fait que nous y avons ajouté tous les nombres symétriques de signe négatif ( ).

Ainsi, en abusant toujours des notations (car normalement un groupe n'a qu'une seule loi et une seule
relation d'ordre R suffit à l'ordonner): (5.130)

forme un groupe abélien totalement ordonné (4 groupes au fait!) et: (5.131)

un monoïde abélien (deux monoïdes au fait!) totalement ordonné.

Remarquons aussi que la loi de division n'existe pas pour tout élément de l'ensemble ! Donc en toute
généralité nous disons qu'elle n'y existe pas.

Synthèse :

(lois) (+) (-) (x) (/)


Opération interne oui Oui oui
Associative oui Non oui
Commutative oui Non oui
oui non oui
Élément neutre non
(zéro "0") (0 pas neutre à gauche) (un "1")
oui
Élément absorbant non Non
(zéro "0")
oui
Symétrique Oui non
(signe opposé)
Tableau: 5.2 - Lois et leurs propriétés dans l'ensemble des entiers relatifs

Nous avons donc les propriétés suivantes :

P1. est totalement ordonné (attention à nouveau cette notation est un peu abusive! il suffit qu'il y ait
juste une des deux relations d'ordre R pour que l'ensemble soit totalement ordonné).

P2. est un groupe commutatif dont zéro "1" est l'élément neutre.

P3. La loi de division n'existe pas dans l'ensemble .

P4. L'ensemble est un groupe abélien totalement ordonné par rapport à la loi d'addition (attention la
notation suivante est encore une fois abusive car le groupe est composé que d'une relation d'ordre R ce qui

donnerait au total 2 groupes): (5.132)

L'ensemble n'est pas un groupe commutatif totalement ordonné par rapport à la loi de multiplication :

(5.133)
Nous voyons de suite alors que a des propriétés trop restreintes, c'est la raison pour laquelle il est
intéressant de le prolonger par l'ensemble des rationnels défini de manière très simpliste... par (cf.

chapitre sur les Nombres): (5.134)

Ce qui signifie pour rappel que l'ensemble des rationnels et défini par l'ensemble des quotients p et q
appartenant chacun à dont nous excluons à q de prendre la valeur nulle (la notation /q signifiant
l'exclusion).

Et nous avons évidemment: (5.135)

Il est dès lors évident (sans démonstration et toujours en utilisant la notation abusive déjà commentée mainte
fois plus haut...) que est aussi totalement ordonné et aussi que est un groupe abélien totalement
ordonné par rapport à la loi d'addition seulement : (5.136)

Ce qui devient intéressant avec , c'est que la loi de multiplication devient une loi interne et forme un
groupe abélien commutatif dit "groupe multiplicatif" par rapport à .

Démonstration:

Démontrons donc que le symétrique existe pour la loi de multiplication (.) tel que: (5.137)

Puisque dans tout nombre peut se mettre sous la forme: (5.138)

avec .

Alors puisque: (5.139)

Il existe donc un symétrique à tout rationnel dans pour la loi de multiplication.

Par définition, ou par construction, la division existe dans et est une opération interne. Mais est-elle
associative telle que pour nous ayons: (5.140)

Démonstration:

Au fait, la démonstration est assez triviale si nous nous rappelons que la division se définit à partir de la loi
de multiplication par l'inverse et que cette dernière loi est (elle!) associative. Ainsi, il vient :

(5.141)

Donc la loi de division n'est pas associative dans .


Nous pouvons aussi nous demander si la loi de division ( / ) est cependant commutative tel que la relation:

(5.142) pour ?

Nous voyons très bien que cela n'est pas le cas puisque nous pouvons écrire cette dernière relation sous la

forme: (5.143)

Synthèse:

(lois) (+) (-) (x) (/)


Opération
oui oui oui oui
interne
Associative oui non oui non
Commutative oui non oui non
oui non oui oui
Élément neutre
(zéro "0") (0 pas neutre à gauche) (un "1") ("1" neutre à droite)
oui oui
Élément abs. non non
(zéro "0") ("0" au numérateur)
oui oui non
Symétrique non
(signe opposé) (signe opposé) (excepté dans )
Tableau: 5.3 - Lois et leurs propriétés dans l'ensemble des rationnels

Nous avons donc les propriétés suivantes :

P1. est totalement ordonné

P2. sont indépendamment des groupes abéliens totalement ordonnés

P3. Zéro "0" est l'élément absorbant par rapport groupe

P4. L'ensemble est un groupe abélien totalement ordonné par rapport aux lois d'addition et de

multiplication que nous notons : et (5.144)

Les mêmes propriétés sont applicables à et à mais à la différence que ce dernier n'est pas ordonnable.

Cependant, il peut être compréhensible que pour vous soyez sceptiques. Développons donc tout cela:

Nous devons nous assurer que la somme, la différence, le produit et le quotient de deux nombres de la forme
donne quelque chose d'encore de cette forme.

Additionnons les nombres et où a, b, c et d sont des réels :

(5.145)

Donc l'addition est bien une loi interne commutative et associative pour laquelle il existe un élément neutre
et symétrique dans l'ensemble des complexes.
Soustrayons les nombres et où a, b, c et d sont ici encore, des réels :

(5.146)

Donc la soustraction est une opération interne elle n'est ni commutative, ni associative elle n'a pas d'élément
neutre à gauche et pas de symétrique.

Multiplions maintenant les nombres et où a, b, c et d là toujours, des réels. Pour parvenir à


nos fins, nous emploierons la distributivité de la multiplication par rapport à l'addition.

(5.147)

Donc la loi de multiplication est bien une opération interne commutative, associative et distributive (!) pour
laquelle il existe un élément neutre et symétrique dans (voir ci-après) dans l'ensemble des complexes.

Une division est avant tout une multiplication par l'inverse. Prouver qu'il existe un inverse c'est prouver qu'il
existe un symétrique pour la multiplication. Inversons donc le nombre où x et y sont des réels
(différents de zéro):

(5.148)

Donc l'inverse d'un nombre complexe est bien une opération interne non associative et non commutative
pour laquelle il existe un élément neutre, et elle est symétrique. Il en est de même pour la division, qui
correspond au produit par l'inverse d'un nombre complexe.

Voyons un exemple de groupe cyclique : Dans , considérons G={1,i,-1,-i} muni de la multiplication


usuelle des nombres complexes. Alors est évidemment un groupe abélien. Un tel groupe est aussi
monogène car engendré par les puissances d'un de ses éléments : i (ou bien -i). Ce groupe monogène étant
fini, il s'agit alors d'un groupe cyclique.

ANNEAUX

L'anneau est le coeur de l'algèbre commutative qui est la structure algébrique correspondant aux concepts
collégiens d'addition, de soustraction, et de multiplication.

Définition: Un groupe commutatif (ou "groupe abélien") A est un "anneau" s'il est muni d'une seconde loi
de composition interne vérifiant les propriétés suivante :

est un anneau si

Comme nous le savons déjà, l'élément neutre de la première loi de composition interne + est noté "0" et
appelé "zéro" de l'anneau. La deuxième loi interne est souvent notée par un point à demi-hauteur et appelée
la "multiplication".
Remarques:

R1. Si de plus, la deuxième loi interne de composition est également commutative, l'anneau est dit
"anneau commutatif". Nous rencontrons aussi des anneaux non-commutatifs dans lesquels la relation de
commutativité n'est pas imposée, il faut alors renforcer la propriété de l'élément neutre de cette deuxième loi
en imposant à "1" d'être un élément neutre à la fois à droite et à gauche tel que : (un exemple
d'anneau non-commutatif est fourni par l'ensemble des matrices à coefficients dans un anneau A, par
exemple - voir chapitre d'Algèbre Linéaire).

R2. Si de plus, il existe dans A un élément neutre pour la deuxième loi de composition interne , et que cet
élément neutre est l'unité "1" nous disons alors que l'anneau est un "anneau unitaire" et 1 est appelé "unité"
de l'anneau. Si l'anneau est commutatif et possède un élément neutre pour la deuxième loi de composition
interne alors nous parlons "d'anneau commutatif unitaire"

R3. Si , quels que soient les éléments a,b de A, l'anneau est dit "anneau intègre"
ou "anneau sans diviseurs de zéro" (dans le cas contraire il est bien évidemment "non intègre").

R4. Un "anneau factoriel" est un anneau commutatif unitaire et intègre dans lequel le théorème fondamental
de l'arithmétique (cf. chapitre de Théorie des Nombres) est vérifié.

Définitions:

D1. Un élément a d'un anneau A est un "élément unité" s'il existe tel que . Si un tel b
existe il est unique (nous en avons vu un exemple lors de notre étude des classes de congruence en théorie
des nombres).

D2. Soit A un anneau. Nous disons que A possède des diviseurs de zéro s'il existe avec
et . Les éléments a et b sont appelés des "diviseurs de zéro".

Remarques:

R1. Il est clair qu'un anneau est intègre si et seulement si il ne possède aucun diviseur de zéro.

R2. Les notions d'unité et de diviseurs de zéro sont incompatibles mais un élément d'un anneau peut être ni
l'un ni l'autre. C'est le cas, par exemple, de tous les entiers dans . Ce ne sont ni des unités, ni
des diviseurs de zéro.

Nous verrons un exemple important d'anneau lors du cadre de notre étude des polynômes (cf. chapitre de
Calcul Algébrique) mais nous en avons déjà vu de très importants lors de notre étude des classes de
congruences dans le chapitre de théorie des nombres.

Voyons quelques exemples d'anneaux : Lors de notre étude des groupes nous avons trouvé que les structures
:

(5.149)

sont tous les quatre des groupes abéliens et les trois premiers sont en plus totalement ordonnés.

La loi de division n'étant en aucun cas associative, nous pouvons nous restreindre à étudier pour chacun des
groupes précités, le couple de lois: (+) et ( x ).

Ainsi, il vient très vite que: (5.150)


constituent des anneaux commutatifs unitaires et intègres.

Remarque: Nous considérerons comme évident, à ce niveau du discours, que le lecteur aura remarqué que
est un "sous-anneau" de dans le sens où les opérations définies sont internes à chacun des ensembles et
que les éléments neutres et identité sont identiques et qu'il existe pour chaque élément de ces ensembles un
opposé qui est dans le même ensemble. Nous allons approfondir le concept de sous-anneau un peu plus loin.

Soit A un anneau. Nous avons les propriétés suivant :

P1.

P2.

P3.

Démonstrations:

DM1. La propriété P1 découle de la définition D4 des structures algébriques (tout élément possède un
opposé/symétrique). En effet, nous pouvons additionner à l'égalité l'élément -a. Nous obtenons
alors par l'existence de l'opposé cela donne d'où

DM2. La propriété P2 découle des définitions D3 (existence de l'élément neutre), D4 (existence de


l'opposé/symétrique), D5 (distributivité par rapport à l'autre loi) ainsi que de la propriété P1 ci-dessus. En
effet, nous avons : (5.151)

Nous avons donc . La propriété P1 ci-dessus permet de conclure que (nous pourrions
discuter de la pertinence de ce genre de démonstration...).

DM3. La propriété P3. se montre à l'aide de P2. Nous avons :

(5.152)

en ajoutant -a à cette dernière égalité, nous avons: (5.153)

SOUS-ANNEAU

Définition: Soit A un anneau et un sous-ensemble de A. Nous disons que S est un "sous-anneau" de A


si :

P1. (élément neutre de A est aussi dans S)

P2.

P3.

P4.

Exemple: L'anneau est un sous-anneau de


CORPS

Définition: Nous désignons un ensemble de nombres par le terme "corps" si :

est un corps si

Donc un corps est un anneau non nul dans lequel tout élément non nul est inversible ou en d'autres termes :
un anneau dont tous les éléments non nuls sont des unités est un corps.

Remarque:

R1. Si la loi interne est également commutative, le corps est dit "corps commutatif".

R2. Les quaternions (cf. chapitre sur les Nombres) forment par exemple un corps non commutatif pour
l'addition et la multiplication.

Voyons des exemples de corps parmi les anneaux unitaires suivant :

Il nous faut d'abord déterminer lesquels ne constituent pas des groupes par rapport à la loi interne de
multiplication ( ). Comme nous l'avons déjà vu dans notre étude des groupes précédemment, il est évident
qu'il nous faut éliminer à cause de l'existence des inverses qui n'est pas assurée dans cet ensemble.

Ainsi, les corps fondamentaux de l'arithmétique sont: (5.155)

et puisque la loi de multiplication ( ) est commutative dans ces ensembles, nous pouvons affirmer que ces
corps sont également des corps commutatifs. Nous avons souvent dans les petites classes le schéma suivant
pour le corps le plus important:

(5.156)
Ainsi, nous appellerons "corps" un système C de nombres réels ou complexes a tels que la somme, la
différence, le produit et le quotient de deux quelconques de ces nombres a appartiennent au même système
C.

Nous énonçons également cette propriété de la manière suivante : les nombres d'un corps se reproduisent par
les opérations rationnelles (addition, soustraction, multiplication, division). Ainsi, il est évident que le
nombre zéro ne pourra jamais former le dénominateur d'un quotient et l'ensemble des entiers ne peut former
un corps car la division dans l'ensemble des nombres entiers ne donne pas nécessairement un résultat dans ce
même ensemble.

ESPACES VECTORIELS

Lorsque nous définissons un "vecteur" (cf. chapitre de Calcul Vectoriel), nous faisons habituellement
référence à un "espace euclidien" (cf. aussi chapitre de Calcul Vectoriel) de n dimensions de .
Cependant, la notion d'espace vectoriel est beaucoup beaucoup plus vaste que ce dernier qui ne représente
qu'un cas particulier.

Définition: Un "espace vectoriel (EV)" ou "K-espace vectoriel" (abrégé : K-ev) sur le corps K (nous
prendrons fréquemment pour ce corps ou ) est un ensemble possédant les propriétés :

(5.157)

Nous avons donc deux lois de composition (en prenant les notations traditionnelles des vecteurs qui sera
peut-être plus parlante et utile pour la suite...):

1. Une loi de composition interne: l'addition notée + qui vérifie:

1.1. Associativité:

1.2. Commutativité:

1.3. Élément neutre:

1.4. Élément opposé:

2. Une loi de composition externe: la multiplication par un scalaire, notée , qui vérifie:

2.1. Associativité:

2.2. Distributivité:

2.3. Distributivité:

2.4. Élément neutre (de K sur E):


Remarques:

R1. Nous disons alors que l'espace vectoriel à une "structure algébrique vectorielle" et que ces éléments sont
des "vecteurs", les éléments de K des "scalaires".

R2. Les opérations respectives s'utilisent fréquemment comme l'addition et la multiplication que nous
connaissons bien sur , ce qui est bien commode pour nos habitudes….

R3. Dorénavant, pour distinguer les éléments du corps K et de l'ensemble E, nous noterons ceux de K par
des lettres grecques et ceux de E par des lettres latines majuscules.

R4. Outre les cinq propriétés énumérées ci-dessus, il ne faut pas oublier d'ajouter les cinq autres propriétés
du groupe abélien (opération interne, commutativité, associativité, élément neutre, élément inverse). Ce qui
nous fait donc au total dix propriétés à respecter.

Il est inutile de démontrer que ces propriétés sont respectées pour et, par conséquent pour . Nous
pouvons cependant nous poser la question à propos de certains sous-ensembles de .

Exemples:

E1. Considérons la région rectangulaire illustrée dans la figure (a) (et en perspective dans la figure (c)) ci-
dessous :

(5.158)

Ce sous-ensemble de n'est pas un espace vectoriel car, entre autres, la propriété d'opération interne du
groupe abélien n'est pas satisfaite. En effet, si nous prenons deux vecteurs à l'intérieur du rectangle et que
nous les additionnons, il se peut que le résultat sorte du rectangle. Par contre, il est facile de voir que la
droite (infinie) illustrée dans la figure (b) respecte toutes les propriétés énumérées précédemment et, par
conséquent, défini un espace vectoriel. Notons bien, cependant, que cette droite se doit de passer par
l'origine, sinon la propriété d'élément neutre du groupe abélien ne serait pas respectée (l'élément neutre
n'existant plus).

E2. Un autre exemple d'un espace vectoriel est l'ensemble des polynômes de degré deux ou moins (cf.
chapitre de Calcul Algébrique). Par exemple, deux éléments de cet espace sont :

(5.159)

Cet ensemble respecte les 10 propriétés d'un espace vectoriel. En effet, si nous additionnons deux
polynômes de degré deux ou moins, nous obtenons un autre polynôme de degré deux ou moins. Nous
pouvons aussi multiplier un polynôme par un scalaire sans changer l'ordre (ou degré) de celui-ci, etc. Nous
pouvons donc représenter un polynôme par des vecteurs dont les termes sont les coefficients du polynôme.
Mentionnons que nous pouvons aussi former des espaces vectoriels avec des ensembles de fonctions plus
générales que des polynômes. Il importe seulement de respecter les dix propriétés fondamentales d'un espace
vectoriel !

Ainsi défini, un espace vectoriel E sur K est une action de sur qui est compatible avec la loi de
groupe (par extension un "automorphisme" - voir la définition plus loin - sur ).

Définition: Soit E un espace vectoriel, nous appelons "sous-espace vectoriel" (SEV) F de E un sous-

ensemble de E si et seulement si : (5.160)

ALGÈBRES

Une "C-algèbre A" où C est un corps commutatif, est un ensemble A muni de deux lois de composition
internes + (addition) et (produit) et d'une loi externe (multiplication) à domaine d'opérateurs C (produit
par un scalaire) si et seulement si :

(5.161)

Exemples:

E1. Pour reprendre un exemple dans la lignée de celui sur les exemples vectoriels, l'espace euclidien
muni de l'addition (+), de la multiplication et du produit vectoriel est une -algèbre non

associative et non commutative notée .

E2. est une -algèbre (un nombre complexe pouvant être vu comme un vecteur à deux composantes selon
ce que nous avons dans le chapitre des Nombres).

HOMOMORPHISMES

Le concept d'homomorphismes (du grec homoios = semblable et morphê = forme) a été défini par les
mathématiciens car permettant de mettre en évidence des propriétés remarquables des fonctions en
particulier avec leurs structures, leur noyau, et de ce que nous appelons les "idéaux" (voir plus loin). Ils nous
permettront ainsi d'identifier une structure algébrique d'une autre.

Définitions:

D1. Si et sont deux magmas (peu importe la notation utilisé pour les lois internes), une
application f de A dans B est un "homomorphisme de magma" ou "morphisme de magma" (par abus de
langage nous écrivons parfois aussi "homorphisme" par flegme) si :

(5.162)

en d'autres termes, si l'image d'un composé dans A est le composé des images dans B.
D2. Si et sont deux monoïdes, une application f de A dans B est un "homomorphisme de

monoïde" si : (5.163)

où sont les éléments neutres respectifs des monoïdes A,B.

D3. Si A, B sont deux anneaux, un "homomorphisme d'anneaux" (très important pour le chapitre de
Cryptographie!) de A dans B est une application telle que nous ayons pour tout :

(5.164)

où sont les éléments neutres des anneaux A, B par rapport à la multiplication.

Soit un homomorphisme d'anneaux. Alors :

P1.

P2.

P3. Si a est une unité de A, alors f(a) est une unité de B et

Démonstrations:

DM1. Par , nous avons . En ajoutant des deux côtés


de l'égalité, nous obtenons

DM2. La propriété P2 découle aussi de et de la propriété P1. En effet, nous avons


. En additionnant aux deux côtés de la dernière égalité, nous
obtenons .

DM3. Soient tel que . Alors par et , nous avons


et de même ce qui montre que f(b) est l'inverse de f(a) si b est
l'inverse de a.

Montrons maintenant qu'un homomorphisme d'anneaux est injectif si et seulement si l'élément 0


est la seule pré-image de 0 (et donc réciproquement), ce qui se note techniquement:

(5.165)

c'est-à-dire que le noyau est trivial.


Démonstration:

La condition est clairement nécessaire. Montrons qu'elle est suffisante :

Nous supposons donc que . Soit tel que . Alors comme nous avons un
homorophisme d'anneaux nous pouvons écrire:

(5.166)

qui implique que donc que .

Ce qui montre que f est injectif si c'est un homorphisme et que et que en est effectivement une
condition suffisante.

D4. Soient et , deux groupes et f une application . Nous disons que f est un

"homomorphisme de groupe" si : (5.167)

où sont les éléments neutres respectifs des groupes A,B . Nous remarquons que la seule différence
entre un homorphisme d'anneau et un homorphisme de groupe est que ce dernier à deux lois au lieu d'une et
nous y rajoutons le concept d'inverse.

Ceci dit, la troisième proposition ci-dessus est en fait une conséquence de la définition composée
uniquement des deux premières lignes. Effectivement, considérons un homomorphisme f entre les groupes
et avec et respectivement les éléments neutres de A et B.

Nous avons alors: (5.168)

d'où: (5.169)

et donc: (5.170)

D5. Soient f une application d'un corps vers un autre. Nous disons que f est un "homomorphisme
de corps" si f est un homomorphisme d'anneaux...

Effectivement, le fait que l'homomorphisme de corps soit le même que celui d'un anneau tient juste au fait
que la différence entre les deux structures est que les éléments du corps sont tous inversibles (aucune loi ou
propriété de loi ne diffère entre les deux selon leur définition).

Montrons maintenant que tout homomorphisme de corps est injectif ("homomorphisme injectif") en se
rappelant que plus haut nous avons démontré que tout homomorphisme d'anneaux l'était!
Démonstration:

Si a est différent de 0 et (nous utilisons ici la propriété que les éléments d'un corps sont inversibles!)
alors: (5.171)

Donc lorsque a est différent de zéro f(a) est différent de 0 lorsque ce qui prouve que et donc
que f est injective.

D6. Soient A et B deux K-ev et une application de A dans B. Nous disons que f est une
"application linéaire" ou "homomorphisme d'espaces vectoriels" si :

(5.172)

et nous notons L(A,B) l'ensemble des applications linéaires.

Remarques:

R1. Nous avions déjà défini plus haut le concept d'application linéaire mais n'avions pas précisé que les deux
ensembles A et B étaient des K-ev.

R2. L'application linéaire est appelée "forme linéaire" si et seulement si

D7. Si l'homomorphisme est bijectif nous dirons alors que f est un "isomorphisme". S'il existe un
isomorphisme entre A et B, nous disons que A et B sont "isomorphes" et nous noterons cela .

Remarque: L'isomorphisme permet au fait d'identifier deux ensembles munis d'une structure algébrique
identique (que ce soit groupe, anneau, etc.) mais dont les éléments sont nommés d'une façon différente.

D8. Si l'homomorphisme f est une application uniquement interne, nous dirons alors que f est un
"endomorphisme" (en d'autres termes, nous avons un endomorphisme si dans la définition de l'homorphisme
nous avons A=B)

Remarque: Si nous avons un endomorphisme f de E, f est donc restreint à Im(f). Donc le terme
"endomorphisme" veut juste dire que l'application f arrive dans E et pas qu'elle touche tous les éléments de
E. Nous avons et pas forcément car dans ce dernier cas nous disons que f est surjective
comme nous l'avons déjà vu.

D9. Si l'endomorphisme f est en plus bijectif (donc en d'autres termes si l'homomorphisme est un
endomorphisme et un isomorphisme), nous dirons alors que f est un "automorphisme"

IDÉAL

Définition: Soit A un anneau commutatif. Un sous-ensemble est un "idéal" si :

P1. pour tout

P2. pour tout et tout

En d'autres termes, un idéal est un sous-ensemble fermé pour l'addition et stable par multiplication par un
élément quelconque de A.
Exemple:

L'ensemble des nombres pairs est par un exemple d'idéal de l'ensemble des nombres naturels.

Remarque: Les idéaux et sont appelé les "idéaux triviaux".

Pour savoir si un idéal est égal à tout l'anneau, il est utile d'utiliser la propriété suivante qui spécifie que si A
est un anneau et I un idéal de A, alors si nous avons .

Démonstration:

Ceci résulte de la propriété P2 de la définition d'un idéal :

Pour tout , nous avons car .

Un premier exemple d'idéal est donné par le noyau d'un homomorphisme d'anneaux. Effectivement,
démontrons que le noyau d'un homomorphisme est un idéal de R.

Démonstration:

Soient . Alors : (5.173)

ce qui montre que . Soit , alors : (5.174)

ce qui montre que .

Proposition : Soit A un anneau et soit . Le sous-ensemble : (5.175)

noté ou aA, est un idéal (nous allons voir un exemple concret après la prochaine définition).

Définitions:

D1. Un idéal d'un anneau A est dit "idéal principal" s'il existe tel que .

D2. Un anneau dont tous les idéaux sont principaux est dit "anneau principal".

Montrons maintenant que l'anneau est principal (car tous ses idéaux sont principaux).

Démonstration:

Soit I un idéal de (il est facile d'en choisir un : par exemples tous les multiples de 2 ou de 3, etc.). Soit
le plus petit entier positif non nul de I. Nous allons montrer que :

Soit a un élément quelconque de I. La division euclidienne nous permet d'écrire : (5.176)

avec (nous l'avons déjà démontré).

Mais comme et que , par la définition d'un idéal, nous avons (la somme ou
différences des éléments d'un idéal appartenant à l'idéal). Par choix de r (étant inférieur à r) ceci implique
que et donc que .
Ainsi tout élément de I est un multiple de r et donc : (5.177)

La démonstration ci-dessus n'utilise que la division euclidienne sur . Nous pouvons alors généraliser ce
résultat aux anneaux qui possèdent une division euclidienne. Ainsi, par exemple, l'anneau k[X] des
polynômes (cf. chapitre de Calcul Algébrique) à coefficients dans un corps k est un anneau principal car il
possède une division euclidienne.

Démonstration:

Soit I un idéal de k[X]. Notons d le plus petit degré que puisse avoir un polynôme non nul de I. Si
alors et donc . Autrement, soit a(X) un polynôme de degré d. Si
alors on peut diviser u(X) par a(X). Il existe tels que et
. Donc ce qui entraîne (autrement contradiction avec la
minimalité de d). Par suite, . Nous venons de montrer que

Ainsi, les seuls idéaux de sont ceux de la forme . De plus si nous avons d et m qui sont des entiers > 1.
Alors si et seulement si d | m.

Démonstration:

Si d | m alors il existe n avec . Soit un élément de . Alors : (5.178)

ce qui montre que .

Réciproquement, si ceci implique que m est de la forme et ceci prouve que d divise m.

Démontrons aussi qu'un anneau R est un corps si et seulement s'il ne possède que les idéaux triviaux {0},R.

Démonstration:

Montrons que la condition est nécessaire : Soit I un idéal non nul de R et un élément non nul. Par
hypothèse (qu'il s'agit d'un corps), il est inversible, c'est-à-dire qu'il existe tel que . Ceci
implique que et donc, par un résultat obtenu plus haut .

Réciproquement, supposons que tout idéal soit l'idéal nul. Alors si est un élément non nul de R,
l'idéal principal (r) doit être égal à R. Mais ceci implique que et dont qu'il existe avec
ce qui montre que r est inversible. L'anneau R est donc un corps.

Cette caractérisation va nous permettre de démontrer facilement que tout homomorphisme partant d'un corps
est injectif. Soit que si un homomorphisme où R est un corps. Alors f est injectif.

Démonstration:

Nous mettons ensemble ce qui a été vu jusque-là. Nous avons démontré plus haut que le noyau Ker(f) d'un
homomorphisme est un idéal. Mais nous avons également démontré plus haut que nous avons soit
soit (car l'anneau R est un corps si et seulement s'il ne possède que les idéaux
triviaux).
Mais vu que (de par la définition d'un homomorphisme) il s'ensuit qu'il reste
(puisque nous avons démontré que si A est un anneau et I un idéal de A alors si alors
). Ceci implique par un théorème précédent (où nous avons démontré que si
l'homomorphisme est injectif) que... f est injective.

Etudions maintenant les homomorphismes dont l'anneau de départ est . Soit A un anneau et un
homomorphisme. Par définition d'un homomorphisme et par ses propriétés, il faut que et .
Mail il faut encore que :

(5.179)

pour tout . Ainsi f est complètement déterminé par la donnée de f(1) et est donc unique.
Réciproquement, nous montrons que l'application définie par : (5.180)

est un homomorphisme d'anneaux. En résumé. il existe un et un seul homomorphisme de dans un anneau


quelconque A.

Définition: Soit A un anneau et l'unique homomorphisme défini précédemment. Si f est injectif,


nous dirons que A est de "caractéristique nulle". Sinon, Ker(f)est un idéal non trivial de et comme est
dès lors principal (comme nous l'avons démontré plus haut) il est de la forme avec . L'entier m est
appelé la "caractéristique de A".

Remarque: Moins formellement, la caractéristique d'un anneau est le plus petit entier positif m tel que
. S'il n'y en a pas, alors la caractéristique est nulle.

Exemple:

L'anneau est de caractéristique nulle car l'unique homomorphisme est l'identité. Il est donc
injectif. Les injections montrent que (et également) sont des corps de caractéristique
nulle)

Nous nous proposons maintenant de démontrer que la caractéristique d'un anneau intègre (et en particulier
d'un corps) est égale 0 ou à un premier p.

Démonstration:

Nous montrons la contraposée. Soit A un anneau de caractéristique avec m non premier. Il existe alors
des entiers naturels tels que . Soit l'unique homomorphisme (définir
précédemment). Par définition (de l'idéal) de m, nous avons mais . Mais alors
ce qui montre que A n'est pas intègre.

Remarque: La réciproque du théorème n'est pas vraie comme le montre l'exemple de l'anneau où
l'addition et la multiplication se font composante par composante. C'est un anneau de caractéristique nulle
mais avec des diviseurs de zéro :

(5.181)
6. PROBABILITÉS

L e calcul des probabilités s'occupe des phénomènes aléatoires (dits plus esthétiquement: "processus
stochastiques" lorsqu'ils sont dépendants du temps), c'est-à-dire de phénomènes qui ne mènent pas toujours à
la même issue et qui peuvent êtres étudiés grâce aux nombres et à leurs conséquences et apparitions.
Néanmoins, même si ces phénomènes ont des issues variées, dépendant du hasard, nous observons
cependant une certaine régularité statistique.

Définitions: Il existe plusieurs manières de définir une probabilité. Principalement, nous parlons de:

D1. "Probabilité expérimentale ou inductive" qui est la probabilité déduite de toute la population concernée.

D2. "Probabilité théorique ou déductive" qui est la probabilité connue grâce à l'étude du phénomène sous-
jacent sans expérimentation. Il s'agit donc d'une connaissance "à priori" par opposition à la définition
précédente qui faisait plutôt référence à une notion de probabilité "à posteriori".

Comme il n'est pas toujours possible de déterminer des probabilités a priori, nous sommes souvent amenés à
réaliser des expériences. Il faut donc pouvoir passer de la première à la deuxième solution. Ce passage est
supposé possible en termes de limite (avec une population dont la taille tend vers la taille de la population
réelle).

La modélisation formelle par le calcul des probabilités a été inventée par A.N. Kolmogorov dans un livre
paru en 1933. Cette modélisation est faite à partir de l'espace de probabilités (U, A, P) que nous définirons
de manière un peu complète plus loin et que nous pouvons relier à la théorie de la mesure (voir chapitre du
même nom).

UNIVERS DES ÉVÉNEMENTS

Définitions :

D1. L'univers des événements, ou des "observables", U est l'ensemble de toutes les issues (résultats)
possibles, appelées "événements élémentaires", qui se présentent au cours d'une épreuve aléatoire
déterminée.

L'univers peut être fini (dénombrable) si les événements élémentaires sont en nombre fini ou continu (non
dénombrable) s'ils sont infinis.

D2. Un "événement" quelconque A est un ensemble d'événements élémentaires et constitue une partie de
l'univers des possible U. Il est possible qu'un événement ne soit constitué que d'un seul événement
élémentaire.

Exemple:

Considérons l'univers de tous les groupes sanguins possible, alors l'événement A "l'individu est de rhésus
positif" est représenté par: (6.1)

alors que l'événement B "l'individu est donneur universel" est représenté par: (6.2)

qui constitue donc un événement élémentaire.


D3. Soit U un univers et A un événement, nous disons que l'événement A "à lieu" (ou "se réalise") si lors du
déroulement de l'épreuve se présente l'issue i et que . Dans le cas contraire, nous disons
que A "n'a pas lieu".

D4. Le sous-ensemble vide de U s'appelle "événement impossible". En effet, si lors de l'épreuve l'issue i
se présente, nous avons toujours et donc l'événement n'a donc jamais lieu.

Si U est fini, ou infini dénombrable, tout sous-ensemble de U est un événement, ce n'est plus vrai si U est
non dénombrable (nous verrons dans le chapitre de Statistique pourquoi).

D5. L'ensemble U s'appelle aussi "événement certain". En effet, si lors de l'épreuve l'issue i se présente, nous
avons toujours (car U est l'univers des événements). L'événement U a donc toujours lieu.

D6. Soit A et B deux sous-ensembles de U. Nous savons que les événements et sont tous
deux des sous-ensembles de U donc des événements aussi respectivement conjoints et disjoints.

Si deux événements A et B sont tels que : (6.3)

les deux événements ne peuvent pas êtres réalisables pendant la même épreuve, nous disons alors qu'ils sont
des "événements incompatibles".

Sinon, si : (6.4)

les deux événements peuvent êtres réalisables dans la même épreuve (possibilité de voir un chat noir au
moment où on passe sous une échelle par exemple), nous disons inversement qu'ils sont des "événements
indépendants".

Pour résumer:

- Incompatibles : Ils ne peuvent se produire ensemble.

- Indépendants : la réalisation de l'un ne modifie pas la probabilité de réalisation de l'autre.

AXIOMATIQUE DE KOLMOGOROV

La probabilité d'un événement sera en quelque sorte le répondant de la notion de fréquence d'un phénomène
aléatoire, en d'autres termes, à chaque événement nous allons attacher un nombre réel, appartenant à
l'intervalle [0,1], qui mesurera sa probabilité (chance) de réalisation. Les propriétés des fréquences que nous
pouvons mettre en évidence lors d'épreuves diverses nous permettent de fixer les propriétés des probabilités.

Soit U un univers. Nous disons que nous définissons une probabilité sur les événements de U si à tout
événement A de U nous associons un nombre ou une mesure P(A), appelé "probabilité à priori de
l'événement A" ou "probabilité marginale de A".

A1. Pour tout événement A: (6.5)

Ainsi, la probabilité de tout événement est un nombre réel compris entre 0 et 1 inclus (c'est du bon sens
humain...).

A2. La probabilité de l'événement certain ou de l'ensemble (somme) des événements possibles est égale à 1:

(6.6)
A3. Si sont deux événements incompatibles (disjoints), alors:

(6.7)

la probabilité de la réunion ("ou") de deux événements incompatibles est donc égale à la somme de leurs
probabilités (loi d'addition). Nous parlons alors de "probabilité disjointe".

Par exemple, si nous considérons qu'il est impossible d'avoir les cheveux totalement blonds et bruns en
même temps et que chaque état à une probabilité de 50%, alors la probabilité d'être l'un ou l'autre des
couleurs est la somme des probabilités... Nous retrouverons ce genre de probabilité dans le chapitre de Génie
Industriel dans la méthode AMDEC des systèmes à structure complexe pour un exemple pratique.

Autrement dit sous forme plus générale si est une suite d'évènements disjoints deux à deux ( et
ne peuvent pas se produire en même temps si ) alors :

(6.8)

Nous parlons alors de "σ-additivité" car si nous regardons de plus près les trois axiomes ci-dessus la mesure
P forme une σ-algèbre (cf. chapitre de Théorie de la Mesure).

Une conséquence immédiate des axiomes (A2) et (A3) est la relation entre les probabilités d'un événement A
et son complémentaire, noté : (6.9)

Définition: Si A et B sont indépendants (ou mutuellement exclusifs), nous savons que , alors (très
important en statistiques!) : (6.10)

la probabilité de l'intersection ("et") de deux événements indépendants est égale au produit de leurs
probabilités (loi de multiplication). Nous parlons alors de "probabilité conjointe" (c'est le cas le plus
fréquent).

Autrement dit sous forme plus générale, les événements sont indépendants si la probabilité de

l'intersection est le produit des probabilités : (6.11)

Remarque: Attention à ne pas confondre "indépendants" et "incompatibles"!

Soit U un univers comportant un nombre fini n d'issues possibles: (6.12)

Les événements: (6.13)

sont donc appelés "événements élémentaires". Lorsque ces événements ont même probabilité, nous disons
qu'ils sont "équiprobables". Dans ce cas, il est très facile de calculer leur probabilité. En effet, ces
événements étant par définition incompatibles entre eux à ce niveau de notre discours, nous avons en vertu
de l'axiome 3 des probabilités : (6.14)

mais puisque : (6.15)


et que les probabilités du membre de droite sont par hypothèse équiprobables, nous avons :

(6.16)

PROBABILITÉS CONDITIONNELLES

Que pouvons-nous déduire sur la probabilité d'un évènement B sachant qu'un évènement A est réalisé? En
d'autres termes, nous voulons savoir s'il est possible de définir la probabilité d'un événement
conditionnellement (relativement) à un autre événement.

Ce type de probabilité est appelée "probabilité conditionnelle" ou "probabilité à posteriori" de B sachant A,


et se note dans le cadre de l'étude des probabilités conditionnelles:P(B / A) (6.17)

et souvent dans la pratique pour éviter la confusion avec une possible division: P(B | A) (6.18)

Nous avons aussi le cas: P(A | B) (6.19)

qui est appelé "fonction de vraisemblance de A" ou encore "probabilité à priori" de A sachant B (cas
beaucoup moins intéressant....).

Historiquement, le premier mathématicien à avoir utilisé correctement la notion de probabilité


conditionnelle fut Thomas Bayes (1702-1761). Aussi parlons-nous souvent de Bayes ou de bayésien dès que
des probabilités conditionnelles sont en jeu: formule de Bayes, statistique bayésienne...

La notion de probabilité conditionnelle que nous allons introduire est beaucoup moins simple qu'elle ne
paraît a priori et les problèmes de conditionnement sont une source inépuisable d'erreurs en tout genre (il
existe de fameux paradoxes sur le sujet).

Commençons d'abord par un exemple simpliste: Supposons que nous ayons deux dès. Imaginons maintenant
que nous ayons lancé seulement le premier dé. Nous voulons savoir quelle est la probabilité qu'en lançant le
second dé, la somme des deux chiffres vaille une certaine valeur minimale. Ainsi, la probabilité d'obtenir
cette valeur minimale fixée sachant la valeur du premier dé est totalement différente de la probabilité
d'obtenir cette même valeur minimale en lançant les deux dès en même temps. Comment calculer cette
nouvelle probabilité?

Formalisons la démarche:

Après le lancer du premier dé, nous avons: (6.20)

Soit l'hypothèse que , nous pressentons que P(B / A) doit être proportionnel à P(B), la constante de
proportionnalité étant déterminée par la normalisation: (6.21)

Soit maintenant (B est inclus dans le complémentaire de A donc les événements sont incompatibles).
Il est assez intuitif que sous l'hypothèse précédente nous ayons: (6.22)

Ceci nous mène aux définitions suivantes des probabilités à posteriori et respectivement à prori:

et (6.23)
Ainsi, le fait de savoir que B est réalisé réduit l'ensemble des résultats possibles de U à B. A partir de là,
seules les éventualités de ont une importance. La probabilité de A sachant B et inversement (par
symétrie) doit donc être proportionnelle à !

Le coefficient de proportionnalité qui est le dénominateur permet d'assurer l'événement certain.


Effectivement, si les deux événements A et B sont incompatibles (pensez à l'histoire du chat noir et de
l'échelle par exemple), nous avons donc: (6.24)

et nous voyons alors P(B / A) qui vaut P(B) et donc A n'apporte rien sur B et réciproquement!!

Une autre façon assez intuitive pour voir les choses est de se représenter la mesure de probabilité P comme
une mesure d'aires de sous-ensembles de .

En effet, si A et B sont deux sous-ensembles de d'aires respectives P(A) et P(B) alors à la question de
savoir qu'elle est la probabilité qu'un point du plan appartienne à B sachant qu'il appartient à A il est assez
évident de répondre que cette probabilité est donnée par:

(6.25)

Indiquons aussi que la définition des probabilités conditionnelles s'utilise souvent sous la forme suivante :

(6.26)

appelée "formule des probabilités composées". Ainsi, la probabilité à posteriori de B sachant A peut donc

aussi s'écrire sous la forme: (6.27)

Exemples:

Supposons une maladie comme la méningite. La probabilité de l'avoir sera noté (chiffre
arbitraire pour l'exemple) et un signe de cette maladie comme le mal de tête sera noté .
Supposons connue la probabilité à posteriori d'avoir mal à la tête si nous avons une méningite:

(6.28)

Le théorème de Bayes donne alors la probabilité à priori d'avoir une méningite si nous avons mal à la tête! :

(6.29)

Pour en revenir à la théorie, notons que nous avons aussi:

(6.30)
qui est appelée la "formule des probabilités totales" ou "théorème des probabilités totales". Mais aussi, pour
tout j, nous avons le corollaire suivant en utilisant les résultats précédents:

(6.31)

qui est la forme générale de la "formule de Bayes" ou "théorème de Bayes" que nous utiliserons un tout petit
peu en Mécanique Statistique et dans le cadre de l'étude de la théorie des files d'attentes (cf. chapitre de
Techniques De Gestion). Il faut savoir que les implications de ce théorème sont cependant considérables
dans le quotidien, dans la médecine, dans l'industrie et dans le domaine du Data Mining informatique.

Exemple:

Deux machines et produisent respectivement 100 et 200 pièces. produit 5% de pièces


défectueuses et en produit 6% (ces valeurs proviennent d'une loi exponentielle!). Quelle est la
probabilité pour qu'un objet défectueux ait été fabrique par la machine ?

L'événement constaté A est donc la présence d'une pièce défectueuse et la probabilité recherchée est la
probabilité à priori que celle-ci provienne de la machine .

Nous avons alors:

(6.32)

L'analyse bayésienne fournit donc un outil puissant de formalisation du raisonnement dans l'incertain et les
exemples que nous avons montrés illustrent surtout à quel point cet outil est délicat à employer..

MARTINGALES

Une martingale en probabilités (il en existe une autre dans les processus stochastiques) est une technique
permettant d'augmenter les chances de gain aux jeux de hasard tout en respectant les règles de jeu. Le
principe dépend complètement du type de jeu qui en est la cible, mais le terme est accompagné d'une aura de
mystère qui voudrait que certains joueurs connaissent des techniques secrètes mais efficaces pour tricher
avec le hasard. Par exemple, de nombreux joueurs (ou candidats au jeu) cherchent LA martingale qui
permettra de battre la banque dans les jeux les plus courants dans les casinos (des institutions dont la
rentabilité repose presque entièrement sur la différence - même faible - qui existe entre les chances de
gagner et celles de perdre).

De nombreuses martingales ne sont que le rêve de leur auteur, certaines sont en fait inapplicables, quelques-
unes permettent effectivement de tricher un peu. Les jeux d'argent sont en général inéquitables : quel que
soit le coup joué, la probabilité de gain du casino (ou de l'État dans le cas d'une loterie) est plus importante
que celle du joueur. Dans ce type de jeu, il n'est pas possible d'inverser les chances, seulement de minimiser
la probabilité de ruine du joueur.
L'exemple le plus courant est la martingale de la roulette, elle consiste à jouer une chance simple à la
roulette (noir ou rouge, paire ou impaire) de façon à gagner, par exemple, une unité dans une série de coups
en doublant sa mise si l'on perd, et cela jusqu'à ce que l'on gagne. Exemple : le joueur mise 1 unité sur le
rouge, si le rouge sort, il arrête de jouer et il a gagné 1 unité (2 unités de gain moins l'unité de mise), si le
noir sort, il double sa mise en pariant 2 unités sur le rouge et ainsi de suite jusqu'à ce qu'il gagne.

Ayant une chance sur deux de gagner, il peut penser qu'il va finir par gagner ; quand il gagne, il est
forcément remboursé de tout ce qu'il a joué, plus une fois sa mise de départ.

Cette martingale semble être sûre en pratique. À noter que sur le plan théorique, pour être sûr de gagner, il
faudrait avoir la possibilité de jouer au cas où un nombre de fois illimité. Ce qui présente des inconvénients
majeurs :

Cette martingale est en fait limitée par les mises que le joueur peut faire car il faut doubler la mise à chaque
coup tant que l'on perd : 2 fois la mise de départ, puis 4, 8, 16.... s'il perd 10 fois de suite, il doit pouvoir
avancer 1024 fois sa mise initiale pour la 11e partie ! Il faut donc beaucoup d'argent pour gagner peu.

Les roulettes comportent un "0" qui n'est ni rouge ni noir. Le risque de perdre lors de chaque coup est ainsi
plus grand que 1/2...

De plus, pour paralyser cette stratégie, les casinos proposent des tables de jeu par tranche de mise : de 1 à
100.-, de 2 à 200.-, de 5 à 500.-, ... (bon ensuite voir s'il est possible de changer de table...). Impossible donc
d'utiliser cette méthode sur un grand nombre de coups, ce qui augmente le risque de tout perdre.

Le black jack est un jeu qui possède des stratégies gagnantes : plusieurs techniques de jeu, qui nécessitent
généralement de mémoriser les cartes, permettent de renverser les chances en faveur du joueur. Le
mathématicien Edward Thorp a ainsi publié en 1962 un livre qui fut à l'époque un véritable best-seller. Mais
toutes ces méthodes demandent de longues semaines d'entraînement et sont facilement décelables par le
croupier (les brusques changements de montant des mises sont caractéristiques). Le casino a alors tout loisir
d'écarter de son établissement les joueurs en question.

Il faut noter qu'il existe des méthodes assez évoluées. L'une d'elles repose sur les combinaisons les moins
jouées. Dans les jeux où le gain dépend du nombre de joueurs gagnants (Loto...), jouer les combinaisons les
moins jouées optimisera les gains. C'est ainsi que certaines personnes vendent des combinaisons qui seraient
statistiquement très rarement utilisées par les autres joueurs.

Partant de ce raisonnement, on peut encore conclure qu'un joueur qui aurait réussi à déterminer ainsi les
combinaisons statistiquement les moins jouées, afin d'optimiser son espérance de gain ne sera en fait
certainement pas le seul joueur à avoir obtenu par l'analyse ces fameuses combinaisons, et tous ces joueurs
risquent donc finalement d'être très déçus par leurs gains s'il s'avérait que cette combinaison équiprobable
sorte au tirage! Cela revient à dire que les numéros en théorie les moins joués sont en fait surjoués par
combinaisons, le mieux serait peut-être de réaliser un savant mélange de numéros sous-joués et de numéros
surjoués pour obtenir les combinaisons idéales, qui peuvent par ailleurs être observées dans les tirages
passés lorsqu'il n'y a pas eu de gagnant. Une autre conclusion à tout cela est peut-être que le mieux est
encore de jouer des combinaisons aléatoires qui ont finalement moins de chance d'être également choisies
par les joueurs qui incorporent un facteur humain et harmonieux dans le choix de leurs nombres.

ANALYSE COMBINATOIRE

"L'analyse combinatoire" est le domaine de la mathématique qui s'occupe de l'étude de l'ensemble des
issues, événements ou faits (distinguables ou non tous distinguables) avec leurs arrangements
(combinaisons) ordonnés ou non selon certaines contraintes données.
Définitions:

D1. Une suite d'objets (événements, issues, objets,...) est dite "ordonnée" si chaque suite composée d'un
ordre particulier des objets est comptabilisée comme une configuration particulière.

D2. Une suite est donc "non ordonnée" si et seulement si nous intéresse la fréquence d'apparition des objets
indépendamment de leur ordre.

D3. Des objets (d'une suite) sont dits "distincts" si leurs caractéristiques ne permettent pas de les confondre
avec des autres objets.

Remarque: Nous avons choisi de mettre l'analyse combinatoire dans ce chapitre car lorsque nous calculons
des probabilités, nous avons également assez souvent besoin de savoir quelle est la probabilité de tomber sur
une combinaison ou un arrangement d'événements donnés sous certaines contraintes.

Il existe plusieurs types d'arrangements selon les contraintes et les propriétés des éléments arrangés. Nous
allons présenter et démontrer ci-dessous les 5 cas les plus répandus à partir desquels nous pouvons trouver
(habituellement) tous les autres :

ARRANGEMENTS AVEC RÉPÉTITION

Définition: Un "arrangement avec répétition" est une suite ordonnée de longueur m de n objets distincts non
nécessairement tous différents dans la suite (soit avec répétition possible!).

Soient A et B deux ensembles finis de cardinaux respectifs m, n tels que trivialement il y ait m façons de
choisir un objet dans A (de type a) et n façons de choisir un objet dans B (de type b).

Nous avons vu en théorie des ensemble que si A et B sont disjoints, que: (6.33)

Nous en déduisons donc les propriétée suivantes:

P1. Si un objet ne peut être à la fois de type a et de type b et s'il y a m façons de choisir un objet de type a et
n façons de choisir un objet de type b, alors il y a façons de choisir un objet de type a ou de type b.

P2. Si nous pouvons choisir un objet de type a de m façons puis un objet de type b de n façons, alors il y a
selon le produit cartésien de deux ensembles (cf. chapitre de Théorie Des Ensembles) :

(6.34)

de manière choisir un seul et unique objet de type a puis un objet de type b.

Avec les mêmes notations, choisir une fonction de A dans B, c'est choisir (dans le cas général) pour chaque
élément de A, son unique image parmi les n éléments de B. Il y a donc n façons de choisir l'image du
premier élément de A, puis aussi n façons de choisir l'image du deuxième, ..., puis n façons de choisir
l'image du m-ème. Le nombre d'applications totales possibles de A dans B est donc égal au produit de
m égaux à n. Ainsi, nous avons : (6.35)

où est l'ensemble des applications de A dans B. La progression du nombre de possibilités est donc
géométrique (et non "exponentielle" comme il est souvent dit à tort!).
Ce résultat mathématique est assimilable au résultat non-ordonné (un arrangement dont l'ordre des
éléments de la suite n'est pas est pris en compte) de m tirages dans un sac contenant n boules différentes
avec remise après chaque tirage.

Exemples:

E1. Combien de "mots" (ordonnés) de 7 lettres pouvons-nous former à partir d'un alphabet de 24 lettres
distinctes (très utile pour connaître le nombre d'essais pour trouver un mot de passe par exemple)? La
solution est: (6.36)

E2. Combien de groupes d'individus aurons-nous lors d'une votation sur 5 sujets et où chacun peut être soit
accepté, soit rejeté? La solution (très utilisée dans les entreprises ou en Suisse) est:

(6.37)

Une généralisation simple de ce dernier résultat peut consister dans l'énoncé du problème suivant :

Si nous disposons de m objets tels que peut prendre états différents alors le nombre de
combinaisons possibles est: (6.38)

Et si nous avons alors nous retombons sur : (6.39)

PERMUTATIONS SIMPLES (SANS REPETITION)

Définition: Une "permutation simple" (appelée anciennement "substitution") de n objets distincts est une
suite ordonnée (différente) de ces n objets par définition tous différents dans la suite (sans répétition).

Attention à ne pas confondre le concept de permutation et d'arrangement!

Le nombre d'arrangements de n éléments peut être calculé par récurrence : il y a n places pour un premier
élément, n-1 pour un deuxième élément, ..., et il ne restera qu'une place pour le dernier élément restant.

Il est dès lors trivial que nous aurons un nombre d'arrangements donné par :

(6.40)

Rappelons que le produit: (6.41)

est appelé "factorielle de n" et nous la notons n! pour .

Il y a donc pour n éléments distinguables : (6.42)

arrangements possibles. Ce type de calcul peut être par exemple utile en gestion de projets (calcul de
manière différentes de de recevoir dans une chaîne de production n pièces toutes différentes commandées
chez des fournisseurs externes).
Exemple:

Combien de "mots" (ordonnés) de 7 lettres distinctes sans répétition pouvons-nous former ?

(6.43)

Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des éléments de la
suite est pris en compte) du tirage de toutes les boules différentes d'un sac contenant n boules distinguables
sans remise.

PERMUTATIONS AVEC RÉPÉTITION

Définition : Lorsque nous considérons le nombre de permutations ordonnées (différentes) d'une suite de n
objets distincts tous nécessairement non différents dans une quantité donnée dans la suite nous parlons de
"permutation avec répétition".

Remarque: Il ne faut pas confondre cette dernière définition avec "l'arrangement avec répétition"!

Lorsque certains éléments éléments ne sont pas distinguables dans une suite d'objets (ils sont répétitifs dans
la suite), alors le nombre d'arrangements (permutations) que nous pouvons constituer se réduit alors assez
trivialement à un nombre plus petit que si tous les éléments étaient distinguables.

Soit le nombre d'objets du type i, avec: (6.44)

alors, nous notons : (6.45)

avec le nombre d'arrangements possibles (pour l'instant inconnu) avec répétition (un ou plusieurs
éléments répétitifs dans une suite d'éléments sont non distinguables par permutation).

Si chacune des places occupées par des éléments identiques était occupée par des éléments différents, le
nombre de permutations serait alors à multiplier par chacun des (cas précédent).

Il vient alors que nous retombons sur la factorielle telle que :

(6.46)

alors: (6.47)

Si les n objets sont tous différentes dans la suite, nous avons alors :

(6.48)

et nous nous retrouvons bien avec une permutation simple (sans répétition) telle que :

(6.49)
Il convient de remarquer que les permutations avec répétition sont en plus petit nombre que celles sans
répétition (évident puisque nous ne prenons pas en compte les permutations des éléments identiques entre
eux!).

Exemple:

Combien de "mots" (ordonnés) pouvons-nous former avec les lettres du mot "mississippi" :

(6.50)

Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des éléments de la
suite est pris en compte) du tirage de n boules non toutes distinguables d'un sac contenant boules avec
remise limitée pour chaque boule.

ARRANGEMENTS SIMPLES SANS RÉPÉTITION

Définition: Un "arrangement simple sans répétition" est une suite ordonnée de p objets tous distincts pris
parmi n objets distincts avec .

Nous nous proposons donc maintenant de dénombrer les arrangements possibles de p objets parmi n. Nous
noterons le nombre des ces arrangements.

Il est aisé de calculer et de vérifier que . Effectivement, il existe n façons de choisir le


premier objet et (n-1) façons de choisir le deuxième lorsque nous avons déjà le premier.

Pour déterminer , nous raisonnons alors par récurrence. Nous supposons connu et nous en
déduisons : (6.51)

Dès lors: (6.52)

alors: (6.53)

d'où : (6.54)

Ce résultat nous amène à l'assimiler au résultat ordonné (un arrangement dont l'ordre des éléments de la
suite est pris en compte) du tirage de p boules d'un sac contenant n boules différentes sans remise.

Exemple:

Soit les 24 lettres de l'alphabet, combien de "mots" (ordonnés) de 7 lettres distinctes pouvons-nous former ?

(6.55)
Le lecteur aura peut-être remarqué que si nous prenons nous nous retrouvons avec :

(6.56)

Donc une permutation simple est donc un arrangement simple sans répétition avec !

COMBINAISONS SIMPLES

Définition: Une "combinaison simple" ou "choix" est une suite non-ordonnée (dont l'ordre ne nous intéresse
pas!) de p éléments tous différents (pas nécessairement dans le sens visuel du terme!) choisis parmi n objets
distincts et est par définition notée et appelée la "binomiale".

Si nous permutons les éléments de chaque arrangement simple de p éléments parmi n, nous obtenons toutes
les permutations simples et nous savons qu'il y en a p! d'où en utilisant la convention d'écriture du site :

(6.57)

C'est une relation très souvent utilisée dans les jeux de hasard mais également dans l'industrie via la loi
hypergéométrique (cf. chapitre de Techniques De Gestion).

Remarques:

R1. Nous avons nécessairement par définition

R2. Selon les auteurs nous inversons l'indice ou le suffixe de C il faut donc être prudent!

Exemple:

Soit un alphabet de 24 lettres, combien avons-nous de choix de prendre 7 lettres parmi les 24 sans prendre

en compte l'ordre dans lequel sont triées les lettres : (6.58)

La même valeur peut être obtenue avec la fonction COMBIN( ) de MS Excel.

Ce résultat nous amène à l'assimiler au résultat non ordonné (un arrangement dont l'ordre des éléments de
la suite n'est pas pris en compte) du tirage de p boules d'un sac contenant n boules différentes sans remise.

Il existe, relativement à la binomiale, une autre relation très souvent utilisée dans de nombreux cas d'études
ou également de manière plus globale en physique ou analyse fonctionnelle. Il s'agit de la "formule de
Pascal" : (6.59)

Démonstration:

(6.60)
Or donc : (6.61)

et de même : (6.62)

Ainsi : (6.63)

CHAÎNES DE MARKOV

Les chaînes de Markov sont des outils statistiques et probabilistes simples mais dont la forme de
présentation mathématique prête parfois à l'horreur. Nous allons tenter ici de simplifier un maximum les
notations pour introduire cet outil formidable très utilisé au sein des entreprises pour gérer la logistique, les
files d'attentes aux centrales d'appel ou aux caisses de magasins jusqu'à la théorie de la défaillance pour la
maintenance préventive, en physique statistique ou en génie biologique (et la liste est encore longue et pour
plus de détails le lecteur pourra se reporter aux chapitres concernés disponibles sur le site...).

Définition: Nous noterons un processus probabiliste fonction du temps (c'est donc un processus
stochastique) dont la valeur à chaque instant dépend de l'issue d'une expérience aléatoire. Ainsi, à chaque
instant t, X(t) est donc une variable aléatoire.

Si nous considérons un temps discret, nous notons alors un processus stochastique à temps discret.
Si nous supposons que les variables aléatoires ne peuvent prendre qu'un ensemble discret de valeurs.
Nous parlons alors de "processus à temps discret et à espace discret".

Remarque: Il est tout à fait possible comme dans l'étude du télétrafic d'avoir un processus à temps continu et
à espace d'état discret.

Définition : est une "chaîne de Markov" si et seulement si:

(6.64)

en d'autres termes (c'est très simple!) la probabilité pour que la chaîne soit dans un certain état à la n-ème
étape du processus ne dépend que de l'état du processus à l'étape n - 1 et pas des étapes précédentes!

Remarque: En probabilité un processus stochastique vérifie la propriété markovienne si et seulement si la


distribution conditionnelle de probabilité des états futurs, étant donné l'instant présent, ne dépend que de ce
même état présent et pas des états passés. Un processus qui possède cette propriété est donc appelé
"processus de Markov".

Définition: Une "chaîne de Markov homogène" est une chaîne telle que la probabilité qu'elle a pour passer
dans un certain état à la n-ème soit indépendante du temps. En d'autres termes, la loi de probabilité
caractérisant la prochaine étape ne dépend pas du temps (de l'étape précédente), et en tout temps la loi de
probabilité à tout moment de la chaîne est toujours la même pour caractériser la transition à l'étape en cours.
Nous pouvons alors définir la (loi) de "probabilité de transition" d'un état i vers un état j par :

(6.65)

Il est alors naturel de définir la "matrice de transition" :

(6.66)

Les chaînes de Markov peuvent être représentées graphiquement sous la forme d'un graphe orienté (cf.
chapitre de Théorie Des Graphes). Nous associons alors à chaque composante un arc orienté et sa la
probabilité de transition.

Exemple:

(6.67)

Ainsi, les seules transitions permises par les 4 états (matrice 4x4) sont celles indiquées par les flèches. Ce
qui fait que la matrice de transition s'écrit alors :

(6.68)

L'analyse du régime transitoire d'une chaîne de Markov consiste à déterminer la matrice-colonne (vecteur)
p(n) d'être dans un état j à l'étape n (ou en la n-ème étape autrement dit...) :

(6.69)
Ce vecteur de probabilités dépend (c'est assez intuitif) de la matrice de transition P et du vecteur de
probabilités initiales p(0).

Nous en verrons un exemple trivial dans le chapitre de Théorie des Graphes qui sera redéveloppé sous forme
détaillée et complète ainsi que dans le chapitre de Théorie Des Jeux Et De La Décision dans le cadre de la
pharmaco-économie. Mais signalons également que les chaînes de Markov sont également utilisées en
météorologie par exemple:

(6.70)

ou dans le domaine médical, financier, des transports du marketing, etc.


7. STATISTIQUES (1/2)

L a statistique est une science qui a pour objet le groupement méthodique de faits ou événements répétitifs
qui se prêtent à une évaluation numérique dans le temps suivant une loi donnée.

Il faut savoir que parmi tous les domaines de la mathématique, celle qui est utilisée à la plus large échelle
dans un cadre professionnel dans les entreprises est bien la statistique! Raison pour laquelle ce chapitre est
un des plus gros alors que seuls les concepts élémentaires y sont présentés!

Il est peut être inutile de préciser que la statistique est beaucoup utilisée en ingénierie, physique théorique,
en économétrie, en gestion de projets, dans l'industrie des processus, dans les domaines des assurances vies
et non vies, dans l'actuariat ou dans la simple analyse de banque de données (avec MS Excel très souvent...
malheureusement....) et la liste est encore longue. Par ailleurs, nous rencontrerons les outils présentés ici
assez souvent dans les chapitres de Mécanique des Fluides, de Thermodynamique, des Techniques de
Gestion, du Génie Industriel et d'Économétrie (en particulier dans ces deux dernières). Le lecteur pourra
donc s'y reporter pour avoir des applications pratiques concrètes des quelques-uns des éléments théoriques
les plus importants qui seront vus ici.

Signalons également que outre les quelques exemples simples données sur ces pages, de nombreux autres
exemples applicatifs sont donnés sur le serveur d'exercices du site dans les catégories Probabilités et
Statistiques, Génie Industriel, Économétrie et Techniques de Gestion.

Définition: Le but principal de la statistique est de déterminer les caractéristiques d'une population donnée à
partir de l'étude d'une partie de cette population, appelée "échantillon" ou "échantillon représentatif".

Remarque: Le traitement des données concerne la "statistique descriptive". L'interprétation des données à
partir des estimateurs s'appelle "l'inférence statistique" (ou "statistique inférentielle"), et l'analyse de données
en masse la "statistique fréquentielle" (en opposition à l'inférence bayesienne).

Lorsque nous observons un événement prenant en compte certains facteurs, il peut arriver qu'une deuxième
observation ait lieu dans des conditions qui semblent identiques. En répétant ces mesures plusieurs fois sur
différents objets supposés similaires, nous pouvons constater que les résultats observables sont distribués
statistiquement autour d'une valeur moyenne qui est, finalement le résultat possible le plus probable. Dans la
pratique, nous n'effectuons cependant parfois qu'une seule mesure et il s'agit alors de déterminer la valeur de
l'erreur que nous commettons en adoptant celle-ci comme moyenne mesurée. Cette détermination nécessite
de connaître le type de distribution statistique auquel nous avons à faire et c'est ce que nous allons nous
attarder (entre autres) à étudier ici (les bases du moins!). Il existe cependant plusieurs approches
méthodologiques courantes (les moins courantes n'étant pas citées pour l'instant) face au hasard :

1. Une toute première consiste à ignorer purement et simplement les éléments aléatoires, pour la bonne
raison que l'on ne sait pas comment les intégrer. Nous utilisons alors la "méthode des scénarios" appelé aussi
"simulation déterministe". C'est typiquement un outil utilisé par les financiers ou gestionnaires non diplômés
travaillant avec des outils comme MS Excel (qui inclut un outil de gestion de scénarios) ou MS Project (qui
inclut un outil de type scénarios optimiste, pessimiste, attendu déterministes).

2. Une seconde approche envisageable, quand nous ne savons pas associer des probabilités précises aux
futurs événements aléatoires, est la théorie des jeux (cf. chapitre de la Théorie Des Jeux Et De La Décision)
où l'on utilise des critères de sélection semi-empiriques comme le critère du maximax, du minimax, de
Laplace, de Savage, etc.

3. Enfin, quand nous pouvons lier des probabilités aux événements aléatoires, soit que ces probabilités
découlent de calculs ou de mesures, soit qu'elles reposent sur une expérience acquise auprès de situations
antérieurs de même nature que la situation actuelle, nous pouvons faire appel aux statistiques descriptives et
inférentielles (contenu du présent chapitre) pour tirer des informations exploitables et pertinentes de cette
masse de données acquises.

4. Une dernière approche quand nous avons connaissance de probabilités relatives aux issues intervenantes
faisant suite à des choix stratégiques est l'utilisation de la théorie de la décision (cf. chapitre de la Théorie
Des Jeux Et De La Décision).

Remarque: Sans la statistique mathématique, un calcul sur des données (par exemple une moyenne), n'est
qu'un "indicateur". C'est la statistique mathématique qui lui donne le statut d'estimateur dont on maîtrise le
biais, l'incertitude et autres caractéristiques statistiques. Nous cherchons en général à ce que l'estimateur soit
sans biais, convergeant et efficace.

Introduisons avant de continuer quelques définitions qui vont nous être utiles pour la suite sur le concept
d'échantillons et de moyennes :

ÉCHANTILLONS

Lors de l'étude statistique d'ensembles d'informations, la façon de sélectionner l'échantillon est aussi
importante que la manière de l'analyser. Il faut que l'échantillon soit représentatif de la population (nous ne
faisons pas nécessairement référence à des populations humaines!). Pour cela, l'échantillonnage aléatoire est
le meilleur moyen d'y parvenir.

Le statisticien part toujours de l'observation d'un ensemble fini d'éléments, que nous qualifions de
"population". Les éléments observés, en nombre n, sont tous de même nature, mais cette nature peut être fort
différente d'une population à l'autre.

Définitions:

D1. Nous sommes en présence d'un "caractère quantitatif" lorsque chaque élément observé fait explicitement
l'objet d'une même mesure. A un caractère quantitatif donné, nous associons une "variable quantitative" qui
synthétise toutes les valeurs possibles que la mesure considérée est susceptible de prendre (ce type
d'information étant représenté par des courbes de Gauss, de Bêta, de Poisson, etc.)

Remarque: Nous reviendrons sur le concept de "variable" en statistiques plus loin...

D2. Nous sommes en présence d'un"caractère qualitatif" lorsque chaque élément observé fait explicitement
l'objet d'un rattachement unique à une "modalité" (nombre d'occurrences dans l'observation) choisie dans un
ensemble de modalités exclusives permettant de classer tous les éléments de l'ensemble étudié selon un
certain point de vue (ce type d'information étant représenté par des diagrammes à barre, fromages,
diagrammes à bulles, etc.).

D3. Un "échantillon aléatoire" est un échantillon tiré au hasard dans lequel tous les individus d'une
population ont la même chance, ou "équiprobabilité" (et nous insistons sur le fait que cette probabilité doit
être égale), de se retrouver dans l'échantillon.

D4. Dans le cas contraire d'un échantillon dont les éléments n'ont pas été pris au hasard, nous disons alors
que l'échantillon est "biaisé" (dans le cas inverse nous disons qu'il est "non-biaisé")

Remarque: Un petit échantillon représentatif est, de loin, préférable à un grand échantillon biaisé. Mais
lorsque la taille des échantillons utilisés est petite, le hasard peut donner un résultat moins bon que celui qui
est biaisé...
MOYENNES

La notion de "moyenne" ou "tendance centrale" (les financiers appellent cela aussi une "mesure de
localisation"...) est avec la notion de "variable" à la base des statistiques.

Cette notion nous semble très familière et nous en parlons beaucoup sans nous poser trop de questions.
Pourtant il existe divers qualificatifs (nous insistons sur le fait que ce ne sont que des qualificatifs!) pour
distinguer la forme de la résolution d'un problème consistant à calculer la moyenne.

Il faut donc être très très prudent quant aux calculs des moyennes car il y a une fâcheuse tendance dans les
entreprises à se précipiter et à utiliser systématiquement la moyenne arithmétique sans réfléchir, ce qui peut
amener à de graves erreurs!

Nous verrons ci-dessous différentes moyennes avec des exemples relatifs à l'arithmétique, au
dénombrement, à la physique, à l'économétrie, à la géométrie et à la sociologie. Le lecteur trouvera d'autres
exemples pratiques en parcourant l'ensemble du site.

Définitions: Soit des nombres réels, nous avons alors :

D1. La "moyenne arithmétique" ou "moyenne empirique" (la plus communément connue) définie par le

quotient de la somme des n valeurs observées par l'effectif total n: (7.1)

et très souvent notée ou encore et est pour toute loi statistique discrète ou continue un estimateur sans
biais de l'espérance (mais pas forcément).

Si plusieurs valeurs occurrent plus d'une fois dans les mesures, la moyenne arithmétique sera alors souvent

notée formellement: (7.2)

et appelée "moyenne pondérée par les effectifs". Enfin, indiquons que dans le cadre de cette démarche, la
moyenne pondérée par les effectifs prendra le nom "d'espérance mathématique" dans le domaine d'étude des
probabilités.

Nous pouvons tout aussi bien utiliser les fréquences d'apparition des valeurs observées (dites "fréquence des

classes"): (7.3)

Nous avons alors la "moyenne pondérée par les fréquences de classe":

(7.4)

Avant de continuer, indiquons que dans le domaine de la statistique il est souvent utile et nécessaire de
regrouper les mesures/données dans des intervalles de classe de largeur donnée (voir les exemples plus loin).
Il faut souvent faire plusieurs essais pour cela même s'il existe des formules semi-empiriques pour choisir le
nombre de classes lorsque nous avons n valeurs à disposition. Une des ses règles semi-empiriques utilisée
par de nombreux praticiens consiste à retenir le plus petit nombre entier de classes k tel que:

(7.5)
la largeur de l'intervalle de classe étant alors obtenue en divisant l'étendue (différence entre la valeur
maximale mesurée et la minimale) par k. Par convention et en toute rigueur... (donc rarement respecté dans
les notations), un intervalle de classe est fermé à gauche et ouvert à droite: [...,...[.

Ensuite, pour chaque intervalle i le praticien prendra par tradition pour la moyenne entre les deux bornes
pour le calcul et la multipliera par la fréquence fi de classe correspondante. Dès lors, le regroupement en
fréquence de classe fait que :

1. La moyenne pondérée par les effectifs diffère de la moyenne arithmétique.

2. Vue l'approximation effectuée elle sera un moins bon indicateur que la moyenne arithmétique

3. Elle est très sensible aux choix du nombre de classes donc médiocre à ce niveau là

Plus loin, nous verrons deux propriétés extrêmement importantes de la moyenne arithmétique et de
l'espérance mathématique qu'il vous faudra absolument comprendre (moyenne pondérée des écarts à la
moyenne et la moyenne des écarts à la moyenne).

Remarque: Le "mode", noté Mod ou simplement M, est par définition la valeur qui apparaît le plus grand
nombre de fois dans une série de valeurs. Dans MS Excel, soulignons que la fonction MODE( ) renvoie la
première valeur dans l'ordre des valeurs ayant le plus grand nombre d'occurrences en supposant donc une
distribution unimodale.

D2. La "médiane" ou "moyenne milieu", notée (ou plus simplement M), est la valeur qui coupe une
population en deux parties égales. Dans le cas d'une distribution statistique continue f(x) d'une variable
aléatoire X, il s'agit de la valeur qui représente 50% de probabilités cumulées d'avoir lieu tel que (nous
détaillerons le concept de distribution statistique plus loin très en détails):

(7.6)

Dans le cas d'une série de valeurs ordonnées , la médiane est donc de par sa définition la
valeur de la variable telle que l'on ait autant d'éléments qui ont une valeur qui lui est supérieure ou égale, que
d'éléments qui ont une valeur qui lui est inférieure ou égale. Elle est principalement utilisée pour les
distributions asymétriques, car elle les représente mieux que la moyenne arithmétique

Plus rigoureusement:

- Si le nombre de termes est impair, de la forme 2n+1, la médiane de la série est le terme de rang n+1 (que
les termes soient tous distincts ou non!).

- Si le nombre de termes est pair, de la forme 2n, la médiane de la série est la demi-somme (moyenne
arithmétique) des valeurs des termes de rang n et n + 1 (que les termes soient tous distincts ou non!).

Dans tous les cas, de par cette définition, il découle qu'il y a au moins 50 % des termes de la série inférieurs
ou égaux à la médiane, et au moins 50% des termes de la série supérieurs ou égaux à la médiane.
Considérons par exemple la table de salaires ci-dessous:

%Cumul
N° Employé Salaire Cumul employés
employés
1 1200 1 6%
2 1220 2 12%
3 1250 3 18%
4 1300 4 24%
5 1350 5 29%
6 1450 6 35%
7 1450 7 41%
8 1560 8 47%
9 1600 9 53%
10 1800 10 59%
11 1900 11 65%
12 2150 12 71%
13 2310 13 76%
14 2600 14 82%
15 3000 15 88%
16 3400 16 94%
17 4800 17 100%
Tableau: 7.1 - Identification de la médiane

Il y a un nombre impair 2n+1 de valeurs. Donc la médiane de la série est le terme de rang n+1. Soit 1'600.-
(résultat que vous donnera n'importe quel tableur informatique). La moyenne arithmétique quant à elle vaut
2'020.

En relation directe avec la médiane il est important de définir le concept suivant afin de comprendre le
mécancisme sous-jacent:

Définition: Soit donné une série statistique , nous appelons "dispersion des écarts absolus"
autour de x le nombre défini par : (7.7)

est minimum pour une valeur de x la plus proche d'une valeur donnée au sens de l'écart absolu. La
médiane est la valeur qui réalise ce minimum (extrémum)! L'idée va alors consister à étudier les variations
de la fonction pour trouver le rang de cet extrémum.

En effet, nous pouvons écrire :

(7.8)

Donc par définition de la valeur x :

(7.9)
Ce qui nous permet donc de faire sauter les valeurs absolues est simplement le choix de l'indice r qui est pris
de telle manière que la série de valeurs peut en pratique toujours être coupé en deux parties: tout ce qui est
inférieur à un élément de la série indexé par r et tout ce qui lui est supérieur (la médiane donc par
anticipation).

est donc une fonction affine (assimilable à l'équation d'une droite pour r et n fixés) par morceaux
(discrète) où l'on peut assimiler le facteur: 2r-n (7.10)

à la pente et: (7.11)

à l'ordonnée à l'origine.

La fonction est donc décroissante (pente négative) tant que r est inférieur à n/2 et croissante quand r est
supérieur à n/2. Plus précisément, nous distinguons deux cas qui nous intéressent particulièrement puisque n
est un entier (elle pas donc par un extremum!) :

- Si n est pair, nous pouvons poser , alors la pente peut s'écrire et elle est nulle si et
dès lors puisque ce résultat n'est valable par construction que pour alors est constante
sur et nous avons un extrémum obligatoirement au milieu de cet intervalle (moyenne
arthmétique des deux termes).

- Si n est impair, nous pouvons poser (nous coupons la série en deux parties égales), alors le pente
peut s'écrire et elle est donc nulle si et dès lors puisque ce résultat n'est valable
que pour alors il est immédiat que la valeur du milieu sera la médiane .

Nous retrouvons donc bien la médiane dans les deux cas. Nous verrons aussi plus loin comment la médiane
est définie pour une variable aléatoire continue.

Il existe un autre cas pratique où le statisticien n'a à sa disposition que des valeurs regroupées sous forme
d'intervalles de classes statistiques. La procédure pour déterminer la médiane est alors différente:

Lorsque nous avons à notre disposition uniquement une variable classée, l'abscisse du point de la médiane se
situe en général à l'intérieur d'une classe. Pour obtenir alors une valeur plus précise de la médiane, nous
procédons à une interpolation linéaire. C'est ce que nous appelons la "méthode d'interpolation linéaire de la
médiane".

La valeur de la médiane peut être lue sur le graphique ou calculée analytiquement. Effectivement,
considérons le graphique représentant la probabilité cumulée F(x) en intervalles de classe comme ci-dessous
où les bornes des intervalles ont été reliées par des droites:

(7.12)
La valeur de la médiane M se trouve évidemment au croisement entre la probabilité de 50% (0.5) et
l'abscisse. Si nous prenons dans le cadre particulier de l'exemple ci-dessus la borne supérieure de l'intervalle
de classe précédant celle contenant la médiane nous avons 2 et 4 pour la borne inférieure de l'intervalle
suivant. Nous avons alors en calculant la pente la relation suivante:

(7.13)

Ce que nous écrivons fréquemment: (7.14)

d'où la valeur de la médiane: (7.15)

Prenons le tableau suivant que nous retrouverons bien plus tard dans le présent chapitre:

Montant des Nombre de tickets Nombre cumulés de Fréquences


tickets tickets relatives cumulées
[0;50[ 668 668 0.068
[50,100[ 919 1'587 0.1587
[100,150[ 1'498 3'085 0.3085
[150,200[ 1'915 5000 0.5000
[200,250[ 1'915 6'915 0.6915
[250,300[ 1'498 8'413 0.8413
[300,350[ 919 9'332 0.9332
[350,400[ 440 9'772 0.9772
[400 et + 228 10'000 1
Tableau: 7.2 - Identification de la classe médiane

Nous voyons que la "classe médiane" est dans l'intervalle [150,200] car la valeur cumulée de 0.5 s'y trouve
mais la médiane a elle, en utilisant la relation établie précédemment, précisément une valeur de (c'est trivial
dans l'exemple particulier du tableau ci-dessus mais faisons quand même le calcul...):

(7.16)

et nous pouvons faire de même avec n'importe quel autre centile bien évidemment!

La question qui se pose ensuite est celle de la pertinence du choix de la moyenne ou de la médiane et termes
de communication...

Un bon exemple reste celui du marché du travail où de façon générale, alors que le salaire moyen et le
salaire médian sont relativement différents, les instutions de statistiques étatiques calculent la médiane que
beaucoup de médias traditionnels assimilent alors explicitement au concept de "moyenne arithmétique" dans
leurs communiqués.

Remarque: Pour éviter d'obtenir une moyenne arithmétique ayant peu de sens, nous calculons souvent une
"moyenne élaguée", c'est à dire une moyenne arithmétique calculée après avoir enlevé des valeurs aberrantes
à la série.
Les "quantiles" généralisent la notion de médiane en coupant la distribution en des ensembles données de
parties égales (de même cardinal pourrions nous dire...) ou autrement dit en intervalles réguliers. Nous
définissons ainsi les "quartiles", les "déciles" et les "centiles" (ou "percentiles") sur la population, ordonnée
dans l'ordre croissant, que nous divisons en 4, 10 ou 100 parties de même effectif.

Nous parlerons ainsi du centile 90 pour indiquer la valeur séparant les premiers 90% de la population des
10% restant.

Précisons que dans la version francophone de MS Excel les fonctions QUARTILE( ), CENTILE( ),
MEDIANE( ), RANG.POURCENTAGE ( ) sont disponibles et spécifions qu'il existe plusieurs variantes de
calcul des ces centiles d'où une variation possible entre les résultats sur différents logiciels.

Ce concept est très important dans le cadre des intervalles de confiance que nous verrons beaucoup plus loin
dans ce chapitre et très utile dans le domaine de la qualité avec l'utilisation des boîtes à moustaches
(traduction de Box & Whiskers Plot ou BoxPlot) permettant de comparer rapidement deux populations de
données et surtout d'éliminer les valeurs aberrantes (prendre comme référence la médiane sera justement

plus judicieux!): (7.17)

Une autre représentation mentale très importante des boîtes à moustache est la suivante (elle permet de se
donner donc une idée de l'asymétrie de la distribution):
(7.18)

D4. Par analogie avec la médiane, nous définissons la "médiale" comme étant la valeur (dans l'ordre
croissant des valeurs) qui partage la somme (cumuls) des valeurs en deux masses égales (donc la somme
totale divisée par deux).

Dans le cas de salaires, alors que le médiane donne le 50% des salaires se trouvant en-dessous et en-dessus,
la médiale donne combien de salariés se partagent (et donc le salaire partageant) la première moitié et
combien de salariés se partagent la seconde moitié de l'ensemble des coûts salariaux.

Par exemple pour revenir à notre tableau sur les salaires:

N° Employé Salaire Cumul salaire %Cumulé salaire


1 1200 1200 3.5%
2 1220 2420 7%
3 1250 3670 10.7%
4 1300 4970 14.5%
5 1350 6320 18.4%
6 1450 7770 22.6%
7 1450 9220 26.8%
8 1560 10780 31.4%
9 1600 12380 36.1%
10 1800 14180 41.3%
11 1900 16080 46.8%
12 2150 18230 53.1%
13 2310 20540 59.8%
14 2600 23140 67.4%
15 3000 26140 76.1%
16 3400 29540 86%
17 4800 34340 100%
Tableau: 7.3 - Identification de la médiale
La somme de tous les salaires fait donc 34'340 et la médiale est alors 17'170 (entre l'employé n°11 et 12)
alors que la médiane était de 1'600. Nous voyons alors que la médiale correspond au 50% du cumul. Ce qui
est un indicateur très utile dans le cadre des analyse de Pareto ou de Lorenz par exemple (cf. chapitre de
Technique de Gestion).

D5. La "moyenne quadratique" parfois simplement notée Q qui est définie par :

(7.19)

avec m=2.

Remarque: C'est une des moyennes les plus connues en statistiques car l'écart-type est une moyenne
quadratique (voir plus loin).

Exemple:

Soit un carré de côté a , et un autre carré de côté b. La moyenne des aires des deux carrés est égale à carrée

de côté: (7.20)

D6. La "moyenne harmonique" parfois simplement notée H est définie par : (7.21)

peu connue mais découle souvent de raisonnements simples et pertinents (typiquement la résistance
équivalente d'un circuit électrique ayant plusieurs résistances en parallèles). Il existe une fonction
MOYENNE.HARMONIQUE( ) dans MS Excel pour la calculer.

Exemple:

Soit une distance d parcourue dans un sens à la vitesse et dans l'autre (ou pas) à la vitesse . La vitesse

moyenne s'obtiendra en divisant la distance totale 2d par le temps mis à la parcourir: (7.22)

Si nous calculons le temps mis lorsqu'on parcourt d avec une vitesse c'est tout simplement le quotient:

(7.23)

Le temps total vaut donc: (7.24)

La vitesse moyenne (son inverse pour être exacte) sera donc bien du type harmonique :

(7.25)
D7. La "moyenne géométrique" parfois notée simplement G est définie par : (7.26)

Cette moyenne est souvent oubliée mais néanmoins très connue dans le domaine de l'économétrie (surtout
quand nous étudierons le rendement géométrique moyen) et de la finance d'entreprise (cf. chapitre
Techniques De Gestion) raison pour laquelle il existe une fonction MOYENNE.GEOMETRIQUE( ) dans
MS Excel pour la calculer.

Exemple:

Supposons qu'une banque offre une possibilité de placement et prévoit pour la première année un intérêt
(c'est absurde mais c'est un exemple) de , mais pour la deuxième année un intérêt de
Au même moment une autre banque offre un intérêt constant pour deux ans: X%. C'est pareil,
dirons-nous un peu rapidement. En fait les deux placements n'ont pas la même rentabilité.

Dans la première banque, un capital deviendra au bout de la première année: (7.27)

et la seconde année: (7.28)

Dans l'autre banque nous aurons au bout d'un an: (7.29)

et après la seconde année: (7.30)

etc...

Comme vous pouvez le voir le placement ne sera pas identique si ! Donc X% n'est donc pas la
moyenne de et .

Posons maintenant: et (7.31)

Quelle est en fait la valeur moyenne r ?

Au bout de deux ans le capital est multiplié par . Si la moyenne vaut r il sera alors multiplié par .
Nous avons donc la relation: (7.32)

C'est un exemple d'application où nous retrouvons donc la moyenne géométrique. L'oubli de la moyenne
harmonique une erreur fréquente dans les entreprises lorsque certains employés calculent le taux moyen
d'augmentation d'une valeur de référence.

D8. La "moyenne mobile", appelée aussi "moyenne glissante" est définie par:

(7.33)

La moyenne mobile est particulièrement utilisée en économie, où elle permet de représenter une courbe de
tendance d'une série de valeurs, dont le nombre de points est égal au nombre total de points de la série de
valeurs moins le nombre que vous spécifiez pour la période.
Une Moyenne Mobile (MM) en finance est calculée à partir des moyennes des cours d'une valeur, sur une
période donnée: chaque point d'une moyenne mobile sur 100 séances est la moyenne des 100 derniers cours
de la valeur considérée. Cette courbe, affichée simultanément avec la courbe d'évolution des cours de la
valeur, permet de lisser les variations journalières de la valeur, et de dégager des tendances.

Les moyennes mobiles peuvent être calculées sur différentes périodes, ce qui permet de dégager des
tendances à court terme MMC (20 séances selon les habitudes de la branche), moyen terme (50-100 séances)
ou long terme MML (plus de 100 séances).

(7.34)

Les croisements des moyennes mobiles par la courbe des cours (découpée avec une certaine granularité) de
la valeur génèrent des signaux d'achat ou de vente (selon les professionnels) suivant le cas:

- Signal d'achat: lorsque la courbe des cours franchit la MM.

- Signal de vente: lorsque la courbe des cours franchit la MM vers le bas.

Outre la moyenne mobile, précisons qu'il existe une quantité d'autres indicateurs artificiels souvent utilisés
en finance comme par exemple le "upside/downside ratio".

L'idée est la suivante: Si vous avec un produit financier (cf. chapitre d'Économétrie) actuellement de prix
(prix courant) pour lequel vous avez un objectif de gain haut à un prix haut correspondant que noterons
(high price) et inversement le potentiel de perte que vous estimez à un prix (low price).

Alors, le rapport: (7.35)

donne le Upside/Downside Ratio.

Par exemple, un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 5.- a donc un ratio
et donc un facteur spéculatif identique pour permette le grain ou une perte de 5.-.

Un produit financier de 10.- avec un prix bas de 5.- et un prix haut de 20.- a donc un donc deux
fois le potentiel spéculatif de gain par rapport à celui de perte.
Certaines associations boursières recommandent de refuser les inférieurs à 3. Les investisseurs ont
tendance à rejeter les trop élevés pouvant être un signe de gonflage artificiel.

D9. La "moyenne pondérée" (dont nous avons déjà fait mention plus haut d'un cas particulier) est définie

par: (7.36)

et est utilisée par exemple en géométrie pour localiser le barycentre d'un polygone, en physique pour
déterminer le centre de gravité ou en statistiques pour calculer une espérance (le dénominateur étant toujours
égal à l'unité en probabilités) et en gestion de projets pour estimer les durées des tâches.

Dans le cas général le poids représente l'influence pondéré ou arbitraire/empirique de l'élément par
rapport aux autres.

D10. La "moyenne fonctionnelle" ou "moyenne intégrale" est définie par : (7.37)

où dépend d'une fonction f d'une variable réelle intégrable (cf. chapitre de Calcul Différentiel Et Intégral)
sur un intervalle [a,b]. Elle est très souvent utilisée en théorie du signal (électronique, électrotechnique).

PROPRIÉTÉS DES MOYENNES

Voyons maintenant quelques propriétés pertinentes qui relient quelques-unes de ces moyennes ou qui sont
propres à une moyenne donnée.

Les premières propriétés sont importantes donc prenez garde à bien les comprendre :

P1. Le calcul des moyennes arithmétique, quadratique et harmonique peut être généralisé à l'aide de la

relation suivante : (7.38)

où nous retrouvons :

1. Pour , la moyenne arithmétique

2. Pour , la moyenne quadratique

3. Pour , la moyenne harmonique

P2. La moyenne arithmétique a une propriété de linéarité, c'est-à-dire que (sans démonstration car quand
simple à vérifier) : (7.39)

C'est la version statistique de la propriété de l'espérance en probabilité que nous verrons plus loin.

P3. La somme pondérée des écarts à la moyenne arithmétique est nulle.


Démonstration:

D'abord, par définition, nous savons que : et (7.40)

il s'ensuit que : (7.41)

Ainsi, cet outil ne peut être utilisé comme mesure de dispersion!

Par extension la moyenne des écarts à la moyenne pondérée par les effectifs est nulle aussi :

(7.42)

Ce résultat est relativement important car il permettra plus loin de mieux saisir le concept d'écart-type et de
variance.

P4. Soit à démontrer : (7.43)

Démonstration:

Tout d'abord, nous prenons deux nombres réels non nuls et tels que et nous écrivons :

1. La moyenne arithmétique : (7.44)

2. La moyenne géométrique : (7.45)

3. La moyenne harmonique : (7.46)

4. La moyenne quadratique : (7.47)

Remarque: Les comparaisons entre les moyennes précitées et la médiane ou encore les moyennes glissantes
et pondérées n'ont pas de sens c'est pour cela que nous nous abstenons à les faire.

Prouvons déjà que par l'absurde en posant :


(7.48)

Par commodité posons nous savons que . Or : (7.49)

et nous cherchons à montrer que n'est pas possible. Mais ceci découle des équivalences
suivantes :

(7.50)

Il y donc contradiction et ce qui vérifie notre hypothèse initiale : (7.51)

Regardons maintenant si :

Sous l'hypothèse . Nous cherchons donc maintenant à montrer que : (7.52)

Or nous avons les équivalences suivantes :

(7.53)

et la dernière expression est évidement correcte.

Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :

(7.54)

Nous prouvons maintenant et démontrons-le par l'absurde en posant :


(7.55)

Or le carré d'un nombre est toujours positif ce qui vérifie notre hypothèse initiale :

(7.56)

Nous avons donc bien : (7.57)

Démontrons par l'absurde que en posant et que .

Démonstration:

Nous avons alors :

(7.58)

Il y a donc contradiction avec l'hypothèse initiale et nous avons donc bien :

(7.59)

Ces inégalités démontrées, nous pouvons alors passer à une figure que nous attribuons à Archimède pour
placer trois de ces moyennes. L'intérêt de cet exemple est de montrer qu'il existe des relations remarquables
parfois entre la statistique et la géométrie (fruit du hasard ???).

(7.60)

Nous allons d'abord poser et O est le milieu de . Ainsi, le cercle dessiné est de centre
O et de rayon . D est l'intersection de la perpendiculaire à passant par B et du cercle (nous
choisissons l'intersection que nous voulons). H est quant à lui le projeté orthogonal de B sur .
Archimède affirme que est la moyenne arithmétique de a et b et que est la moyenne géométrique de
a et b, et la moyenne harmonique de a et b.

Nous démontrons donc que (trivial) : (7.61)

Donc est bien la moyenne arithmétique de a et b.

Ensuite nous avons dans le triangle rectangle ADB: (7.62)

Puis dans le triangle rectangle nous avons : (7.63)

Nous additionnons alors ces deux égalités, et nous trouvons (7.64)

Nous savons que D est sur un cercle de diamètre , donc ADC est rectangle en D, donc :

(7.65)

Puis nous remplaçons et par a et b:

(7.66)

Et donc, est bien la moyenne géométrique de a et b.

Nous reste à prouver alors que est la moyenne harmonique de a et b :

Nous avons dans un premier temps (projection orthogonale) :

(7.67)

Puis nous avons aussi (projection orthogonale aussi):

(7.68)

Nous avons donc : (7.69)

et comme , nous avons donc : (7.70)

est donc bien la moyenne harmonique de a et b, Archimède ne s'était pas trompé.


TYPES DE VARIABLES

Lorsque nous avons parlé des échantillons au début de ce chapitre, nous avons fait mention de deux types
d'informations : les variables quantitatives et qualitatives. Nous n'avons cependant pas précisé qu'il existait
trois types de variables quantitatives très importantes qu'il convient absolument de différencier :

1. Les variables discrètes (par comptage): Sont analysées avec des loi stastistiques basées un domaine de
définition dénombrable toujours strictement positif (loi de Poisson typiquement dans l'industrie). Sont
quasiment toujours représentées sous forme graphique par des histogrammes.

2. Les variables continues (par mesure): Sont analysées avec des loi stastistiques basées un domaine de
définition non dénombrable strictement positif ou pouvant prendre toute valeur positive ou négative (loi
Normale typiquement dans l'industrie). Sont également quasiment toujours représentées sous forme
graphique par des histogrammes.

3. Les variables par attribut (de classification): Il ne s'agit pas de données numériques mais de données
qualitatives de type {Oui, Non}, {Réussi, Échec}, {A temp, En retard}, etc. Les données de type attribut
suivent une loi Binômiale.

Comprendre les différents types de données est une disciples important de l'ingénieur parce que cela a des
conséquences importantes sur le type d'analyse, les outils et et technique qui seront employées.

Il y a une question fréquente concernant la collecte de données est de savoir la quantité qui devrait être
collecter. Au fait cela dépend du niveau de précision souhaité. Nous verrons beaucoup plus loin dans ce
chapitre (avec démonstration) comment déterminer mathématiquement la quantité de données à collecter en
faisant de la précision souhaitée pour un process Normal.

Voyons de près de quoi il s'agit car maintenant que le concept de moyenne nous est relativement bien connu,
nous allons pouvoir aborder des calculs plus formels et qui prendront tout leur sens.

VARIABLES DISCRÈTES

Soit X un variable indépendante (un élément d'un échantillon dont la propriété est indépendante des autres
éléments) qui peut prendre les valeurs aléatoires discrètes dans avec les probabilités

respectives où, de par l'axiomatique des probabilités: (7.71)

Alors nous définissons "l'espérance mathématique" de la variable X par: (7.72)

En d'autres termes, nous savons qu'à chaque événement de l'espace des échantillons est associé une
probabilité à laquelle nous associons également une valeur (donnée par la variable aléatoire). La question
étant alors de savoir quelle valeur, à long terme, nous pouvons obtenir. La valeur espérée, (l'espérance
mathématique donc...) est alors la moyenne pondérée, par la probabilité, de toutes les valeurs des
événements de l'espace des échantillons.

Si la probabilité est donnée par une fonction de distribution (voir les définitions des fonctions de distribution
plus bas) de la variable aléatoire, nous avons:

(7.73)

Remarque: peut être notée s'il n'y pas de confusion possible.


Voici les propriétés mathématiques les plus importantes de l'espérance pour toute variable aléatoire (quelque
soit sa loi!) ou pour toute série de variables aléatoires et que nous utiliserons souvent tout au long de ce
chapitre:

P1. Multiplication par une constante: (7.74)

P2. Somme de deux variables aléatoires:

(7.75)

où nous avons utilisé dans la 4ème ligne, la propriété vue dans le chapitre de Probabilités:

Nous en déduisons que pour n variables aléatoires , définies sur une même loi de distribution:

(7.76)

P3. Espérance d'une constante: (7.77)

Après avoir traduit la tendance par l'espérance, il est intéressant de traduire la dispersion ou "déviation
standard" autour de l'espérance par une valeur appelée "variance de X", notée V(X) ou (lire "sigma-
deux") et donnée sous sa forme discrète par:

(7.78)

La variance n'est cependant pas comparable directement à la moyenne, car l'unité de la variance est le carré
de l'unité de la variable, ce qui découle directement de sa définition. Pour que l'indicateur de dispersion
puisse être comparé aux paramètres de tendance centrale (moyenne, médiane et... mode), il suffit d'en
prendre la racine carrée.

Par commodité, nous définissons ainsi "l'écart-type" de X, noté , par:


(7.79)
L'écart-type est donc la moyenne quadratique des écarts entre les observations et leur moyenne.

Remarques:

R1. L'écart-type de la variable aléatoire X peut être noté s'il n'y pas de confusion possible.

R2. L'écart-type et la variance sont, dans la littérature, souvent appelés "paramètres de dispersion".

Définition: Le rapport (exprimé en %) parfois utilisé dans les entreprises comme comparaison de la
moyenne et de l'écart-type est appelée le "coefficient de variation" (C.V.).

Pourquoi trouvons-nous un carré (réciproquement une racine) dans cette définition de la variance? La raison
intuitive est simple (la rigoureuse l'est nettement moins...). Nous avons démontré plus haut que la somme
des écarts à la moyenne pondéré par les effectifs, est toujours nulle :

(7.80)

Or, si nous assimilons les effectifs par la probabilité en normalisant ceux-ci par rapport à n, nous tombons
sur une relation qui est la même que la variance à la différence que le terme entre parenthèse n'est pas au
carré. Et nous voyons alors immédiatement le problème... la mesure de dispersion serait toujours nulle d'où
la nécessité de porter cela au carré.

Nous pourrions imaginer cependant d'utiliser la valeur absolue des écarts à la moyenne, mais pour un certain
nombre de raisons que nous verrons plus loin lors de notre étude des estimateurs le choix de porter au carré
intervient s'impose assez naturellement.

Signalons cependant quand même l'utilisation courante dans l'industrie de l'écart-moyen:

qui est un indicateur élémentaire très utilisé lorsque nous ne souhaitons pas faire de l'inférence statistique sur
une série de mesures. Cet écart peut être facilement calculé dans MS Excel à l'aide de la fonction
ECART.MOYEN( ).

Dans le cas où nous avons à disposition une série de mesures, nous pouvons estimer la valeur moyenne
(l'espérance) et la variance des mesures par les estimateurs suivants (il s'agit simplement au fait de
l'espérance et l'écart-type d'un échantillon dont les événements sont tous équiprobables) dont la notation est

particulière : et (7.81)

Démonstration:

(7.82)
Le terme de la somme se trouvant dans l'expression de la variance (écart-type) est appelée "somme des
carrés des écarts à la moyenne". Nous l'appelons aussi la "somme des carrés totale", ou encore la "variation
totale" dans le cadre de l'étude de l'ANOVA (voir la fin de ce chapitre).

Remarque: Il est important que le lecteur comprenne que dans ce cas l'espérance se calcule simplement en
utilisant la moyenne arithmétique!

La variance peut également s'écrire sous la forme de la "formule de Huyghens" que nous réutiliserons
plusieurs fois par la suite. Voyons de quoi il s'agit:

(7.83)

Soit X une variable aléatoire d'espérance (valeur constante et déterminée) et de variance (valeur

constante et déterminée), nous définissons la "variable centrée réduite" par la relation: (7.84)

et l'on démontre de façon très simple (contactez-nous si vous souhaitez que nous ajoutions la démonstration)
en utilisant la propriété de linéarité de l'espérance et la propriété de multiplication par un scalaire de la
variance (voir de suite après) que: (7.85)

Démonstration: (7.86)

et en utilisant la formule de Huyghens:

(7.87)

Ainsi, toute répartition statistique définie par une moyenne et un écart-type peut être transformée en une
autre distribution statistique souvent plus simple à analyser.

Voici quelques propriétés mathématiques importantes de la variance :

P1. Multiplication par une constante :

(7.88)
P2. Somme de deux variables aléatoires:

(7.89)

où nous introduisons le concept de "covariance" dont nous verrons une expression plus commode un peu
plus bas.

Introduisons une forme plus générale et extrêmement importante dans de nombreux domaines:

(7.90)

Donc dans le cas général: (7.91)

En utilisant la linéarité de l'espérance et le fait que: (7.92)


nous avons pour la covariance :

(7.93)

et donc nous obtenons la relation très utilisée en statistiques et finance:

(7.94)

Indiquons également que si , nous retrouvons la formule de Huyghens: (7.95)

Ainsi, le terme de covariance est défini par l'expression: (7.96)

appelée "forme bilinéaire de la variance" ou "forme multivariée".

Remarque: Les statistiques peuvent être découpées selon le nombre de variables aléatoires que nous
étudions. Ainsi, lorsqu'une seule variable aléatoire est étudiée, nous parlons de "statistique univariée", pour
deux variables aléatoires de "statistique bivariée" et en général, de "statistique multivariée".

Si la covariance est univariée, nous avons dès lors: (7.97)

Si et seulement si les variables sont équiprobables, nous la retrouvons la covariance dans la littérature sous
la forme suivante qui découle de calculs que nous avons déjà fait ultérieurement avec l'espérance :

(7.98)

La covariance est un indicateur de la variation simultanée de X et Y. En effet si, en général X et Y croissent


simultanément, les produits seront positifs (corrélés positivement), tandis que si Y décroît
lorsque X croît, ces même produits seront négatifs (corrélés négativement).

Soit un vecteur de composantes et un autre vecteur de composantes , tous


deux étant des variables aléatoires, le calcul de la covariance des composantes deux à deux donnent ce que
l'on appelle la "matrice des covariances" (outil très utilisé en finance et dans la gestion en général!).

Effectivement, si nous notons: (7.99)

Nous pouvons dès lors écrire une matrice symétrique (le plus souvent dans la pratique elle est carrée) sous la
forme:

(7.100)
Cette matrice a comme propriété remarquable que si nous prenons deux vecteurs identiques (dont les
composantes sont les mêmes variables aléatoires) et que nous calculons la matrice, alors la diagonale de
cette dernière donnera les variances des composantes de vecteurs (voir les exemples dans le chapitre
d'économétrie)! Raisons pour laquelle cette matrice est souvent appelée "matrices des variances-
covariances".

Remarque: Cette matrice est très importante et nous la retrouverons fréquemment dans le chapitre
d'Économétrie lors de notre étude da la théorie du portefeuille et dans les techniques de fouille de données
(data mining, clustering) dans le chapitre de Méthodes numériques (l'analyse par composantes principales).

Rappelons maintenant que nous avions un axiome en probabilités (cf. chapitre de Probabilités) qui énonçait
que deux événements A,B sont indépendants si :

(7.101)

De la même façon, par extension, nous définissons l'indépendance des variables aléatoires discrètes.

Définition: Soit X,Y deux variables aléatoires discrètes. Nous disons que X, Y sont indépendantes si :

(7.102)

Plus généralement, les variables discrètes sont indépendantes (en bloc) si :

. (7.103)

L'indépendance de deux variables aléatoires implique que leur covariance est nulle (la réciproque est
fausse!). Prouvons ceci dans le cas où les variables aléatoires ne prennent qu'un nombre fini de valeurs

et respectivement, avec I, J des ensembles finis :

(7.104)

et donc : (7.105)

Remarque: Donc plus la covariance est faible, plus les séries sont indépendantes. A l'inverse, plus la
covariance est élevée, plus les séries sont liées.

Etant donné que : (7.106)

si X, Y sont indépendantes alors : (7.107)

De manière plus générale si sont indépendantes (en bloc) alors pour toute loi statistique (!) nous

avons: (7.108)
Souvent en statistique, il est utile de déterminer l'écart-type de la moyenne empirique (ou en d'autres
termes... : l'erreur quadratique moyenne). Voyons de quoi il s'agit :

Soit la moyenne d'une série de termes déterminés chacun par la mesure de plusieurs valeurs (il s'agit au fait
de son estimateur dans un cas particulier comme nous le verrons beaucoup plus loin):

(7.109)

alors en utilisant les propriétés de l'espérance: (7.110)

et si toutes les variables aléatoires sont identiquement distribuées et indépendantes nous avons alors:

(7.111)

Pour la variance, le même raisonnement s'applique:

(7.112)

et si les variables aléatoires sont toutes identiquement distribuées: (7.113)

d'où l'écart-type de la moyenne appelé aussi "erreur type", "erreur standard" ou encore "variation non

systématique": (7.114)

et il s'agit rigoureusement de l'écart-type de l'estimateur de la moyenne (c'est beaucoup plus clair ainsi)!

Cette relation se trouve dans de nombreux logiciels dont dans les graphiques MS Excel (mais il n'y a pas de
fonction intégrée), écrite avec l'écart-type (comme ci-dessus), soit avec la notation de la variance (suffit de
mettre au carré...).

Signalons que la dernière relation peut-être utilisée même si la moyenne des n variables aléatoires n'est pas
identique! La condition suffisante étant juste que les écarts-types soient tous égaux et c'est le cas de
l'industrie (production).

Nous avons donc: (7.115)

où désigne la somme des n variables aléatoires et leur moyenne.

La variable centrée réduite que nous avions introduite plus haut: (7.116)

peut alors s'écrire de plusieurs manières: (7.117)


Par ailleurs, en supposant que le lecteur sait déjà ce qu'est une loi normale , nous démontrerons plus
loin en détails car c'est extrêmement important (!) que la loi de probabilité de la variable aléatoire ,
moyenne de n variables aléatoires identiquement distribuées et linéairement indépendantes, est alors la loi:

(7.118)

Maintenant, considérons X et Y deux variables aléatoires ayant pour covariance:

(7.119)

Nous avons: (7.120)

nous allons démontrer cette relation immédiatement car l'utilisation de la covariance seule pour l'analyse des
données n'est pas géniale car elle n'est pas à proprement parler bornée et simple d'usage (au niveau de
l'interprétation). Nous allons donc construire un indicateur plus facile d'usage en entreprise.

Démonstration:

Choisissons une constante a quelconque et calculons la variance de :

(7.121)

Nous pouvons alors immédiatement écrire à l'aide des propriétés de la variance et de l'espérance:

(7.122)

La quantité de droite est positive et nulle en tout a par construction de la variance (de gauche). Donc le
discriminant de l'expression, vue comme un trinôme en a du type:

(7.123)

Donc pour que P(a) soit positif pour tout a nous avons comme seule possibilité que:

(7.124)

Soit après simplification: (7.125)

Ce qui nous donne: (7.126)


Finalement nous obtenons une forme de l'inégalité statistique dite "inégalité de Cauchy-Schwarz" :

(7.127)

Si les variances de X et Y sont non nulles, la corrélation entre X et Y est définie par le "coefficient de

corrélation linéaire" : (7.128)

ce qui peut aussi s'écrire sous forme développée (en utilisant la formule de Huyghens) :

(7.129)

ou encore plus condensée : (7.130)

Quels que soient l'unité et les ordres de grandeur, le coefficient de corrélation est un nombre sans unité,
compris entre -1 et 1. Il traduit la plus ou moins grande dépendance linéaire de X et Y et ou,
géométriquement, le plus ou moins grand aplatissement. Un coefficient de corrélation nul ou proche de 0
signifie qu'il n'y a pas de relation linéaire entre les caractères. Mais il n'entraîne aucune notion
d'indépendance plus générale.

Quand le coefficient de corrélation est proche de 1 ou -1, les caractères sont dits fortement corrélés. Il faut
prendre garde à la confusion fréquente entre corrélation et causalité. Cependant, que deux phénomènes
soient corrélés n'implique en aucune façon que l'un soit cause de l'autre.

Ainsi:

- Si nous avons affaire à une corrélation négative dite "corrélation négative parfaite" (tous les
points de mesures sont situés sur une droite de régression de pente négative).

- Si nous avons affaire à une corrélation négative ou positive dite "corrélation imparfaite" ou
la relation linéaire sera respectivement décroissante ou croissante.

- Si la corrélation est nulle... (pas de relation linéaire).

- Si nous avons affaire à une corrélation positive dite "corrélation positive parfaite" (tous les points
de mesures sont situés sur une droite de régression de pente positive).

L'analyse de régression et de corrélation poursuit donc deux objectifs:

1. Déterminer le degré d'association entre les différentes variables: celui-ci est exprimé par le coefficient de
détermination, qui est le carré du coefficient de corrélation. Le coefficient de détermination mesure la
contribution d'une des variables à l'explication de la seconde.

2. Déterminer les caractéristiques de cette association, c'est-à-dire des paramètres et de la droite de


régression (voir la section d'analyse numérique du site au chapitre des algorithmes traitant de la régression
linéaire). Si l'on peut faire valablement l'hypothèse de la stabilité du processus générateur des couples de
valeurs des deux variables, la connaissance de ces paramètres permettrait de prédire le comportement du
phénomène étudié

En utilisant les expressions de la moyenne et de l'écart-type de variables équiprobables tel que démontré

plus haut, nous passons de : (7.131)

à: (7.132)

où nous voyons que la covariance devient alors la moyenne des produits moins le produit des moyennes.

Soit après simplification : (7.133)

et peut être calculé dans MS Excel avec entre autres la fonction COEFFICIENT.CORRELATION( ).

Remarques:

R1. Dans la littérature le coefficient de corrélation est souvent appelée "coefficient d'échantillonnage de
Pearson" (dans le cas équiprobable) ou "test de Bravais-Pearson" (dans le cas non équiprobable) et lorsque
nous le portons au carré, nous parlons alors de "coefficient de détermination".

R2. Souvent le carré de ce coefficient est un peu abusivement interprété comme le % de variation expliqué
de la variable étudiée Y par la variable explicative X.

Enfin, à noter que nous avons donc la relation suivante qui est très utilisée dans la pratique:

(7.134)

Exemple:

Une compagnie aérienne a à sa disposition 120 sièges qu'elle réserve pour des passagers en correspondance
venant de deux autres vols arrivés un peu plus tôt dans la journée et en partance pour Francfort. Le premier
vol arrive de Manille et le nombre de passagers à son bord suit une loi Normale de moyenne 50 et de
variance 169. Le second vol arrive de Taïpei et le nombre de passagers à son bord suit une loi Normale de
moyenne 45 et de variance 196.

Le coefficient de corrélation linéaire entre le nombre de passagers des deux vols est de:

(7.135)
La loi que suit le nombre de passagers pour Francfort si nous supposons que la loi du couple suit elle aussi
une loi Normale est (nous utilisons la propriété de stabilité de la loi Normale qui sera démontrée plus loin):

(7.136)

avec: (7.137)

et: (7.138)

ce qui donne: (7.139)

VARIABLES CONTINUES

Définitions:

D1. Nous disons que X est une variable continue si sa "fonction de répartition" est continue. La fonction de
répartition de X étant définie par: (7.140)

soit la probabilité cumulée que la variable aléatoire X soit plus petite ou égale à la valeur x fixée. Nous avons
aussi bien évidemment .

D2. Si de plus la fonction de répartition F de X est continûment dérivable de dérivée appelée "fonction de
densité" ou "fonction de masse" ou encore "fonction de distribution" alors nous disons que X est absolument

continue et dans ce cas nous avons: (7.141)

avec la condition de normalisation: (7.142)

Toute fonction de distribution de probabilité doit satisfaire l'intégrale de normalisation dans son domaine de
définition!

Remarque: Il est intéressant de remarquer que la définition amène à ce que la probabilité qu'une variable
aléatoire totalement continue prenne une valeur donnée est nulle! Donc ce n'est pas parce qu'un événement à
une probabilité nulle qu'il ne peut arriver!!!

La moyenne ayant été définie par la somme pour une variable discrète, elle devient une intégrale pour une

variable continue: (7.143)

et la variance s'écrit donc : (7.144)


Nous avons alors aussi la médiane qui est logiquement redéfinie dans le cas d'une variable aléatoire continue

par: (7.145)

et elle coïncide rarement avec la moyenne!

Souvent les statisticiens utilisent les mêmes notations pour l'espérance mathématique d'une variable
continue: (7.146)

et pour la variance: (7.147)

que pour une variable discrète.

Par la suite, nous calculerons ces différents termes avec développements uniquement dans les cas les plus
usités.

FONCTIONS DE DISTRIBUTIONS

Lorsque nous observons des phénomènes probabilistes, et que nous prenons note des valeurs prises par ces
derniers et que nous les reportons graphiquement, nous observons toujours que les différentes mesures
obtenues suivent une caractéristique courbe ou droite typique fréquemment reproductible.

Dans le domaine des probabilités et statistiques, nous appelons ces caractéristiques des "fonctions de
distribution" car elles indiquent la fréquence avec laquelle la variable aléatoire apparaît avec certaines
valeurs.

Remarque: Nous utilisons aussi simplement le terme "fonction" ou encore "loi" pour désigner ces
caractéristiques.

Ces fonctions sont en pratique bornées par ce que nous appelons "l'étendue de la distribution", ou
"dispersion de la distribution", qui correspond à la différence entre la donnée maximale (à droite) et la
donnée minimale (à gauche) des valeurs observées : (7.148)

Si les valeurs observées se distribuent d'une certaine manière c'est qu'elles ont alors une probabilité d'avoir
une certaine valeur de la fonction de distribution.

Dans la pratique industrielle (cf. chapitre de Génie Industriel), la dispersions de valeurs statistiques est
important parce qu'elle donne une indication sur la vairation d'un processus (variablité).

Définitions:

D1. La relation mathématique qui donne la probabilité qu'a une variable aléatoire d'avoir une valeur donnée
de la fonction de distribution est appelée "fonction de densité", "fonction de masse" ou encore "fonction
marginale".

D2. La relation mathématique qui donne la probabilité cumulée qu'a une variable aléatoire d'être inférieure
ou égale à une certaine valeur est nommée la "fonction de répartition" ou "fonction cumulée".

D3. Des variables aléatoires sont dites "indépendantes et identiquement distribuées" (i.i.d.) si elles suivent
toutes la même fonction de distribution et qu'elles sont indépendantes...

Remarque: Le lecteur pourra trouver la fonction de distribution de Weibull (ou "loi de Weibull") dans le
chapitre traitant du Génie Industriel (section sur l'Ingénierie).
De telles fonctions étant très nombreuses dans la nature, nous proposons au lecteur une étude détaillée des
plus connues seulement.

FONCTION DISCRÈTE UNIFORME

Si nous admettons qu'il est possible d'associer une probabilité à un événement, nous pouvons concevoir des
situations où nous pouvons supposer a priori que tous les événements élémentaires sont équiprobables (c'est-
à-dire qu'ils ont même probabilité). Nous utilisons alors le rapport entre le nombre de cas favorables et le
nombre de cas possibles pour calculer la probabilité de tous les événements de l'Univers des événements U.
Plus généralement si U est un ensemble fini d'événements équiprobables et A une partie de U nous avons
sous forme ensembliste : (7.149)

Plus communément, soit e un événement pouvant avoir N issues équiprobables possibles. Alors la
probabilité d'observer l'issue donnée de l'événement suit une "fonction discrète uniforme" (ou "loi discrète
uniforme") donnée par la relation : (7.150)

Ayant pour espérance (ou moyenne) : (7.151)

Si nous nous mettons dans le cas particulier où avec . Nous avons alors (cf. chapitre de
Suites et Séries):

(7.152)

Et pour variance:

(7.153)
Exemple:

Tracé de la fonction de distribution et respectivement de répartition pour la loi discrète uniforme de


paramètres {1,5,8,11,12} (nous voyons que chaque valeur a bien une probabilité équiprobable) :

(7.154)

FONCTION DE BERNOULLI

Si nous avons affaire à une observation binaire alors la probabilité d'un événement reste constant d'une
observation à l'autre s'il n'y a pas d'effet mémoire (autrement dit: une somme de variables de Bernoulli, deux
à deux indépendantes).

Nous appelons ce genre d'observations où la variable aléatoire à valeurs 0 ou 1, avec probabilité (1-p), p
respectivement, des "essais de Bernoulli" avec "événements contraires à probabilités contraires".

Ainsi, une variable aléatoire X suit une "fonction de Bernoulli" (ou "loi de Bernoulli") si elle ne peut prendre
que les valeurs 0 ou 1, associées aux probabilités q et p de sorte que et:

(7.155)

L'exemple classique d'un tel processus est le jeu de pile de face ou de tirage avec remise. Il est inutile de
vérifier formellement que la probabilité cumulée est unitaire...

Remarquons que par extension, si nous considérons N événements où nous obtenons dans un ordre
particulier k fois une des issues possible (réussite) et N-k l'autre (échec), alors la probabilité d'obtenir une
telle série (de k réussites et N-k échecs ordonnées dans un ordre particulier) sera donnée par:

(7.156)

conformément à ce que nous avions vu obtenu en combinatoire dans le chapitre de Probabilités!

Exemple:

Tracé de la fonction pour :


(7.157)

La fonction de Bernoulli a donc pour espérance (moyenne):

(7.158)

et pour variance (nous utilisons la formule de Huyghens démontrée plus haut):

(7.159)

Remarque: L'exemple ci-dessus n'est certes par pertinent mais nous verrons dans le chapitre de Techniques
De Gestion que la fonction de Bernoulli apparaît naturellement au début de notre étude des files d'attentes.

FONCTION GÉOMÉTRIQUE

La loi géométrique ou "loi de Pascal" consiste dans une épreuve de type Bernoulli, dont la probabilité de
succès est p et celle d'échec sont constantes, que nous renouvelons de manière indépendante
jusqu'au premier succès.

Si nous appelons X la variable aléatoire donnant le rang du premier succès la probabilité que est alors
(cas particulier de la fonction de Bernoulli): (7.160) avec .

Cette loi a pour espérance:

(7.161)

Or, cette dernière relation s'écrit aussi (car c'est une simple série géométrique):

(7.162)
Effectivement, nous avons démontré dans le chapitre sur les Suites et Séries que :

(7.163)

En prenant la limite lorsque nous obtenons : (7.164) car .

Ensuite, il suffit de dériver les deux membres de l'égalité par rapport à q et nous obtenons :

(7.165)

Nous avons donc le nombre moyen d'essais X qu'il faut faire pour arriver au premier succès:

(7.166)

Calculons maintenant la variance en rappelant comme à chaque fois que (formule de Huyghens):

(7.167)

Commençons donc par calculer :

(7.168)

Le dernier terme de cette expression est l'équivalent de l'espérance calculée précédemment. Soit :

(7.169)

Il reste à calculer : (7.170)

Nous avons : (7.171)

Or en dérivant l'égalité : (7.172)

Nous obtenons : (7.173)


Par conséquent : (7.174)

Donc : (7.175)

Pour finir : (7.176)

Exemple:

E1. Vous essayez, tard dans la nuit et dans l'obscurité, d'ouvrir une serrure au moyen d'un trousseau de 5
clés, sans porter attention, car vous êtes un peu fatigué (ou un peu éméché...) vous essayez chaque clé.
Sachant qu'une seule convient, quelle est la probabilité d'utiliser la bonne clé au k-ème essai?

(7.177)

E2. Tracé de la fonction de distribution et répartition pour la fonction Géométrique de paramètre :

(7.178)

Déterminons maintenant la fonction de répartition de la loi géométrique. Nous partons donc de:

(7.179)

nous avons alors par définition la probabilité que l'expérience réussisse dans les n premiers essais:

(7.180)

avec n entier valant 0...1...2, etc.

Posons: (7.181)
Nous avons alors: (7.182)

FONCTION BINOMIALE

Si nous revenons maintenant à notre épreuve de Bernoulli. Plus généralement, tout N-uplet particulier formé
de k succès et de N-k échecs aura pour probabilité (dans le cadre d'un tirage avec remise ou sans remise si la
population est grande en première approximation...): (7.183)

d'être tiré (ou d'apparaître) quel que soit l'ordre d'apparition des échecs et réussites.

Mais, nous savons que la combinatoire permet de déterminer le nombre de N-uplets de ce type (le nombre de
manières d'ordonner les apparitions d'échecs et de réussites). Le nombre d'arrangements possibles étant,
nous l'avons démontré (cf. chapitre Probabilités), donné par la binomiale :

(7.184)

Donc comme la probabilité d'obtenir une série de k succès et N-k échecs particuliers est toujours identique
(quelque soit l'ordre) alors il suffit de multiplier la probabilité d'une série particulière par la combinatoire
(cela étant équivalent à faire à une somme):

(7.185)

pour avoir la probabilité totale d'obtenir une quelconque de ces séries possibles (puisque chacune est
possible).

Remarque: Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) simple avec
contrainte sur l'ordre ou à l'étude d'une série de succès ou d'échecs. Nous utiliserons cette relation dans le
cadre de la théorie des files d'attentes ou en fiabilité. Il faut noter que dans le cas de grandes populations,
même si le tirage n'est pas avec remise il est considéré comme tel...

Ecrite autrement ceci donne la "fonction Binomiale" (ou "loi Binomiale") connue aussi sous la forme de la
fonction de distribution suivante:

(7.186)

et parfois notée: (7.187)

et peut être calculée dans MS Excel à l'aide de la fonction LOI.BINOMIALE( ).

Nous disons parfois que la loi Binomiale est non exhaustive car la taille de la population initiale n'est pas
apparente dans l'expression de la loi.

Exemple:

Nous souhaitons tester l'alternateur d'un groupe électrogène. La probabilité de défaillance à la sollicitation
de ce matériel est estimée à 1 défaillance pour 1'000 démarrages.
Nous décidons d'effecteur un test de 100 démarrages. La probabilité d'observer 1 panne au cours de ce test

est de: (7.188)

Nous avons bien évidemment pour la fonction de répartition (très utile dans la pratique comme le contrôle

de lots de fournisseurs ou la fiabilité!): (7.189)

Effectivement, nous avons démontré dans le chapitre de Calcul Algébrique que:

(7.190)

Donc: (7.191)

Il vaut mieux utiliser MS Excel pour ne pas s'embêter à calculer ce genre de relations (ou tout autre logiciel
largement répandu) en utilisant la fonction CRITERE.LOI.BINOMIALE( ).

L'espérance mathématique (moyenne) de P(N,k) est:

(7.192)

Or: (7.193)

d'où: (7.194)

donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée de probabilité p après N essais.

Avant de calculer la variance, introduisons la relation suivante:

(7.195)

En effet, en utilisant les développements précédents:


(7.196)

Commençons maintenant le (long) calcul de la variance dans lequel nous allons utiliser les résultats
précédents:

(7.197)

L'écart-type étant , nous avons : (7.198)

Exemple: Tracé de la fonction de distribution et respectivement de répartition de la loi binomiale


:
(7.199)

FONCTION HYPERGÉOMÉTRIQUE

Nous considérons pour approche à cette fonction un exemple simple concernant une urne contenant n boules
dont m sont noires et les autres m' blanches (pour un exemple concret utilisé dans l'industrie se reporter au
chapitre de Génie Industriel). Nous tirons successivement, et sans les remettre dans l'urne, p boules. Quelle
est la probabilité que parmi ces p boules, il y en ait k qui soient noires (dans cet énoncé l'ordre du tirage ne
nous intéresse donc pas!).

Nous parlons souvent de "tirage exhaustif" avec la loi hypergéométrique car contrairement à la loi
binomiale, la taille du lot qui sert de base au tirage va apparaître dans la loi. Raison pour laquelle la loi
hypergéométrique tend vers les valeurs de la loi normale lorsque la taille du lot est petite.

Remarque: Cela équivaut à l'étude non ordonnée d'un tirage sans remise (cf. chapitre de Probabilités) avec
contrainte sur les occurrences appelé parfois "tirage simultané". Nous utiliserons cette relation souvent dans
le domaine de la qualité ou de la fiabilité ou les boules noires sont associées à des éléments avec défauts et
les blanches à des éléments sans défauts.

Les p boules peuvent être choisies parmi les n boules de façons (représentant donc le nombre de tirages
différents possibles) avec pour rappel (cf. chapitre de Probabilités) :

(7.200)

Les k boules noires peuvent être choisies parmi les m noires de façons. Les p-k boules blanches peuvent
être elles choisies de façons. Il y a donc tirages qui donnent k boules noires et p-k boules
blanches.

La probabilité recherchée vaut donc:

(7.201)

et est dite suivre une "fonction Hypergéométrique" (ou "loi Hypergéométrique") et peut être obtenue
heureusement de manière directe dans MS Excel avec la fonction LOI.HYPERGEOMETRIQUE( ).
Exemple:

Nous souhaitons mettre en production un petit développement informatique de 10'000 lignes de code. Le
retour d'expérience) montre que la probabilité de défaillance est de 1 bug pour 1'000 lignes de code.

Nous testons environ 50% des fonctions du logiciel au hasard avant l'envoi au client (soit l'équivalent de
5'000 lignes de code). La probabilité d'observer 5 bugs est avec MS Excel:

=LOI.HYPERGEOMETRIQUE(5;5000;10000;10000)=24.62%

Il n'est pas interdit de faire le calcul direct de l'espérance et de la variance la fonction hypergéométrique
mais le lecteur pourra sans trop de peine imaginer que ce calcul va être... relativement indigeste. Alors nous
pouvons utiliser une méthode indirecte qui de plus est intéressante.

D'abord le lecteur aura peut-être, même certainement, remarqué qu'au fait l'expérience de la loi
hypergéométrique est une série d'essais de Bernoulli (sans remise bien entendu!).

Alors, nous allons tricher en utilisant dans un premier temps la propriété de linéarité de l'espérance.
Définissons pour cela une nouvelle variable correspondant implicitement au fait à l'expérience da la fonction

hypergéométrique (k essais de Bernoulli de suite!) : (7.202)

où représente la réussite d'obtenir au i-ème tirage une boule noire (soit 0 ou 1). Or, nous savons que pour
tout i la variable aléatoire suit une fonction de Bernoulli pour laquelle nous avons démontré lors de notre
étude de la loi de Bernoulli que . Dès lors, de par la propriété de linéarité de l'espérance nous

avons : (7.203)

Or, dans l'essai de Bernoulli, p est la probabilité d'obtenir l'élément recherché (pour rappel...). Dans la loi
hypergéométrique ce qui nous intéresse est la probabilité d'avoir une boule noire (qui sont en quantité m,
avec donc m' boules blanches) par rapport à la quantité totale de boules n. Et le rapport nous donne
évidemment cette probabilité. Ainsi, nous avons :

(7.204)

où k est le nombre de tirages (attention à ne pas confondre avec l'énoncé initial!). Cette moyenne donne donc
le nombre moyen de boules noires lors d'un tirage de k boules parmi n.

Pour déterminer la variance, nous allons utiliser la variance de la fonction de Bernoulli et la relation suivante
démontrée lors de l'introduction de l'espérance et de la covariance au début de ce chapitre :

(7.205)

Dons en rappelant que nous avons il vient:

(7.206)
Or, pour la loi de Bernoulli, nous avons:

(7.207)

Alors nous avons déjà: (7.208)

Ensuite, nous avons facilement: (7.209)

Le calcul de nécessite une bonne compréhension des probabilités (c'est un bon rappel!).

L'espérance est donnée (implicitement) par la somme pondérée des probabilités que deux
événements aient lieu en même temps comme nous le savons. Or, nos événements sont binaires: soit c'est
une boule noire (1) soit c'est une boule blanche (0). Donc tous les termes de la somme n'ayant pas deux
boules noirs consécutivement seront nuls!

Le problème est alors de calculer la probabilité d'avoir deux boules noires consécutives et celle-ci s'écrit
donc:

(7.210)

Donc nous avons finalement: (7.211)

Soit: (7.212)

Finalement: (7.213)
où nous avons utilisé le fait que: (7.214)

est composé de: (7.215)

terme puisqu'il correspond au nombre de façons qu'il y a de choisir le couple (i, j) avec .

Donc finalement: (7.216)

Exemple:

Tracé de la fonction de distribution et répartition pour la fonction Hypergéométrique de paramètre


:

(7.217)

FONCTION MULTINOMIALE

La loi binomiale concerne le nombre de succès dans N épreuves de Bernoulli indépendantes donnant
chacune un résultat binaire, comme dans le jeu de pile ou face. La loi multinomiale est une généralisation de
celle-ci, applicable par exemple à N jets d'un dé à six faces. Contrairement à ces exemples simples, les
différentes possibilités ne sont en plus généralement pas équiprobables.

Considérons une approche à nouveau par l'exemple :

Soit l'espace des événements muni d'une probabilité . Nous tirons n


fois de suite avec remise un élément de avec la probabilité . Quelle est la probabilité
d'obtenir le nombre 1, fois le nombre 2, fois, sur une suite d'un tirage de n éléments.

Remarque: Cela équivaut à l'étude d'un tirage avec remise (cf. chapitre de Probabilités) avec contraintes sur
les occurrences. Donc sans contraintes nous verrons par l'exemple que nous retombons sur un tirage avec
remise simple.
Nous avons vu dans le chapitre de Probabilités, que si nous prenons un ensemble d'événements ayant
plusieurs issues, alors les différentes combinaisons de suites que nous pouvons obtenir en prenant p éléments

choisis parmi n est: (7.218)

Il y a donc : (7.219)

façons différentes d'obtenir fois un certain événement. Ensuite, en associant ce que nous avons vu pour la
loi binômiale il vient:

Il y a ensuite : (7.220)

façons différentes d'obtenir un second événement puisque dans l'ensemble de la suite, de n éléments déjà
on été tirés ce qui fait qu'il n'en reste plus sur lesquels nous pouvons obtenir les voulus.

Nous avons alors selon la loi binômiale:

(7.221)

et: (7.222)

Alors nous avons dans le cas particulier de deux séries d'uplets:

(7.223)

et comme: (7.224)

il vient: (7.225)

Ainsi, par récurrence nous avons la probabilité probabilité P recherchée appelée "fonction Multinomiale"
(ou "loi Multinomiale") et donnée par :
(7.226)

dans des logiciels comme MS Excel, le terme:

(7.227)

appelé "coefficient multinomial" est disponible sous le nom de la fonction MULTINOMIALE( ).

Exemples:

E1. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité que les six faces apparaissent le même
nombre de fois (mais pas nécessairement conséctivement!):

(7.228)

où nous voyons bien que m correspond au nombre de groupes de réussites.

E2. Nous lançons un dé non-pipé 12 fois. Quelle est la probabilité qu'une seule et unique face apparaisse 12
fois (donc que le "1" apparaisse 12 fois de suite, ou le "2", ou le "3", etc.):

(7.229)

Nous retrouvons donc avec ce dernier exemple un résultat connu de la binomiale.

FONCTION DE POISSON

Pour certains événements forts rares, la probabilité p est très faible et tend vers zéro. Toutefois la valeur
moyenne tend vers une valeur fixe lorsque n tend vers l'infini.

Nous partirons donc d'une distribution binomiale de moyenne que nous supposerons finie lorsque
n tend vers l'infini.

La probabilité de k réussites lors de n épreuves vaut (loi Binomiale) :

(7.230)
En posant (où m est temporairement la nouvelle notation pour la moyenne selon ), cette
expression peut s'écrire:

(7.231)

En regroupant les termes, nous pouvons mettre la valeur de sous la forme:

(7.232)

Nous reconnaissons que, lorsque n tend vers l'infini, le deuxième facteur du produit a pour limite .

Quant au troisième facteur, puisque nous nous intéressons aux petites valeurs de k (la probabilité de réussite
est très faible), sa limite pour n tendant vers l'infini vaut 1.

Cette technique de passage à la limite est parfois appelée dans ce contexte: "théorème limite de Poisson".

Nous obtenons ainsi la "fonction de Poisson" (ou "loi de Poisson"), appelée également parfois "loi des

événements rares", donnée donc par: (7.233)

qui peut être obtenu dans MS Excel avec la fonction LOI.POISSON( ).

Il s'agit bien d'une loi de probabilité puisque en utilisant les séries de Taylor, nous montrons que la somme

des probabilités cumulées est bien: (7.234)

Remarque: Nous retrouverons fréquemment cette loi dans différents chapitres du site comme par exemple
lors de l'étude du Génie Industriel en maintenance préventive ou encore dans le même chapitre lors de
l'étude des théories des files d'attentes (le lecteur peut s'y reporter pour un exemple intéressant et
pragmatique).

Exemple:

Tracé de la fonction de distribution et répartition pour la fonction de Poisson de paramètre :

(7.235)
Cette distribution est importante car elle décrit beaucoup de processus dont la probabilité est petite et
constante. Elle est souvent utilisée dans la "queing theory" (temps d'attente), test d'acceptabilité et fiabilité,
et contrôles statistiques de qualité. Entre autres, elle s'applique aux processus tels que l'émission des quanta
de lumière par des atomes excités, le nombre de globules rouges observés au microscope, le nombre d'appels
arrivant à une centrale téléphonique. La distribution de Poisson est valable pour de nombreuses observations
faites en physique nucléaire ou corpusculaire.

L'espérance (moyenne) de la fonction de Poisson est (nous utilisons la série de Taylor de l'exponentielle):

(7.236)

et donne le nombre moyen de fois que l'on obtiendra l'issue souhaitée.

Ce résultat peut paraître déroutant.... la moyenne s'exprime par la moyenne??? Oui il ne faut simplement pas
oublier que celle-ci est donnée au début par: (7.237)

Remarque: Pour plus de détails le lecteur peut aussi se reporter à la partie concernant les "estimateurs" dans
le présent chapitre.

La variance de la fonction de distribution de Poisson est elle donnée par (en utilisant à nouveau les séries de
Taylor):

(7.238)

toujours avec: (7.239)

Les lois théoriques de distribution statistiques sont établies en supposant la réalisation d'un nombre infini de
mesures. Il est évident que nous ne pouvons en effectuer qu'un nombre fini N. D'où la nécessité d'établir des
correspondances entre les valeurs utiles théoriques et expérimentales. Pour ces dernières nous n'obtenons
évidemment qu'une approximation dont la validité est toutefois souvent admise comme suffisante.
FONCTION DE GAUSS-LAPLACE/LOI NORMALE

Cette caractéristique est la plus importante fonction de distribution en statistiques suite au résultat d'un
théorème connu appelé "théorème central limite" qui comme nous le verrons, permet de démontrer (entre
autres) que toute suite de variables aléatoires indépendantes de même loi ayant une espérance et un écart-
type fini et non nécessairement égaux converge vers une fonction de Gauss-Laplace (loi Normale).

Il est donc très important de focaliser particulièrement sont attention sur les développements qui vont être
faits ici!

Partons d'une fonction Binomiale et faisons tendre le nombre n d'épreuves vers l'infini. Si p est fixé au
départ, la moyenne tend également vers l'infini, de plus l'écart-type tend également vers
l'infini.

Remarque: Le cas où p varie et tend vers 0 tout en laissant fixe la moyenne ayant été étudié lors de
la présentation de la fonction de Poisson.

Si nous voulons calculer la limite de la fonction Binomiale, il s'agira donc de faire un changement d'origine
qui stabilise la moyenne, en 0 par exemple, et un changement d'unité qui stabilise l'écart-type, à 1 par
exemple.

Voyons tout d'abord comment varie en fonction de k (nombre de réussites) et calculons la différence:

(7.240)

Nous en concluons que est une fonction croissante de k, tant que est positif (pour n, p et q
fixés). Pour le voir il suffit de prendre quelques valeurs (du membre de droite de l'égalité) ou d'observer la
distribution graphique de la fonction Binomiale en se souvenant bien que:

(7.241)

Comme il est par conséquent évident que la valeur de k voisine de la moyenne constitue le
maxima de .

D'autre part la différence est le taux d'accroissement de la fonction . Nous pouvons


alors écrire :

(7.242)

comme étant la pente de la fonction.

Définissons maintenant une nouvelle variable aléatoire telle que sa moyenne soit nulle (variations
négligeables) et son écart-type unitaire (une variable centrée-réduite en d'autres termes). Nous avons alors :
Nous avons alors aussi avec cette nouvelle variable:

(7.243)

Appelons F(x) l'expression de calculée en fonction de la nouvelle variable de moyenne nulle et


d'écart-type unitaire dont nous recherches l'expression quand n tend vers l'infini.

Reprenons: (7.244)

Afin de simplifier l'étude de cette relation quand n tend vers l'infini et k vers l'espérance, multiplions des

deux côtés par : (7.245)

Récrivons le terme de droite de l'égalité. Il vient alors:

(7.246)

Et maintenant récrivons le terme de gauche de la relation antéprécédente. Il vient:

Après un passage à la limite pour n tendant vers l'infini nous avons dans un premier temps pour le terme

antéprécédent: (7.247)

Donc: (7.248)

et dans un second temps, tenant compte du fait que les valeurs de k considérées se trouvent alors au

voisinage de l'espérance np, nous obtenons: (7.249)

et: (7.250)

Donc: (7.251)
et comme: (7.252)

Nous avons finalement: (7.253)

Cette relation peut encore s'écrire en réarrangeant les termes: (7.254)

et en intégrant les deux membres de cette égalité nous obtenons (cf. chapitre de Calcul Différentiel Et

Intégral) : (7.255)

La fonction suivante est une des solutions de la relation précédente: (7.256)

Effectivement: (7.257)

La constante est déterminée par la condition que: (7.258)

qui représente la somme de toutes les probabilités, vaille 1. Nous pouvons montrer pour cela que :

(7.259)

Démonstration:

Nous avons: (7.260)

Donc concentrons-nous sur le dernier terme de l'égalité. Ainsi: (7.261)

puisque est une fonction paire (cf. chapitre d'Analyse Fonctionnelle). Ecrivons maintenant le carré de
l'intégrale de la manière suivante:

(7.262)

et faisons un changement de variable en passant en coordonnées polaires, dès lors nous faisons aussi usage
du Jacobien dans ses mêmes coordonnées (cf. chapitre de Calcul Différentiel Et Intégral) :
(7.263)

Par extension pour nous avons: (7.264)

Nous obtenons donc la "loi normale centrée réduite" notée: (7.265)

qui peut être calculée dans MS Excel avec la fonction LOI.NORMALE.STANDARD( ) ou pour la
réciproque par LOI.NORMALE.STANDARD.INVERSE( ).

Pour information, une variable suivant une loi Normale centrée réduite est très souvent par tradition notée Z
(pour "Zentriert" en allemand).

En revenant aux variables non normées: (7.266)

nous obtenons donc la "fonction Gauss-Laplace" (ou "loi de Gauss-Laplace") ou également appelée "loi

Normale" : (7.267)

souvent notée N( , ) qui peut être calculée dans MS Excel avec la fonction LOI.NORMALE( ) ou pour la
réciproque par LOI.NORMALE.INVERSE( ).

La probabilité cumulée de valoir une certaine valeur k étant bien évidemment donnée par :

(7.268)

Exemple: Tracé de la fonction de distribution et répartition pour la fonction Normale de


paramètres :

(7.269)
Cette loi régit sous des conditions très générales, et souvent rencontrées, beaucoup de phénomènes
aléatoires. Elle est par ailleurs symétrique par rapport à la moyenne (c'est important de s'en souvenir).

Montrons maintenant que représente bien l'espérance mathématique (ou la moyenne) de x (c'est un peu
bête mais on peut quand même vérifier...):

(7.270)

Posons . Nous avons dès lors :

(7.271)

Calculons la première intégrale: (7.272)

Donc il vient au final: (7.273)

Remarques:

R1. Le lecteur pourrait trouver cela déroutant dans un premier temps que le paramètre d'une fonction soit un
des résultats que nous cherchons de la fonction. Ce qui dérange est la mise en pratique d'une telle chose. Au
fait, tout s'éclairera lorsque nous étudierons plus loin dans ce chapitre les concepts "d'estimateurs de
vraisemblance".

R2. Indiquons que dans la pratique (finance, qualité, assurance, etc.) il est fréquent de devoir calculer
l'espérance uniquement pour des valeurs positives de la variable aléatoire qui est définie alors naturellement
comme étant "l'espérance positive" et donnée par:

(7.274)

Nous en verrons un exemple pratique dans le chapitre d'Économétrie lors de notre étude du modèle
théorique de la spéculation de Louis Bachelier.

Montrons aussi (...) que représente bien l'écart type de X (il convient, en d'autres termes de montrer que
) et pour cela rappelons que nous avions démontré que (formule de Huyghens):

(7.275)
Nous avons déjà calculé tout à l'heure commençons alors par calculer :

(7.276)

Posons qui conduit dès lors à :

(7.277)

Or, nous savons : (7.278)

Il reste donc à calculer la première intégrale. Pour cela, procédons par une intégration par parties (cf.
chapitre de Calcul Différentiel et Intégral) :

(7.279)

D'où : (7.280)

Il vient finalement : (7.281)

Une signification supplémentaire de l'écart-type dans la loi de Gauss-Laplace est une mesure de la largeur de
la distribution telle que (cela ne peut se vérifier qu'à l'aide d'intégration à l'aide de méthodes numériques)
que toute moyenne et pour tout écart-type non nul nous avons:

(7.282)
La largeur de l'intervalle a une très grande importance dans l'interprétation des incertitudes d'une mesure. La
présentation d'un résultat comme signifie que la valeur moyenne a environ 68.3% de chance
(probabilité) de se trouver entre les limites de et , ou qu'elle a 95.5% de se trouver entre
et etc.

Remarque: Ce concept est beaucoup utilisé en gestion de la qualité en entreprise particulièrement avec le
concept industriel anglo-saxon Six Sigma (cf. chapitre de Génie Industriel) qui impose une maîtrise de 6
autour de chaque côté (!) de la moyenne des côtés des pièces fabriquées (ou tout autre sujet dont on mesure
la déviation).

Niveau de qualité Taux de non-défection assuré Taux de défection en


Sigma en % parties par million
1 68.26894 317'311
2 95.4499 45'500
3 99.73002 2'700
4 99.99366 63.4
5 99.999943 0.57
6 99.9999998 0.002
Tableau: 7.4 - Niveau de qualité Sigma avec taux de défection/non-défection

La deuxième colonne du tableau peut facilement être obtenue avec Maple. Par exemple pour la première
ligne:

>S:=evalf(int(1/sqrt(2*Pi)*exp(-x^2/2),x=-1..1));

et la première ligne de la troisième colonne par:

>(1-S)*1E6;

Si la loi Normale est décentrée, il suffirait alors d'écrire pour la deuxième colonne:

>S:=evalf(int(1/sqrt(2*Pi)*exp(-(x-mu)^2/2),x=-1..1));

et ainsi de suite pour tout écart-type et toute moyenne on retombre sur les mêmes intervalles!!!

La loi de Gauss-Laplace n'est par ailleurs pas qu'un outil d'analyse de données mais également de génération
de données. Effectivement, cette loi est une des plus importantes dans le monde des multinationales qui
recourent aux outils statistiques pour la gestion du risque, la gestion de projets et la simulation lorsqu'un
grand nombre de variables aléatoires sont en jeu. Le meilleur exemple d'application en étant le logiciel
CrystalBall ou @Risk de Palisade (mon préféré...).

Dans ce cadre d'application (gestion de projets), il est par ailleurs très souvent fait usage de la somme (durée
des tâches) ou le produit de variables aléatoires (facteur d'incertitude du client) suivant des lois de Gauss-
Laplace. Voyons comment cela se calcule :

SOMME DE DEUX VARIABLES ALÉATOIRES

Soit X, Y deux variables aléatoires indépendantes. Supposons que X suit la loi et que Y suit la loi
. Alors, la variable aléatoire aura une densité égale au produit de convolution
de . C'est-à-dire:
(7.283)

ce qui équivaut à faire le produit conjoint (cf. chapitre de Probabilités) des probabilités d'apparition des deux
variables continues (se rappeler le même genre de calcul sous forme discrète!)

Pour simplifier l'expression, faisons le changement de variable et posons ,

Comme: (7.284)

Nous obtenons: (7.285)

Nous posons : (7.286)

Alors : (7.287)

Sachant que : (7.288)

et: (7.289)

notre expression devient : (7.290)

Nous reconnaissons l'expression de la loi de Gauss-Laplace de moyenne et d'écart type

Par conséquent, suit la loi : (7.291)


Ce résultat est ce que nous nommons en statistiques la "stabilité par la somme" de la loi de Gauss-Laplace.
Nous retrouverons ce type de propriétés pour d'autres lois que nous étudierons plus loin.

Dans l'industrie, nous avons in-extenso l'expression suivante qui est très importante lorsque possédant
plusieurs échantillons de mesure d'une même population, nous souhaitons savoir la loi de toute la population
à partir de la connaissance de la moyenne et de l'écar-type de chacune:

(7.292)

PRODUIT DE DEUX VARIABLES ALÉATOIRES

Soit X, Y deux variables aléatoires indépendantes réelles. Nous désignerons par et les densités
correspondantes et nous cherchons à déterminer la densité de la variable .

Notons f la fonction de densité du couple (X,Y). Vu que X, Y sont indépendantes (cf. chapitre de
Probabilités) : (7.293)

La fonction de répartition de Z est:

(7.294)

où .

D peut se réécrire comme union disjointe (nous faisons cette opération pour anticiper lors du futur
changement de variables une division par zéro) : (7.295)

avec : (7.296)

Nous avons : (7.297)

La dernière intégrale vaut zéro car est de mesure (épaisseur) nulle pour l'intégrale selon x.

Nous effectuons ensuite le changement de variable suivant :

(7.298)

Le jacobien de la transformation est: (7.299)


Donc: (7.300)

Notons la densité de la variable Z. Par définition : (7.301)

D'un autre côté : (7.302)

comme nous venons de le voir. Par conséquent : (7.303)

Ce qui est un peu triste c'est que dans le cas d'une loi de Gauss-Laplace (loi Normale), cette intégrale ne peut
être calculée simplement que numériquement... il faut alors faire appel à des méthodes d'intégration du type
Monte-Carlo (cf. chapitre de Méthodes Numériques).

D'après quelques recherche faites sur Internet cependant, mais sans certitude, cette intégrale pourrait être
calculée et donnerait une nouvelle loi appelée "loi de Bessel".

LOI NORMALE CENTRÉE RÉDUITE

La fonction de Gauss-Laplace n'est pas tabulée puisqu'il faudrait autant de tables numériques que de valeurs
possibles pour la moyenne et l'écart-type (qui sont donc des paramètres de la fonction comme nous
l'avons vu).

C'est pourquoi, en opérant un changement de variable, la loi Normale devient la "loi Normale centrée
réduite" où :

1. "Centrée" signifie soustraire la moyenne (la fonction à alors pour axe de symétrie l'axe des ordonnées)

2. "Réduite" signifie, diviser par l'écart-type

Par ce changement de variable, la variable k est remplacée par la variable aléatoire centrée réduite :

(7.304)

Si la variable k a pour moyenne et pour écart- type alors la variable a pour moyenne 0 et
pour écart-type 1.

Donc la relation : (7.305)


s'écrit alors (trivialement) plus simplement : (7.306)

qui n'est d'autre que l'expression de la loi Normale centrée réduite souvent notée N(0,1)!

Attention!!! Nous retrouverons très fréquemment cette distribution en physique et en gestion de la qualité!

DROITE DE HENRY

Souvent, dans les entreprises c'est la loi de Gauss-Laplace (Normale) qui est analysée mais des logiciels
courants et facilement accessibles comme MS Excel sont incapables de vérifier que les données mesurées
suivent une loi Normale lorsque nous faisons de l'analyse fréquentielle (aucun outil intégré par défaut ne
permet de le faire) et que nous n'avons pas les données d'origines non groupées.

L'astuce consiste alors à utiliser la variable centré réduite qui se construit comme nous l'avons démontré plus

haut avec la relation suivante: (7.307)

L'idée de la droite d'Henry est alors d'utiliser la relation linéaire entre k et k* donnée par l'équation de la

droite: (7.308)

et qui peut être tracée pour déterminer la moyenne et l'écart-type de la loi Normale.

Exemple:

Supposons que nous ayons l'analyse fréquentielle suivante de 10'000 tickets de caisse dans un supermarché :

Montant des Nombre de tickets Nombre cumulés de Fréquences


tickets tickets relatives cumulées
[0;50[ 668 668 0.068
[50,100[ 919 1'587 0.1587
[100,150[ 1'498 3'085 0.3085
[150,200[ 1'915 5000 0.5000
[200,250[ 1'915 6'915 0.6915
[250,300[ 1'498 8'413 0.8413
[300,350[ 919 9'332 0.9332
[350,400[ 440 9'772 0.9772
[400 et + 228 10'000 1
Tableau: 7.5 - Intervalles de classe pour la détermination de la droite de Henry

Si nous traçons maintenant cela sous MS Excel nous obtenons:


(7.309)

Ce qui ressemble terriblement à une loi Normale d'où l'autorisation, sans trop de risques, d'utiliser dans cet
exemple la technique de la droite d'Henry.

Mais que faire maintenant? Eh bien connaissant les fréquences cumulées, il ne nous reste plus qu'à calculer
pour chacune d'entre elles k* à l'aide de tables numériques ou avec la fonction NORMSINV( ) de MS Excel
(car rappelons que l'intégration formelle de la fonction gaussienne n'est pas des plus faciles...).

Ceci nous donnera les valeurs de la loi Normale centrée réduite N(0,1) de ces mêmes fréquences respectives
cumulées (fonction de répartition). Ainsi nous obtenons (nous laissons le soin au lecteur de chercher sa table
numérique ou d'ouvrir son logiciel préféré...):

Borne de l'intervalle Fréquences relatives Correspondance pour


cumulées k* de N(0,1)
50 0.068 -1.5
100 0.1587 -1
150 0.3085 -0.5
200 0.5000 0
250 0.6915 0.5
300 0.8413 1
350 0.9332 1.5
400 0.9772 2
- 1 -
Tableau: 7.6 - Fréquences relatives cumulées pour la droite de Henry

Signalons que dans le tableau ci-dessus, dans MS Excel, les valeurs de fréquences cumulées nulles et
unitaires (extrêmes) posent problèmes. Il faut alors jouer un petit peu...

Comme nous l'avons spécifié plus haut, nous avons sous forme discrète:

(7.310)

Donc graphiquement sous MS Excel nous obtenons grâce à notre tableau le graphique suivant:
(7.311)

Donc à l'aide de la régression donnée par MS Excel (ou calculée par vos soins selon les techniques de
régressions linéaires vues dans le chapitre de Méthodes Numériques). Il vient :

(7.312)

Donc nous avons immédiatement : (7.313)

Il s'agit donc d'une technique particulière pour une distribution particulière! Des techniques similaires plus
ou moins simples (ou compliquées suivant les cas) existent pour nombre de distributions.

FONCTION LOG-NORMALE

Nous disons qu'une variable aléatoire positive X suit une "fonction log-normale" (ou "loi log-normale") de

paramètres (moment de la loi log-Normale), si et seulement si en posant: (7.314)

nous voyons que y suit une fonction de probabilité cumulée de type loi Normale de moyenne et de
variance (moments de la loi Normale).

La fonction de densité de X pour est alors (cf. chapitre de Calcul Intégral) :

(7.315)

qui peut être calculée dans MS Excel avec la fonction LOI.LOGNORMALE( ) ou pour la réciproque par
LOI.LOGNORNALE.INVERSE( ).

Ce type de scénario se retrouve fréquemment en physique, dans les techniques de maintenance ou encore en
finance des marchés dans le modèle de pricing des options (voir ces chapitres respectifs du site pour des
exemples concrets). Il y a par ailleurs une remarque importante relativement à la loi log-normale dans le
traitement plus loin du théorème central limite!

Montrons que la fonction de probabilité cumulée correspond bien à une loi Normale si nous faisons le
changement de variable mentionné précédemment:
(7.316)

en posant: (7.317)

et : (7.318)

nous avons bien: (7.319)

L'espérance (moyenne) de X est donnée alors par (le logarithme népérien n'étant pas défini pour nous
bornons l'intégrale à partir de zéro) :

(7.320)

où nous avons effectué le changement de variable : (7.321)

L'expression : (7.322)

étant par ailleurs égale à : (7.323)

la dernière intégrale devient donc :

(7.324)

Rappelons que la variance de X est définie par : (7.325)


Calculons en procédant de manière similaire aux développements précédents:

(7.326)

où nous avons encore une fois le changement de variable: (7.327)

et où nous avons transformé l'expression : (7.328)

sous la forme: (7.329)

Donc : (7.330)

Exemple:

Tracé de la fonction de distribution et répartition pour la fonction Log-Normale de paramètres


:

(7.331)
FONCTION UNIFORME CONTINUE

Soient . Nous définissons la fonction de distribution de la "fonction uniforme" (ou "loi uniforme") par

la relation : (7.332)

Nous avons donc pour fonction de répartition:

Il s'agit bien d'une fonction de distribution car elle vérifie (intégrale simple) :

(7.333)

La fonction uniforme a par ailleurs pour espérance (moyenne) :

(7.334)

et pour variance en utilisant la formule de Huyghens :

(7.335)

signifie qu'en dehors du domaine de définition [a,b] la fonction de distribution est nulle. Nous
retrouverons ce type de notation dans certaines autres fonctions de distribution.

Exemple:

Tracé de la fonction de distribution et respectivement de répartition pour la loi Uniforme de paramètres


:
(7.336)

Remarque: Cette fonction est souvent utilisée en simulation dans les entreprises pour signaler que la variable
aléatoire a des probabilités égales d'avoir une valeur comprise dans un certain intervalle (typiquement dans
les rendements de portefeuilles ou encore dans l'estimation des durées des projets). Le meilleur exemple
d'application étant à nouveau le logiciel CrystalBall ou @Risk qui s'intègre dans MS Project.

Voyons un résultat intéressant de la loi Uniforme continue (et qui s'applique à la discrète aussi en fait...).

Souvent j'entends des gestionnaires (qui se jugent de haut niveau) dire que comme une mesure à une
probabilité égale d'avoir lieu dans un intervalle fermé donné, alors la somme de deux variables aléatoires
indépendantes du même type aussi!

Or nous allons démontrer ici que ce n'est pas (si quelqu'un a une démonstration plus élégante je suis
preneur)!

Démonstration:

Considérons deux variables aléatoires indépendantes X et Y suivante une loi uniforme dans un intervalle
fermé [0,a]. Nous cherchons donc la densité de leur somme qui sera notée: (7.337)

Nous avons alors: (7.338)

avec la variable: (7.339)

Pour calculer la loi de la somme, rappelons que nous savons qu'en termes discrets cela équivaut faire le
produit conjoint des probabilités (cf. chapitre de Probabilités) d'apparition des deux variables continues (se
rappeler le même genre de calcul sous forme discrète!)

C'est-à-dire: (7.340)

Comme si et sinon 0 alors le produit de convolution précédent se réduit à:


(7.341)

L'intégrant vaut par définition 0 sauf lorsque par construction où il vaut alors 1.

Intéressons nous alors aux bornes de l'intégrale dans ce dernier cas qui est bien évidemment le seul qui est
intéressant....

Faisons d'abord un changement de variables en posant: (7.342)

d'où: (7.343)

L'intégrale s'écrit alors dans alors dans cet intervalle après ce changement de variable:

(7.344)

En se rappelant comme vu au début que , alors nous avons immédiatement si et


que l'intégrale est nulle.

Nous allons considérer deux cas pour cet intervalle car la convolution de ces deux fonctions rectangulaires
peuvent se distingueront à la situation où dans un premier temps elles se croisent (s'emboîtent), c'est-à-dire
où , et ensuite s'éloignent l'une de l'autre, c'est-à-dire .

- Dans le premier cas (emboîtement) où : (7.345)

où nous avons changé la borne inférieure à 0 car de toute façon est nulle pour toute valeur négative
(et lorsque , est justement négatif ou nul!).

- Dans le deuxième cas (déboîtement) où :

(7.346)

où nous avons changé la borne supérieur à a car de toute façon est nulle pour toute valeur supérieure
(et lorsque , z est justement plus grand que a).

Donc au final, nous avons: (7.347)

Il s'agit d'un cas particulier, volontairement simplifié, de la loi triangulaire que nous allons voir de suite.

Ce résultat (qui peut sembler contre intuitif) se vérifie en quelques secondes avec un tableur comme MS
Excel en utilisant la fonction ALEA.ENTRE.BORNES( ) et la fonction FREQUENCE( ).
FONCTION TRIANGULAIRE

Soit . Nous définissons la "fonction triangulaire" (ou "loi triangulaire") par construction selon les
deux fonctions de distribution suivantes:

(7.348)

où a est souvent assimilé à la valeur optimiste, c la valeur attendue (le mode) et b la valeur pessimiste.

C'est effectivement la seule manière de l'écrire si le lecteur garde à l'esprit que le triangle de base c-a doit
avoir une hauteur h valant 2/(c-a) telle que sa surface totale soit égale à l'unité (nous allons de suite le
montrer).

Exemple:

Tracé de la fonction de distribution et répartition pour la fonction triangulaire de paramètres (a,c,b)=(0,3,5):

(7.349)

La pente de la première droite (croissante de gauche) est donc bien évidemment: (7.350)

et la pente de la deuxième droite (décroissante à droite): (7.351)

Cette fonction est une fonction de distribution si elle vérifie: (7.352)

Il s'agit dans ce cas de l'aire du triangle qui rappelons-le est simplement la base multipliée par la hauteur le

tout divisé par 2 (cf. chapitre sur les Formes Géométriques): = 1 (7.353)
Remarque: Cette fonction est beaucoup utilisée en gestion de projet dans le cadre de l'estimation des durées
des tâches ou encore en simulations industrielles. La valeur a correspondant à la valeur optimiste, la valeur c
à la valeur attendue (mode) et la valeur b à la valeur pessimiste. Le meilleur exemple d'application étant à
nouveau le logiciel CrystalBall ou @Risk qui s'intègre dans MS Project.

La fonction triangulaire a par ailleurs une espérance (moyenne) :

(7.354)
et pour variance :

(7.355)

on remplace par l'expression obtenue précédemment et on simplifie (c'est de l'algèbre élémentaire


pénible...) :

(7.356)

Nous pouvons montrer que la somme de deux variables aléatoires indépendantes chacune de loi uniforme
sur [a,b] suit une loi uniforme sur [2a,2b] mais si elles n'ont pas les mêmes bornes, alors leur somme donne
une loi triangulaire.

FONCTION DE PARETO

La "fonction de Pareto" (ou "loi de Pareto") est la formalisation du principe des 80-20. Cet outil d'aide à la
décision détermine les facteurs (environ 20%) cruciaux qui influencent la plus grande partie (80%) de
l'objectif.

Remarque: Cette loi est un outil fondamental et basique en gestion de la qualité (cf. chapitre de Génie
Industriel et Techniques de Gestion). Elle est aussi utilisée en réassurance. La théorie des files d'attente s'est
intéressée à cette distribution, lorsque des recherches des années 90 ont montré que cette loi régissait aussi
au nombre de grandeurs observées dans le trafic internet (et plus généralement sur tous les réseaux de
données à grande vitesse).

Une variable aléatoire est dite par définition suivre une loi de Pareto si sa fonction de répartition est donnée

par : (7.357)

avec x qui doit être supérieur ou égal à xm.

La fonction de densité (fonction de distribution) de Pareto est alors :

(7.358)

avec et (donc ).
La distribution de Pareto est donc définie par deux paramètres, xm et k (nommé "index de Pareto").

C'est par ailleurs bien une fonction de distribution puisque étant connue sa fonction de répartition:

(7.359)

L'espérance (moyenne) est donnée par: (7.360)

si . Si , l'espérance n'existe pas.

Pour calculer la variance, en utilisant la relation : (7.361)

Nous avons : (7.362)

si . Si , n'existe pas.

Donc si : (7.363)

Si , la variance n'existe pas.

Exemple: Tracé de la fonction de distribution et répartition pour la fonction de Pareto de paramètre


:

(7.364)
Remarque: Il faut noter que lorsque la distribution s'approche de où est la fonction
Delta de Dirac.

FONCTION EXPONENTIELLE

Nous définissons la "fonction exponentielle" (ou "loi exponentielle") par la relation de fonction de
distribution suivante : (7.365)

avec qui comme nous allons de suite le montrer n'est au fait que l'inverse de la moyenne.

Remarques:

R1. Cette fonction se retrouve fréquemment en physique nucléaire (désintégrations) ou encore en physique
quantique ainsi qu'en fiabilité (maintenance préventive).

R2. Nous pouvons obtenir cette loi dans MS Excel avec la fonction LOI.EXPONENTIELLE( ).

Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie :

(7.366)

La fonction exponentielle a pour espérance (moyenne) en utilisant l'intégration par parties:

(7.367)

et pour variance nous utilisons à nouveau et il ne nous reste plus qu'à calculer :

(7.368)

Un changement de variable conduit à : (7.369)

Une double intégration par parties donne :

(7.370)

D'où il vient dès lors : (7.371)


Donc l'écart-type (racine carrée de la variance pour rappel) et la moyenne ont exactement la même
expression!

Exemple:

Tracé de la fonction de distribution et répartition pour la fonction exponentielle de paramètre :

(7.372)

Déterminons maintenant la fonction de répartition de la loi exponentielle:

(7.373)

Remarque: Nous verrons plus loin que la fonction de distribution exponentielle n'est qu'un cas particulier
d'une fonction plus générale qui est la fonction du Khi-Deux, cette dernière aussi n'étant qu'un cas particulier
d'une fonction encore plus générale qui est la fonction Gamma.

FONCTION DE CAUCHY

Soient X,Y deux variables aléatoires indépendantes suivant des lois Normales centrées réduites (variance
unité et espérance nulle). La fonction de densité est donc donnée par :

(7.374)

La variable aléatoire : (7.375)

(la valeur absolue intervient dans l'intégrale lors du changement variable) suit une caractéristique appelée
"fonction de Cauchy" (ou "loi de Cauchy") ou encore "loi de Lorentz".

Déterminons sa fonction de densité f. Pour cela, rappelons que f est déterminée par la relation (générale):
(7.376)

Donc (application du calcul intégral élémentaire) : (7.377)

dans le cas où f est continue.

Etant donné que X et Y sont indépendantes, la fonction de densité du vecteur aléatoire est donnée par un des
axiomes des probabilités (cf. chapitre de Probabilités) : (7.378)

Donc : (7.379)

où donc .

Cette dernière intégrale devient : (7.380)

Faisons le changement de variable dans l'intégrale intérieure. Nous obtenons :

(7.381)

Donc : (7.382)

C'est maintenant que la valeur absolue va nous être utile pour écrire :

(7.383)

Pour la première intégrale nous avons :

(7.384)

Il ne reste donc plus que la seconde intégrale et en faisant le changement de variable , nous obtenons :
(7.385)

Ce que nous noterons par la suite (afin de respecter les notations optées jusqu'à présent) :

(7.386)

et qui n'est d'autre que la fonction de Cauchy.

Il s'agit par ailleurs bien d'une fonction de distribution car elle vérifie (cf. chapitre de Calcul Différentiel et
Intégral):

(7.387)

Exemple:

Tracé de la fonction de distribution:

(7.388)

La fonction de Cauchy a pour espérance (moyenne) :

(7.389)
Attention !!! Les calculs précédents ne donnent pas zéro au fait car la soustraction d'infinis est non pas nul
mais indéterminé ! La loi de Cauchy n'admet donc pas d'espérance rigoureusement parlant!

Ainsi, même si nous pouvons bricoler une variance :

(7.390)

celle-ci est absurde et n'existe rigoureusement parlant pas puisque la l'espérance n'existe pas...!

LOI BÊTA

Rappelons d'abord que la fonction Gamma d'Euler est définie par la rela tion (cf. chapitre de Calcul

Différentiel Et Intégral): (7.391)

Nous avons démontré (cf. chapitre de Calcul Différentiel Et Intégral) qu'une propriété non triviale de cette
fonction est que: (7.392)

Posons maintenant: (7.393)

où : (7.394)

En faisant le changement de variables : (7.395)

nous obtenons : (7.396)

Pour l'intégrale interne nous utilisons maintenant la substitution et nous trouvons alors:

(7.397)

La fonction B qui apparaît dans l'expression ci-dessus est appelée "fonction bêta" et nous avons donc :

(7.398)
Maintenant que nous avons défini ce qu'était la fonction bêta, considérons deux paramètres et
considérons la relation particulière ci-dessous comme étant la "fonction de distribution Bêta" ou "loi bêta" (il
existe plusieurs formulations de la loi bêta donc une très importante qui est étudiée en détails dans le
chapitre de Techniques de Gestion):

(7.399)

où: (7.400)

Nous vérifions d'abord que que est bien une fonction de distribution (sans trop aller dans les
détails...):

(7.401)

Maintenant, nous calculons qu'elle est son espérance (moyenne) :

(7.402)

en utilisant la relation: (7.403)

et sa variance :

(7.404)

En sachant que et que nous trouvons :

(7.405)

et donc : (7.406)
Exemple:

Tracé de la fonction pour en rouge, en vert, en noir,


en bleu, en magenta, en cyan, en gris,
en turquoise, en jaune, en couleur or :

(7.407)

et tracé de la fonction de distribution et répartition de la loi bêta de paramètres :

(7.408)

FONCTION GAMMA

La fonction Gamma d'Euler étant connue, considérons deux paramètres et définissons la


"fonction Gamma" (ou "loi Gamma") comme étant donnée par la relation :
(7.409)

En faisant le changement de variables nous obtenons :

(7.410)

et pouvons alors écrire la relation sous une forme plus classique que nous trouvons fréquemment dans les
ouvrages :

(7.411)

et c'est sous cette forme que nous retrouvons cette fonction dans MS Excel sous le nom LOI.GAMMA( ) et
pour sa réciproque par LOI.GAMMA.INVERSE( ).

Remarques:

R1. Si alors et nous retombons sur la loi exponentielle.

R2. Si la distribution s'appelle alors la "fonction d'Erlang".

Ensuite, nous vérifions avec un raisonnement similaire en tout point celui de fonction bêta que est

une fonction de distribution : (7.412)

Exemple: Tracé de la fonction pour en rouge, en vert, en noir,


en bleu, en magenta :

(7.413)
et tracé de la fonction de distribution et répartition pour la fonction Gamma de paramètre :

(7.414)

La fonction Gamma a par ailleurs pour espérance (moyenne):

(7.415)

et pour variance :

(7.416)

Démontrons une propriété de la fonction Gamma qui nous servira à démontrer plus tard dans ce chapitre lors
de notre étude de l'analyse de la variance et des intervalles de confiance sur des petits échantillons une autre
propriété extrêmement importante de la loi du khi-deux.

Comme nous le savons, la fonction de densité d'une variable aléatoire suivant une fonction Gamma de

paramètres est : (7.417)

avec (cf. chapitre de Calcul Différentiel Et Intégral) la fonction Gamma d'Euler :

(7.418)
Par ailleurs, quand une variable aléatoire suite une fonction Gamma nous la notons:

(7.419)

Soit X, Y deux variables indépendantes. Montrons que si et alors :

(7.420)

Notons f la fonction de densité du couple (X,Y), la fonction de densité de X et la fonction de densité


de Y. Vu que X, Y sont indépendantes, nous avons : (7.421)

pour tout .

Soit . La fonction de répartition de Z est alors :

(7.422)

où .

Remarque: Nous appelons un tel calcul une "convolution" et les statisticiens ont souvent à manipuler de
telles entités ayant à travailler sur des nombreuses variables aléatoires qu'il faut sommer ou même
multiplier.

En simplifiant : (7.423)

Nous effectuons le changement de variable suivant : (7.424)

Le jacobien est alors (cf. chapitre de Calcul Différentiel Et Intégral) : (7.425)

Donc avec la nouvelle borne d'intégration nous avons:

(7.426)

Si nous notons g la fonction de densité de Z nous avons :

(7.427)
Par suite : (7.428)

et étant nulles lorsque leur argument est négatif, nous pouvons changer les bornes d'intégration :

pour (7.429)

Calculons g : (7.430)

Après le changement de variable nous obtenons :

(7.431)

où B est la fonction bêta que nous avons vu plus haut dans notre étude la fonction de distribution bêta. Or

nous avons aussi démontré la relation : (7.432)

Donc : (7.433)

Ce qui finalement nous donne : (7.434)

Ce qui montre que bien que si deux variables aléatoires suivent une fonction Gamma alors leur somme aussi
tel que : (7.435)

donc la fonction Gamma est stable par addition de même que le sont toutes les lois qui découlent de la loi
gamma et que nous allons aborder ci-après.

FONCTION DE KHI-DEUX (OU DE PEARSON)

La "fonction de Khi-Deux" (appelée aussi "loi du Khi-Deux" ou encore "loi de Pearson") n'est qu'un cas
particulier de la fonction de distribution Gamma dans le cas où et , avec k entier positif :

(7.436)

Cette relation qui relie la loi du khi-deux à la loi Gamma est important dans MS Excel car la fonction
LOI.KHIDEUX( ) donne le seuil de confiance et non la loi de distribution. Il faut alors utiliser la fonction
LOI.GAMMA( ) avec les paramètres donnés ci-dessus (à part qu'il faut prendre l'inverse de 1/2, soit 2
comme paramètre) pour avoir la fonction de distribution et de répartition.
Tous les calculs faits auparavant s'appliquent et nous avons alors immédiatement:

(7.437)

Exemple:

Tracé de la fonction pour en rouge, en vert, en noir, en bleu :

(7.438)

et tracé de la fonction de distribution et respectivement de répartition pour la loi du khi-deux pour :

(7.439)

Dans la littérature, il est de tradition de noter :

ou (7.440)
pour indiquer que la distribution de la variable aléatoire X est la loi du khi-deux. Par ailleurs il est courant de
nommer le paramètre k "degré de liberté" et de l'abréger "ddl".

La fonction khi-deux découle donc de la loi gamma et par ailleurs en prenant nous retrouvons aussi la
loi exponentielle (voir plus haut) pour :

(7.441)

Par ailleurs, puisque (cf. chapitre de Calcul Différentiel Et Intégral): (7.442)

la loi du khi-deux avec k égal à l'unité peut s'écrire sous la forme :

(7.443)

FONCTION DE STUDENT

La "fonction de Student" (ou "loi de Student") de paramètre k est définie par la relation :

(7.444)

avec k étant le degré de liberté de la loi du khi-deux sous jacente à la construction de la fonction de Student
comme nous allons le voir.

Indiquons qu'elle peut aussi être obtenue dans MS Excel à l'aide des fonctions LOI.STUDENT( ) et sa
réciproque par LOI.STUDENT.INVERSE( ).

Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement mais
bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc indirectement...) :

(7.445)

Voyons la démonstration la plus simple pour justifier la provenance de la loi de Student et qui nous sera en
même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin.

Pour cette démonstration, rappelons que:

R1. Si X, Y sont deux variables aléatoires indépendantes de densités respectives , la loi du couple
(X,Y) possède une densité f vérifiant (axiome des probabilités!): (7.446)

R2. La loi N(0,1) est donnée par (voir plus haut): (7.447)
R3. La loi est donnée par (voir précédemment): (7.448)

pour et .

R4. La fonction est définie pour tout par (cf. chapitre de Calcul Différentiel et Intégral):

(7.449)

et vérifie (cf. chapitre de Calcul Différentiel et Intégral): (7.450) pour .

Ces rappels étant faits, considérons maintenant X une variable aléatoire suivant la loi N(0,1) et Y une
variable aléatoire suivant la loi .

Nous supposons X et Y indépendantes et nous considérons la variable aléatoire (c'est à l'origine l'étude
historique de la loi de Student dans le cadre de l'inférence statistique qui a amené à poser cette variable dont

nous justifierons l'origine plus loin): (7.451)

Nous allons montrer T suit une loi de Student de paramètre n.

Démonstration:

Notons F et f les fonctions de répartition et de densité de T et ,f les fonctions de densité de X, Y et


(X,Y) respectivement. Nous avons alors pour tout :

(7.452)

où: (7.453)

la valeur imposée positive et non nulle de y étant due au fait qu'elle est sous une racine et en plus au
dénominateur.

Ainsi: (7.454)

où comme X suit une loi N(0,1): (7.455)

est la fonction de répartition de la loi Normale centrée réduite.


Nous obtenons alors la fonction de densité de T en dérivant F:

(7.456)

car (la dérivée d'une fonction est égale à sa dérivée multipliée par sa dérivée intérieure):

(7.457)

Donc: (7.458)

En faisant le changement de variable:

(7.459)

nous obtenons:

(7.460)

ce qui est bien la loi de Student de paramètre n.


Voyons maintenant quelle est l'espérance de la loi de Student: (7.461)

Nous avons: (7.462)

Mais existe si et seulement si . En effet pour :

(7.463)

et: (7.464)

Tandis que pour nous avons: (7.465)

Ainsi pour , l'espérance n'existe pas.

Donc pour : (7.466)

Voyons maintenant la valeur de la variance. Nous avons donc: (7.467)

Discutons de l'existence de . Nous avons trivialement:

(7.468)

X suit une loi normale centrée réduite donc:

(7.469)

Pour ce qui est de nous avons:

(7.470)
où nous avons fait le changement de variable .

Mais l'intégrale définissant converge seulement si .

Donc existe si et seulement si et vaut alors selon les propriétés de la loi Gamma d'Euler
démontrées dans le chapitre de Calcul Différentiel et Intégral:

(7.471)

Ainsi pour : (7.472)

Il est par ailleurs important de remarque que cette loi est symétrique par rapport à 0!

Exemple:

Tracé de la fonction de distribution et répartition pour la fonction de Student de paramètre :

(7.473)

FONCTION DE FISHER

La "fonction de Fisher" (ou "loi de Fisher-Snedecor") de paramètres k et l est définie par la relation:

(7.474)

si . Les paramètres k et l sont des entiers positifs et correspondent aux degrés de liberté des deux lois
du khi-deux sous-jacentes. Cette distribution est souvent notée ou F(k,l) et peut être obtenue dans MS
Excel par la fonction LOI.F( ).
Il s'agit bien d'une fonction de distribution car elle vérifie également (reste à démontrer directement mais
bon comme nous allons le voir elle est le produit de deux fonctions de distribution donc indirectement...) :

(7.475)

Voyons la démonstration la plus simple pour justifier la provenance de la loi de Fisher et qui nous sera en
même temps très utile dans l'inférence statistique et l'analyse de la variance plus loin.

Pour cette démonstration, rappelons que:

R1. La loi est donnée par (voir plus haut): (7.476)

pour et .

R2. La fonction est définie pour tout par (cf. chapitre de Calcul Différentiel et Intégral):

(7.477)

Soit X, Y deux variables aléatoires indépendantes suivant respectivement les lois et .

Nous considérons la variable aléatoire: (7.478)

Nous allons donc montrer que la loi de T est la loi de Fisher-Snedecor de paramètres n, m.

Notons pour cela F et f les fonctions de répartition et de densité de T et , f les fonctions de densité
de X, Y et (X,Y) respectivement. Nous avons pour tout :

(7.479)

où: (7.480)

où les valeurs positives imposées proviennent de l'origine d'une loi du khi-deux pour x et y.

Ainsi : (7.481)

Nous obtenons la fonction de densité de T en dérivant F. D'abord la dérivée intérieure:

(7.482)
Ensuite en explicitant puisque:

et (7.483)

nous avons alors:

(7.484)

En faisant le changement de variable:

(7.485)

nous obtenons :

(7.486)

FONCTION DE BENFORD

Cette distribution aurait été découverte une première fois en 1881 par Simon Newcomb, un astronome
américain, après qu'il se fut aperçu de l'usure (et donc de l'utilisation) préférentielle des premières pages des
tables de logarithmes (alors compilées dans des ouvrages). Frank Benford, aux alentours de 1938, remarqua
à son tour cette usure inégale, crut être le premier à formuler cette loi qui porte indûment son nom
aujourd'hui et arriva aux même résultats après avoir répertorié des dizaines de milliers de données
(longueurs de fleuves, cours de la bourse, etc).

Seule explication possible : nous avons plus souvent besoin d'extraire le logarithme de chiffres commençant
par 1 que de chiffres commençant par 9, ce qui implique que les premiers sont "plus nombreux" que les
seconds.

Bien que cette idée lui paraisse tout à fait invraisemblable, Benford entreprend de vérifier son hypothèse.
Rien de plus simple : il se procure des tables de valeurs numériques, et calcule le pourcentage d'apparition
du chiffre le plus à gauche (première décimale). Les résultats qu'il obtient confirment son intuition:

Chiffre initial Probabilité d'apparition


1 30.1 %
2 17.6 %
3 12.5 %
4 9.7 %
5 7.9 %
6 6.7 %
7 5.8 %
8 5.1 %
9 4.6 %
Tableau: 7.7 - Probabilité d'appartion d'un chiffre selon la loi de Benford

A partir de ces données, Benford trouve expérimentalement que la probabilité qu'un nombre commence par
le chiffre n (excepté 0) est (nous allons le démontrer plus loin) donnée par la relation :

(7.487)

appelée "fonction de Benford" (ou "loi de Benford").

Exemple: Voici un tracé de la fonction précédente :

(7.488)
Il convient de préciser que cette loi ne s'applique qu'à des listes de valeurs "naturelles", c'est-à-dire à des
chiffres ayant une signification physique. Elle ne fonctionne évidemment pas sur une liste de chiffres tirés
au hasard.

La loi de Benford a été testée sur toutes sortes de tables : longueur des fleuves du globe, superficie des pays,
résultat des élections, liste des prix de l'épicerie du coin... Elle se vérifie à presque tous les coups.

Elle est évidemment indépendante de l'unité choisie. Si l'on prend par exemple la liste des prix d'un
supermarché, elle fonctionne aussi bien avec les valeurs exprimées en Francs qu'avec les mêmes prix
convertis en Euros.

Cet étrange phénomène est resté peu étudié et inexpliqué jusqu'à une époque assez récente. Puis une
démonstration générale en a été donnée en 1996, qui fait appel au théorème de la limite centrale.

Aussi surprenant que cela puisse paraître, cette loi a trouvé une application : le fisc l'utilise aux Etats-Unis
pour détecter les fausses déclarations. Le principe est basé sur la restriction vue plus haut : la loi de Benford
ne s'applique que sur des valeurs ayant une signification physique.

S'il existe une distribution de probabilité universelle P(n) sur de tels nombres, ils doivent êtres invariants
sous un changement d'échelle tel que: (7.489)

Si : (7.490)

alors: (7.491)

et la normalisation de la distribution donne: (7.492)

si nous dérivons par rapport à nous obtenons :

(7.493)

en posant nous avons : (7.494)

Cette équation différentielle a pour solution: (7.495)

Cette fonction, n'est pas en premier lieu à proprement parler une fonction de distribution de probabilité (elle
diverge) et deuxièmement, les lois de la physique et humaines imposent des limites.

Nous devons donc comparer cette distribution par rapport à une référence arbitraire. Ainsi, si le nombre
décimal étudié contient plusieurs puissance de 10 (10 au total: 0,1,2,3,4,5,6,7,9) la probabilité que le premier

chiffre non nul (décimal) soit D est donné par la distribution logarithmique: (7.496)
Les bornes de l'intégrale sont de 1 à 10 puisque la valeur nulle est interdite.

L'intégrale du dénominateur donne: (7.497)

L'intégrale du numérateur donne: (7.498)

Ce qui nous donne finalement: (7.499)

De par les propriétés des logarithmes (voir le chapitre d'Analyse fonctionnelle) nous avons :

(7.500)

Cependant, la loi de Benford ne s'applique pas uniquement aux données invariantes par changement
d'échelle mais également à des nombres de provenant de sources quelconques. Expliquer ce cas implique
une investigation plus rigoureuse en utilisant le théorème de la limite centrale. Cette démonstration a été
effectuée seulement en 1996 par T. Hill par une approche utilisant la distribution des distributions.
7. STATISTIQUES (2/2)

ESTIMATEURS DE VRAISEMBLANCE

Ce qui va suivre est d'une extrême importance en statistiques et est utilisé énormément en pratique. Il
convient donc d'y accorder une attention toute particulière!

Nous supposons que nous disposons d'observations qui sont des réalisations de variables
aléatoires non biaisées (dans le sens qu'elles sont choisies aléatoirement parmi un lot) indépendantes
de loi de probabilité inconnue mais identique.

Nous allons chercher à estimer cette loi de probabilité P inconnue à partir des observations .

Supposons que nous procédons par tâtonnement pour estimer la loi de probabilité P inconnue. Une manière
de procéder est de se demander si les observations avaient une probabilité élevée ou non de
sortir avec cette loi de probabilité arbitraire P.

Nous devons pour cela calculer la probabilité conjointe qu'avaient les observations de sortir

avec . Cette probabilité vaut (cf. chapitre de Probabilités): (7.1)

en notant P la loi de probabilité supposée associée à . Il faut avouer qu'il serait alors
particulièrement maladroit de choisir une loi de probabilité (avec ses paramètres!) qui minimise cette
quantité...

Au contraire, nous allons chercher la probabilité qui maximise , c'est-à-dire


qui rende les observations le plus vraisemblable possible.

Nous sommes donc amené à chercher le (ou les) paramètre(s) qui maximise(nt) la quantité :

(7.2)

Cette quantité L porte le nom de "vraisemblance". C'est une fonction du ou des paramètres et des
observations .

La ou les valeurs du paramètre qui maximisent la vraisemblance sont appelées "estimateurs du


maximum de vraisemblance" (estimateur MV).

Faisons quand même trois petits exemples (très classiques, utiles et importants dans l'industrie) avec dans
l'ordre d'importance (donc pas forcément dans l'ordre de facilité...) la fonction de distribution de Gauss-
Laplace (Normale), la fonction de distribution de Poisson et finalement Binomiale.

Remarque: Ces trois exemples sont importants car utilisés dans les SPC (maîtrise statistiques de processus)
dans différentes multinationales à travers le monde (cf. chapitre de Génie Industriel).
ESTIMATEURS DE LA LOI NORMALE

Soit un n-échantillon de variables aléatoires identiquement distribuées supposées suivre une


loi de Gauss-Laplace (loi Normale) de paramètres et .

Nous recherchons quelles sont les valeurs des estimateurs de maximum de vraisemblance qui maximisent
la vraisemblance de la loi Normale ?

Remarque: Il va de soit que les estimateurs de maximum de vraisemblance sont ici :

(7.3)

Nous avons démontré plus haut que la densité d'une variable aléatoire gaussienne était donnée par :

(7.4)

La vraisemblance est alors donnée par:

(7.5)

Maximiser une fonction ou maximiser son logarithme est équivalent donc la "log-vraisemblance" sera:

(7.6)

Pour déterminer les deux estimateurs de la loi Normale, fixons d'abord l'écart-type. Pour cela, dérivons

par rapport à et regardons pour quelle valeur de la moyenne la fonction s'annule.

Il nous reste après simplification le terme suivant qui est égal à zéro: (7.7)

Ainsi, l'estimateur de maximum de vraisemblance de la moyenne (espérance) de la loi Normale est donc

après réarrangement: (7.8)

et nous voyons qu'il s'agit simplement de la moyenne arithmétique (ou appelée aussi "moyenne empirique").

Fixons maintenant la moyenne. L'annulation de la dérivée de en conduit à :

(7.9)
Ce qui nous permet d'écrire l'estimateur de maximum de vraisemblance pour l'écart-type (la variance lorsque
la moyenne est connue selon la loi de distribution supposée elle aussi connue!):

(7.10)

Cependant, nous n'avons pas encore défini ce qu'était un bon estimateur ! Ce que nous entendons par là:

- Si l'espérance d'un estimateur est égale à elle-même, nous disons que cet estimateur est "sans biais" et c'est
bien évidemment ce que nous cherchons!

- Si l'espérance d'un estimateur n'est pas égale à elle-même, nous disons alors que cet estimateur est "biaisé"
et c'est forcément moins bien...

Dans l'exemple précédent, la moyenne est donc non biaisée (trivial car la moyenne de la moyenne
arithmétique est égale à elle même). Mais qu'en est-il de la variance (in extenso de l'écart-type) ?

Un petit calcul simple par linéarité de l'espérance (puisque les variables aléatoires sont identiquement
distribuées) va nous donner la réponse dans le cas où la moyenne théorique est approchée comme dans la
pratique (industrie) par l'estimateur de la moyenne (cas le plus fréquent).

Nous avons donc le calcul de l'espérance de la "variance empirique":

(7.11)

Or, comme les variables sont équidistribuées: (7.12)

Et nous avons (formule de Huyghens): (7.13)

ainsi que : (7.14)

où la deuxième relation ne peut s'écrire que parce que nous utilisons l'estimateur de maximum de
vraisemblance de la moyenne (moyenne empirique). D'où:

(7.15)

et comme: et (7.16)

Nous avons finalement: (7.17)


nous avons donc un biais de -1 fois l'erreur-standard: (7.18)

Nous noterons également que l'estimateur tend vers un estimateur sans biais (E.S.B.) lorsque le nombre
d'échantillons tend vers l'infini . Nous disons alors que nous avons un "estimateur asymptotiquement
non biaisé".

Remarque: Un estimateur est aussi dit "estimateur consistant" s'il converge en probabilité, lorsque ,
vers la vraie valeur du paramètre.

De par les propriétés de l'espérance, nous avons alors:

(7.19)

il vient alors:

(7.20)

Nous avons donc finalement deux résultats importants:

1. L'estimateur de maximum de vraisemblance biaisé ou appelé également "variance empirique" ou encore

"variance échantillonnale" et donc donné par: (7.21)

lorsque .

2. Et donc "l'estimateur de maximum vraisemblance non biaisé": (7.22)

deux relations que nous retrouvons souvent dans les tables et dans de nombreux logiciels et que nous
utiliserons plus bas dans les développements des intervalles de confiance et des tests d'hypothèses!

Par exemple, dans MS Excel l'estimateur biaisé est donné par la fonction ECARTYPEP( ) et le non biaisé
par ECARTTYPE( ).

Au total, cela nous fait donc trois estimateurs pour la même quantité!! Comme dans l'écrasante majorité des
cas de l'industrie la moyenne théorique n'est pas connue, nous utilisons le plus souvent les deux dernières
relations encadrées ci-dessus. Maintenant, c'est la que c'est le plus vicieux : lorsque nous calculons le biais
des deux estimateurs, le premier est biaisé, le second ne l'est pas. Donc nous aurions tendance à utiliser que
le second. Que nenni! Car nous pourrions aussi parler de la variance et de la précision d'un estimateur, qui
sont aussi des critères importants pour juger de la qualité d'un estimateur par rapport à un autre. Si nous
faisions le calcul de la variance des deux estimateurs, alors le premier, qui est biaisé, a une variance plus
petite que le second qui est sans biais! Tout ça pour dire que le critère du biais n'est pas (et de loin) le seul à
étudier pour juger de la qualité d'un estimateur.

Enfin, il est important de se rappeler que le facteur -1 du dénominateur de l'estimateur de maximum de


vraisemblance non biaisé provient du fait qu'il fallait corriger l'espérance de l'estimateur biaisé à la base
minoré de une fois l'erreur-standard!
In extenso, ils est possible de démontrer (mais c'est long) que si la variable aléatoire suivant une loi normale
dont nous cherchons l'expression de l'estimateur non biaisé est la somme de k variables aléatoires
linéairement indépendantes alors nous avons:

(7.23)

ESTIMATEUR DE LA LOI DE POISSON

En utilisant la même méthode que pour la loi Normale (Gauss-Laplace), nous allons donc rechercher
l'estimateur de maximum de vraisemblance la loi de Poisson qui rappelons-le, est définie par :

(7.24)

Dès lors, la vraisemblance est donnée par : (7.25)

Maximiser une fonction ou maximiser son logarithme est équivalent donc:

(7.26)

Nous cherchons maintenant à la maximiser :

(7.27)

et obtenons donc son unique estimateur de maximum de vraisemblance qui sera :

(7.28)

Il est tout à fait normal de retrouver dans cet exemple didactique la moyenne empirique, car c'est le meilleur
estimateur possible pour le paramètre de la loi de Poisson (qui représente aussi l'espérance d'une loi de
Poisson).

Sachant que l'écart type de la distribution particulière (voir plus haut) n'est que la racine carrée de la
moyenne, nous avons alors pour l'écart-type de maximum de vraisemblance biaisé:

(7.29)

Remarque: Nous montrons de la même manière que les résultats identiques pour la loi exponentielle très
utilisée en maintenance préventive et fiabilité!
ESTIMATEUR DE LA LOI BINOMIALE

En utilisant la même méthode que pour la loi Normale (Gauss-Laplace) et la loi de Poisson, nous allons
donc rechercher l'estimateur de maximum de vraisemblance la loi Binomiale qui rappelons-le, est définie par
:

(7.30)

Dès lors, la vraisemblance est donnée par :

(7.31)

Il convient de se rappeler que le facteur qui suit le terme combinatoire exprime déjà les variables successives
selon ce que nous avons vu lors de notre étude de la fonction de distribution de Bernoulli et de la fonction
bin0miale.

Maximiser une fonction ou maximiser son logarithme est équivalent donc:

(7.32)

Nous cherchons maintenant à la maximiser :

(7.33)

Ce qui donne : (7.34)

d'où nous tirons l'estimateur de maximum de vraisemblance biaisé qui sera : (7.35)

Ce résultat est assez intuitif si l'on considère l'exemple classique d'une pièce de monnaie qui à une chance
sur deux de tomber sur une des ces faces. La probabilité p étant le nombre de fois k où une face donnée a été
observée sur le nombre d'essais total (toutes faces confondues).

Remarque: Dans la pratique, il n'est pas aussi simple d'appliquer ces estimateurs! Il faut bien réfléchir
lesquels sont les plus adaptés à une expérience donnée et idéalement calculer également l'erreur quadratique
moyenne (erreur standard) de chacun des estimateurs de la moyenne (comme nous l'avons déjà fait pour la
moyenne empirique plus tôt). Bref c'est un long travail de réflexion.

ESTIMATEUR DE LA LOI WEIBULL

Nous avons vu dans le chapitre de Génie Industriel une étude très détaillée de la loi de Weibull à trois
paramètres avec son écart-type et son espérance car nous avions précisée qu'elle était assez utilisée dans le
domaine de l'ingénierie de la fiabilité.

Malheureusement les trois paramètres de cette loi nous sont en pratique inconnus. A l'aide des estimateurs
nous pouvons cependant déterminer l'expression de deux des trois en supposant comme étant nul. Cela
nous donne donc la loi de Weibull dite "à deux paramètres" suivante:
(7.36)

avec pour rappel et .

Dès lors la vraisemblance est donnée par:

(7.37)

Maximiser une fonction ou maximiser son logarithme est équivalent donc:

(7.38)

Cherchons maintenant à maximiser cela en se rappelant que (cf. chapitre de Calcul Différentiel et Intégral):

et (7.39)

d'où: (7.40)

Et nous avons pour le deuxième paramètre:

(7.41)

d'où: (7.42)
Finalement avec les écritures correctes (et dans l'ordre de résolution dans la pratique):

et (7.43)

La résolution de ces équations implique de lourds calculs et on peut rien en tirer dans les tableaux classiques
comme MS Excel ou Calc de Open Office.

On prend alors une approche différente en écrivant notre loi de Weibull à deux paramètres ainsi:

(7.44)

avec pour rappel et .

Dès lors la vraisemblance est donnée par:

(7.45)

Maximiser une fonction ou maximiser son logarithme est équivalent donc:

(7.46)

Cherchons maintenant à maximiser cela en se rappelant que (cf. chapitre de Calcul Différentiel et Intégral):

et (7.47)

d'où: (7.48)

Et nous avons pour le deuxième paramètre: (7.49)

Il est alors immédiat que: (7.50)

injecté dans la relation: (7.51)


Il vient: (7.52)

en simplifiant: (7.53)

La résolution des deux équations (dans l'ordre de haut en bas):

(7.54)

peut très facilement être calculé avec l'outil Valeur Cible de MS Excel ou Calc de Open Office.

INTERVALLES DE CONFIANCE

Jusqu'à maintenant nous avons toujours déterminé les différents estimateurs de vraisemblance ou
estimateurs simples (variance, écart-type) à partir de lois (fonctions) statistiques théoriques ou mesurées sur
toute une population de données.

Nous allons maintenant aborder une approche un peu différente et importante dans l'industrie en se
demandant maintenant quelles doivent être les tailles d'échantillons pour avoir une certaine validité
(intervalle de confiance I.C.) pour les données mesurées ou encore quel écart-type ou fractile dans une loi
Normale centrée réduite (grand nombre d'échantillons), du Khi-deux, de Student ou de Fisher correspond à
un certain intervalle de confiance (nous verrons ces deux derniers cas de faibles échantillons dans la partie
traitant de l'analyse de la variance ou ANOVA) lorsque la variance ou la moyenne est connue ou
respectivement inconnue sur l'ensemble ou une partie de la population de donnée.

Indiquons que ces intervalles de confiance utilisent le théorème central limite démontré plus loin (afin
d'éviter toute frustration) et que les développements que nous allons faire maintenant nous seront également
utiles dans le domaine des Tests d'Hypothèse qui ont une place majeure en statistique!

I.C. SUR LA MOYENNE AVEC VARIANCE THEORIQUE CONNUE

Commençons par le cas le plus simple et le plus courant qui est la détermination du nombre d'échantillons
pour avoir une certaine confiance dans la moyenne des mesures effectuées d'une variable aléatoire supposée
suivre une loi Normale.

D'abord rappelons que nous avons démontré au début de ce chapitre que l'erreur-type (écart-type à la

moyenne) était : (7.55)


Maintenant, avant d'aller plus loin, considérons X comme une variable aléatoire suivant une loi Normale de
moyenne et d'écart-type . Nous souhaiterions déterminer à combien de sigma correspond un intervalle
de confiance de 95%. Pour déterminer cela, nous écrivons d'abord:

(7.56)

Remarque: Donc avec un intervalle de confiance de 95% vous aurez raison 19 fois sur 20, ou n'importe quel
autre niveau de confiance ou niveau de risque (1-niveau de confiance, soit 5%) que vous vous serez fixé à
l'avance. En moyenne, vos conclusions seront donc bonnes, mais nous ne pourrons jamais savoir si une
décision particulière est bonne! Si le niveau de risque est très faible mais que l'événement a quand même
lieu, les spécialiste parlent alors de "grande déviation".

En centrant et réduisant la variable aléatoire : (7.57)

Notons maintenant Y la variable centrée réduite : (7.58)

Puisque la loi Normale centrée réduite est symétrique : (7.59)

D'où : (7.60)

A partir de là en lisant dans les tables numériques de la loi Normale centrée réduite, nous avons pour

satisfaire cette égalité que : (7.61)

Ce qui s'obtient facilement avec MS Excel en utilisant la fonction: -NORMSINV((1-0.95)/2).

Donc : (7.62)

Ce qui est noté de façon traditionnelle dans le cas général autre que 95% par (Z n'est pas une variable
aléatoire c'est juste le facteur qui est la variable suivante) : (7.63)

Or, considérons que la variable X sur la quelle nous souhaitons faire de l'inférence statistique est justement
la moyenne (et nous démontrerons plus loin que celle-ci suit une loi Normale centrée réduite). Dès lors :

(7.64)

nous en tirons : (7.65)

Ainsi, nous pouvons maintenant savoir le nombre d'échantillons à avoir pour s'assurer un intervalle de
précision (marge d'erreur) autour de la moyenne et pour qu'un pourcentage donné des mesures se trouvent
dans cet intervalle et en supposant l'écart-type expérimental connu (ou imposé) d'avance (typiquement
utilisé dans l'ingénirie de la qualité ou les instituts de sondages).
Cependant... en réalité, la variable Z provient du théorème central limite (voir plus bas) qui donne pour un
échantillon de grande taille (approximativement):

(7.66)

En réarrangeant nous obtenons: (7.67)

et comme Z peut être négatif ou positif alors il est plus censé d'écrire cela sous la forme:

(7.68)

Soit: (7.69)

que les ingénieurs notent parfois: (7.70)

avec LCL étant la lower confidence limit et UCL la upper confidence limit. C'est de la terminologie Six
Sigma (cf. chapitre de Génie Industriel).

Et nous venons de voir plus avant que pour avoir un intervalle de confiance à 95% nous devions avoir
Z=1.96. Et puisque la loi Normale est symétrique:

(7.71)

Cela se note finalement: (7.72)

soit dans le cas d'un I.C. (intervalle de confiance) à 95%:

(7.73)

Nous sommes ainsi capables maintenant d'estimer des tailles de population nécessaires à obtenir un certain
niveau de confiance dans un résultat, soit d'estimer dans quel intervalle de confiance se trouve la moyenne
théorique par rapport à la moyenne expérimentale (empirique).

I.C. SUR LA VARIANCE AVEC MOYENNE THEORIQUE CONNUE

Commençons à démontrer une propriété fondamentale de la loi du khi-deux :

Si une variable aléatoire X suit une loi Normale centrée réduite alors son carré suit une loi du
khi-deux de degré de liberté 1 : (7.74)
Démonstration:

Pour démontrer cette propriété, il suffit de calculer la densité de la variable aléatoire avec .
Or, si et si nous posons , alors pour tout nous obtenons:

(7.75)

Puisque la loi Normale centrée réduite est symétrique par rapport à 0 pour la variable aléatoire X, nous

pouvons écrire : (7.76)

En notant la fonction de répartition de la loi Normale centrée réduite (sa probabilité cumulée en d'autres

termes pour rappel...), nous avons : (7.77)

et comme : (7.78)

alors : (7.79)

La fonction de répartition de la variable aléatoire (probabilité cumulée) est donne donnée par :

(7.80)

si y est supérieur ou égal à zéro, nulle si y inférieur à zéro. Nous noterons cette réparation pour la
suite des calculs.

Puisque la fonction de distribution est la dérivée de la fonction de répartition et que X suit une loi Normale
centrée réduite alors nous avons pour la variable aléatoire X :

(7.81)

alors nous avons pour la loi de distribution de Y (qui est donc le carré de X pour rappel!) :

(7.82)

cette dernière expression correspond exactement à la relation que nous avions obtenu lors de notre étude de
la loi du khi-deux en imposant un degré de liberté unité.

Le théorème est donc bien démontré tel que si X suit une loi Normale centrée réduite alors son carré suit une

loi du khi-deux à 1 degré de liberté tel que : (7.83)

Ce type de relation est utilisé dans les processus industriels et leur contrôle (cf. chapitre de Génie Industriel).
Nous allons maintenant utiliser un résultat démontré lors de notre étude de la loi Gamma. Nous avons
effectivement vu plus haut que la somme de deux variables aléatoires suivant une loi Gamma suit aussi une
loi Gamma dont les paramètres s'additionnent : (7.84)

Comme la loi du khi-deux n'est qu'un cas particulier de la loi Gamma, le même résultat s'applique.

Pour être plus précis, cela revient à écrire :

Si sont des variables aléatoires indépendantes (!) et identiquement distribuées N(0,1) alors par

extension de la démonstration précédente où nous avons montré que: (7.85)

et de la propriété d'addition de la loi Gamma, la somme de leurs carrés suit alors une loi du khi-deux de
degré k tel que: (7.86)

Ainsi, la loi du à k degrés de liberté est la loi de probabilité de la somme des carrés de k variables
normales centrées réduites linéairement indépendantes entre elles. Il s'agit de la propriété de linéarité de la
loi du Khi-deux (implicitement de la linéarité de la loi Gamma)!

Maintenant voyons une autre propriété importante de la loi du khi-deux : Si sont des variables
aléatoires indépendantes et identiquement distribuées (donc de même moyenne et même écart-
type et suivant une loi Normale) et si nous notons l'estimateur de maximum de vraisemblance de la variance:

(7.87)

alors, le rapport de la variable aléatoire sur l'écart-type supposé connu de l'ensemble de la population (dit
"écart-type vrai" ou "écart-type théorique" pour bien différencier!) multiplié par le nombre d'échantillons n

de la population suit une loi du khi-deux de degré n telle que : (7.88)

Remarques:

R1. En laboratoire, les peuvent être vues comme une classe d'échantillons d'un même produit
étudié identiquement par différentes équipes de recherche avec des instruments de même précision (écart-
type de mesure nul).

R2. est la "variance interclasse" également appelée "variance expliquée". Donc elle donne la variance
d'une mesure ayant eu lieu dans les différents laboratoires.

Ce qui est intéressant c'est qu'à partir du calcul de la loi du khi-deux en connaissant n et l'écart-type il est
possible d'estimer cette variance (écart-type) interclasse.

Pour voir que cette dernière propriété est une généralisation élémentaire de la relation :

(7.89)
il suffit de constater que la variable aléatoire est une somme de n carrés de N(0,1) indépendants
les uns des autres. Effectivement, rappelons qu'une variable aléatoire centrée réduite (voir notre étude de la

loi Normale) est donnée par : (7.90)

Dès lors : (7.91)

Or, puisque les variables aléatoires sont indépendantes et identiquement distribuées selon une loi

Normale, alors les variables aléatoires : (7.92)

sont aussi indépendantes et identiquement distribuées mais selon une loi Normale centrée réduite.

Puisque: (7.93)

en réarrangeant nous obtenons: (7.94)

Donc sur la population de mesures, l'écart-type vrai suit la relation donnée ci-dessus. Il est donc possible de
faire de l'inférence statistique sur l'écart-type lorsque la moyenne théorique est connue (...).

Puisque la fonction du khi-deux n'est pas symétrique, la seule possibilité pour faire l'inférence c'est de faire
appel au calcul numérique et nous noterons alors l'intervalle de confiance à 95% (par exemple...) de la

manière suivante: (7.95)

Soit en notant : (7.96)

le dénominateur étant alors bien évidemment la probabilité cumulée. Cette relation est rarement utilisée dans
la pratique car la moyenne théorique n'est pas connue. Voyons donc le cas le plus courant:

I.C. SUR LA VARIANCE AVEC MOYENNE EMPIRIQUE CONNUE

Cherchons maintenant à faire de l'inférence statistique lorsque la moyenne théorique de la population


n'est pas connue. Pour cela, considérons maintenant la somme:

(7.97)

où pour rappel est la moyenne empirique (arithmétique) de l'échantillon: (7.98)


En continuant le développement nous avons:

(7.99)

Or, nous avons démontré au début de ce chapitre que la somme des écarts à la moyenne était nulle. Donc:

(7.100)

et reprenons l'estimateur sans biais de la loi Normale (nous changeons de notation pour respecter les
traditions et bien différencier la moyenne empirique de la moyenne théorique):

(7.101)

Dès lors: (7.102)

ou autrement écrit: (7.103)

Puisque le deuxième terme (au carré) suit une loi Normale centrée réduite aussi, alors si nous le supprimons
nous obtenons de par la propriété démontrée plus haut de la loi du Khi-deux:

(7.104)

Ces développements nous permettent cette fois-ci de faire aussi de l'inférence sur la variance d'une loi
lorsque les paramètres et sont tous les deux inconnus pour l'ensemble de la population. C'est
ce résultat qui nous donne, par exemple, l'intervalle de confiance:

(7.105)

lorsque la moyenne théorique est donc inconnue.


I.C. SUR LA MOYENNE AVEC MOYENNE EMPIRIQUE CONNUE

Nous avons démontré beaucoup plus haut que la loi de Student provenait de la relation suivante:

(7.106)

si Z et U sont des variables aléatoires indépendantes et si Z suit une loi Normale centrée réduite N(0,1) et U
une loi du khi-deux tel que:

(7.107)

Voici une application très importante du résultat ci-dessus:

Supposons que constituent un échantillon aléatoire de taille n issu de la loi . Alors nous
pouvons déjà écrire que selon les développements faits plus haut:

(7.108)

Et pour U qui suit une loi , si nous posons alors selon les résultats obtenus plus haut:

(7.109)

Nous avons alors après quelques simplifications triviales:

(7.110)

Donc puisque: (7.111)

suit une loi de Student de paramètre k alors: (7.112)

suit aussi une loi de Student de paramètre n-1.

Ce qui nous donne aussi: (7.113)


Ce qui nous permet de faire de l'inférence sur la moyenne d'une loi Normale d'écart-type inconnu mais
dont l'estimateur sans biais de l'écart-type est connu (donc l'écart-type théorique est inconnu!). C'est ce
résultat qui nous donne l'intervalle de confiance:

(7.114)

où nous retrouvons les mêmes indices que pour l'inférence statistique sur la moyenne d'une variable aléatoire
d'écart-type connu puisque la loi de Student est symétrique!

Remarque: Le résultant précédent fut obtenu par William S. Gosset aux alentours de 1910. Gosset qui avait
étudié les mathématiques et la chimie, travaillait comme statisticien pour la brasserie Guinness en
Angleterre. À l'époque, on savait que si sont des variables aléatoires indépendantes et

identiquement distribuées alors: (7.115)

Toutefois, dans les applications statistiques on s'intéressait bien évidemment plutôt à la quantité:

(7.116)

on se contentait alors de supposer que cette quantité suivait à peu près une loi Normale centrée réduite ce qui
n'était pas une mauvais approximation comme le montre l'image ci-dessous ( ):

(7.117)

Suite à de nombreuses simulations, Gosset arriva à la conclusion que cette approximation était valide
seulement lorsque n est suffisamment grand (donc cela lui donnait l'indication comme quoi il devait y avoir
quelque part derrière le théorème central limite). Il décida de déterminer l'origine de la distribution et après
avoir suivi un cours de statistique avec Karl Pearson il obtint son fameux résultat qu'il publia sous le
pseudonyme de Student. Ainsi, on appelle loi de Student la loi de probabilité qui aurait dû être appelée la loi
ou fonction de Gosset.
Signalons enfin que le test de student est très utilisée pour identifier si des variations (progressions ou
l'inverse) de la moyenne de chiffres de deux populations identiques sont significatives.

LOI FAIBLE DES GRANDS NOMBRES

Nous allons maintenant nous attarder sur une relation très intéressante en statistique qui permet de dire pas
mal de choses tout en ayant peu de données et ce quelque soit la loi considérée (ce qui est pas mal quand
même!). C'est une propriété très utilisée en simulation statistique par exemple dans le cadre de l'utilisation
de Monte-Carlo.

Soit une variable aléatoire à valeurs dans . Alors nous allons démontrer la relation suivante appelée

"inégalité de Markov" : (7.118)

avec dans le contexte particulier des probabilités.

En d'autres termes, nous proposons de démontrer que la probabilité qu'une variable aléatoire soit plus grande
ou égale qu'une valeur est inférieure ou égale à son espérance divisée par la valeur considérée et ce
quelle que soit la loi de distribution de la variable aléatoire X!

Démonstration:

Notons les valeurs de X par , où (c'est-à-dire triées par ordre croissant) et


posons . Nous remarquons d'abord que l'inégalité est triviale au cas ou . Effectivement,
comme X ne peut être compris qu'entre 0 et par définition alors la probabilité qu'il soit supérieure à
est nul. En d'autres termes : (7.119)

et X étant positif, E(X) l'est aussi, d'où l'inégalité pour ce cas particulier dans un premier temps.

Sinon, nous avons et il existe alors un tel que . Donc :

(7.120)

Exemple :

Nous supposons que le nombre de pièces sortant d'une usine donnée en l'espace d'une semaine est une
variable aléatoire d'espérance 50. Si nous souhaitons estimer la probabilité cumulée que la production
dépasse 75 pièces nous appliquerons simplement :

(7.121)

Considérons maintenant une sorte de généralisation de cette inégalité appelée "inégalité de Bienaymé-
Tchebychev" (abrégée "inégalité BT") qui va nous permettre d'obtenir un résultat très intéressant un peu plus
bas.
Considérons une variable aléatoire X. Alors nous allons démontrer l'inégalité de Bienaymé-

Tchebychev suivante: (7.122)

qui exprime le fait que plus l'écart-type est petit, plus la probabilité que la variable aléatoire X s'éloigne de
sont espérance est faible.

Nous obtenons cette inégalité en écrivant d'abord :

(7.123)

et le choix du carré va nous servir pour une simplification future.

Puis en appliquant l'inégalité de Markov (comme quoi c'est quand même utile...) à la variable aléatoire

avec il vient automatiquement :

(7.124)

Ensuite, en utilisant la définition de la variance:

(7.125)

Nous obtenons bien: (7.126)

Si nous posons: (7.127)

l'inégalité s'écrit: (7.128)

et exprime que la probabilité que pour que X s'éloigne de son espérance de plus que t fois son écart-type, est
inférieure à . Il y a, en particulier, moins de 1 chance sur 9 pour que X s'éloigne de son espérance de
plus de trois fois l'écart-type.

Exemple :

Nous reprenons l'exemple où le nombre de pièces sortant d'une usine donnée en l'espace d'une semaine est
une variable aléatoire d'espérance 50. Nous supposons en plus que la variance de la production
hebdomadaire est de 25. Nous cherchons à calculer la probabilité que la production de la semaine prochaine
soit comprise entre 40 et 60 pièces.

Pour calculer ceci il faut d'abord se souvenir que l'inégalité de BT est basée en parties sur le terme
donc nous avons : (7.129)
donc l'inégalité de BT nous permet bien de travailler sur des intervalles égaux en valeur absolue ce qui
s'écrit aussi : (7.130)

Ensuite, ne reste plus qu'à appliquer simplement l'inégalité numériquement :

(7.131)

Ces deux dernières inégalités vont nous permettre d'obtenir une relation très importante et puissante que
nous appelons la "loi faible des grands nombres" (L.F.G.N.) ou encore "théorème de Khintchine".

Considérons une variable aléatoire X admettant une variance et une suite de variables aléatoires
indépendantes (donc non corrélées deux-deux) de même loi que X et ayant toutes les mêmes espérances
et les mêmes écarts-types .

Ce que nous allons montrer est que si nous mesurons une même quantité aléatoire de même loi au cours
d'une suite d'expériences indépendantes (alors dans ce cas, nous disons techniquement que la suite
de variables aléatoires sont définies sur le même espace probabilisé), alors la moyenne
arithmétique des valeurs observées va se stabiliser sur l'espérance de X quand le nombre de mesures est
infiniment élevée.

De manière formelle ceci s'exprime sous la forme :

(7.132)

lorsque .

Donc en d'autres termes la probabilité cumulée que la différence entre la moyenne arithmétique et
l'espérance des variables aléatoires observées soit compris dans un intervalle autour de la moyenne tend vers
zéro quand le nombre de variables aléatoires mesurées tend vers l'infini (ce qui est finalement intuitif).

Ce résultat nous permet d'estimer l'espérance mathématique en utilisant la moyenne empirique


(arithmétique) calculée sur un très grand nombre d'expériences.

Démonstration:

Nous utilisons l'inégalité de Bienaymé-Tchebychev pour la variable aléatoire (cette relation s'interprète

difficilement mais permet d'avoir le résultat escompté) : (7.133)

Et nous calculons d'abord en utilisant les propriétés mathématiques de l'espérance que nous avions
démontrées plus haut:

(7.134)

et dans un deuxième temps en utilisant les propriétés mathématiques de la variance aussi déjà démontrées
plus haut :
(7.135)

et puisque nous avons supposé les variables non corrélées entre elles alors la covariance est nulle dès lors :

(7.136)

Donc en injectant cela dans l'inégalité BT : (7.137)

nous avons alors : (7.138)

qui devient : (7.139)

et l'inégalité tend bien vers zéro quand n au numérateur tend vers l'infini.

Signalons que cette dernière relation est souvent notée dans certains ouvrages et conformément à ce que

nous avons vu au début de ce chapitre: (7.140)

ou encore: (7.141)

Donc, pour : (7.142)

FONCTION CARACTÉRISTIQUE

Avant de donner une démonstration à la manière ingénieur du théorème central limite, introduisons d'abord
la conception de "fonction caractéristique" qui tient une place centrale en statistiques.

D'abord, rappelons que la transformée de Fourier est donnée dans sa version physicienne par (cf. chapitre de

Suites et Séries) la relation: (7.143)

Rappelons que la transformation de Fourier est un analogue de la théorie des séries de Fourier pour les
fonctions non périodiques, et permet de leur associer un spectre en fréquences.

Nous souhaitons maintenant démontrer que si: alors (7.144)

En d'autres termes, nous cherchons une expression simplifiée de la transformée de Fourier de la dérivée de
f(x).
Démonstration:

Nous partons donc de: (7.145)

Une intégration par parties donne :

(7.146)

En imposant que, f tend vers zéro à l'infini, nous avons alors: (7.147)

et: (7.148)

C'est la premier résultat dont nous avions besoin.

Maintenant, démontrons que si: alors (7.149)

Démonstration:

Nous partons donc de:

(7.150)

C'est le deuxième résultat dont nous avions besoin.

Maintenant effectuons le calcul de la transformée de Fourier de la loi Normale centrée-réduite (ce choix n'est

pas innocent...) : (7.151)

Nous savons que cette dernière relation est trivialement solution de l'équation différentielle (ou bien elle
vérifie) : (7.152)

en prenant la transformée de Fourier des deux côté de l'égalité, nous avons en utilisant les deux résultats
précédents: alors (7.153) alors

Nous avons: (7.154)

Ou encore: (7.155)
Donc après intégration: (7.156)

Nous avons:

(7.157)

Nous avons démontré lors de notre étude de la loi Normale que: (7.158)

Donc: (7.159)

Nous avons alors (résultat important!): (7.160)

Introduisons maintenant la fonction caractéristique telle que définie par les statisticiens:

(7.161)

qui est un outil analytique important et puissant permettant d'analyser une somme de variables aléatoires
indépendantes. De plus, cette fonction contient toutes les informations caractéristiques de la variable
aléatoire X.

Remarque: La notation n'est pas innocente puisque le E[...] représente une espérance de la fonction de
densité par rapport à l'exponentielle complexe.

Donc la fonction caractéristique de la variable aléatoire normale centrée réduite de distribution:

(7.162)

devient simple à déterminer car: (7.163)

raison pour laquelle la fonction caractéristique de la loi Normale centrée réduite est souvent assimilée à une
simple transformée de Fourier.

Et grâce au résultat précédent: (7.164)

Donc: (7.165)
qui est le résultat dont nous avons besoin pour le théorème central limite.

Mais avant cela, regardons d'un peu plus près cette fonction caractéristique:

(7.166)

En développement de MacLaurin nous avons (cf. chapitre Suites et Séries) et en changeant un peu les
notations:

(7.167)

et en intervertissant la somme et l'intégrale, nous avons:

(7.168)

Cette fonction caractéristique contient donc tous les moments (terme général utilisé pour l'écart-type et
l'espérance) de X.

THÉORÈME CENTRAL LIMITE

Le théorème central limite est un ensemble de résultats du début du 20ème siècle sur la convergence faible
d'une suite de variables aléatoires en probabilité. Intuitivement, d'après ces résultats, toute somme
(implicitement: la moyenne de ses variables) de variables aléatoires indépendantes et identiquement
distribuées tend vers une certaine variable aléatoire. Le résultat le plus connu et le plus important est
simplement appelé "théorème central limite" qui concerne une somme de variables aléatoires dont le nombre
tend vers l'infini et c'est celui-ci que nous allons démontrer de manière heuristique ici.

Dans le cas le plus simple, considéré ci-dessous pour la démonstration du théorème, ces variables sont
continues, indépendantes et possèdent la même moyenne et la même variance. Pour tenter d'obtenir un
résultat fini, il faut centrer cette somme en lui soustrayant sa moyenne et la réduire en la divisant par son
écart-type. Sous des conditions assez larges, la loi de probabilité (de la moyenne) converge alors vers une loi
Normale centrée réduite. L'omniprésence de la loi Normale s'expliquant par le fait que de nombreux
phénomènes considérés comme aléatoires sont dus à la superposition de causes nombreuses.

Ce théorème de probabilités possède donc une interprétation en statistique mathématique. Cette dernière
associe une loi de probabilité à une population. Chaque élément extrait de la population est donc considéré
comme une variable aléatoire et, en réunissant un nombre n de ces variables supposées indépendantes, nous
obtenons un échantillon. La somme de ces variables aléatoires divisée par n donne une nouvelle variable
nommée la moyenne empirique. Celle-ci, une fois réduite, tend vers une variable Normale réduite lorsque n
tend vers l'infini comme nous le savons.

Le théorème central limite nous dit à quoi il faut s'attendre en matière de sommes de variables aléatoires
indépendantes. Mais qu'en est-il des produits ? Eh bien, le logarithme d'un produit (à facteurs strictement
positifs) est la somme des logarithmes des facteurs, de sorte que le logarithme d'un produit de variables
aléatoires (à valeurs strictement positives) tend vers une loi Normale, ce qui entraîne une loi log-Normale
pour le produit lui-même.
En elle-même, la convergence vers la loi Normale de nombreuses sommes de variables aléatoires lorsque
leur nombre tend vers l'infini n'intéresse que le mathématicien. Pour le praticien, il est intéressant de s'arrêter
un peu avant la limite : la somme d'un grand nombre de ces variables est presque gaussienne, ce qui fournit
une approximation souvent plus facilement utilisable que la loi exacte.

En s'éloignant encore plus de la théorie, on peut dire que bon nombre de phénomènes naturels sont dus à la
superposition de causes nombreuses, plus ou moins indépendantes. Il en résulte que la loi Normale les
représente de manière raisonnablement efficace.

A l'inverse, on peut dire qu'aucun phénomène concret n'est vraiment gaussien car il ne peut dépasser
certaines limites, en particulier s'il est à valeurs positives.

Démonstration:

Soit une suite (échantillon) de variables aléatoires continues (dans notre démonstration
simplifiée...), indépendantes (mesures de phénomènes physiques ou mécaniques indépendants par exemple)
et identiquement distribuées, dont la moyenne et l'écart-type existent.

Nous avons vu au début de ce chapitre que: (7.169)

sont les mêmes expressions d'une variable centrée réduite générée à l'aide d'une suite de n variables
aléatoires identiquement distribuées qui par construction a donc une moyenne nulle et une variance unitaire:

et (7.170)

Développons la première forme de l'égalité antéprécédente (elles sont de toute façon égales les deux!):

(7.171)

Maintenant utilisons la fonction caractéristique de la loi Normale centrée-réduite:

(7.172)

Comme les variables aléatoires sont indépendantes et identiquement distribuées, il vient:

(7.173)
Un développement de Taylor du terme entre accolades donne au troisième ordre:

(7.174)

Finalement:

(7.175)

Posons: (7.176)

Nous avons alors: (7.177)

Nous avons donc quand x tend vers l'infini (cf. chapitre d'Analyse fonctionnelle):

(7.178)

Nous retrouvons donc la fonction caractéristique de la loi Normale centrée réduite!

En deux mots, le Théorème Central Limite (TCL) dit que pour de grands échantillons, la somme centrée et
réduite de n variables aléatoires identiquement distribuées suit une loi Normale centrée et réduite. Et donc
nous avons in extenso pour la moyenne empirique:
(7.179)

Malgré l'immensité de son champ d'applications, le TCL n'est pas universel. Dans sa forme la plus simple, il
impose en particulier à la variable considérée d'avoir des moments du premier et du deuxième ordre
(moyenne et variance). Si tel n'est pas le cas, il ne s'applique plus.

L'exemple le plus simple d'échec du TLC est donné par la distribution de Cauchy, qui n'a ni moyenne, ni
variance, et dont la moyenne empirique a toujours la même distribution (Cauchy) quelle que soit la taille de
l'échantillon.

Maintenant, nous allons illustrer le théorème central limite dans le cas d'une suite de variables
aléatoires indépendantes discrètes suivant une loi de Bernoulli de paramètre 1/2.

Nous pouvons imaginer que représente le résultat obtenu au n-ème lancé d'une pièce de monnaie (en

attribuant le nombre 1 pour pile et 0 pour face). Notons: (7.180)

la moyenne. Nous avons pour tout n bien évidemment: (7.181)

et donc: (7.182)

Après avoir centré et réduit nous obtenons: (7.183)

Notons la fonction de répartition de la loi Normale centrée réduite.

Le théorème central limite nous dit que pour tout : (7.184)

A l'aide de Maple nous avons tracé en bleu quelques graphiques de la fonction:

(7.185)

pour différentes valeurs de n. Nous avons représenté en rouge la fonction .


: (7.186)

: (7.187)
(7.188)

(7.189)

Ces graphiques obtenus avec Maple à l'aide des commandes suivantes:

> with(stats):
> with(plots):
> e1:=plot(Heaviside(t+1)*statevalf[dcdf,binomiald[1,0.5]](trunc((t+1)/2)),t=-2..2,y=0..1,color=blue):
> e2:=plot(Heaviside(t+sqrt(2))*statevalf[dcdf,binomiald[2,0.5]](trunc((t*sqrt(2)+2)/2)),t=-sqrt(2)-
1..sqrt(2)+1,y=0..1,color=blue):
> e3:=plot(Heaviside(t+sqrt(5))*statevalf[dcdf,binomiald[5,0.5]](trunc((t*sqrt(5)+5)/2)),t=-sqrt(5)-
1..sqrt(5)+1,y=0..1,color=blue):
> e4:=plot(statevalf[cdf,normald](t),t=-5..5):
> e5:=plot(Heaviside(t+sqrt(30))*statevalf[dcdf,binomiald[30,0.5]](trunc((t*sqrt(30)+30)/2)),t=-sqrt(30)-
1..sqrt(30)+1,y=0..1,color=blue):
> display({e1,e4});
> display({e2,e4});
> display({e4,e3});
> display({e5,e4});

montrent bien la convergence de vers .

En fait nous remarquons que la convergence est carrément uniforme ce qui est confirmé par le "théorème
central limite de Moivre-Laplace":

Soit une suite de variables aléatoires indépendantes de même loi de Bernoulli de paramètre p, .

Alors: (7.190)

tend uniformément vers sur lorsque .

TESTS D'HYPOTHÈSE (OU D'ADÉQUATION)

Lors de notre étude des intervalles de confiance, rappelons nous sommes arrivées aux relations suivantes:

(7.191)

et: (7.192)

et: (7.193)

et enfin: (7.194)

qui permettaient donc de faire de l'inférence statistique en fonction de la connaissance ou non de la moyenne
ou de la variance vraie sur la totalité ou sur un échantillon de la population. En d'autres termes de savoir
dans quelles bornes se situait un moment (moyenne ou variance) en fonction d'un certain niveau de
confiance imposé. Nous avions vu que le deuxième intervalle ci-dessus ne peut être que difficilement utilisé
dans la pratique (suppose la moyenne théorique connue) et nous lui préférons donc le troisième.

Nous allons également démontré en détails plus loin les deux intervalles suivants:

(7.195)

et: (7.196)
Le premier intervalle ci-dessus ne peut être lui aussi que difficilement utilisé dans la pratique (suppose la
moyenne théorique connue) et nous lui préférons donc le deuxième.

Lorsque nous cherchons à savoir si nous pouvons faire confiance à la valeur d'un moment ou d'une variable
aléatoire en général avec une certaine confiance, nous parlons de "test d'hypothèse" ou "test d'adéquation"
ou encore de "test de conformité".

Les tests d'hypothèses sont destinés à vérifier si un échantillon peut être considéré comme extrait d'une
population donnée ou représentatif de cette population, vis-à-vis d'un paramètre comme la moyenne, la
variance ou la fréquence observée. Ceci implique que la loi théorique du paramètre est connue au niveau de
la population.

Par exemple, si nous souhaitons savoir avec une certaine confiance si une moyenne donnée d'un échantillon
de population est réaliste par rapport à la vraie moyenne théorique inconnue, nous utiliserons le "test-Z" qui
est simplement:

(7.197)

si la moyenne de toute la population se trouve bien dans les bornes pour la confiance donnée, la moyenne de
l'échantillon test de taille n avec l'écart-type de toute la population connue!

Maintenant rappelons que nous avons démontré que si nous avions deux variables aléatoires de loi:

(7.198)

alors la soustraction (différencier) des moyennes donne: (7.199)

Donc pour la différence de deux moyennes de variables aléatoires provenant de deux échantillons de

population nous obtenons directement: (7.200)

Nous pouvons alors adapter le test-Z sous la forme: (7.201)

Cette relation est très utile lorsque pour deux échantillons de deux populations de données, nous voulons
vérifier s'il existe une différence significative des différences des moyennes théoriques à un niveau de
confiance donné et la probabilité associée pour avoir cette différence par exemple donné par:

(7.202)

Donc: (7.203)

Nous parlons du "test-Z de la moyenne à deux échantillons" et il est beaucoup utilisé dans l'industrie pour
vérifier l'égalité de la moyenne de deux populations de mesures.
Et si l'écart-type théorique n'est pas connu, nous utiliserons les "test-T" de Student:

(7.204)

Dans la même idée pour l'écart-type, nous utiliserons le "test du khi-deux":

(7.205)

Et lorsque nous voulons tester l'égalité de la variance de deux populations nous utilisons le "test-F" de
Fisher (démontré plus bas lors de notre étude de l'analyse de la variance):

(7.206)

Le fait que nous obtenions alors l'ensemble des valeurs satisfaisant à ce test borné à droite et (!) à gauche est
ce que nous appelons dans le cas général un "test bilatéral" car il comprend le test unilatéral à gauche et
unilatéral à droite. Ainsi, tous les tests susmentionnés sont dans une forme bilatérale mais nous pourrions en
faire une analyse unilatérale aussi!

Signalons aussi que les tests d'hypothèses sur l'écart-type (variance), la moyenne ou la corrélation sont
appelés des "tests paramétriques" à l'inverse des tests non-paramétriques que nous verrons plus loin.

Remarque: Il existe également une autre définition du concept de test paramétrique et non-paramétrique
(complétement différente). Mais sur ce site web nous préférerons utiliser celle mentionnée ci-dessus.

Enfin, de nombreux logiciels calculent ce que nous appelons la "p-value" qui est généralement le risque
limite pour lequel nous passons de l'état d'hypothèse acceptée à l'état refusée.

Pour un test , le 5% de risque est le risque de rejeter l'hypothèse alors même qu'elle est vraie. Si le risque est
5% et que la p-value est supérieure, le test échoue (rejet de l'hypothèse). Nous rejetons l'hypothèse si la p-
value est plus faible que 5%.

Remarque: Nous ne devrions jamais dire que nous "acceptons" une hypothèse ou encore qu'elle soit "vraie"
ou "fausse" car ces termes sont trop forts. Nous devons dire si nous "rejetons" ou non l'hypothèse et qu'elle
est éventuellement "correcte" ou "non correcte".

Nous allons dans ce qui suit démontrer l'origine du test F de Fisher et par la même occasion nous
introduirons deux autres tests qui sont le "test-T homoscédastique" et le "test-T hétéroscédastique".

ANALYSE DE LA VARIANCE (ANOVA A UN FACTEUR)

L'objectif de l'analyse de la variance (contrairement à ce que son nom pourrait laisser penser) est une
technique statistique permettant de comparer les moyennes de deux populations ou plus (très utilisé dans le
pharma ou dans les labos de R&D ou de bancs d'essais). Cette méthode, néanmoins, doit son nom au fait
qu'elle utilise des mesures de variance afin de déterminer le caractère significatif, ou non, des différences de
moyenne mesurées sur les populations.

Plus précisément, la vraie signification est de savoir si le fait que des moyennes d'échantillons sont
(légèrement) différentes peut être attribué au hasard de l'échantillonnage ou provient du fait que les
échantillons sont significativement différents (si nous avons les valeurs de toute la population, nous n'avons
rien à faire!).
Pour l'analyse de la variance abrégée "ANOVA" (ANalysis Of VAriance) ou "ANAVAR" (ANAlyse de la
VARiance) nous allons d'abord rappeler, comme nous l'avons démontré, que la loi de Fisher-Snedecor est
donnée par le rapport de deux variables aléatoires indépendantes suivant une loi du khi-deux et divisée par
leur degré de liberté tel que:

(7.207)

et nous allons voir maintenant son importance.

Considérons un échantillons aléatoire de taille n, disons issu de la loi et un


échantillon aléatoire de taille m, disons issu de la loi .

Considérons les estimateurs de maximum de vraisemblance de l'écart-type de la loi Normale


traditionnellement notée dans le domaine de l'analyse de la variance par:

et (7.208)

Les statistiques ci-dessus sont les statistiques que nous utiliserions pour estimer les variances si les
moyennes théoriques sont connues. Donc nous pouvons utiliser un résultat démontré plus haut lors
de notre étude des intervalles de confiance:

(7.209)

Comme les sont indépendantes des (hypothèse!), les variables: (7.210)

sont indépendantes l'une de l'autre.

Nous pouvons donc appliquer la loi de Fisher-Snedecor avec: et (7.211)

ainsi que: et (7.212)

Nous avons donc: (7.213)


Soit: (7.214)

Ce théorème nous permet de déduire l'intervalle de confiance du rapport de deux variances lorsque la
moyenne théorique est connue. Puisque la fonction du Fisher n'est pas symétrique, la seule possibilité pour
faire l'inférence c'est de faire appel au calcul numérique et nous noterons alors pour un intervalle de
confiance donné le test de la manière suivante:

(7.215)

Dans le cas où les moyennes sont inconnues, nous utilisons l'estimateur sans biais de la variance
traditionnellement notée dans le domaine de l'analyse de la variance par:

et (7.216)

Pour estimer les variances théoriques, nous utilisons le résultat démontré plus haut:

et (7.217)

Comme les sont indépendantes des (hypothèse!), les variables:

(7.218)

sont indépendantes l'une de l'autre. Nous pouvons donc appliquer la loi de Fisher-Snedecor avec:

et (7.219)

ainsi que: et (7.220)

Nous avons donc: (7.221)

Soit: (7.222)

Ce théorème nous permet de déduire l'intervalle de confiance du rapport de deux variances lorsque la
moyenne empirique est connue. Puisque la fonction du Fisher n'est pas symétrique, la seule possibilité pour
faire l'inférence c'est de faire appel au calcul numérique et nous noterons alors pour un intervalle de
confiance donné le test de la manière suivante:

(7.223)

R. A. Fisher (1890-1962) est, comme Karl Pearson, l'un des principaux fondateurs de la théorie moderne de
la statistique. Fisher étudia à Cambridge où il obtint en 1912 un diplôme en astronomie. C'est en étudiant la
théorie de l'erreur dans les observations astronomiques que Fisher s'intéressa à la statistique. Fisher est
l'inventeur de la branche de la statistique appelée l'analyse de la variance.

Au début du 20ème siècle, R. Fischer développe donc la méthodologie des plans d'expérience. Pour valider
l'utilité d'un facteur, il met au point un test permettant d'assurer que des échantillons différents sont de
natures différentes. Ce test est basé sur l'analyse de la variance (des échantillons), et nommé ANOVA
(analyse normalisée de la variance).

Prenons k échantillons de n valeurs aléatoires chacun (appelé "facteur explicatif" dans l'analyse de la
variance). Chacune des valeurs étant considérée comme une observation ou une mesure de quelque chose.
Nous aurons donc un nombre total de N d'observations (mesures) donnée par: (7.224)

si chacun des échantillons a un nombre identique de valeurs tel que .

Nous considérerons que chacun des k échantillons est issu (suit) d'une variable aléatoire suivant une loi
Normale.

En termes de test, nous voulons tester si les moyennes des k échantillons sont égales sous l'hypothèse que
leurs variances sont égales. Ce que nous écrivons sous forme d'hypothèse de la manière suivante:

(7.225)

Autrement dit: les échantillons sont représentatifs d'une même population (d'une même loi statistique). C'est-
à-dire que les variations constatées entre les valeurs des différents échantillons sont dues essentiellement au
hasard. Pour cela nous étudions la variabilité des résultats dans les échantillons et entre les échantillons.

Nous noterons i l'indice d'échantillon (de 1 à k) et j l'indice de l'observation (de 1 à n). Donc sera la
valeur de la j-ème observation de l'échantillon de données numéro i.

Selon l'hypothèse susmentionnée, nous avons: (7.226)

Nous noterons par la moyenne empirique/estimée (arithmétique) de l'échantillon i :

(7.227)

et la moyenne empirique/estimée des N valeurs (soit la moyenne des ) donnée donc par:
(7.228)

En utilisant les propriétés de l'espérance et de la variance déjà démontrées plus haut nous savons que:

et (7.229)

avec qui est la moyenne des moyennes vraies : (7.230)

Maintenant, introduisons la "variance totale" comme étant la variance estimée sans biais en considérant
l'ensemble des N observations comme un seul échantillon:

(7.231)

où rappelons que le terme au numérateur est appelé "variation totale".

La variance entre échantillons (c'est-à-dire entre les moyennes des échantillons) est l'estimateur de la
variance des moyennes des échantillons:

(7.232)

Comme nous avons démontré que si toutes les variables sont identiquement distribuées (même variance) la
variance des individus vaut n fois celle de la moyenne:

(7.233)

alors la variance des observations (variables aléatoires dans un échantillon) est donnée par :

(7.234)

Nous avons donc ci-dessus l'hypothèse de l'égalité des variances qui est exprimée sous forme mathématique
pour les développements à suivre.

La variance résiduelle est l'effet des facteurs dits non contrôlés. C'est par définition la moyenne des
variances des échantillons.

(7.235)
Au final, ces indicateurs sont parfois résumés sous la forme suivante:

(7.236)

Remarquons que si les échantillons n'ont pas la même taille (ce qui est rare), nous avons alors:

(7.237)

Remarques:

R1. Le terme est souvent indiqué dans l'industrie par l'abréviation SST signifiant en anglais "Sum of
Squares Total" ou plus rarement TSS pour "Total Sum of Square".

R2. Le terme est souvent indiqué dans l'industrie par l'abréviation SSB signifiant en anglais "Sum of
Squares Between (samples)" ou plus rarement SSk pour "Sum of Squared Beetween treatments".

R3. Le terme est souvent indiqué dans l'industrie par l'abréviation SSW signifiant en anglais "Sum of
Squares Within (samples)" ou plus rarement SSE pour "Sum of Squared due to Errors".

Indiquons que nous voyons souvent dans la littérature (nous réutiliserons un peu plus loin cette notation):

(7.238)

avec donc l'estimateur sans biais de la variance des observations: (7.239)

Avant d'aller plus loin, arrêtons-nous sur la variance résiduelle. Nous avons donc pour des échantillons qui

ne sont pas de même taille: (7.240)


Ouvrons maintenant une petite parenthèse... Prenons le cas particulier deux échantillons seulement. Nous
pouvons alors écrire:

(7.241)

Soit en introduisant l'estimateur de maximum de vraisemblance de la variance:

(7.242)

Nous pouvons d'ailleurs observer que dans le cas particulier où: (7.243)

alors: (7.244)

Donc: (7.245)

Supposons maintenant que nous souhaitions comparer avec un certain intervalle de confiance la moyenne de
deux populations ayant une variance différente pour savoir si elles sont de natures différentes ou non.

Nous connaissons pour le moment deux tests pour vérifier les moyennes. Le test-Z et le test-T. Comme dans
l'industrie il est rare que nous ayons le temps de prendre des grands échantillons, concentrons-nous sur le
deuxième que nous avions démontré plus haut:

(7.246)

Et rappelons aussi que: (7.247)

Maintenant rappelons que nous avons démontré que si nous avions deux variables aléatoires de loi:

(7.248)

alors la soustraction (différencier) des moyennes donne: (7.249)

Donc pour la différence de deux moyennes de variables aléatoires provenant de deux échantillons de
population nous obtenons directement:

(7.250)

Et maintenant l'idée est de prendre l'approximation (sous l'hypothèse que les variances sont égales):
(7.251)

Cette approximation est appelée "hypothèse homoscédastique".

Nous avons alors l'intervalle de confiance:

(7.252)

Comme l'idée est de tester l'égalité des moyennes théoriques à partir des estimateurs connus alors:

(7.253)

avec: (7.254)

Dans la plupart des logiciels disponibles sur le marché, le résultat est uniquement donné à partir du fait que
le que nous avons est compris dans le correspondant à l'intervalle de confiance donné rappelons-

le par: (7.255)

dans le cas de l'hypothèse homoscédastique (égalité des variances) sinon par:

(7.256)

dans l'hypothèse hétéroscédasticité (non égalité des variances).

Donc: (7.257)

Si nous faisons ce test avec deux échantillons à variances égales, nous parlons du "t-test homoscédastique",
sinon du "test-t hétéroscédastique". Bref, fermons cette parenthèse et revenons à nos moutons... Nous en
étions donc au tableau suivant:

(7.258)
où nous avons donc le cas d'échantillons de même taille:

(7.259)

Ainsi que la variance totale qui est la somme de la variance des moyennes (interclasses) et de la variance
résiduelle (intra-classes) et ce que les échantillons soient de même taille ou non: (7.260)

Effectivement: (7.261)

Or, nous avons: (7.262)

car: (7.263)

Donc: (7.264)

Sous les hypothèses mentionnées au début (égalité des moyennes entre échantillons) nous avons:

(7.265)

ce qui découle immédiatement de la démonstration que nous avions fait lors de notre étude de l'inférence
statistique où nous avions obtenu:

(7.266)

Ce que nous souhaitons faire c'est voir s'il y a une différence entre la variance des moyennes (interclasses) et
de la variance résiduelle (intra-classes). Pour comparer deux variances lorsque les moyennes vraies sont
inconnues nous avons vu que le mieux était d'utiliser le test de Fisher.

De même, nous avons: (7.267)

Effectivement, d'abord nous avons: (7.268)


Donc de par la linéarité de la loi du Khi-deux: (7.269)

puisque: (7.270)

et parce que: (7.271)

Donc pour résumer nous avons: et (7.272)

et puisque , nous avons alors:

(7.273)

C'est maintenant qu'intervient la loi de Fisher dans l'hypothèse où les variances sont égales! Puisque:

et (7.274)

Or, nous avons démontré dans notre étude de la loi de Fisher un peu plus haut que:

(7.275)

où dans notre cas d'étude: (7.276)

Indiquons encore que la relation précédente: (7.277)

et souvent indiquée dans la littérature sous la formation suivante: (7.278)

où MSK est appelé "Mean Square for treatments" et MSE "Mean Square for Error".

Remarque: S'il y a seulement deux populations, il faut bien comprendre qu'à ce moment l'utilisation du test-
T de Student suffit amplement.
Tout les calculs que nous avons fait sont très souvent représentés dans les logiciels sous la forme d'une table
standardisée donc voici la forme et le contenu (c'est ainsi que le présente MS Excel ou Minitab par
exemple):

Source Somme des carrés Moyenne des F Valeur critique F


ddl du
carrés
Inter- k-1
Classe

Intra- N-k
Classe

Total N-1

Tableau: 7.1 - Terminologie et paramètres traditionnels d'une ANOVA à un facteur

ainsi, pour que l'hypothèse soit acceptée, il faut que la valeur de: (7.279)

soit plus petite ou égale à au centile de la même loi F avec une probabilité cumulée à l'intervalle de
confiance imposé.

TEST D'AJUSTEMENT DU KHI-DEUX

Nous allons étudier ici notre premier test d'hypothèse non-paramétrique, un des plus connus certainement et
des plus simples.

Supposons qu'une variable statistique suive une loi de probabilité P. Si nous tirons un échantillon dans la
population correspondant à cette loi, la distribution observée s'écartera toujours plus ou moins de la
distribution théorique, compte tenu des fluctuations d'échantillonnage.

Généralement, nous ne connaissons ni la forme de la loi P, ni la valeur de ses paramètres. C'est la nature du
phénomène étudié et l'analyse de la distribution observée qui permettent de choisir une loi susceptible de
convenir et d'en estimer les paramètres.

Les écarts entre la loi théorique et la distribution observée peuvent être attribués soit aux fluctuations
d'échantillonnage, soit au fait que le phénomène ne suit pas, en réalité, la loi supposée.

En gros, si les écarts sont suffisamment faibles, nous admettrons qu'ils sont imputables aux fluctuations
aléatoires et nous accepterons la loi retenue ; au contraire, s'ils sont trop élevés, nous en conclurons qu'ils ne
peuvent pas être expliqués par les seules fluctuations et que le phénomène ne suit pas la loi retenue.

Pour évaluer ces écarts et pouvoir prendre une décision, il faut :

1. Définir la mesure de la distance entre distribution empirique et distribution théorique résultant de la loi
retenue.

2. Déterminer la loi de probabilité suivie par cette variable aléatoire donnant la distance

3. Énoncer une règle de décision permettant de dire, d'après la distribution observée, si la loi retenue est
acceptable ou non.
Nous aurons pour cela besoin du théorème central limite et deuxièmement rappelons que lors lors de la

construction de la loi Normale, nous avons montré que la variable: (7.280)

suivait une loi Normale centrée réduite lorsque n tendait vers l'infini (condition de Laplace).

En pratique, l'approximation est tout à fait acceptable... dans certaines entreprises... lorsque et
soit (c'était un des termes qui devait tendre vers zéro quand nous avions fait la démonstration):

(7.281)

Par exemple dans les deux figures ci-dessous où nous avons représenté les lois binomiales approchées par
les lois Normales associées, nous avons à gauche et à droite
:

(7.282)

Rappelons enfin, que nous avons démontré que le sommes des carrées de n variables aléatoires normales
centrées réduites linéairement indépendantes suit une loi du khi-deux à n degrés de liberté noté .

Considérons maintenant une variable aléatoire X suivant une fonction de distribution théorique (continue ou
discrète) P et tirons un échantillon de taille n dans la population correspondant à cette loi P.

Les n observations seront réparties suivant k modalités (classes de valeurs) C1, C2, ..., Ck, dont les
probabilités p1, p2, ..., pk sont déterminées par la fonction de distribution P (se référer à l'exemple de la droite
de Henry).

Pour chaque modalité Ci, l'effectif empirique est lui une variable aléatoire ki de loi binomiale:

(7.283)

Cet effectif ki correspond en effet au nombre de succès "résultat égal à la modalité Ci" de probabilité pi,
obtenus au cours des n tirages d'un lot expérimental (et non dans la population de la loi théorique comme
avant).
Nous avons démontré lors de l'étude de la loi binomiale que son espérance: (7.284)

représente l'effectif théorique de la modalité Ci et sa variance est:

(7.285)

car pi est relativement petite, ce qui donne qui est assez proche de 1. Son écart-type est donc:

(7.286)

Dans ces conditions, pourvu que la modalité Ci ait un effectif théorique npi au moins égal à 5, l'écart réduit:

(7.287)

entre effectif empirique et effectif théorique peut être approximativement considéré comme une variable
normale centrée réduite comme nous l'avons vu plus haut.

Nous définissons alors la variable: (7.288)

où est souvent nommée "fréquence expérimentale" et "fréquence théorique".

Signalons que cette variable est aussi parfois (un peu malheureusement) notée:

(7.289)

ou le plus souvent: (7.290)

Cette variable D, somme des carrés des variables Ei, nous donne une mesure de ce que nous pourrions
appeler une "distance" ou "différence" ou "écart" entre distribution empirique et distribution théorique.
Notons bien cependant qu'il ne s'agit cependant pas d'une distance au sens mathématique habituel
(topologique).

Rappelons que D peut donc aussi s'écrire: (7.291)

D est donc la somme des carrés de N variables aléatoires normales centrées réduites liées par la seule
relation linéaire: (7.292)

où n est donc la taille de l'échantillon. Donc D suit une loi khi-deux mais à N-1 degrés de liberté, donc un
degré de moins à cause de l'unique relation linéaire qui les lie! Effectivement, rappelons que le degré de
liberté indique le nombre de variables indépendantes dans la somme et non pas juste le nombre de termes
sommés.
Donc: (7.293)

Nous appelons ce test un "test non-paramétrique du khi-2" ou "test du khi-2 de Pearson" ou encore "test
d'ajustement du khi-2".

Ensuite, l'habitude est de déterminer la valeur de la loi du khi-deux à N-1 degrés de liberté ayant 5% de
probabilité d'être dépassée. Donc dans l'hypothèse où le phénomène étudié suit la loi théorique P, il y a donc
95% de probabilité cumulée que la variable D prenne une valeur inférieur à celle donnée par la loi du khi-
deux.

Si la valeur de la loi du khi-deux obtenu à partir de l'échantillon prélevé est inférieure à celle correspondant
aux 95% de probabilité cumulée, nous acceptons l'hypothèse selon laquelle le phénomène suit la loi P.

Remarques:

R1. Le fait que l'hypothèse de la loi P soit acceptée ne signifie pas pour autant que cette hypothèse soit
vraie, mais simplement que les informations données par l'échantillon ne permettent pas de la rejeter. De
même, le fait que l'hypothèse de la loi P soit rejetée ne signifie pas nécessairement que cette hypothèse soit
fausse mais que les informations données par l'échantillon conduisent plutôt à conclure à l'inadéquation
d'une telle loi.

R2. Pour que la variable D suive une loi du khi-deux, il est nécessaire que les effectifs théoriques npi des
différentes modalités Ci soient au moins égaux à 5, que l'échantillon soit tiré au hasard (pas
d'autocorrélation) et qu'aucune des probabilités pi soit trop proche de zéro.

CALCULS D'ERREURS/INCERTITUDES

Il est impossible de connaître (mesurer) la valeur exacte d'une grandeur physique expérimentalement, il est
très important donc d'en déterminer l'incertitude.

Nous appelons bien évidemment "erreur", la différence entre la valeur mesurée et la valeur exacte.
Cependant, comme nous ignorons la valeur exacte, nous ne pouvons pas connaître l'erreur commise quand
même.... Le résultat est donc toujours incertain. C'est la raison pour laquelle nous parlons des "incertitudes
de mesure".

Nous distinguons deux types d'incertitudes :

1. Les "erreurs systématiques" : elles affectent le résultat constamment et dans le même sens (erreurs des
appareils de mesures, limites de précision, etc.). Il faut alors éliminer, ou corriger le résultat, si possible !

2. Les "erreurs accidentelles" (statistiques) : il faut alors répéter les mesures, calculer la moyenne et évaluer
l'incertitude en utilisant les outils de statistique.

Le deuxième type d'erreurs faits un très gros usage de tous les outils statistiques que nous avons présentés
jusqu'à maintenant. Nous ne reviendrons donc pas dessus et nous concentrerons alors uniquement sur
quelques nouveaux concepts.

INCERTITUDES ABSOLUES ET RELATIVES

Si la vraie valeur d'une grandeur est x (connue théoriquement) et la valeur mesurée est , est
"l'incertitude absolue" (l'incertitude dû aux appareils de mesure) telle que :
(7.294)
Le résultat s'écrit alors : (7.295)

"L'incertitude relative" est quant à elle définie par : (7.296)

L'incertitude absolue permet de savoir l'approximation du dernier chiffre significatif de celle-ci. Par contre,
lorsque nous désirons comparer deux mesures ayant des incertitudes absolues afin de déceler lequel a la plus
grande marge d'erreur, nous calculons l'incertitude relative de ce nombre en divisant l'incertitude absolue par
le nombre, et transformé en pourcentage.

En d'autres termes, l'incertitude relative permet d'avoir une idée de la précision de la mesure en %. Si nous
faisons une mesure avec une incertitude absolue de 1 [mm], nous ne saurons pas si c'est une bonne mesure
ou non. Ça dépend si nous avons mesuré la taille d'une pièce de monnaie, de notre voisin, de la distance
Paris-Marseille ou de la distance Terre-Lune. Bref, ça dépend de l'incertitude relative (c'est-à-dire du rapport
de l'incertitude absolue sur la mesure).

ERREURS STATISTIQUES

Dans la plupart des mesures, nous pouvons estimer l'erreur due à des phénomènes aléatoires par une série de
n mesures :

Comme nous l'avons vu plus haut, la valeur moyenne arithmétique sera alors :

(7.297)

et l'écart moyen (estimateur biaisé démontré plus haut) :

(7.298)

et l'écart quadratique moyen ou écart-type (estimateur sans biais) :

(7.299)

et nous avions démontré que l'écart-type de la moyenne était donné par :

(7.300)

et comme nous l'avons vu, après un grand nombre de mesures indépendantes, la distribution des erreurs sur
une mesure suit une gaussienne tel que nous puissions écrire :

(7.301)

bref nous pouvons réutiliser tous les outils statistiques vus jusqu'à maintenant.
PROPAGATION DES ERREURS

Soit une mesure et une fonction de x. Quelle est l'incertitude sur y ?

Lorsque est petit, f(x) est remplacé au voisinage de x par sa tangente (il s'agit simplement de la dérivée

bien sûr) : (7.302)

mais si y dépend de plusieurs grandeurs x,z,t mesurées avec les incertitudes :

(7.303)

alors l'erreur maximale possible est alors la différentielle totale exacte (cf. chapitre de Calcul Différentiel Et

Intégral) : (7.304)

Ce qui conduit à : (7.305)

Il apparaît ainsi clairement qu'une opération mathématique ne peut améliorer l'incertitude sur les données.

Remarque: Le résultat d'une multiplication, d'une division, d'une soustraction ou d'une addition est arrondi à
autant de chiffres significatifs que la donnée qui en comporte le moins.

CHIFFRES SIGNIFICATIFS

Dans les petites écoles (et aussi les plus grande parfois), il est demandé de transformer une mesure exprimée
en une certaine unité en une autre unité.

Par exemple, en prenant les tables, nous pouvons avoir le type de conversion suivante :

(7.306)

Vient alors la question suivante (que l'élève peut avoir oublié...). Au départ d'une mesure dont la précision
est de l'ordre de 1 [lb] (donc de l'ordre de 0.5 [kg]), une simple conversion d'unité pourrait-elle amener à une
précision au 1/10 [mg] près ?

De cet exemple il faut donc retenir qu'une marge d'incertitude est associée à toute valeur mesurée et à toute
valeur calculée à partir de valeurs mesurées.

Dans les sciences exactes, tout raisonnement, toute analyse doit prendre cette incertitude en compte.

Mais pourquoi des chiffres sont-ils significatifs et d'autres pas alors ? Parce qu'en sciences, nous ne
rapportons que ce qui a objectivement été observé (principe d'objectivité). En conséquence, nous limitons
l'écriture d'un nombre aux chiffres raisonnablement fiables en dépit de l'incertitude : les chiffres significatifs.
La précision que des chiffres supplémentaires sembleraient apporter est alors illusoire.
Il faut alors savoir arrondir selon des règles et conventions:

- Lorsque le chiffre de rang le plus élevé qu'on laisse tomber est supérieur à 5, le chiffre précédent est
augmenté de 1 (exemple : 12.66 s'arrondit à 12.7)

- Lorsque le chiffre de rang le plus élevé qu'on laisse tomber est inférieur à 5, le chiffre précédent reste
inchangé (exemple 12.64 s'arrondit à 12.6).

- Lorsque le chiffre de rang le plus élevé qu'on laisse tomber est égal à 5, si un des chiffres qui le suivent
n'est pas nul, le chiffre précédent est augmenter de 1 (exemple : 12.6502 s'arrondit à 12.7).

- Si le chiffre de rang le plus élevé que nous laissons tomber est un 5 terminal (qui n'est suivi d'aucun
chiffre) ou qui n'est suivi que de zéros, nous augmentons de 1 le dernier chiffre du nombre arrondi s'il est
impair, sinon nous le laissons inchangé (exemples : 12.75 s'arrondit à 12.8 et 12.65 à 12.6). Dans ce dernier
cas, le dernier chiffre du nombre arrondi est toujours un chiffre pair.

Au fait dans la pratique ces règles sont peu utilisées car les logiciels (tableurs) n'intègrent pas des fonctions
adaptées. Il est alors d'usage d'arrondir simplement à la valeur de la décimale la plus proche.

Les chiffres significatifs d'une valeur comprennent tous ses chiffres déterminés avec certitude ainsi que le
premier chiffre sur lequel porte l'incertitude (ce dernier significatif occupe le même rang que l'ordre de
grandeur de l'incertitude).

Souvent, les sources de données ne mentionnent pas d'intervalle de confiance (c'est-à-dire une indication +/-
). Par exemple, lorsque nous écrivons nous considérons conventionnellement que l'incertitude
est du même ordre de grandeur que le rang du dernier chiffre significatif (soit le chiffre incertain).

En fait, seul le rang décimal de l'incertitude est implicite : sa marge réelle n'est pas précisée.
8. CALCUL ALGÉBRIQUE

D ans la section d'Arithmétique de ce site, nous avons beaucoup écrit sur différentes théorèmes utilisant
les nombres abstraits afin de généraliser l'étendue de la validité de ces dernières. Nous avons cependant peu
abordé la façon dont nous devions manipuler ces nombres abstraits. C'est ce que nous allons voir
maintenant.

Comme vous le savez peut-être déjà, le nombre peut être envisagé en faisant abstraction de la nature des
objets qui constituent le groupement qu'il caractérise et ainsi qu'à la façon de codifier (chiffre arabe, romain,
ou autre système...). Nous disons alors que le nombre est un "nombre abstrait" et lorsque nous manipulons
ces types d'objets nous disons que nous faisons du "calcul algébrique" ou encore du "calcul littéral".

Définition: Le "calcul littéral" consiste à calculer avec des variables (c'est-à-dire avec des lettres) comme on
le ferait avec des nombres.

Pour les mathématiciens il n'est souvent pas avantageux de travailler avec des valeurs numériques (1,2,3...)
car ils représentent uniquement des cas particuliers. Ce que cherchent les physiciens, ingénieurs ainsi que les
mathématiciens, se sont des relations applicables universellement dans un cadre le plus général possible.

Ces nombres abstraits appelés aujourd'hui communément "variables" sont très souvent représentés par
l'alphabet latin (pour lequel les premières lettres de l'alphabet latin a, b, c, ... désignent souvent les nombres
connus, et les dernières x, y, z, ... les nombres inconnus.), l'alphabet grec (aussi beaucoup utilisé pour
représenter des opérateurs mathématiques plus ou moins complexes) et l'alphabet hébraïque (à moindre
mesure)

Bien que ces symboles puissent représenter n'importe quel nombre, il en existe cependant aussi bien en
physique ou en mathématique quelques uns qui peuvent représenter des constantes dites Universelles
(vitesse de la lumière c, la constante gravitationnelle G, la valeur Pi, le nombre d'Euler, ...).

Remarque: Il semblerait que les lettres pour représenter les nombres ont été employées pour la première fois
par Viète au milieu du 16ème siècle.

Une variable est donc susceptible de prendre des valeurs numériques différentes. L'ensemble de ces valeurs
peut varier suivant le caractère du problème considéré.

Rappels (nous avions déjà défini cela dans le chapitre traitant des Nombres dans la section d'Arithmétique):

R1. Nous appelons "domaine de définition" d'une variable, l'ensemble des valeurs numériques qu'elle est
susceptible de prendre entre deux bornes.

Soit deux a et b deux nombres tel que a<b. Alors:

R2. Nous appelons "intervalle fermé d'extrémité a et b", l'ensemble de tous les nombres x compris entre ces
deux valeurs et nous le désignons de la façon suivante:

(8.1)

R3. Nous appelons "intervalle ouvert d'extrémité a et b", l'ensemble de tous les nombres x compris entre ces
deux valeurs non comprises et nous le désignons de la façon suivante:

(8.2)
R4. Nous appelons "intervalle fermé à gauche, ouvert à droite" la relation suivante:

(8.3)

R5. Nous appelons "intervalle ouvert à gauche, fermé à droite" la relation suivante:

(8.4)

Remarque: Si la variable peut prendre toutes les valeurs négatives et positives possibles nous écrivons dès
lors: où le symbole " " signifie "infini". Evidemment il peut y avoir des combinaisons
d'intervalles ouverts et infinis à droite, fermé et limité gauche et réciproquement.

Définition: Nous appelons "voisinage de a", tout intervalle ouvert de contenant a (c'est un concept
simple que nous reprendrons pour définir ce qu'est une fonction continue). Ainsi:

(8.5)

est un voisinage de a.

ÉQUATIONS ET INÉQUATIONS

L'algèbre élémentaire consiste à partir des définitions de l'addition, soustraction, multiplication, et puissance
et de leurs propriétés (associativité, distributivité, commutativité, élément neutre, inverse, ...) - ce qui
constitue selon l'ensemble sur lequel nous travaillons un corps ou un groupe commutatif abélien ou non (cf.
chapitre Théorie des Ensembles) - de manipuler selon un but fixé des "équations algébriques" mettant en
relation des variables et constantes..

Nous allons définir de suite après ce qu'est une équation et une inéquation mais nous souhaitons d'abord
définir certaines de leurs propriétés:

Soit A et B deux polynômes (ou monômes) quelconques - voir définitions un peu plus loin - les expressions:

(8.6)

Vérifient les propriétés suivantes:

P1. Nous pouvons toujours ajouter ou ôter aux deux membres d'une inéquation ou équation un même
polynôme en obtenant une inéquation ou équation équivalente (c'est à dire avec les mêmes solutions ou
réductions). Nous disons alors que l'égalité ou l'inégalité restent "vraies" par l'opération d'addition ou de
soustraction membre à membre.

P2. Si nous multiplions ou si nous divisons les deux membres d'une équation ou inéquation par un même
nombre positif nous obtenons également une inéquation ou équation équivalente (nous avons déjà vu cela).
Nous disons alors que l'égalité ou l'inégalité reste "vraie" par l'opération de multiplicaton ou division
membre à membre..

P3. Si nous multiplions ou si nous divisons les deux membres d'une inéquation par un même nombre négatif
et si nous inversons le sens de l'inégalité, nous obtenons alors une inéquation ou équation équivalente.
ÉQUATIONS

Définition: Une "équation" est une relation d'égalité entre des valeurs toutes abstraites (autrement dit: deux
expressions algébriques) ou non toutes abstraites (dès lors nous parlons d'équations à une inconnue, deux
inconnues, trois inconnues, ... ) reliées entre elles par des opérateurs divers.

La maîtrise parfaite de l'algèbre élémentaire est fondamentale en physique-mathématique et dans


l'industrie!!! Comme il existe une infinité de types d'équations, nous ne les présenterons pas ici. C'est le rôle
de l'enseignant/formateur dans les classes d'entraîner le cerveau de son auditoire pendant plusieurs années (2
à 3 ans en moyenne) à résoudre énormément de configurations différentes d'équations algébriques (exposées
sous forme de problèmes de tous les jours, géométriques ou purement mathématiques) et ce afin que les
élèves manipulent ces dernières sans erreurs en suivant un raisonnement logique et rigoureux (ce n'est qu'en
forgeant que l'on devient forgeron...)!!!

En d'autres termes: Un professeur/formateur et un établissement ad hoc sont irremplaçables pour acquérir un


savoir et avoir un retour d'expérience!!!

Nous avons tenté, ci-dessous, de faire une généralisation simpliste des règles de base de l'algèbre
élémentaire. Cette généralisation sera d'autant plus simple à comprendre que le lecteur aura l'habitude de
manipuler des quantités abstraites:

Ainsi, soit a, b, c, d, e, ..., x, y des nombres abstraits pouvant prendre n'importe quelle valeur numérique
(nous restons dans le cadre des nombres classiques scolaires et industriels...).

Soit (la lettre majuscule grecque se prononçant "Xi") représentant un ou plusieurs nombres abstraits
(variables) opérants entre eux d'une façon quelconque tel que nous ayons des monômes (un seul nombre
abstrait) ou polynômes (poly = plusieurs) algébriques différents distinguables ou non (nous faisons donc ici
une sorte d'abstrait de l'abstraction ou si vous préférez une variable de plusieurs variables).

Propriétés (il s'agit plus d'exemples au fait que de propriétés...):

P1. Nous aurons toujours si et seulement si le terme à gauche de l'égalité représente le même
terme que celui qui est à droite de l'égalité. Si cette condition est satisfaite nous avons alors :

(8.7)

Sinon:

(8.8)

où nous excluons donc les cas où tous les sont identiques entre eux (sinon nous revenons à P1).

P3. Nous avons:

(8.9)

qui vérifie la symbolique de l'équation dans le cas seulement où les éléments sont identiques entre
eux (nous excluons bien évidemment le cas avec dénominateur nul).

Nous avons sinon dans le cas où tous les sont strictement différents:

(8.10)
Nous pouvons avoir:

(8.11)

dans le cas où une simplification (ou non) des termes contenus dans les amène à une identité de la relation
binaire (non nécessairement égale à l'unité).

P4. Si tous les sont strictement identiques, alors:

(8.12)

Sinon nous avons:

(8.13)

qui ne peut s'écrire sous forme condensée simple. Il peut aussi arriver que:

(8.14)

avec le à droite de l'égalité identique à aucun, un ou encore plusieurs du membre gauche de l'égalité.

P5. Nous pouvons avoir:

(8.15)

sans que nécessairement les exposants du numérateur ou dénominateur soient égaux (nous excluons le
dénominateur nul)

Sinon nous pouvons avoir:

ou (8.16)

mais il n'est cependant bien évidemment pas impossible d'avoir quand même ou (nous
excluons le cas avec dénominateur nul)

P6. Nous avons si tous les sont strictement identiques aux dénominateurs:

(8.17)

Mais... il est également possible que dans l'expression précédente certains différents s'annulent cependant
entre eux dès que leur divisions mutuelle est égale à l'unité (nous excluons le dénominateur nul).

Si tous les de la relation précédente sont identiques, la relation est égal à l'unité.

Sinon nous avons:


(8.18)

mais il n'est cependant pas impossible d'avoir quand même:

(8.19)

avec le à droite de l'égalité identique à aucun, un ou plusieurs du membre gauche de l'égalité ou même
il est tout à fait possible d'avoir:

(8.20)

P7. Soit représentant indifféremment soit exclusivement l'addition ou exclusivement la soustraction nous
avons (au signe près):

(8.21)

si tous les sont identiques entre eux ou si la combinaison d'un nombre indéterminés de sont égaux au
présent à droite de l'égalité.

Sinon quoi nous aurons:

(8.22)

il peut cependant arriver que le à droite de l'égalité soit identique à aucun, un ou plusieurs du membre
gauche de l'égalité.

Nous pouvons également avoir:

(8.23)

si et seulement si les sont tous égaux (ou décomposable égaux) et les puissances non nécessairement
égales.

A partir de la connaissance des ces 7 règles/exemples de base, nous pouvons résoudre, simplifier ou montrer
qu'une équation simple possède des solutions ou non par rapport à un problème ou énoncé donné.

Ainsi, soit une opérande ou une suite d'opérations quelconques sur une ou des abstractions d'abstrait et
parmi tous les , une (ou plusieurs) dont la ou les valeurs numériques est ou sont inconnues (les autres étant
connues). Alors, nous devons pouvoir trouver ou démontrer qu'une équation du type:

(8.24)

possède ou non des solutions.

Dans le cas d'une équation avec la valeur absolue (cf. chapitre Opérateurs Arithmétiques) du type:

(8.25)

avec le deuxième membre strictement positif (sinon la relation précédente serait un non sens) cela équivaut
bien sûr d'après la définition de la valeur absolue à écrire:
et (8.26)

Remarques:

R1. La présence de la valeur absolue dans une équation algébrique dont nous cherchons les solutions double
souvent le nombre de solutions.

R2. Une équation est dite "équation conditionnelle", s'il y a des nombres dans l'ensemble de définition des
expressions qui ne sont pas solutions (ce qui est en fait le cas le plus fréquent). Inversement, si tout nombre
de l'ensemble de définition est solution de l'équation alors l'équation est dit "équation identité".

Nous pouvons parfois avoir à résoudre (et non à simplifier) un "système d'équations". Qu'est-ce que c'est ?:
C'est un ensemble d'au moins 2 équations à résoudre (et non à simplifier!). La particularité du système ? :
L'ensemble des solutions du système est l'intersection des solutions de toutes les équations à résoudre.
Quelle est leur utilité ?: Elle est sans fin, ces systèmes permettent de résoudre des problèmes faisant
intervenir des applications des mathématiques à d'autres domaines. A cause de la variété illimitée des
applications, il est difficile d'établir des règles précises pour trouver des solutions. La marche à suivre que
voici peut-être utile pour autant bien sûr que le problème puisse être formulé sous forme d'équations:

1. Si le problème est posé par écrit, le lire plusieurs fois soigneusement, réfléchir aux faits donnés ainsi qu'à
la quantité d'inconnues à trouver (résumer l'énoncé sur une feuille de papier est souvent plus qu'utile pour les
gros problèmes!).

2. Choisir une lettre qui représente la quantité inconnue. C'est l'un des pas décisifs dans la recherche de la
solution. Des phrases contenant des mots comme: trouver, quoi, combien, où, quand ; devraient vous
renseigner sur la quantité inconnue.

3. Faire éventuellement un dessin (de tête ou sur papier) avec des légendes.

4. Dresser une liste des faits connus et des relations concernant les quantités inconnues. Une relation peut
être décrite par une équation dans laquelle apparaissent d'un seul ou des deux côtés du signe égal des
énoncés écrits à la place des lettres ou des nombres.

5. Après avoir analysé la liste de l'étape 4, formuler une ou plusieurs équations qui décrive nt précisément ce
qui est énoncé avec des mots.

6. Résoudre l'équation ou le système d'équation formulée à l'étape 5.

7. Contrôler les solutions obtenues à l'étape 6 en se reportant à l'énoncé de départ du problème. Vérifier que
la solution concorde avec les conditions de l'énoncé.

Les méthodes de résolutions des systèmes d'équations sont traités en détails dans le chapitre de Méthodes
Numériques (vous y verrez la méthode) et également dans le chapitre d'Algèbre linéaire de la présente
section (vous y comprendrez pourquoi la méthode est telle quelle).

INÉQUATIONS

Précédemment nous avons vu qu'une équation était une égalité composée de différents calculs avec
différents termes (dont au moins une "inconnue" ou un "chiffre abstrait"), et que "résoudre" une équation
revenait à calculer la valeur de l'inconnue de l'égalité, alors que la "simplifier" revenait à minimiser
mathématiquement le nombre de termes (en factorisant ou autre..) et que développer revenait à mettre à plat
tous les termes.

Pourquoi avons-nous besoin de rappeler la définition d'une équation ? Tout simplement parce que pour
l'inéquation, c'est le même système. La différence ? Si l'équation est une égalité, l'inéquation est une
inégalité: comme l'équation, l'inéquation est composée de différents calculs avec différents termes reliés
entre eux par des opérateurs quelconques, dont au moins une inconnue.

Différence entre égalité et inégalité:

- Egalité: Symbolisée par le signe =

- Inégalité: Symbolisée par les relations d'ordre d'égalités strictes et larges .

Lorsque nous résolvons une inéquation, notre inconnue peut-avoir un intervalle de valeurs qui satisfont à
l'inéquation. Nous disons alors que la solution de l'inéquation est un "ensemble de valeurs".C'est la
différence fondamentale entre une égalité (plusieurs solutions) et une inégalité (intervalle de solutions) !

Rappelons les signes que nous pouvons rencontrer dans une inéquation sont:

: Se lit "strictement inférieur à" ou "strictement plus petit que". Dans ce cas, le plus souvent, la valeur
butoir numérique n'est pas comprise dans le domaine et nous pouvons représenter alors le domaine avec un
crochet ouvert à gauche ]... ou à droite ...[ selon que la valeur butoir est positive ou négative.

: Se lit "strictement supérieur à" ou "strictement plus grand que". Dans ce cas, le plus souvent, la valeur
butoir numérique n'est également pas comprise dans le domaine et nous pouvons représenter alors le
domaine avec un crochet ouvert à gauche ]... ou à droite ...[ selon que la valeur butoir est positive ou
négative.

Remarque: Attention cependant pour les deux cas précités, il existe des situations où le domaine est imposé
par l'ensemble de nombres sur lequel nous travaillons (penser par exemple à une inéquation où pour
certaines valeurs les solutions appartiennent à l'ensemble des complexes). Dans ce cas, les valeurs butoirs à
l'ensemble de nombres sur lequel nous travaillons peuvent imposer des crochets fermés.

: Se lit "inférieur ou égal à "ou "plus petit ou égal à". Dans ce cas, la valeur butoir numérique est comprise
dans le domaine et nous pouvons représenter alors le domaine avec un crochet fermé à gauche [... ou à droite
...] (mais pas nécessairement les deux!) selon que la valeur butoir est positive ou négative.

: Se lit "supérieur ou égal à" ou "plus grand ou égal à" . Dans ce cas, la valeur butoir numérique est
également comprise dans le domaine et nous pouvons représenter alors le domaine avec un crochet fermé à
gauche [... ou à droite ...] (mais pas nécessairement les deux!) selon que la valeur butoir est positive ou
négative.

Remarque: Nous renvoyons le lecteur au début de ce chapitre où nous avions définit la manière d'écrire des
domaines de définition.

L'objectif des inéquations est la plupart du temps (excepté le côté esthétique) d'avoir au moins parmi
l'ensemble des termes une valeur numérique qui permet de définir le domaine de solution (de tous les termes
abstraits de l'inéquation) qui satisfait l'inéquation.

Il existe plusieurs façons de représenter les domaines de définition des variables qui satisfont à l'inéquation.
Nous allons voir à travers un petit exemple quelles sont ces possibilités:

Soit une inéquation linéaire (du premier degré) en x à une seule inconnue à laquelle nous imposons une
contrainte particulière arbitraire pour l'exemple (évidemment l'expression peut contenir plus de termes...):

(8.27)

nous avons dans l'inéquation ci-dessus déjà simplifié tous les termes qui étaient superflus.
Résoudre l'inégalité revient à chercher les valeurs de x inférieures à 2. Bien sûr, il n'existe pas une seule
solution dans mais un ensemble (intervalle) de solutions et c'est cela même le principe des inéquations!

Pour résoudre l'inéquation, nous observons d'abord le type d'inégalité imposée ("stricte" ou "égal"). Ensuite,
dans les petites classes (et pas seulement parfois...) nous représentons l'ensemble traditionnellement par
un tableau tel que:

- 0 +
................... ......|...... ...................
Tableau: 8.1 - Résolution d'inéquation

Nous savons intuitivement que la solution de notre inéquation regroupe toutes les valeurs inférieures à 2 (2
exclu des solutions) et ce jusqu'à - . Nous écrivons alors cet intervalle ou domaine sous la forme suivante:

(8.28)

Ensuite, nous pouvons représenter graphiquement l'ensemble des solutions (cela aide à comprendre et
prépare l'étudiant à la résolution de systèmes d'équations et d'inéquations et aux variations de fonctions).
Pour cela, nous reprenons le modèle de schéma du système numérique, et y plaçons notre valeur butoir
(nous n'en avons qu'une dans cet exemple mais parfois il peut y en avoir plusieurs dû au fait qu'il y a une
singularité ou des racines pour certaines valeurs du domaine de définition), soit 2:

- 0 2 +
................... ......|...... ......|...... ...................
Tableau: 8.2 - Construction des points particuliers de l'inéquation

et enfin, nous délimitons au stylo de couleur (...) l'ensemble des solutions de - à 2 exclu:

- 0 2 +
................... ......|...... ......[...... ...................
Tableau: 8.3 - Mise en place du type de bornes l'inéquation

A la valeur 2, nous n'oublions pas de marquer le signe ....[ pour montrer que cette valeur est exclue des
solutions. Et voilà, le tour est joué et le concept est extrapolable a des inéquation beaucoup plus complexes.

Remarques:

R1. Parfois au lieu de représenter les tableaux comme nous l'avons fait, certains professeurs (c'est un choix
complètement artistique) demandent à leur élèves d'hachurer les cases du tableau et d'y dessiner de petits
ronds, ou encore se servent de petites flèches, ou encore de dessiner le graphique des fonctions de
l'inéquation (cette dernière méthode est certes esthétique mais prend du temps..).

R2. Dans le cadre d'inéquations de degré supérieur à 1, il faut (voir plus loin ce que cela signifie exactement)
d'abord déterminer les racines de l'inéquation qui permettent de déterminer les intervalles et ensuite par
essais successifs, déterminer quels intervalles sont à rejeter ou a conserver.

Nous pouvons également (au même titre que les équations) parfois avoir à résoudre un "système
d'inéquations". Qu'est-ce que c'est ?: C'est un ensemble d'au moins 2 inéquations à résoudre. La particularité
du système ? : L'ensemble des solutions du système est l'intersection des solutions des toutes les inéquations
à résoudre.
Autrement dit, la méthode est la même que la précédente, à la différence que notre tableau (représentant les
domaines de solutions) comportera une ligne supplémentaire par inéquation supplémentaire dans le système
plus une ligne de synthèse qui est la projection des domaines de solutions possibles du système.

Ainsi, un système à n inéquations aura un tableau récapitulatif à lignes.

Mathématiquement, les domaines (car ils peuvent y en avoir plusieurs qui sont disjoints) peuvent s'écrire
comme un ensemble des domaines:

(8.29)

Les systèmes d'inéquations sont très fréquents dans beaucoup de problèmes de la mathématique, physique,
économétrie, etc... Il est donc important de s'entraîner à les résoudre pendant vos études avec l'aide de votre
professeur.

Par exemple, voici une possible représentation du domaine de solutions d'un système d'inéquations pris du
chapitre de Méthodes Numériques où nous étudions la "recherche opérationnelle".

(8.30)

IDENTITÉS REMARQUABLES

Les identités remarquables sont des sortes formules magiques, qui nous servent le plus souvent pour la
factorisation ou la résolution d'équations algébriques.

Rappelons certaines notions qui ont déjà été vues dans le chapitre de théorie des ensembles de la section
d'arithmétique (nous supposons le concept d'élément neutre connu puisque déjà défini):

Commutativité:

et (8.31)

Associativité:
et (8.32)

Distributivité:

(8.33)

Les mêmes observations sont valables avec l'opération de soustraction bien évidemment dans les domaines
de définition adéquats.

Nous pouvons vérifier avec des valeurs numériques (en remplaçant chaque nombre abstrait par un nombre
choisi au hasard), ou par distribution (ce serait mieux, ainsi vous êtes sûr d'avoir compris ce dont quoi nous
parlions), que les identités algébriques suivantes sont vérifiées (ce sont les plus connues):

1. Identité du second degré:

(8.34)

2. Identité du troisième degré:

(8.35)

Remarque: Nous pouvons très bien poser que où nous avons bien évidemment
posé que (nous faisons un "abstrait d'abstraction" ou plus couramment: un "changement de
variable")...:

(8.36)

Nous pouvons remarquer que pour calculer le développement de , nous utilisons le développement
de , c'est-à-dire calculé avec la valeur précédente de n.

Nous remarquons les propriétés suivantes pour a et b:

P1. Les puissances de a décroissent de n à 0 ( , donc il n'est pas noté dans le dernier terme)

P2. Les puissances de b croissent de 0 à n ( , donc il n'est pas noté dans le dernier terme)

P3. Dans chaque terme, la somme des puissances de a et b est égal à n

P4. Les coefficients multiplicateurs devant chaque terme se calculent en faisant la somme des coefficients
multiplicateurs de deux termes du développement obtenu avec la valeur précédente de b (voir la figure ci-
dessous).

Les coefficients binomiaux peuvent alors êtres obtenus par construction du "triangle de Pascal" ci-dessous:
(8.37)

Dont chaque élément est donné par (cf. chapitre de Probabilités):

(8.38)

avec .

Nous pouvons alors démonter que:

(8.39)

ce qui constitue le fameux "binôme de Newton" (que nous réutiliserons à de multiples endroits sur le site).

Démonstration:

Cette relation se démontre simplement par récurrence en supposant la relation précédente vraie et en la
calculant pour le rang 1 :

(8.40)

Montrons que si elle est vraie pour n alors elle est vraie pour n+1:
(8.41)

La relation est vraie au rang n+1, elle est donc vraie pour tout n.

C.Q.F.D.

Pour ce qui est des identités remarquables avec des valeurs négatives, il est inutile d'apprendre par coeur
l'emplacement du signe "-". Il suffit de faire un changement de variable et une fois le développement fait de
refaire le changement de variable dans l'autre sens.

Exemple:

(8.42)

et ainsi de suite pour toute puissance n.

Nous pouvons bien sûr mélanger les genres tels que (fameux exemple particulier):

(8.43)

et quelques relations remarquables pratiques supplémentaires qui sont souvent utilisées dans les petites
classes pour les exercices:

(8.44)

et autre cas très fréquent:


(8.45)

Remarque: Lorsqu'à partir du terme de droite (sous forme numérique simplifiée) le professeur demande à
ses élèves en tant qu'exercice d'obtenir la factorisation à gauche de l'égalité, il n'existe pas d'autres moyens
que de procéder par essais successifs.

Bien sûr, il y en a encore un beaucoup plus grand nombre de relations utiles (dont une partie découle d'une
généralisation de celle présentées ci-dessus) que le lecteur découvrira par ses propres raisonnements et en
fonction de sa pratique.

Remarque: Il est bien sûr possible de multiplier des polynômes entre eux et de distribuer les termes
multiplicatifs. Inversement, il est souvent demandé aux élèves des petites classes de faire la procédure
inverse ("factoriser" ou "décomposer" un polynôme) afin qu'ils s'habituent à la manipulation des identités
remarquables. Décomposer en un produit de facteurs est une opération importante en mathématiques,
puisqu'il est ainsi possible de réduire l'étude d'expressions compliquées à l'étude de plusieurs expressions
plus simples.

POLYNÔMES

Définition (simpliste): Nous appelons "polynôme algébrique P(x)" une fonction de degré qui s'écrit:

(8.46)

ou de façon plus condensée par:

(8.47)

Remarques:

R1. Le n en indice du P(x) est parfois omis car explicitement défini dans l'énoncé.

R2. Le lecteur qui aura parcouru le chapitre de Théorie Des Ensembles, se rappellera certainement que
l'ensemble des polynômes de degré n ou inférieurs forment un structure d'espace vectoriel!

Définition (ensembliste): Soit k un anneau (cf. chapitre de Théorie Des Ensembles) et ., "l'anneau des
polynômes" en n indéterminées (ou variables) est construit à partir d'un polynôme élémentaire,
appelé "monôme" de la forme:

(8.48)

où est le "coefficient du monôme", sont des entiers et où forme la "partie


littérale du monôme". Ainsi, par construction, un polynôme est une somme d'un nombre fini de monômes
appelés alors "termes du polynôme".

Ainsi, le cas particulier commun utilisé dans les petites classes et présenté au début est k[X], c'est-à-dire
l'anneau des polynômes à une variable à coefficients dans k. Tout élément de k[X] s'écrit donc:

(8.49)
avec et .

Remarques:

R1. Notez bien que les puissances sont toujours positives (ou nulles) dans k[X] !!!

R2. Nous disons que deux monômes sont semblables s'ils ont la même partie littérale.

Définition: Nous nommons "racine" ou "zéro de polynôme", la ou les valeurs x telles que "l'équation
polynomiale" soit satisfaite à la condition qu'au moins un des avec soit non nul.

Si le polynôme admet une ou plusieurs racines nous pouvons alors factoriser ce dernier sous la forme
(nous le démontrerons rigoureusement de manière générale plus loin):

(8.50)

afin que quand x prend la valeur d'un des racines, l'expression ci-dessus soit nulle. C'est ce que nous
appelons par convention "factoriser un polynôme".

Les identités algébriques sont des des formes particulières de fonctions polynomiales. Considérons une
constante c et une variable x et:

(8.51)

Nous voyons que si nous posons:

(8.52)

nous retrouvons:

(8.53)

Définition: Le "coefficient dominant" d'un polynôme est le coefficient de son monôme de plus haut degré.

DIVISION EUCLIDIENNE DES POLYNÔMES

Plaçons nous à présent dans l'anneau k[X]. Si , nous notons deg(P) le degré du polynôme
P(X) à coefficients dans un anneau k (les réels ou les complexes... peu importe!)

Remarque: Par convention,

Soit:

(8.54)

avec .
Alors il existe deux polynômes uniques tels que:

(8.55)

et:

(8.56)

Démonstration:

Si u(X) = 0 le résultat est évident. Supposons que et montrons l'existence par récurrence sur le
degré k de u(X).

Si k = 0 alors q(X) = 0 (puisque ) et donc r(X) = u(X) fait l'affaire.

Supposons l'affirmation vraie pour tout :

Soit u(X) de degré . Si alors q(X) = 0 et r(X) = u(X) font l'affaire.

Sinon, si alors en écrivant:

(8.57)

nous réduisons u(X) à un polynôme de degré puisque v(X) est de degré m (et qu'il existe)!

Effectivement, le terme:

(8.58)

élimine (au moins) le terme de plus grand degré

Par hypothèse de récurrence, il existe f(X),g(X) tels que:

(8.59)

avec . Donc:

(8.60)

et:

, (8.61)
font l'affaire.

Donc par récurrence nous observons que la division euclidienne existe dans l'anneau des polynômes k[X].

C.Q.F.D.

Remarque: Cette démonstration nous a permis dans le chapitre de théorie des ensembles de montrer que cet
anneau est "principal".

THÉORÈME DE FACTORISATION DES POLYNÔMES

Nous allons maintenant démontrer une propriété importante qui est au fait à l'origine illustré (entre autres)
par les identités remarquables que nous avons vues plus haut:

Si une fonction polynôme à coefficients dans k de degré a une racine dans


l'anneau k, alors nous pouvons factoriser P(x) par (x - r) tel que:

(8.62)

où Q est une fonction polynôme de degré n-1 (et peut donc être dans certains cas un simple monôme).

Autrement dit, "factoriser un polynôme", c'est l'écrire sous la forme d'un produit de polynômes. La
factorisation est donc une opération qui transforme une somme en un produit.

Démonstration:

L'idée consiste à effectuer la division euclidienne de P par (x-r). D'après le théorème, il existerait un couple
(Q, R) de polynôme tels que:

(8.63)

et selon le résultat obtenu du théorème précédent sur la division euclidienne:

(8.64)

Or, , donc (ou ). R est donc une fonction polynôme constante. Par ailleurs, r
est une racine de P. Nous avons donc:

(8.65)

Donc . Donc R est la fonction polynôme nulle et le théorème est pratiquement démontré. Il reste
encore à prouver que , ce qui est une conséquence immédiate de la relation:

(8.66)

D'où:

(8.67)

C.Q.F.D.
De cette propriété de factoriser un polynôme vue précédemment, appelée "théorème de factorisation", nous
pouvons donner un avant gout d'un théorème beaucoup plus important:

Montrons que si nous avons une fonction polynôme de degré à coefficients dans k,
alors elle possède au plus un nombre fini n de racines (certaines étant éventuellement confondues) dans k.

Démonstration:

D'abord, puisque P a un degré, P n'est pas la fonction polynôme nulle. Ensuite, raisonnons par l'absurde:

Si la fonction P possède p racines avec , en notant ces racines, nous avons, d'après le théorème
de factorisation précédent (appliqué p fois):

(8.68)

où Q est donc une fonction polynôme de degré :

(8.69)

Or, comme par définition un polynôme en est un si seulement son degré appartient à , le polynôme Q doit
donc être le polynôme nul tel que :

(8.70)

Il s'ensuit que :

(8.71)

ce qui contredit l'hypothèse initiale comme quoi P n'est la fonction polynôme nulle d'où :

(8.72)

C.Q.F.D.

ÉQUATIONS DIOPHANTIENNES

Si nous généralisons le concept de polynôme avec plusieurs variables tel que:

(8.73)

nous appelons alors "équation diophantienne" une équation de la forme:

(8.74)

où P est un polynôme à coefficients entiers (ou rationnels) dont nous cherchons les radicaux strictement
dans ou . Des exemples classiques d'équations diophantiennes sont:

- Les triplets pythagoriciens (ou triades) tel que:

(8.75)
- Le grand théorème de Fermat dont la conjecture dit que si n est supérieur à 2, il n'existe pas d'entiers
non nuls pour lesquels:

(8.76)

Pour la démonstration il faudra attendre un peu que les auteurs du site aient le temps de la comprendre
également (...).

POLYNÔMES DE DEGRÉ 1

Soit:

(8.77)

Si alors le polynôme admet une unique racine simple:

(8.78)

tel que .

Remarques:

R1. Il faut toujours prendre l'habitude de vérifier l'existence de la solution dans l'équation d'origine pour
s'assurer de la validation du domaine de définition de la solution. Effectivement, il existe des solutions aux
développements de résolution d'une équation qui ne vérifient pas l'équation d'origine et c'est ce que nous
nommons des "solutions étrangères" ou encore "racines étrangères".

R2. Si les coefficients du polynôme de degré 1 sont tous réels alors la racine est réelle.

R3. Si un des coefficients est complexe alors la racine est nécessairement complexe.

R4. Si les deux coefficients sont complexes, alors la racine est soit complexe soit réelle.

R5. Nous disons que deux équations sont équivalentes si elles admettent le même ensemble de solutions.

Voici quelques propriétés que nous considérons comme triviales et que nous admettrons donc sans
démonstrations:

P1. Si nous ajoute (ou si nous retranchon) un même nombre à chaque membre d'une équation, nous obtenons
une équation qui a les mêmes solutions que l'équation dont nous sommes partis (et ce quelque soit son
degré!).

P2. Si nous multiplions (ou si nous divisons) chaque membre d'une équation par un même nombre non nul,
nous obtenons une équation qui a les mêmes solutions que l'équation dont nous sommes partis (et ce quelque
soit son degré!).

POLYNÔMES DE DEGRÉ 2

Soit le polynôme à coefficients réels (trinôme du second degré):


(8.79)

Si nous représentons ce polynôme graphiquement sur la plan réel, cela donne:

(8.80)

Si nous dérivons cette fonction (cf. chapitre de Calcul Différentiel et Intégral) et cherchons en quel point la
tangente s'annulle, nous avons toujours:

(8.81)

Si alors nous avons:

(8.82)

Nous avons alors une "racine double" (ou "racine de multiplicité 2") que nous notons:

(8.83)
tel que et où nous définissons un nouveau terme appelé "déterminant du polynôme" ou
"discriminant" qui allège souvent les écritures:

(8.84)

Remarque: Il faut aussi toujours prendre l'habitude de vérifier l'existence de la solution dans l'équation
d'origine pour s'assurer de la validation du domaine de définition de la solution au cas où la solution serait
"étrangère".

Si le polynôme du deuxième degré en x comporte deux racines, nous pouvons alors factoriser de manière
irréductible (selon le théorème fondamental de factorisation des polynômes vu plus haut) de la manière
suivante:

(8.85)

Nous démontrons, à partir de l'expression des racines, sans trop de peine les relations dites "relations de
Viète":

et (8.86)

Avec le signe de a et celui du discriminant nous avons:

(8.87)

Donc:

- Si le polynôme n'admet pas de zéros réels et ne se décompose pas en un produit de facteurs réels du
premier degré mais de facteurs complexes. Ainsi (il est nécessaire d'avoir lu la partie traitant des nombres
complexes dans le chapitre des Nombres de la section d'Arithmétique du site):
(8.88)

et nous savons que nous pouvons écrire tout nombre complexe sous une forme condensée (formule d'Euler)
et comme les racines complexes d'un polynôme du second degré sont conjuguées (nous connaissons ce
terme) nous avons:

(8.89)

où (rappel) r est le module des racines complexes (module égal pour les deux racines) et l'argument des
racines complexes (égales en valeur absolue).

- Si alors le polynôme possède une seule solution qui est bien évidemment:

(8.90)

- Si alors le polynôme possède deux solutions définies par les relations générales que nous avons déjà
données précédemment.

En ce qui concerne le cas complexe, prenons comme exmple le polynôme suivant du second degré:

(8.91)

qui admet donc uniquement deux racines complexes qui sont i et -i. Dans le plan réel ce polynôme sera
représenté avec Maple par:

>plot(x^2+1,x=-5..5);

(8.92)

où nous voyons bien qu'il n'y a aucune solution (zéros) réelle. Alors qu'en nous plaçant dans les complexes,
nous avons:
>plot3d(abs(-(re+I*im)^2+1),re=-2..2,im=-2..2,view=[-2..2,-2..2,-2..2],orientation=[-
130,70],contours=50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=10000);

(8.93)

où les deux zéros sont bien visibles sur l'axe imaginaire en -1 et +1. Evidemment quand c'est la première fois
que l'on voit une fonction représentée sur une figure en prenant en compte les valeurs complexes on essaie
d'y retrouver la parabole correspondante au cas purement réel. Pour cela, il suffit de couper la surface ci-
dessus en deux sur l'axe imaginaire et nous avons alors:

>plot3d(abs((re+I*im)^2+1),re=-2..2,im=0..2,view=[-2..2,-2..2,0..2],orientation=[-
130,70],contours=50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=10000);
(8.94)

où nous retrouvons notre parabole bien visible sur la coupe de la surface. Ainsi, nous pouvons nous
demander si les valeurs complexes ne sont pas une extension naturelle de notre espace conventionnel
échappant à notre sens physique commun et nos appareils de mesures.

Evidemment de ce qui a été vu jusqu'à maintenant nous en tirons que si un polynôme admet une ou plusieurs
racines alors ce même polynôme est divisible par .

NOMBRE D'OR

Il existe un polynôme de degré deux dont la solution est fameuse de par le monde. Ce nombre est appelé la
"divine proportion" ou "nombre d'or" et se retrouve en architecture, esthétique ou encore en phyllotaxie
(c'est-à-dire dans la disposition des feuilles autour de la tige des plantes).

Ce nombre vaut:

(8.95)

et appartient à l'ensemble des nombres irrationnels car il ne peut pas s'écrire sous forme de fraction entière,
mais c'est un nombre algébrique puisqu'il est la solution positive de l'équation:

(8.96)

POLYNÔMES DE DEGRÉ 3

Bien que rare à résoudre en physique théorique ou lors de ses études, la résolution d'un polynôme du 3ème
degré est assez récréative et montre un bon exemple d'un raisonnement mathématique déjà mature (nous
devons ces développements à Scipione del Ferro et Jérome Cardan mathématiciens du 16ème siècle...).
Soit l'équation:

(8.97)

avec les coefficients tous dans (pour commencer...). Dans un premier temps, le lecteur pourra voir que les
raisonnements que nous avons appliqués pour les polynômes de degrés inférieurs coincent rapidement
(excepté pour des cas particuliers simplistes bien sûr...).

Nous allons contourner le problème par des changements de variables subtils mais tout à fait justifiés.

Ainsi, rien ne nous empêche de poser que:

(8.98)

et que en divisant le polynôme de degré 3 par a d'écrire:

(8.99)

En regroupant les termes de même ordre:

(8.100)

et posons (rien, mais alors absolument rien ne nous l'interdit):

(8.101)

où (1) est connu si et seulement si X est connu et où p, q sont de tout façon connus.

Le polynôme:

(8.102)

étant de degré impair, il admet comme permet de le constater tout tracé visuel d'un tel polynôme à
coefficient réels aux moins une racine réelle, appelée "racine certaine" (vérifiez vous verrez bien par une
représentation graphique d'un polynôme de degré impair que cela est trivial).
Maintenant, nous faisons un autre changement de variable (nous en avons tout à fait le droit) subtil:

(8.103)

en imposant la condition que u,v doivent êtres tels que (rien ne nous empêche d'imposer une telle
contrainte) et nous avons alors:

(8.104)

Dès lors nous avons:

(8.105)

Nous pouvons très bien faire une analogie entre les deux relations (1') et (2') et les relations de Viète que
nous avions obtenues pour le polynôme de degré 2 qui rappelons-le étaient:

et (8.106)

à la différence que nous avons maintenant (nous adoptons une autre notation pour ces racines
intermédiaires):

et (8.107)

ce qui nous donne pour le polynôme P en imposant (toujours par analogie) une nouvelle équation:

(8.108)

dont sont les racines.

Cette dernière équation à pour discriminant:

(8.109)

Prenons maintenant le cas par cas:

- Si , l'équation en Z admet deux solutions dont la somme va nous donner indirectement la


valeur de X puisque par définition et et . Nous voyons que nous avons tous les
ingrédients pour trouver la première racine de l'équation initiale qui sera la racine certaine (ou "zéro
certain"). Ainsi:
(8.110)

comme et que les racines supérieures sont cubiques nous avons nécessairement si tous les
coefficients de l'équation originale sont bien dans .

- Si , nous le savons, l'équation en Z admet une racine double et puisque le discriminant comporte une
puissance carrée de q cela signifie nécessairement que p est négatif.

Le polynôme P admet donc lui aussi une racine double et de même pour l'équation d'origine. Nous avons vu
par ailleurs que pour un polynôme du second degré si le discriminant est nul les racines sont:

(8.111)

alors par analogie:

(8.112)

- Si nous devons à nouveau utiliser les nombres complexes comme nous l'avons fait lors de notre
étude du polynôme de degré 3. Ainsi, nous savons que l'équation en Z admet deux solutions complexes telles
que:

(8.113)

et à nouveau comme les racines sont conjuguées nous pouvons écrire sous la forme condensée:

(8.114)

et comme:

(8.115)

nous avons donc:

(8.116)

Comme sont conjugués, nous avons nécessairement .

POLYNÔMES DE DEGRÉ 4

L'équation polynômiale à résoudre ici est:

(8.117)
avec .

Remarque: Nous devons cette méthode de résolution à l'italien Lodovico Ferrari mathématicien italien du
16ème siècle également.

Quitte à diviser par a nous avons:

(8.118)

Puis, en posant:

(8.119)

l'équation se réduit:

(8.120)

où nous voyons que le coefficient devant s'annule. Ainsi, tout polynôme du type:

(8.121)

peut être écrit sous la forme suivante:

(8.122)

En posant:

(8.123)
Remarque: Si , l'équation à résoudre est en réalité une "équation bicarrée". Le changement de variable
permet alors de se ramener à une équation polynomiale du deuxième degré (ce que nous savons
facilement résoudre).

Nous introduisons maintenant un paramètre t (que nous choisirons judicieusement par la suite) et nous
réécrivons l'équation polynomiale sous la forme suivante:

(8.124)

Remarque: Si le lecteur développe et distribue tous les termes de la relation précédente il retombera bien
évidemment sur .

L'idée sous-jacente est d'essayer de faire en sorte que la partie entre crochets de l'expression précédente
puisse s'écrire comme un carré tel que:

(8.125)

Car dans ce cas, en utilisant:

(8.126)

Notre équation polynomiale peut alors s'écrire:

(8.127)

et nous n'aurions plus qu'à résoudre deux équations polynomiales du deuxième degré (ce que nous savons
déjà faire).

Or, pour que nous puissions écrire:

(8.128)

Il faudrait que l'expression du deuxième degré à gauche de l'égalité n'ait qu'une seule racine. Or, nous avons
vu dans notre étude des équations polynomiales du deuxième degré que cela signifiait dès lors que le
déterminant est nul:

(8.129)

et que la racine s'exprimait par:

(8.130)

Ce qui correspond dans notre cas:

(8.131)
et donc que:

(8.132)

avec:

(8.133)

Donc finalement, si t est tel que , alors nous avons:

(8.134)

puisque le théorème fondamental des polynômes nous donne pour un polynôme du deuxième degré n'ayant
qu'une seule racine:

(8.135)

Pour conclure, il suffit de voir que trouver un nombre t vérifiant la relation:

(8.136)

est un problème de degré 3 que nous savons déjà résoudre par la méthode de Cardan.

De telles méthodes générales n'existent plus pour les degrés égaux ou supérieurs à 5 comme nous le verrons
à l'aide de la théorie de Galois (cf. chapitre d'Algèbre Ensembliste).

POLYNÔMES TRIGONOMÉTRIQUES

Définition: Nous appelons "polynôme trigonométrique" de degré N toute somme finie:

(8.137)

où .

Un polynôme trigonométrique peut aussi être écrit en utilisant les fonctions trigonométriques usuelles grâce
aux transformations suivantes:

(8.138)

Soit en utilisant la formule d'Euler (cf. chapitre sur les Nombres):

(8.139)
Ce que nous pouvons récrire aussi sous la forme:

(8.140)

En posant alors:

(8.141)

Il vient:

(8.142)

Nous verrons longuement dans le chapitre des Suites Et Séries comment utiliser ces polynômes dans le cadre
de l'étude des séries de Fourier.

POLYNÔMES CYCLOTOMIQUES

Si n est un entier naturel, nous appelons "polynôme cyclotomique" ce que nous notons traditionnellement
et que définissons comme étant le produit de tous les monômes ( ) où est un racine primitive n-
ème de l'unité de .

Pour rappel une racine n-ème de l'unité (parfois appelée "nombre de De Moivre") est un nombre complexe
dont la puissance n-ème vaut 1.

Ainsi, l'ensemble des racines n-èmes de l'unité est l'ensemble:

(8.143)

qui est un groupe cyclique (voir la Théorie Des Ensembles dans la section d'arithmétique du site et le
chapitre d'Algèbre Ensembliste dans la présente secion).

Nous appelons alors "racine primitive n-ème de l'unité" ou "R.P.N." tout élément de ce groupe l'engendrant.

Les éléments de sont donc du type:

(8.144)

avec . Nous écrivons alors l'ensemble des sous la forme:

(8.145)

Un petit exemple de polynôme cyclotomique:

(8.146)
avec:

(8.147)

qui sont donc les racines quatrième de l'unité (autrement dit chacun de ces nombres mis à la puissance 4
donne 1). Elles forment le groupe et celui-ci peut-être engendré que par i et -i (générateur du group selon
ce qui a été vu dans le chapitre de Théorie des Ensembles).

Donc un polynôme cyclotomique est le produit de facteurs qui s'écrit:

(8.148)

avec et k étant premier par rapport à n.

Les polynômes ont un grand nombre de propriétés que nous n'aborderons pas ici puisque ce site ne se veut
pas être un ouvrage de mathématiques supérieure.

POLYNÔMES DE LEGENDRE

Définition: les polynômes de Legendre sont définis par (lire de préférence les chapitres de calcul différentiel
et intégral ainsi que d'analyse fonctionnelle avant):

(8.149)

où est donc un polynôme de degré n. Nous retrouverons ces polynômes dans la résolution d'équations
différentielles en physique (propagation de la chaleur, physique quantique, chimie quantique, etc.).

Démontrons que selon la définition du produit scalaire fonctionnel (cf. chapitre d'Analyse Fonctionnelle et
de Calcul Vectoriel) que les polynômes de Legendre sont orthogonaux.

Démonstration:

Soit P un polynôme de degré . Il suffit de montrer que , c'est-à-dire que est orthogonal à
l'espace des polynômes de degré inférieur à n. Nous avons en effet:

(8.150)

en intégrant par parties nous obtenons:


(8.151)

Attention pour le terme nul ci-dessus, seulement le terme y est dérivé. Donc puisque x est au carré,
quelque soit la dérivée la valeur sera toujours la même. Ce qui justifie que le terme soit nul.

En continuant de la sorte nous obtenons après n intégrations par parties:

(8.152)

C.Q.F.D.

Remarque: Le terme dérivé est nul puisque le polynôme dérivé est de degré n-1

Voici quelques propriétés utiles en chimie quantique des:

P1.

Démonstration:

(8.153)

et par la formule de Leibniz (cf. chapitre de Calcul Différentiel Et Intégral) nous avons:

(8.154)

d'où:

(8.155)

C.Q.F.D.

P2. si n est pair:

Démonstration:

Si n est pair, est une fonction paire et donc:


(8.156)

est paire.

C.Q.F.D.

P3. si n est impair.

Démonstration:

Si n est impair, est impaire et donc:

(8.157)

est impaire.

C.Q.F.D.

Nous allons à présent démontrer la validité de la relation de récurrence suivante pour les (relations que
nous utiliserons en physique):

(8.158)

pour .

Démonstration:

est un polynôme de degré , il existe dès lors des tel que ce polynôme peut s'exprimer
comme combinaisons linéaire de la famille de polynômes constituant la base orthonormale (base qui permet
donc d'engendrer ):

(8.159)

nous pouvons dès lors écrire:

(8.160)

mais nous choisissons (parce que est dès lors de degré ):

(8.161)
Donc c'est-à-dire que nous devons avoir . Par suite:

(8.162)

Par les propriétés des polynômes de Legendre vues précédemment, nous pouvons écrire les égalités:

: (8.163)

et:

: (8.164)

d'où:

et (8.165)

Le coefficient dominant de est défini (rappelons-le) par le coefficient du monôme du plus grand degré.
Ainsi, il est donné par:

(8.166)

Donc:

(8.167)

Remarque: Le lecteur vérifiera au besoin pour un n donné que:

(8.168)

La relation:

(8.169)

que nous avons obtenu ci-dessus nous impose que le coefficient dominant du polynôme de la combinaison
linéaire soit égal au coefficient dominant du polynôme (nous avons éliminé le qui se simplifie):

(8.170)
après simplification, nous obtenons:

(8.171)

et ce qui donne finalement facilement:

(8.172)

La relation:

(8.173)

devient dès lors:

(8.174)

C.Q.F.D.

Voici les six premiers polynômes de Legendre:

(8.175)

(8.176)
9. ALGÈBRE (ET GÉOMÉTRIE) ENSEMBLISTE

N ous allons aborder sur ce site l'étude des structures ensemblistes de manière très pragmatique (puisque
rappelons que ce site est dédié aux ingénieurs). Ainsi, il sera fait usage du minimum de formalisme et
seulement les démonstrations des éléments que nous considérons comme absolument essentiels à l'ingénieur
seront présentées. Par ailleurs, de nombreuses démonstrations seront faites par l'exemple et nous nous
focaliserons en grande partie sur la théorie algébrique des groupes car elle a une place prédominant en
physique plus que pour les autres structures ensembliste.

ALGÉBRE ET GÉOMETRIE CORPORELLE

Les symétries des figures géométriques, des cristaux et de tous les autres objets de la physique
macroscopique font l'objet depuis des siècles d'observations et d'études. En termes modernes, les symétries
d'un objet donné forment un groupe.

Depuis le milieu du 19ème siècle, la théorie des groupes a pris une extension énorme, et ses applications à la
mécanique quantique et à la théorie des particules élémentaires se sont développées tout au long du 20ème
siècle.

Dans une lettre de 1877 au mathématicien Adolph Mayer, Sophus Lie écrit qu'il a crée la théorie des groupes
en janvier 1873. Il s'agit bien sûr des groupes qu'il appelait "groupes continus" et qui sont appelés
aujourd'hui "groupes de Lie". Lie cherchait à étendre l'usage des groupes du domaine des équations
algébriques, où Galois les avait introduits, à celui des équations différentielles.

Dès 1871, la notion de générateur infinitésimal d'un groupe à un paramètre de transformations était apparue
dans son oeuvre. C'est l'ensemble des générateurs infinitésimaux des sous-groupes à un paramètre d'un
groupe continu qui forme ce que nous appelons aujourd'hui une algèbre de Lie.

Ce furent Wigner et Weyl qui montrèrent le rôle prééminent de la théorie des groupes, et de leurs
représentations en particulier, dans la nouvelle mécanique quantique que développaient Heisenberg et Dirac.
L'idée générale de la théorie des représentations est d'essayer d'étudier un groupe en le faisant agir sur un
espace vectoriel de manière linéaire : nous essayons ainsi de voir le groupe comme un groupe de matrices
(d'où le terme "représentation"). Nous pouvons ainsi, à partir des propriétés relativement bien connues du
groupe des automorphismes de l'espace vectoriel (cf. chapitre de Théorie des Ensembles), arriver à déduire
quelques propriétés du groupe qui nous intéressait.

Nous pouvons considérer la théorie des représentations de groupes comme une vaste généralisation de
l'analyse de Fourier. Son développement est continu et elle a, depuis le milieu du 20ème siècle, des
application innombrables en géométrie différentielle, en théorie ergodique, en théorie des probabilités, en
théorie des nombres, dans la théorie des formes automorphes, dans celle des systèmes dynamiques ainsi
qu'en physique, chimie, biologie moléculaire et traitement du signal. À l'heure actuelle, des branches
entières des mathématiques et de la physique en dépendent.

Avant de commencer, nous renvoyons le lecteur au chapitre traitant de la Théorie Des Ensembles pour qu'il
se rappelle de la structure et des propriétés fondamentales qui constituent le groupe et également au chapitre
d'Algèbre Linéaire (car nous en utiliseront quelques résultats).

GROUPES CYCLIQUES

Le groupe cyclique (dont la définition a déjà été vue dans le chapitre de Théorie des Ensembles) va nous
servir de base dans le cadre de l'étude des groupes finis. Par ailleurs, plutôt que de faire des développements
généralisés nous avons préféré prendre des exemples particuliers afin de présenter l'idée de groupe cyclique
(approche plus adaptée à l'ingénieur).

Nous allons donc prendre l'exemple fort sympathique des heures de la montre... avec trois approches
différentes qui successivement (!) permettront d'aborder un groupe cyclique simple.

- Première approche :

Imaginons donc une horloge avec une aiguille qui peut prendre 12 positions possibles (mais pas de positions
intermédiaires). Nous noterons de manière spéciale les 12 positions possibles: (le trait au-dessus
des nombres n'est pas innocent!).

Rien ne nous empêche sur l'ensemble de ces positions de définir une addition, par exemple :

(9.1)

ce qui est similaire aux résultats que nous obtenons lorsque dans notre quotidien nous faisons des calculs
avec notre montre.

- Deuxième approche (première extension)

Si nous observons bien notre montre, nous remarquons qu'à chaque fois que nous rajoutons 12 (ou
retirons...) à une valeur des heures de notre montre alors nous tombons sur un ensemble de nombres bien
déterminé qui sont aussi dans . Ainsi (évidemment dans le cadre d'une montre seules les premières valeurs
positives nous intéressent la plupart du temps mais ici nous faisons des maths alors nous généralisons un
peu...) :

(9.2)

Nous retrouvons ici un concept que nous avions déjà vu dans le chapitre de Théorie Des Nombres. Il s'agit
de classes de congruences et l'ensemble des ces classes forment l'ensemble quotient . Si nous
munissons cet ensemble quotient d'une loi d'addition, il est normalement facile d'observer que celle-ci est un
interne à l'ensemble quotient, qu'elle est associative, qu'il existe un élément neutre et chaque élément
possède un symétrique (inverse).

Ainsi, cet ensemble quotient muni de uniquement de la loi d'addition (sinon en ajoutant la multiplication
nous pouvons former un anneau) est un groupe commutatif.

- Troisième approche (deuxième et dernière extension) :

Voyons une troisième et dernière approche qui explique pourquoi le groupe quotient est cyclique.

Si nous projetons la rotation des aiguilles de notre montre dans et que nous définissons :

(9.3)

Nous avons alors et :


(9.4)

ce qui explique pourquoi le groupe quotient est appelé "groupe cyclique" (par isomorphisme de
groupe selon ce qui a été vu en théorie des ensembles). Son isomorphe est noté .

Si nous représentons dans l'ensemble isomorphe nous obtenons alors sur le cercle unité un polygone
ayant n sommets comme le montre la figure ci-dessous :

(9.5)

Par ailleurs, le nombre d'éléments composants étant fini, est fini. Contrairement au
groupe qui est lui un groupe discret infini.

Ce concept de finitude sera peut-être plus évident avec l'exemple que nous ferons de suite après avec
où le lecteur observera que cet ensemble a le même nombre d'éléments que .

Remarque: Les mathématiciens appellent le "groupe des racines n-èmes de l'unité". Une racine n-ème de
l'unité (parfois appelée "nombre de De Moivre") est donc un nombre complexe dont la puissance n-ème vaut
1. Par ailleurs, pour un entier n donné, toutes les racines n-ème de l'unité sont situées sur le cercle unité et
sont les sommets d'un polygone régulier à n côtés ayant un sommet d'affixe 1.

Ce qui intéresse les physiciens particulièrement dans un premier temps ce sont les représentations des
groupes finis (aussi les groupes continus que nous verrons plus loin). Ainsi, la représentative de nous
est connue puisque la rotation dans le plan complexe est donnée comme nous l'a montrée notre étude des
complexes dans le chapitre sur les Nombres :

(9.6)
avec . Cette représentatives est un sous-groupe du groupe des rotations O(2) sur lesquelles nous
reviendrons plus loin. Le groupe des rotations du plan étant lui-même un sous-groupe du groupe linéaire
GL(2) (nous en donnerons une définition précise et un exemple plus loin).

Au fait, les mathématiciens sont capables de démontrer que tous les groupes quotients sont cycliques
à isomorphisme près avec . Les mathématiciens disent aussi que est un quotient fini du group
monogène .

Cette approche est par contre peut-être un peu abstraite. Alors, si le lecteur se rappelle du chapitre de
Théorie Des Ensembles nous avons vu une définition bien précise de que qu'était la cyclicité d'un groupe :
Un groupe G est dit cyclique si G est engendré par la puissance d'au moins un de ses éléments appelé
générateur tel que:

. (9.7)

Vérifions que ce soit bien le cas pour le groupe :

(9.8)

qui constitue un cas scolaire.

Nous noterons les éléments qui constituent ce groupe . Ceci étant fait, il convient de faire attention
que dans la définition ensembliste du groupe cyclique nous parlons de "puissance" si la loi interne du groupe
est la multiplication mais si la loi interne est l'addition, nous avons alors : .

Le premier élément générateur du groupe :

(9.9)

est l'élément 1. Effectivement :

(9.10)

Le deuxième élément générateur du même groupe est 3 :

(9.11)

Par contre, le lecteur pourra vérifier que 2 n'est pas générateur de ce groupe!
Au fait, en ce qui concerne les groupes les mathématiciens arrivent à démontrer que seules
les éléments du groupe qui sont premiers avec n sont générateurs (c'est-à-dire les éléments dont le plus grand
commun diviseur est 1).

Voilà pour notre introduction aux groupes cycliques. Passons maintenant à une autre catégorie des groupes.

GROUPES DE TRANSFORMATIONS

Le groupe des rotations est celui qui intéresse le plus les physiciens surtout dans les domaines des matériaux,
de la chimie, de la physique quantique et de l'art... Les mathématiciens apprécient eux l'étude des groupes de
rotation dans le cadre de la géométrie bien évidemment (mais pas seulement) et les informaticiens tout
autant les groupes linéaires. Nous en avons d'ailleurs vu un exemple de groupe de rotation juste
précédemment.

Définition: Nous appelons "groupe linéaire d'ordre n" et nous notons GL(n) les matrices inversibles (donc le
déterminant est non nul selon ce que nous avons vu dans le chapitre d'Algèbre Linéaire) dont les coefficients
sont dans un corps quelconque :

(9.12)

Un exemple simple et important de groupe linéaire est celui du sous-"groupe des transformations affines" du
plan qui est traditionnellement noté (c'est intuitif) :

(9.13)

avec (nous verrons le pourquoi du comment de l'inégalité un peu plus loin).

Prenons un exemple pratique :

(9.14)

ce qui appliqué à un cercle donnerait :

(9.15)

Cette transformation est une manière de définir les ellipses comme images d'un cercle par une
transformation affine.
Les coefficients sont sans importance pour la forme de l'image. En fait, ils induisent bien évidemment
des translations sur les figures. Nous pouvons donc nous en passer si nous cherchons seulement à la
déformer.

Ainsi, il nous reste :

(9.16)

ce qui peut s'écrire sous forme matricielle :

(9.17)

La transformation se réduit donc à la matrice :

(9.18)

et comme nous l'avons vu en algèbre linéaire, la multiplication matricielle est associative n'est pas
commutative, donc la transformation linéaire ne l'est pas non plus.

L'élément neutre est la matrice :

(9.19)

et l'inverse de F est :

(9.20)

et comme nous avons imposé tout élément y possède donc un inverse. Ainsi, le groupe linéaire
affine est non commutatif et... forme bien un groupe...

Définition: Nous appelons "groupe spécial linéaire d'ordre n" et nous notons SL(n) les matrices inversibles
dont les coefficients sont dans un corps quelconque et dont le déterminant est égal à l'unité :

(9.21)

Il s'agit évidemment d'un sous-groupe de GL(n).

En reprenant l'exemple précédant et en se rappelant que le déterminant d'une matrice carré bidimensionnelle
est (cf. chapitre d'Algèbre Linéaire) :

(9.22)
nous remarquons bien géométriquement ce que signifie d'avoir un déterminant unitaire dans ce cas!
Effectivement nous avons vu dans le chapitre d'Algèbre Linéaire lors de notre interprétation géométrique
qu'avoir un déterminant équivaut à une surface. Ainsi, le fait d'avoir ad-bc unitaire permet donc que quelque
soit l'ordre de la transformation, nous avons l'aire qui vaut toujours 1. Ainsi, le groupe spécial linéaire
conserve les surfaces.

Définition: Nous appelons "groupe orthogonal réel d'ordre n" et notons O(n) les matrices orthogonales (cf.
chapitre d'Algèbre Linéaire) données par :

(9.23)

Par ailleurs, nous avons démontré dans le chapitre d'Algèbre Linéaire lors de notre étude des matrices de
rotation que implique .

C'est le cas par exemple de la matrice de O(2) vue précédemment (elle appartient au groupe orthogonal mais
aussi au groupe des rotations que nous verrons plus loin) :

(9.24)

qui est orthogonale comme il est facile de le vérifier.

Remarque: O(1) est constitué aussi de l'ensemble des matrices triviales.... [1],[-1]

Définition: Si et que nous avons alors nous obtenons un sous-groupe de O(n) appelé
"groupe spécial orthogonal réel d'ordre n" et noté SO(n) :

(9.25)

La matrice de rotation donnée précédemment fait partie de ce groupe puisque son déterminant est égal à
l'unité! Par ailleurs, ce groupe occupe une place très spéciale en physique et nous le retrouverons de maintes
fois.

Le sous-groupe SO(2), appelé aussi parfois "groupe cercle" et noté , que nous avions aussi étudié dans le
chapitre de Géométrie Euclidienne a une représentative donnée par la matrice:

(9.26)

occupe une place à part dans la famille des groupes SO(n) avec n supérieur à l'unité. Effectivement il est le
seul à être commutatif. Par ailleurs, il est isomorphe à soit à U(1) le groupe multiplicatif des nombres
complexes de module 1. C'est aussi le groupe de symétrie propre d'un cercle et l'équivalent continu .

Le sous-groupe SO(3) donné par la matrice (cf. chapitre de Géométrie Euclidienne) :


(9.27)

pour la rotation autour de l'axe X dans l'espace tridimensionnel n'est pas commutatif. Par ailleurs les
quaternions, dont la représentative est donc SO(3), forment une groupe non commutatif aussi (par rapport à
la loi de multiplication) comme nous l'avons vu dans le chapitre sur les Nombres.

Par rapport à un vecteur unitaire on se rend facilement compte visuellement parlant que SO(3) est un sous-
groupe fermé de GL(3), c'est-à-dire de l'ensemble des groupes linéaires de dimension 3.

Remarque: SO(1) est constitué de la matrice [1].

Définition: Nous appelons "groupe unitaire d'ordre n" et nous notons U(n) les matrices dont les
composantes sont complexes (dans le cadre de ce site le plus souvent) ou réelles et qui sont orthogonales :

(9.28)

Remarquons par ailleurs que toute matrice unitaire à coefficients complexes et à une dimension... (de U(n)
donc...) est un nombre complexe de module unitaire, qui peut toujours s'écrire sous la forme .

Nous en avons déjà vu un exemple aussi sur le site lors de notre étude des spineurs dans le chapitre de
Calcul Spinoriel. Il s'agit des matrices de Pauli (utilisées dans le chapitre de Physique Quantique Relativiste)
données par :

(9.29)

Définition: Nous appelons "groupe spécial unitaire d'ordre n" et nous notons SU(n) les matrices dont les
coefficients sont complexes et qui sont orthogonales et dont le déterminant est unitaire :

(9.30)

Remarque: U(1) est égal à SU(1) et il s'agit donc du cercle unité complexe égal à . Par ailleurs, SO(2) est
commutatif et isomorphe à U(1) car c'est l'ensemble des rotations du plan.

Un exemple connu est toujours celui des matrices de Pauli mais simplement écrites sous la forme utilisée en
Physique Quantique Relativiste (voir chapitre du même nom) :

(9.31)

qui font partie de SU(2) et qui comme nous l'avons montré (implicitement) au début du chapitre de Calcul
Spinoriel est isomorphe au groupe des quaternions SO(3) de module 1 sur la sphère de dimension 3 (notée
). Relation que les mathématiciens appellent dans le cas présent un homomorphisme de revêtement....

Remarque: Le groupe spécial unitaire possède une importance particulière en physique des particules. Si le
groupe unitaire U(1) est le groupe de jauge de l'électromagnétisme (pensez au nombre complexe
apparaissant dans les solutions de l'équation d'onde!), SU(2) est le groupe associé à l'interaction faible, et
SU(3) celui de l'interaction forte. C'est par exemple grâce à la structure des représentations de SU(3) que
Gellman a conjecturé l'existence des quarks.

Avec une approche différente que celle vue dans le chapitre de Calcul Spinoriel comment montrer que les
matrices de Pauli sont les bases de SU(2).

D'abord, rappelons que nous avons montré dans de Calcul Spinoriel que toute rotation dans l'espace de trois
dimensions pouvait s'exprimer à l'aide de la relation:

(9.32)

Et nous avons vu dans le chapitre d'Informatique Quantique qu'une formulation explicite et décomposée la
relation précédente était (nous changeons les notations des angles car rien nous oblige de tourner :

(9.33)

et donc que tout élément de SU(2) est produit de ces trois matrices qui font chacune décrire à l'extrémité d'un
vecteur dans l'espace une courbe!

Maintenant, nous remarquons que ces trois matrices sont égales à:

(9.34)

lorsque . Nous obtenons donc la matrice identité. Donc si nous cherchons la tangente en ce point
conjoint, nous pouvons donc construire une base (3 vecteurs orthogonaux).

Regardons ceci:
(9.35)

Ainsi, SU(2) admet pour base:

(9.36)

et ce sont en d'autres termes les générateurs infinitésimaux du groupe SU(2). SU(2) a donc une base qui est
une Algèbre de Lie selon le vocabulaire des mathématiciens.

Ce résultat est assez remarquable... Puisque SU(2) et SO(3) sont isomorphes, nous pouvons alors obtenir la
base de l'Algèbre de Lie de SO(3) alors avec la méthode!!!

Voyons ceci! Nous avons vu dans le chapitre de Géométrie Euclidienne que les matrices de rotation étaient
données par (nous changeons le R par un U afin de ne pas confondra avec les matrices précédentes):

(9.37)

Nous remarquons à nouveau qu'en la courbe que fait décrire à un vecteur les trois matrices de
rotation passent par:

(9.38)

Alors de la même manière que pour SU(2), nous calculons les dérivées en ces angles pour déterminer les
matrices de bases génératrices de SO(3):
(9.39)

L'algèbre de Lie de SO(3) admet donc pour base:

(9.40)

En physique, on préfère travailler avec des matrices complexes. Nous introduisons alors les matrices:

(9.41)

Il faut alors remarquer que si nous définissons:

(9.42)

nous avons trivialement pour la complexe conjuguée de la matrice transposée:

(9.43)

et au fait... nous avons aussi les relations de non-commutation (ce que nous pouvons développer sur
demande):

(9.44)
(cycl.)

et aussi la relation de commutation:

(9.45)
(cycl.)

ce que satisfont aussi les matrices de Pauli et... pour rappel (ou information pour ceux qui n'ont pas encore lu
le chapitre de Physique Quantique Ondulatoire) les sont les opérateurs du moment cinétique total du
système de couplage spin-orbite!!!

GROUPES DE SYMÉTRIES
Le groupe de symétrie d'un objet noté X (image, signal, etc. en 1D, 2D ou 3D) est le groupe de toutes les
isométries sous lesquelles il est invariant avec la composition en tant qu'opération.

Tout groupe de symétrie dont les éléments ont un point fixe commun, ce qui est vrai pour tous les groupes
de symétrie de figures limitées, peut être représenté comme un sous-groupe du groupe orthogonal O(n) en
choisissant l'origine pour point fixe. Le groupe de symétrie propre est alors un sous-groupe du groupe
orthogonal spécial SO(n), et par conséquent, il est aussi appelé le groupe de rotation de la figure.

Dans ce qui suit, nous allons interpréter la composée de deux opérations de symétrie comme une
multiplication au même titre que pour les permutations.

Définition: Le groupe des symétries de X est l'ensemble des symétries de X, muni de la structure de
multiplication donnée par composition.

Exemples:

E1. Le coeur à un groupe de symétries a deux éléments (d'ordre deux), à savoir l'application identité id, et
l'application : réflexion dans l'axe vertical. Nous observons que le symétrique via la relation .

E2. La lettre à un groupe de symétries à quatre éléments, c'est donc un groupe de symétrie d'ordre 4, à
savoir l'application idendité id, les deux réflexions et et la rotation par l'angle que nous noterons .

Dans ce groupe nous avons par exemple (et c'est commutatif), est la rotation par un angle
, ce qui est la même application que l'application identique, donc .

Ainsi, le groupe de symétrie de cette lettre est commutatif et la loi de composition est bien interne. C'est
donc bien un groupe.

E3. Le pentagone régulier à un groupe de symétries à 10 éléments, c'est donc un groupe de symétrie
d'ordre 10, à savoir les 5 rotations ainsi que les 5 réflexions dans les 5 axes de
symétrie.

Les règles de multiplication sont un peu compliquées dans cet exemple mais nous pouvons néanmoins
observer que la composition est toujours une opération interne (le produit de deux réflexions est toujours une
rotation par exemple).

Plus généralement, le groupe de symétries d'un n-gone régulier (si n est impaire) a exactement 2n éléments.
Ce groupe s'appelle le "groupe diédral d'ordre n" est noté .

E4. Nous reviendrons sur cet exemple lorsque nous introduirons un peu plus loin le concept de groupe
distingué lors de notre étude des groupes de permutations et la définition des groupes distingués.

Le groupe diédral d'ordre 3 des isométries d'un triangle équilatéral à 6 éléments que nous noterons (afin
que l'écriture soit moins lourde) :

(9.46)

où sont les symétries par rapports au trois bissectrices (respectivement médiatrices). La table de
composition de ce groupe diédral montre aussi que ce groupe est non-commutatif :
id

id id
id
id
id
id
id
Tableau: 9.1 - Symétries du groupe diédral d'ordre 3

E5. Regardons un dernier exemple appliqué à la chimie en énumérant les opérations de symétrie qui laissent
la molécule (tétraèdre) invariante.

Le groupe de transformation contient 6 éléments : l'identité id, qui est la rotation de , la


rotation de (que nous noterons par la suite ) toutes deux selon l'axe Z (perpendiculaire au plan XY
donc...) et 3 axes de symétrie/réflexion passant chacun par le milieu d'un des arêtes de base au
milieu de l'arête opposée comme le montre la figure ci-dessous (pyramide vue du dessus) :

(9.47)

La combinaison des différents éléments de symétrie montre que la table de composition est (ce qui prouve
que la loi est interne et que nous travaillons donc bien dans un groupe) :

id

id id
id
id
id
id
id
Tableau: 9.2 - Compositions de transformations du tétraèdre
Attention à l'ordre, nous appliquons d'abord l'élément de ligne puis l'élément de colonne. Nous constatons
que le groupe n'est donc pas commutatif.

ORBITE ET STABILISATEUR

Nous allons voir maintenant deux définitions que nous retrouverons en cristallographie (leur nom n'est pas
innocent!).

Définition: L'orbite d'un élément x de E est donnée par:

(9.48)

L'orbite de x est l'ensemble des positions (dans E) susceptibles d'être occupées par l'image de x sous l'action
de G. Les orbites forment évidemment une partition de E.

Exemple:

Considérons un ensemble E sur lequel agit un groupe G, par:

(9.49)

l'ensemble des 6 sommets d'un hexagone sur lequel nous faisons agir le groupe . Nous
observons déjà trivialement que G est bien un groupe!

Maintenant, prenons un élément de E, par exemple .

Son orbite va donc être par définition:

(9.50)

Définition: Le stabilisateur x d'un élément de E est l'ensemble:

(9.51)

des éléments qui laissent x invariant sous leur action. C'est un sous-groupe de G.

Pour reprendre notre exemple précédent. Son stabilisateur va être réduit à:

(9.52)

GROUPES DES PERMUTATIONS

Les groupes symétriques ont une importance non négligeable dans certains domaines de la physique
quantique mais aussi en mathématiques dans le cadre de la théorie de Galois. Il convient donc d'y porter
aussi une attention toute particulière.

Rappelons d'abord (cf. chapitre de Probabilités) que dans un ensemble il y a n! permutations


possibles. Les mathématiciens disent, à juste titre, qu'il y a n! bijections et appellent ce nombre "ordre du
groupe de permutations".
Prenons par exemple l'ensemble {1,2,3}. Cet ensemble à 3! permutations possibles qui sont notées dans le
cadre des groupes de permutation de la manière suivante:

{(1), (1 2),(1 3),(2 3),(1 2 3),(1 3 2)} (9.53)

Ce qui se lit dans l'ordre : application identité id, 1 amène sur 2 ou 2 sur un 1, 1 amène sur 3 ou 3 sur 1, 2
amène sur 3 ou 3 sur 2, 1 amène sur 2 qui amène sur 3 qui amène sur 1, 1 amène sur 3 qui amène sur 2 qui
amène sur 1.

Soit de manière plus explicite:

(9.54)

Nous pouvons observer facilement que la composition de deux permutations n'est pas commutative :

(9.55)

et que la composition de deux permutations est une loi interne :

(9.56)

avec un élément neutre qui est bien l'identité id. Nous avons donc bien un groupe non commutatif.
Rappelons également au lecteur que certains éléments du groupe, s'ils sont bien choisis, peuvent former un
sous-groupe. C'est l'exemple de :

{(1), (1 2)} (9.57)

qui est un sous-groupe de (il est facile de vérifier qu'il possède toutes les propriétés d'un groupe).

Définition: Un sous-groupe H d'un groupe G est appelé "groupe distingué" si, pour tout g de G et tout h de
H, nous avons qui est élément de H. Les mathématiciens appellent cela un "automorphisme
intérieur"...

Voyons d'abord un exemple géométrique parlant après quoi nous reviendrons à cette définition avec .
Exemple:

Nous avons vu plus haut les éléments du groupe de symétrie diédral d'ordre 3 du triangle équilatéral.
Géométriquement ils correspondent tous à des déplacements du plan dans lequel se trouve le triangle. Nous
avions obtenu pour rappel le tableau de composition suivant :

id

id id
id
id
id
id
id
Tableau: 9.3 - Compositions de transformations du tétraèdre

D'abord, nous constatons facilement à l'aide de ce tableau que nous avons :

- Le sous-groupe formé de {id} d'ordre 1

- Le sous-groupe formé de d'ordre 3

- Le sous-groupe formé de d'ordre 2

- Le sous-groupe formé de d'ordre 2

- Le sous-groupe formé de d'ordre 2

Parmi ces 5 sous-groupes, voyons lesquels sont distingués (cela est relativement facile à visualiser à l'aide
du tableau de composition) :

- Le sous-groupe formé de {id}

- Le sous-groupe formé de

Nous allons voir maintenant une chose remarquable! En numérotant par 1,2 et 3 les sommets du triangle
équilatéral, nous pouvons identifier les éléments de aux éléments suivants de :

(9.58)

et reconstruire la même table de composition!

Bon... ce petit interlude fermé, revenons au groupe distingué de (car il va être important pour notre
introduction aux groupe de Galois) et rappelons d'abord que :
(9.59)

Nous construisons joyeusement la table de composition (copie de la précédente.. hé hé!) :

(1) (1 2 3) (1 3 2) (1 2) (1 3) (2 3)
(1) (1) (1 2 3) (1 3 2) (1 2) (1 3) (2 3)
(1 2 3) (1 2 3) (1 3 2) (1) (2 3) (1 2) (1 3)
(1 3 2) (1 3 2) (1) (1 2 3) (1 3) (2 3) (1 2)
(1 2) (1 2) (1 3) (2 3) (1) (1 2 3) (1 3 2)
(1 3) (1 3) (2 3) (1 2) (1 3 2) (1) (1 2 3)
(2 3) (2 3) (1 2) (1 3) (1 2 3) (1 3 2) (1)
Tableau: 9.4 - Composition du groupe distingué

et nous voyons que le sous-groupe distingué est formé de :

(9.60)

Définition: Pour tout sous-groupe H stable par les automorphismes intérieurs d'un groupe G, nous appelons
"indice de H dans G" le quotient de l'ordre du groupe G par l'ordre du sous-groupe H et nous l'écrivons
[G/H].

Par exemple, l'indice du sous-groupe {(1), (1 2)}dans le groupe est 6/2 c'est-à-dire 3. Ce concept nous
sera très utile lors de notre introduction aux corps de Galois plus loin.

Considérons maintenant, la permutation particulière pour aborder le sujet sous un angle différent mais
équivalent :

(9.61)

Les mathématiciens ont pour habitude de noter cela, dans un premier temps, sous la forme :

(9.62)

avec :

(9.63)

Etant donné et , deux permutations, il est naturel de regarder leur composition (rappelons que
cela signifie d'abord , puis comme pour la composition de fonctions).

Ainsi, si :

et (9.64)

Alors :
(9.65)

et :

(9.66)

Maintenant, l'idée est d'interpréter la composition comme une multiplication de permutations. Cette
multiplication est alors non-commutative comme nous venons de le constater dans l'exemple précédent.
Nous avons en général .

Chaque bijection a un inverse (une fonction réciproque). Dans notre exemple il s'agit de évidemment de :

(9.67)

Géométrique, pour calculer l'inverse d'un élément , il suffit de prendre la réflexion du dessin
de dans un axe horizontal comme le montre la partie gauche de la figure ci-dessous:

(9.68)

Définitions:

D1. L'ensemble des permutations d'un ensemble avec n éléments, muni de cette structure de multiplication,
s'appelle le "groupe des permutations d'ordre n" ou "groupe des substitutions d'ordre n", et se note ou
encore S(n).

D2. Nous disons qu'un élément de est un "cycle d'ordre k", ou un "k-cycle", s'il existe
tel que :

- envoie sur , sur ,..., sur , et sur

- fixe tous les autres éléments de

et nous notons le cycle de la manière .

Pour mieux comprendre reprenons notre exemple de :


(9.69)

Ce groupe symétrique est un 3-cycle noté car dans l'ordre : 1 envoie sur 3, 3 envoie sur 4 et 4
envoie sur 1 (et le 2 n'étant pas mentionné il reste fixe). Nous pouvons noter cela aussi des façons suivantes
équivalents : ou encore .

Définition: L'ordre d'un k-cycle est k (d'où le nom!).

Effectivement si nous reprenons , nous avons alors :

et (9.70)

Définition: Nous disons qu'une permutation est un "cycle" s'il existe tel que est un k-cycle.

Attention! Toute permutation doit s'écrire comme un produit de cycles disjoints (c'est-à-dire qu'un nombre
qui apparaît dans un cycle ne doit pas apparaître dans un autre cycle). Par exemple, dans , nous avons :

(9.71)

Donc cette permutation est un produit d'un 4-cycle et d'un 3-cycle disjoint.

Nous laisserons d'ailleurs le lecteur vérifier par lui-même que l'ordre de ce groupe est 12...

Remarque: Les mathématiciens peuvent démontrer que si est un élément qui a une décomposition en c
cycles disjoints de longueur alors l'ordre de est le plus petit commun multiple des ordres de
tous les cycles disjoints qui le compose.

Nous supposerons également intuitif que dans le vocabulaire commun, un 2-cycle dans s'appelle aussi
une "transposition".

Allons un petit peu plus loin. Nous nous proposons de montrer par l'exemple que l'ensemble des
transpositions engendre . Autrement, dit, toute permutation s'écrit comme un produit de transpositions.

Reprenons notre exemple (il s'agit d'une permutation paire) :

(9.72)

En général, un k-cycle s'écrit donc comme produit de k-1 transpositions.

Définition: Soit une permutation. Nous disons que est "permutation paire" si, dans une écriture
de comme produit de transposition, il y a un nombre paire de transpositions. Nous disons que est
"permutation impaire" si, dans une écriture de comme produit de transpositions, il y a un nombre impaire
de transpositions.
Finissons par un petit complément... Nous avons que est un groupe des permutations d'ordre 3 avec donc
3!=6 permutations possibles.

Si nous énumérons les 6 permutations nous avons vu que nous obtenons :

{(1), (1 2),(1 3),(2 3),(1 2 3),(1 3 2)} (9.73)

Parmi ceux-ci seulement certains peuvent être écrit comme un produit pair de transpositions :

(1 2 3)=(1 2)(3 1) et (1 3 2)=(1 3)(2 1) (9.74)

Les permutations paires forment avec la permutation identité id, un sous-groupe (non commutatif) que nous
appelons le "groupe alterné d'ordre n" et que nous notons . C'est facile de le vérifier avec l'exemple
précédent.
10. CALCUL DIFFÉRENTIEL ET INTÉGRAL (1/2)

L e calcul différentiel est un des domaines les plus passionnants et vastes de la mathématique, et il existe
une littérature considérable (colossale) sur le sujet. Les résultats retrouvent des implications dans
absolument tous les domaines de la physique, de l'informatique, de l'électronique, de la chimie, de la
finance, de la biologie et de la mathématique elle-même.

Les mathématiciens ont rédigé une telle quantité de théorèmes sur le sujet que la validation d'un échantillon
de ceux-ci est délicate car nécessitant à eux-seuls la vie d'un homme pour être parcourus (c'est un problème
que la communauté des mathématiciens reconnaît) et vérifiés (ce qui fait que personne ne les vérifie...).

Ce constat fait, nous avons choisi de ne présenter ici que les points absolument nécessaires à la
compréhension des outils fondamentaux de l'ingénieur. Les puristes nous excuseront donc pour l'instant de
ne pas présenter certains théorèmes qui peuvent leur sembler indispensables mais que nous rédigerons une
fois le temps venu...

Nous allons principalement étudier dans ce qui va suivre ce que les mathématiciens aiment bien préciser (et
ils ont raison) : les cas généraux des fonctions réelles à une variable réelle. Les fonctions plus complexes (à
plusieurs variables réelles ou complexes, continues ou discrètes) viendront une fois cette partie terminée.

Remarque: Nous ne nous attarderons pas à démontrer les dérivées et primitives de toutes les fonctions car
comme il y a une infinité de fonctions possibles, il y a également une infinité de dérivées et de primitives.
C'est le rôle des professeurs dans les instituts scolaires d'entraîner les élèves à appliquer et à comprendre le
raisonnement de dérivation et d'intégration par des applications sur des fonctions connues (l'internet ne
remplacera très probablement jamais l'école à ce niveau).

CALCUL DIFFÉRENTIEL

Soit une fonction f réelle à une variable réelle x notée f(x) (nous nous limitons à ce cas de figure pour
l'instant et étudierons les dérivées partielles dans des espaces à un nombre de dimensions quelconques plus
loin) continue au moins dans un intervalle où se situe l'abscisse a.

Définitions:

D1. Nous appelons "pente moyenne", ou encore "coefficient directeur" le rapport de la projection
orthogonale de deux points de la fonction f non nécessairement continue sur l'axe des abscisses et des

ordonnées tel que : (10.1)

Ce qui se représente sous forme graphique de la manière suivante avec une fonction particulière:

(10.2)
Remarque: signifiant "un delta" exprime le fait que nous sous-entendons une différence d'une même
quantité.

Nous supposerons comme évident (sans démonstration) que deux fonctions dont les pentes sont les mêmes
dans un même intervalle de définition, y sont parallèles (ou confondues).

Nous démontrerons dans le chapitre de Géométrie Analytique que deux fonctions dont la multiplication des
pentes vaut -1 sont perpendiculaires.

D2. Nous appelons "nombre dérivé en a" ou "pente instantanée" ou encore "dérivée première", la limite
quand h tend vers 0 (si elle existe) du rapport de la projection orthogonale de deux points infiniment
proches de la fonction f continue (dans le sens qu'elle ne contient pas de "trous") sur l'axe des abscisses et
des ordonnées tel que :

(10.3)

Une interprétation graphique donne donc bien que f '(a) est le coefficient directeur (la pente de la tangente au
point d'abscisse a).

Remarques:

R1. d signifiant un "différentiel" exprime le fait que nous sous-entendons une différence infiniment petite
d'une même quantité.

R2. Nous renvoyons le lecteur au chapitre d'Analyse Fonctionnelle pour la définition de ce qu'est une
fonction continue.

D3. Soit f une fonction définie sur un intervalle I et dérivable en tout point a de I, la fonction qui à tout réel
a de I associe le nombre f '(a) est appelée "fonction dérivée de f sur I" et est notée f '.

Remarque: Au niveau des notations les physiciens adoptent suivant leur humeur différentes notations
possibles pour les dérivées. Ainsi, considérons la fonction réelle à une variable f(x), vous trouverez dans la
littérature ainsi que dans le présent site les notations suivantes pour la dérivée première :

(10.4)

ou encore en considérant implicitement que f est fonction de x (ceci permet d'alléger un petit peu la tailles

des développements) : (10.5)

Nous pouvons de la même manière définir les dérivées d'ordre 2 (dérivée d'une dérivée), les dérivées d'ordre
3 (dérivée d'une dérivée d'ordre 2) et ainsi de suite. Nous rencontrerons par ailleurs très fréquemment de
telles dérivées en physique (et même en maths pour l'analyse fonctionnelle).

Maintenant, suite à un problème de compréhension de la part d'un internaute dans un des chapitres du site,
précisons une technique utilisée fréquemment par les physiciens. Considérons une dérivée d'ordre 2 telle que
:

(10.6)
Si nous regardons le d/dx comme un opérateur différentiel nous pouvons bien évidemment écrire :

(10.7)

Finalement nous avons : (10.8)

et donc il vient après simplification par f(x) : (10.9)

sinon quoi nous ne pouvons pas avoir cette égalité si l'opérateur agit explicitement sur une fonction dans une
relation mathématique ou physique quelconque.

Cela peut paraître évident pour certains mais parfois moins pour d'autres et il était visiblement utile de
préciser cela car c'est souvent utilisé dans les chapitre de relativité et physique quantique.

Indiquons et démontrons maintenant deux propriétés intuitivement évidente des dérivées et qui nous seront
plusieurs fois indispensables pour certaines démonstrations sur ce site (comme par exemple dans le chapitre
de méthodes numériques ou ici même...).

Considérons d'abord deux nombres réels et f une fonction à valeurs réelles continue sur [a,b] et
dérivable sur ]a,b[ telle que . Alors nous voulons démontrer qu'il existe bien évidemment au
moins un élément c de ]a,b[ tel que (c'est typiquement le cas des fonctions polynômial!).

Cette propriété est appelée "théorème de Rolle" et donc explicitement elle montre qu'il existe au moins un
élément où la dérivée de f est nulle si en la parcourant nous revenons à la même valeur des images pour deux
valeurs distinctes des abscisses, c'est-à-dire qu'il existe au moins un point où la tangente est horizontale.

Démonstration:

Si f est constante, c'est immédiat...

Dans le cas contraire, comme f est continue sur l'intervalle fermé borné [a,b] elle admet au moins un
minimum global ou maximum global compte tenu que nous nous basons sur l'hypothèse que et
que f n'est pas constante. L'extrema est atteint en un point c appartenant à l'intervalle ouvert ]a,b[ (le fait de
prendre l'intervalle ouvert permet dans certains cas d'éviter d'avoir un extrema à nouveau en a ou en b).

Supposons comme premier cas que f(c) est maximum global. La dérivée de la fonction f entre c et un
deuxième point ont alors un signe connu.

Pour h strictement positif et tel que c+h appartienne à l'intervalle [a,b] : (10.10)

En considérant la limite quand h tend vers 0, le nombre dérivé est négatif.

Pour h strictement négatif et tel que c+h appartienne à l'intervalle [a,b] : (10.11)

En considérant la limite quand h tend vers 0, le nombre dérivé f '(c) est positif.
Au bout du compte, la dérivée de f est nulle au point c.

La démonstration est analogue si f(c) est un minimum global, avec les signes des dérivées qui sont les
opposés.

Maintenant, considérons deux réels et f(x) une fonction continue sur [a,b] et dérivable sur ]a,b[. Alors,
nous nous proposons de montrer qu'il existe au moins un réel tel que :

(10.12)

Ce qui peut aussi s'écrire sous la forme suivante : (10.13)

avec .

Géométriquement cela signifie qu'en au moins un point c du graphe de la fonction f(x), il existe une tangente

de coefficient directeur : (10.14)

Graphiquement cela donne :

.
(10.15)

Démonstration:

Nous avons d'abord : (10.16)

car la pente de h(x) est bien évidemment et comme lorsque nous devons avoir
f(a) il s'ensuit donc la relation donnée précédemment.

Ensuite, pour démontrer qu'un tel point c existe, l'idée est de rapporter les deux points a et b à la même
ordonnée ce qui en fait nous ramène au théorème de Rolle et pour cela, nous définissons une fonction g par :

(10.17)
qui est telle que effectivement ... et en l'occurrence égal à 0 (mais cette valeur importe peu). Dès
lors, le théorème de Rolle vu précédemment nous indique qu'il existe un point entre a et b où la dérivée de

g(x) est nulle tel que . Et en constatant que : (10.18)

nous obtenons : (10.19)

Soit après simplification : (10.20)

Puisque le terme de gauche représente un accroissement fini du terme de droite, alors ce résultat est appelée
"théorème des accroissements finis" (TAF).

A l'aide de ce petit théorème et des outils mathématiques introduits précédemment, nous pouvons construire
un petit théorème fort utile et puissant en physique.

Définition: Nous appelons "règle de L'Hôpital" (également appelée "règle de l'Hospital" ou "règle de
Bernoulli") le procédé qui utilise la dérivée dans le but de déterminer les limites difficiles à calculer de la
plupart des quotients et qui apparaissent souvent en physique.

Démonstration:

Considérons deux fonctions f(x) et g(x) et telles que alors nous pouvons écrire:

(10.21)

Alors selon la définition de la dérivée:

(10.22)

Nous pouvons généraliser ce résultat précédent initialement basé sur la contrainte un peu trop forte:

(10.23)

Démonstration:

Rappelons donc que selon le théorème des accroissements finis, si f(x) est dérivable sur un intervalle ]a,b[ et
continue sur [a,b] alors il existe un réel c dans l'intervalle [a,b] tel que:

(10.24)

Si le théorème se vérifie pour deux fonctions satisfaisant aux mêmes contraintes alors nous avons deux
fonctions telles que:

et (10.25)
Si g'(c) est non nul nous avons alors tout à fait le droit d'écrire le rapport (certains appellent cela le
"théorème des accroissements fini généralisé"...) :

(10.26)

ce qui sans perdre en validité tant que c est dans l'étau [a,x] peut s'écrire:

(10.27)

Ainsi, lorsque ce qui implique que l'étau [a,x] se referme et donc nous avons:

(10.28)

Ainsi, nous venons de prouver quand dans la démonstration précédente de la règle de l'Hôpital la relation:

(10.29)

que nous avions est vraie en toute généralité et qu'il n'est pas nécessaire que soit vrai pour
que le résultat soit juste!

DIFFÉRENTIELLES

Nous avons indiqué précédemment ce qu'était un différentiel d. Mais il existe en fait plusieurs types de
sortes de différentielles d'une fonction (remarquez que nous distinguons le genre masculin et féminin du
terme) :

1. Les différentiels

2. Les différentielles partielles

3. Les différentielles totales exactes

4. Les différentielles totales inexactes

Rappelons que nous appelons "différentiel df" d'une fonction f à une variable la relation donnée par (voir
texte précédent) : (10.30)

Cependant, pour exprimer l'effet d'un changement de toutes les variables d'une fonction f de plusieurs
variables, nous devons utiliser un autre type de différentiel que nous appelons la "différentielle totale"
(dérivée en deux sous-familles : différentielle totale exacte et différentielle totale inexacte).

Soit par exemple, une fonction f(x, y) des deux variables x et y. L'accroissement df de la fonction f, pour un
accroissement fini de x à et de y à est : (10.31)

que nous pouvons aussi écrire :

(10.32)
ou encore: (10.33)

Pour des accroissements infiniment petits de x et y :

(10.34)

Intéressons nous dès lors aux deux termes au passage à la limite:

et (10.35)

Le premier terme de gauche, nous le voyons, ne donne finalement que la variation en x de la fonction f(x, y)
en ayant y constant sur la variation. Nous notons cela dès lors (si la connaissance des variables constantes est
triviale, nous ne les indiquons plus) :

(10.36)

et de même : (10.37)

Les deux expressions : et (10.38)

sont ce que nous appelons des "différentielles partielles".

Il vient dès lors : (10.39)

qui est la "différentielle totale exacte" de df. Il est important de se rappeler de la forme de cette relation que
nous retrouverons partout dans des opérateurs particuliers en physique, dans la mécanique des fluides, dans
la thermodynamique, etc.

Remarque: De la même manière, pour une fonction de plus de deux variables, par exemple f(x, y, z), la
différentielle totale df est:

(10.40)

Dans l'équation ci-dessus, la différentielle df a été calculée à partir de l'expression de la fonction f. Puisqu'il
existe une fonction f qui vérifie l'expression de df, la différentielle df est dite alors aussi "totale exacte".

Profitons pour faire une indication importante sur l'utilisation des dérivées partielles par les physiciens (et
donc dans les nombreux chapitres y relatifs du site). Nous avons vu plus haut que si f dépend de deux

variables x, y nous avons toujours : (10.41)


et s'il ne dépend que d'un variable nous avons alors : (10.42)

et alors : (10.43)

raison pour laquelle les physiciens mélangent allègrement les deux notations...

Maintenant, il faut cependant savoir qu'il existe également des différentielles totales exactes, qu'aucune
fonction ne vérifie. Dans ce cas, nous parlons de "différentielle totale inexacte" et pour déterminer si une
différentielle totale est exacte ou inexacte, nous utilisons les propriétés des dérivées partielles (cas très
important en thermodynamique!!!).

Soit la forme différentielle : (10.44)

où M(x,y) et N(x,y) sont des fonctions des variables x et y. Si dz est une différentielle totale exacte, alors :

(10.45)

Il faut donc que : et (10.46)

ou encore, en effectuant une seconde dérivation, que:

et (10.47)

Avant de continuer, nous avons besoin d'un résultat donné par le "théorème de Schwarz" qui s'énonce de la
manière suivante :

Soit une fonction f, si : (10.48)

sont continues alors nous avons (il faut vraiment vérifier que ce soit le cas!) :

(10.49)

pour tout où U est le domaine de définition où f est continue (et donc dérivable).

Démonstration:

Nous considérons l'expression :

(10.50)

Posons : et (10.51)
Nous avons alors : (10.52)

Par le théorème des accroissements finis :

(10.53)

avec En reprenant les définitions de g et w nous obtenons :

(10.54)

en appliquant à nouveau le théorème des accroissements finis aux deux membres entre parenthèses nous
trouvons :

(10.55)

avec Pour finir : (10.56)

et par continuité lorsque , nous avons : (10.57)

Plus simplement écrit : (10.58)

Par récurrence sur le nombre de variables nous pouvons démontrer le cas général (c'est long mais c'est
possible, nous le ferons si besoin il y a...).

Donc finalement pour en revenir à notre problème initial, nous avons donc : (10.59)

Ce qui nous donne finalement : (10.60)

C'est donc la condition que doit satisfaire une différentielle totale pour être une différentielle totale exacte et
la condition qu'elle ne doit pas satisfaire pour être une différentielle totale inexacte!!!
Afin de ne pas confondre les deux types de différentielles, nous utilisons le symbole pour représenter une
différentielle totale inexacte et d pour une différentielle totale exacte. La distinction est extrêmement
importante car seules les différentielles totales exactes ont une intégrale qui ne dépend que des bornes
d'intégration (puisque toutes les variables changent en même temps) :

mais (10.61)

Autrement dit, la variation d'une fonction dont la différentielle est totale exacte, ne dépend pas du chemin
suivi, mais uniquement des états initiaux et finaux. Nous appelons une telle fonction qui satisfait à une
différentielle totale exacte, une "fonction d'état", c'est-à-dire une fonction dont la valeur ne dépend que de
l'état présent et futur, et non de son histoire.

Cette distinction est très importante et particulièrement en thermodynamique où il convient de déterminer si


une quantité physique est une différentielle totale exacte (une "fonction d'état" donc) ou non afin de savoir
comment évoluent les systèmes.

Exemple:

Un exemple important de forme différentielle en thermodynamique, est le travail élémentaire d'une


force exercée sur un corps en mouvement dans le plan Oxy, nous avons :

(10.62)

et ne dérivent pas nécessairement d'un même potentiel U(x,y) tel que : (10.63)

est donc une différentielle totale inexacte!

DÉRIVÉES USUELLES

Nous allons démontrer ici les dérivées les plus fréquentes (une petite trentaine) que nous puissions
rencontrer en physique théorique et mathématique ainsi que certaines de leurs propriétés. La liste est pour
l'instant non exhaustive mais les démonstrations étant généralisées, elles peuvent s'appliquer à un grand
nombre d'autres cas (que nous appliquerons/rencontrerons tout au long de ce site).

1. Dérivée de :

Partons d'abord d'un cas particulier, la dérivée de :

Soit donc a un réel quelconque fixé, alors:

(10.64)

Le nombre dérivé en a de la fonction cube est donc .

Nous pouvons généraliser ce résultat pour tout entier naturel positif ou négatif n et nous allons voir que la
fonction f définie sur par est dérivable et que sa dérivée f' est définie par .
(10.65)

Ainsi, nous avons (quelques exemples peuvent êtres utiles pour comprendre la portée de ce résultat):

(10.66)

Nous voyons donc qu'en ayant déterminé la dérivée d'une fonction de la forme , nous avons également
déterminé la dérivée de toute fonction qui est mise sous cette forme tel que:

et (10.67)

Cependant, les fonctions: (10.68)

ne sont pas dérivables en puisque la fonction n'y est plus définie (division par zéro). De plus, en ce qui
concerne la fonction comportant la racine (puissance non entière), la dérivée n'est pas définie dans .

Cependant, le résultat précédent donne un résultat intéressant pour les fonctions constantes telle que:

(10.69)

il n'est alors pas difficile de déterminer la dérivée qui vaut simplement:

(10.70)

Donc la dérivée de toute fonction constante est nulle (il est important de se souvenir de ce résultat quand
nous étudierons les propriétés des intégrales) !!!

2. Dérivée de la fonction f(x)=cos(x):

Soit donc a un réel quelconque fixé, alors (attention! il est utile de connaître les relations trigonométriques
remarquables que nous démontrons dans le chapitre de trigonométrie dans la section de géométrie):
(10.71)

Puisque: (10.72)

Effectivement, rappelons que la fonction sin(x) est assimilable (visuellement et mathématiquement) à une
droite de fonction au voisinage de .

Donc pour résumer: (10.73)

3. Dérivée de la fonction f(x)=sin(x) :

Soit donc a un réel quelconque fixé, alors (attention! il est utile de connaître les relations trigonométriques
remarquables que nous démontrons dans le chapitre de trigonométrie dans la section de géométrie):

(10.74)

Donc pour résumer: (10.75)

4. Dérivée de la fonction :

La dérivée de la fonction est égale à , c'est-à-dire si : (10.76)

alors: (10.77)

Démonstration:

Si est l'accroissement de la fonction pour un accroissement correspondant de la variable


x, alors :
(10.78)

et nous pouvons écrire : (10.79)

Multiplions et divisons par x l'expression figurant dans le membre droit de la dernière égalité :

(10.80)

Désignons la quantité par . Il est évident que quand tend vers zéro pour un x donné. Par

conséquent : (10.81)

Or, nous retrouvons ici une autre provenance historique de la constante d'Euler (cf. chapitre d'Analyse

Fonctionnelle) où : (10.82)

Ainsi : (10.83)

Une cas particulier important est le cas où a=e. Nous avons alors : (10.84)

5. Dérivée d'une somme de fonctions :

Soient u et v deux fonctions. La fonction somme est dérivable sur tout intervalle où u et v sont
dérivables, sa dérivée est la fonction s' somme des fonctions dérivées u' et v' de u et v.

Ce résultat se généralise pour une somme d'un nombre quelconque fixé de fonctions.

Démonstration:

Soit a un réel fixé et u et v deux fonctions définies et dérivables en a:

(10.85)

Donc la dérivée d'une somme est la somme des dérivées.

6. Dérivée d'un produit de fonctions :


Soient u et v deux fonctions. La fonction produit est dérivable sur tout intervalle où u et v sont
dérivables, sa dérivée première est la fonction p' telle que :

(10.86)

Démonstration:

Soit a un réel fixé et u et v deux fonctions définies et dérivables en a:

(10.87)

Nous rajoutons à cette dernière relation deux termes dont la somme est nulle tel que:

(10.88)

Mais il existe une formulation plus générale que la dérivée première d'un produit :

Considérons pour cela toujours nos deux fonctions u et v, n fois dérivables sur un intervalle I. Alors le
produit uv est n fois dérivable sur I et :

(10.89)

et ceci constitue la "formule de Leibniz" que nous avons utilisé dans le chapitre de calcul algébrique pour
l'étude des polynômes de Legendre (qui nous sont eux-mêmes indispensables pour l'étude de la chimie
quantique).

La démonstration de la formule est très proche de celle fait pour le binôme de Newton (cf. chapitre de Calcul
Algébrique).

Démonstration:

Soit : (10.90)

D'autre part : (10.91)

La formule est ainsi bien initialisée.


La démonstration se fait par récurrence. Ainsi, le but est de montrer que pour que si :

(10.92)

alors :

(10.93)

Nous avons donc :

(10.94)

Nous allons procéder à un changement de variable dans la première somme pour ne plus avoir le terme en
k+1. Nous posons pour cela :

(10.95)

Si nous revenons à la lettre k, nous avons donc :

(10.96)

Nous avons donc :

(10.97)

Nous voulons réunir les deux sommes. Pour cela, nous écartons les termes en trop dans chacun d'elles :

(10.98)

Ce qui donne donc :

(10.99)

D'après la formule de Pascal (cf. chapitre de Probabilités), nous avons : (10.100)


Donc : (10.101)

Or : (10.102)

Donc : (10.103)

7. Dérivée d'une fonction composée :

Soit la fonction composée de deux fonctions u et g dérivables, la première en u(x), la seconde en


x, la fonction dérivée f' est définie par , c'est-à-dire :

(10.104)

Démonstration:

Soit a un réel fixé et u une fonction définie et dérivable en a et g une fonction définie et dérivable en u(a) :

(10.105)

posons , nous avons alors: (10.106)

continuons notre développement précédent:

(10.107)

Donc la dérivée d'une fonction composée est donnée par la dérivée de la fonction multipliée par la "dérivée
intérieure". Par ailleurs, ce type de dérivation est très important car souvent utilisé en physique sous la
dénomination de "dérivation en chaîne".

Voyons de quoi il s'agit. La dernière relation obtenu peut être écrite sous une autre forme si nous posons

et : (10.108)

Ce qui peut s'étendre à des cas plus compliqués par exemple si alors :

(10.109)

8. Dérivée d'une fonction réciproque :


Si la fonction f est continue, strictement monotone sur un intervalle I, dérivable sur I, alors la fonction
réciproque est dérivable sur l'intervalle f(I) et admet pour fonction dérivée:

(10.110)

En effet, nous pouvons écrire : (10.111)

C'est-à-dire (application identité) : (10.112)

Par application de la dérivation des fonctions composées:

(10.113)

d'où: (10.114)

Pour une variable x, nous poserons pour la dérivée de la fonction réciproque: (10.115)

10. Dérivée de la fonction arccos(x) :

En utilisant le résultat précédent de la fonction réciproque, nous pouvons calculer la dérivée de la fonction

arccos(x) : (10.116)

11. Dérivée de la fonction arcsin(x) :

En utilisant le résultat précédent de la fonction réciproque, nous pouvons calculer la dérivée de la fonction

arcsin(x) : (10.117)

12. Dérivée d'un quotient de deux fonctions :

La fonction est dérivable sur tout intervalle où les fonctions u et v sont dérivable et où la fonction

v est non nulle et: (10.118)

Démonstration:

La fonction f peut être considérée comme le produit de deux fonctions : la fonction u et la fonction 1/v. Une
produit de deux fonctions est dérivable si chacune d'elle est dérivable, il faut donc que la fonction u soit
dérivable et que la fonction 1/v soit également dérivable ce qui est le cas quand v est dérivable non nulle.

(10.119)
13. Dérivée de la fonction tan(x) :

Par définition (cf. chapitre de Trigonométrie) nous avons : (10.120)

et en appliquant donc la dérivée d'un quotient vu précédemment, nous avons :

(10.121)

ou encore : (10.122)

14. Dérivée de la fonction cot(x) :

Par définition (cf. chapitre de Trigonométrie), : (10.123)

et donc (dérivée d'un quotient à nouveau) : (10.124)

ou encore :

(10.125)

15. Dérivée de la fonction arctan(x) :

Nous utilisons les propriétés dérivées des fonctions réciproques :

(10.126)

16. Dérivée de la fonction arccot(x) :

Selon la même méthode que précédemment :

(10.127)

17. Dérivée de la fonction :

Nous verrons lors de notre étude des méthodes numérique (cf. chapitre de Méthodes Numériques) que le
"nombre d'Euler" peut être calculé selon la série :

(10.128)
qui converge sur . En dérivant terme à terme cette série qui converge, il vient :

(10.129)

Ainsi l'exponentielle est sa propre dérivée. Ainsi, nous pouvons nous permettre d'étudier les dérivées de
quelques fonctions trigonométriques hyperboliques (cf. chapitre de Trigonométrie).

18. Dérivée de la fonction sinh(x) :

Rappel : (10.130)

Donc trivialement : (10.131)

19. Dérivée de la fonction cosh(x) :

Rappel : (10.132)

Donc trivialement : (10.133)

20. Dérivée de la fonction tanh(x) :

Puisque par définition : (10.134)

Donc en appliquant la dérivée d'un quotient nous obtenons :

(10.135)

Ou encore : (10.136)

21. Dérivée de la fonction coth(x) :

Rappel : (10.137)

et donc : (10.138)

22. Dérivée de la fonction arcsinh(x) :

Nous appliquons les propriétés des dérivées des fonctions réciproques :


(10.139)

Or (voir à nouveau le chapitre de Trigonométrie) :

(10.140)

et donc : (10.141)

Etant donné que cosh ne prend que des valeurs positives, nous avons :

(10.142)

Donc finalement : (10.143)

23. Dérivée de la fonction arccosh(x) :

Nous appliquons les propriétés des dérivées des fonctions réciproques :

(10.144)

Or selon la même méthode que précédemment :

(10.145)

d'où : (10.146)

Etant donné que ne prend que des valeurs positives nous avons alors :

(10.147)

Donc : (10.148)

24. Dérivée de la fonction arctanh(x) :

En appliquant les propriétés des dérivées des fonctions réciproques) :

(10.149)

25. Dérivée de la fonction arccoth(x) :

En appliquant les propriétés des dérivées des fonctions réciproques) si :


(10.150)

26. Dérivée de la fonction :

Avec : (10.151)

Donc (dérivée d'une fonction composée) : (10.152)

CALCUL INTEGRAL

Nous allons aborder ici les principes élémentaires et de base du calcul intégral. La suite (avec plus de
rigueur) viendra en fonction du temps qui est la disposition des responsables du site.

INTEGRALE DÉFINIE

Une valeur approchée de l'aire sous une courbe peut être obtenue par un découpage en n bandes
rectangulaires verticales de même largeur. En particulier on peut réaliser un encadrement de cette aire à
l'aide d'une somme majorante et d'une somme minorante pour un découpage donné.

(10.153)

Supposons que le nombre n de bandes tende vers l'infini. Comme les bandes sont de même largeur, la
largeur de chaque bande tend vers 0.

Si les sommes et ont toutes deux une limite lorsque, le nombre n de bandes, tend vers l'infini, alors
l'aire A sous la courbe est comprise entre ces deux limites.

Nous avons : (10.154)

Si ces deux limites sont égales, leur valeur est celle de l'aire sous la courbe.

D'où une première définition de l'intégrale définie ou dite "intégrale de Riemann":

Soit un intervalle [a, b], divisé en n parties égales, soit f une fonction continue sur l'intervalle [a, b], soit
, la somme algébrique minorante et soit , la somme algébrique majorante. Nous appelons "intégrale

définie" de f, depuis a jusqu'à b, notée : (10.155)


le nombre A tel que : (10.156)

pourvu que cette limite existe. Si cette limite existe, alors nous disons que f est "intégrable" sur [a, b] et
l'intégrale définie existe.

Intuitivement, il est évident que lorsque , nous étendons la définition ainsi :

(10.157)

Remarques:

R1. Pour calculer l'aire majorante et l'aire minorante, il n'est pas nécessaire que la largeur des sous-
intervalles du découpage soit la même partout.

R2. Le fait de chercher cette limite s'appelle "calculer l'intégrale".

R3. Les nombres a et b sont appelés les "bornes d'intégration", a est la "borne inférieure", b est la "borne
supérieure".

R4. D'autres lettres que x peuvent être employées dans la notation de l'intégrale définie. Ainsi si f est

intégrable sur [a, b], alors etc. C'est la raison pour laquelle la variable x de la
définition est dite "variable muette".

R5. Comme nous le verrons plus loin, il est essentiel de ne pas confondre "intégrale définie" et "intégrale

indéfinie". Ainsi, une intégrale indéfinie, notée est une fonction, ou, plus précisément, une famille
de fonctions appelées aussi "primitives de f" (voir plus bas) alors qu'une intégrale définie, notée

est une constante.

INTEGRALE INDÉFINIE

Nous avons vu précédemment lors de notre études des dérivées, le problème suivant : étant donnée une
fonction F(x), trouver sa dérivée, c'est-à-dire la fonction:

(10.158)

Définition: Nous disons que la fonction F(x) est une "primitive" ou "intégrale indéfinie" de la fonction
f(x) sur le segment [a, b], si en tout point de ce segment nous avons l'égalité .

Une autre manière de voire le concept d'intégrale indéfinie est de passer par le théorème fondamental du
calcul intégral (et différentiel) appelé aussi parfois "théorème fondamental de l'analyse" qui s'énonce ainsi :

Soit f une fonction continue sur un intervalle fermé [a, b].

P1. Si A est la fonction définie par pour tout X dans [a, b], alors A est la primitive de f sur
[a, b] qui s'annule en a.
P2. Si F est une primitive de f sur [a, b], alors .

Démonstration:

Soit la fonction : (10.159)

Si f est positive et (la démonstration dans le cas où est proposée similaire) et comme ,
nous pouvons nous représenter A(X) comme l'aire sous la courbe de f depuis jusqu'à .

(10.160)

Pour démontrer que A est une primitive de f , nous allons prouver que . Selon la définition de la
dérivée :

(10.161)

Etudions ce quotient: est représentée par l'aire de la bande de largeur h, prise en sandwich
entre deux rectangles de largeur h.

Soit M le maximum de f sur l'intervalle et m le minimum de f sur ce même intervalle. Les aires
respectives des deux rectangles sont Mh et mh.

Nous avons alors la double inégalité suivante : (10.162)

Comme h est positif, on peut diviser par h sans changer le sens des inégalités :

(10.163)

Lorsque et si f est une fonction continue, alors M et m ont pour limite f(X) , et le rapport:

(10.164)

qui est compris entre m et M, a bien pour limite f(X).


Comme pour tout X, ceci nous montre que la dérivée de la fonction aire est f. Ainsi A est une
primitive de f. Comme , A est bien la primitive de f qui s'annule en a.

Avant de commencer la démonstration de la deuxième propriété du théorème fondamental, donnons et


démontrons le théorème suivant qui va nous être indispensable : Si et sont deux primitives de
la fonction f(x) sur le segment [a, b], leur différence est une constante (ce théorème est très important en
physique pour ce qui est de l'étude de ce que nous appelons les "conditions initiales").

Démonstration:

Nous avons en vertu de la définition de la primitive :

(10.165)

pour .

Posons : (10.166)

Nous pouvons écrire : (10.167)

Il vient donc de ce que nous avons vu pendant notre étude des dérivées que .

Nous avons alors: (10.168)

Il résulte de ce théorème que si nous connaissons une primitive quelconque F(x) de la fonction f(x), toute
autre primitive de cette fonction sera de la forme :

(10.169)

Donc finalement, nous appelons "intégrale indéfinie" de la fonction f(x) et nous notons :

(10.170)

toute expression de la forme où F(x) est une primitive de f(x). Ainsi, par convention d'écriture :

(10.171)

si et seulement si .

Dans ce contexte, f(x) est également appelée "fonction à intégrer" et f(x)dx, "fonction sous le signe somme".

Géométriquement, nous pouvons considérer l'intégrale indéfinie comme un ensemble (famille) de courbes
telles que nous passons de l'une à l'autre en effectuant une translation dans le sens positif ou négatif de l'axe
des ordonnés.

Revenons-en à la démonstration du point (2) du théorème fondamental de l'analyse :


Démonstration:

Soit F une primitive de f.

Puisque deux primitives diffèrent d'une constante, nous avons bien: (10.172)

ce que nous pouvons écrire aussi: (10.173)

pour tout X dans [a, b]. Le cas particulier donne et donc et .

En remplaçant, nous obtenons : (10.174)

Comme cette identité est valable pour tout X de l'intervalle , elle est vraie en particulier pour .

D'où : (10.175)

Remarque:

R1. Le théorème fondamental qui montre le lien entre primitive et intégrale a conduit à utiliser le même

symbole pour écrire une primitive, qui est une fonction, et une intégrale, qui elle, est un nombre.

R2. Nous avons également démontré dans le chapitre de Mécanique Analytique comment calculer à l'aide
d'une intégrale la longueur d'une courbe dans le plan si la fonction f(x) est explicitement connue.

Voici quelques propriétés triviales de l'intégration qu'il est bon de se rappeler car souvent utilisée ailleurs sur
le site (si cela ne vous semble pas évident, contactez-nous et nous le détaillerons) :

P1. La dérivée d'une intégrale indéfinie est égale à la fonction à intégrer :

(10.176)

P2. La différentielle d'une intégrale indéfinie est égale à l'expression sous le signe somme :

(10.177)

P3. L'intégrale indéfinie de la différentielle d'une certaine fonction est égale à la somme de cette fonction et
d'une constante arbitraire :

(10.178)

P4. L'intégrale indéfinie de la somme (ou soustraction) algébrique de deux ou plusieurs fonctions est égale à
la somme algébrique de leurs intégrales (ne pas oublier que l'on travail avec l'ensemble des primitives et non

des primitives particulières!): (10.179)


Démonstration:

Pour démontrer cela nous allons prouver que la dérivée du membre de gauche permet de trouver le membre
de droit et inversement (réciproque) à l'aides des propriétés précédentes.

D'après P1 nous avons : (10.180)

Vérifions s'il en est de même avec le membre de droite (nous supposons connues les propriétés des dérivées
que nous avons démontrées au début de ce chapitre) :

(10.181)

P5. Nous pouvons sortir un facteur constant de sous le signe somme, c'est-à-dire :

(10.182)

Nous justifions cette égalité en dérivant les deux membres (et d'après les propriétés des dérivées) :

(10.183)

P6. Nous pouvons sortir un facteur constant de l'argument de la fonction intégrée (plutôt rarement utilisée) :

(10.184)

En effet, en dérivant les deux membres de l'égalité nous avons d'après les propriétés des dérivées :

(10.185)

P7. L'intégration d'une fonction dont l'argument est sommé (ou soustrait) algébriquement est la primitive de
l'argument sommé (respectivement soustrait) :

(10.186)

Cette propriété ce démontre également identiquement à la précédente à l'aide des propriétés des dérivées.

P8. La combinaison des propriétés P6 et P7 nous permettent d'écrire :

(10.187)

P9. Soit f une fonction continue sur [a,b], nous avons pour :
Ce théorème découle immédiatement de la définition de l'intégrale indéfinie. F étant une primitive de f sur
[a,b] nous avons:

P10. Voilà une propriété souvent utilisée dans le chapitre de Statistiques du site (nous ne trouvons pas de
moyen d'exprimer cette propriété par le langage courant donc...) :

(10.188)

INTÉGRATION PAR CHANGEMENT DE VARIABLES

Lorsque nous ne pouvons facilement déterminer la primitive d'une fonction donnée, nous pouvons nous
débrouiller par un changement de variable astucieux (parfois même très subtile) à contourner la difficulté.
Cela ne marche pas à tous les coups (car certaines fonctions ne sont pas intégrables formellement) mais il
vaut la peine d'essayer avant d'avoir recours à l'ordinateur.

A nouveau, nous ne donnons que la forme générale de la méthode. C'est le rôle des professeurs dans les
écoles d'entraîner les élèves à comprendre et maîtriser ce genre de techniques. De plus, les chapitres traitant
des sciences exactes sur le site (physique, informatique, astrophysique, chimie, ...) regorgent d'exemples
utilisant cette technique et servent ainsi implicitement d'exercices de style.

Soit à calculer l'intégrale (non bornée pour l'instant) : (10.189)

bien que nous ne sachions pas calculer directement la primitive de cette fonction f(x) (en tout cas nous
imaginons être dans une telle situation) nous savons (d'une manière ou d'une autre) qu'elle existe (nous ne
traitons pas encore des intégrales impropres à ce niveau).

La technique consiste alors dans cette intégrale à effectuer le changement de variable :

(10.190)

où est une fonction continue ainsi que sa dérivée, et admettant une fonction inverse. Alors ,

démontrons que dans ce cas l'égalité : (10.191)

est satisfaite.

Nous sous-entendons ici que la variable t sera remplacée après intégration du membre droit par son
expression en fonction de x. Pour justifier l'égalité en ce sens, il suffit de montrer que les deux quantités
considérées dont chacune n'est définie qu'à une constant arbitraire près ont la même dérivée par rapport à x.

La dérivée du membre gauche est : (10.192)

Nous dérivons le membre droit par rapport à x en tenant compte que t est une fonction de x. Nous savons que
:

(10.193)

Nous avons par conséquent :


(10.194)

Les dérivées par rapport à x des deux membres de l'égalité de départ sont donc égales.

Bien évidemment, la fonction doit être choisie de manière à ce que nous sachions calculer
l'intégrale indéfinie figurant à droite de l'égalité.

Remarque: Il est parfois préférable de choisir le changement de variable sous la forme au lieu de
car cela à une large tendance à simplifier la longueur de l'équation au lieu de l'allonger.

JACOBIEN

Considérons un domaine D du plan u,v limité par une courbe L. Supposons que les coordonnées x,y soient
des fonctions des nouvelles variables u,v (toujours dans le cadre d'un changement de variables donc) par les
relations de transformations :

(10.195)

où les fonctions et sont univoques, continues et possèdent des dérivées continues dans un
certain domaine D' que nous définirons par la suite. Il correspond alors d'après les relations précédentes à
tout couple de valeurs u,v un seul couple de valeur x,y et réciproquement.

Il résulte de ce qui précède qu'à tout point du plan Oxy correspond univoquement un point P'(u,v) du
plan Ouv de coordonnées u,v définies par les relations précédentes. Les nombres v et u seront appelées
"coordonnées curvilignes" de P et nous verrons des exemples concrets et schématisé de ceux-ci dans le
chapitre de Calcul Vectoriel.

Si dans le plan Oxy le point P décrit la courbe fermée L délimitant le domaine D, le point correspondant
décrit dans le plan Ouv un certain domaine D'. Il correspond alors à tout point de D' un point de D. Ainsi, les
relations de transformations établissent une correspondance biunivoque entre les points des domaines D et
D'.

Considérons maintenant dans D' une droite . En général, les relations de transformation lui font
correspondre dans le plan Oxy une ligne courbe (ou inversement). Ainsi, découpons le domaine D' par des
droites et en de petits domaines rectangulaires (nous ne prendrons pas en compte dans la limite,
les rectangles empiétant sur la frontière de D'). Les courbes correspondantes du domaine D découpent alors
ce dernier en quadrilatère (définis par des courbes donc). Evidemment, l'inverse est applicable.

Considérons dans le plan Ouv le rectangle limité par les droites :

(10.196)

et le quadrilatère curviligne correspondant dans le plan Oxy. Nous désignerons les aires de ces domaines
partiels également par et . Nous avons évidemment :

(10.197)
Les aires et peuvent êtres en générales différentes.

Supposons donc dans D une fonction continue . Il correspond à toute valeur de cette fonction du
domaine D la même valeur (ce qu'il faut vérifier) dans D', où :

(10.198)

Considérons les sommes intégrales de la fonction dans le domaine D. Nous avons évidemment l'égalité
suivante :

(10.199)

Calculons , c'est-à-dire l'aire du quadrilatère curviligne dans le plan Oxy :

Déterminons les coordonnes de ses sommets :

(10.200)

Nous assimilerons dans le calcul de l'aire du quadrilatère les arcs à des


segments de droites parallèles. Nous remplacerons en outre les accroissements des fonctions par leurs
différentielles. C'est dire que nous faisons abstraction des infiniment petits d'ordre plus élevé que et .
Les relations précédentes deviennent alors :

(10.201)

Sous ces hypothèses, le quadrilatère curviligne peut être assimilé à un parallélogramme. Son aire
est approximativement égale au double de l'aire du triangle , aire que nous pouvons calculer en
utilisant les propriétés du déterminant (comme nous le démontrerons dans le chapitre d'Algèbre Linéaire, le
déterminant dans représente un parallélogramme alors que dans celui-ci représente le volume d'un
parallélépipède) :

(10.202)

Tel que (c'est là qu'il faut faire le meilleur choix pour que l'expression finale soit la plus simple et la plus
esthétique, nous procédons par essais successifs et faisons enfin le choix ci-dessous) :
(10.203)

Ainsi, nous avons :

(10.204)

Par conséquent : (10.205)

Avec : (10.206)

qui est la "matrice jacobienne" (alors que son déterminant est appelé le "jacobien" (tout court)) de la
transformation de coordonnées de . En appliquant exactement le même raisonnement pour , la
matrice jacobienne s'écrit alors (en changeant un peu les notations car sinon cela devient illisible):
(10.207)

Bref, à quoi cela sert-il concrètement ? Eh bien revenons à notre relation : (10.208)

qui n'est finalement qu'approximative étant donné que dans les calculs de l'aire nous avons négligé les
infiniment petits d'ordre supérieur. Toutefois, plus les dimensions des domaines élémentaires et sont
petites, et plus nous nous approchons de l'égalité. L'égalité ayant finalement lieu quand nous passons à la
limite (finalement en maths aussi on fait des approximations... hein !), les surfaces des domaines

élémentaires tendant vers zéro : (10.209)

Appliquons maintenant l'égalité obtenue au calcul de l'intégral double (nous pouvons faire de même avec la
triple bien sûr). Nous pouvons donc finalement écrire (c'est la seule manière de poser la chose qui a un sens)
:

(10.210)

Passant à la limite, nous obtenons l'égalité rigoureuse :

(10.211)

Telle est la relation de transformation des coordonnées dans une intégrale double. Elle permet de ramener le
calcul d'une intégrale double dans le domaine D au domaine D', ce qui peut simplifier le problème.

De même, pour une intégrale triple, nous écrirons :

(10.212)

Déterminons maintenant le Jacobien pour les systèmes de coordonnées les plus courants (nous renvoyons à
nouveau le lecteur au chapitre de calcul vectoriel pour plus d'information concernant ces systèmes) :

1. Coordonnes polaires :

(10.213)

Comme r est toujours positif, nous écrivons simplement : (10.214)


2. Coordonnées cylindriques (cf. chapitre d'Algèbre Linéaire pour le calcul du
déterminant) :

(10.215)

Comme r est toujours positif, nous écrivons simplement : (10.216)

3. En coordonnées sphériques (cf. chapitre d'Algèbre Linéaire


pour le calcul du déterminant) :

(10.217)

Comme est toujours positif, nous écrivons simplement :

avec (10.218)

INTEGRATION PAR PARTIES

Lorsque nous cherchons à effectuer des intégrations, il est très fréquent que nous ayons à utiliser un outil (ou
méthode de calcul) appelé "intégration par parties". Voici la démonstration de la validité de ce dernier.

Soit f,g deux applications de classe (dérivables n fois) de [a,b] dans , alors (voir la version plus light
dans la démo...) :

(10.219)
Démonstration:

Procédons par récurrence sur n. Nous supposons la formule vraie pour n et nous la démontrons pour n+1 :

(10.220)

Pour n=1 nous retrouvons la formule bien connue et qui sera très très souvent utilisée sur tout le site:

(10.221)

PRIMITIVES USUELLES

Il existe en mathématique et en physique un grand nombre de primitives ou de fonctions définies sur des
intégrales que nous retrouvons assez fréquemment (mais pas exclusivement). Comme dans n'importe quel
formulaire, nous vous proposons les primitives connues mais avec les démonstrations.

Cependant, nous omettrons les primitives qui découlent déjà des dérivées que nous avons démontrées plus
haut.

Sinon voici déjà une liste de quelques intégrales fréquentes (le lecteur en rencontrera de toute façon bien
d'autres - développées dans les détails - lors de son parcours du site) :

1. Primitive de :

Par définition nous avons donc : (10.222)

Nous utilise le changement de variable et ainsi :

(10.223)

Donc : (10.224)

2. Primitive de :

Par définition nous avons donc : (10.225)


Nous utilisons le changement de variable et :

(10.226)

Donc : (10.227)

3. Primitive de :

Nous intégrons par parties : (10.228)

Si nous posons , ce qui nous donne , nous obtenons :

(10.229)

Donc : (10.230)

4. Primitive de :

Nous intégrons à nouveau par parties : (10.231)

Si nous posons ,( ), nous obtenons :

(10.232)

Donc : (10.233)

5. Primitive de :

Nous intégrons encore une fois par parties : (10.234)

Si nous posons ,( ), nous obtenons :

(10.235)

Donc : (10.236)

6. Primitive de :
Encore une fois... nous intégrons par parties : (10.237)

Si nous posons ,( ), nous obtenons :

(10.238)

Donc : (10.239)

7. Primitive de avec :

Une intégration par parties nous donne :

(10.240)

Donc : (10.241)

Remarque: Une autre intégrale très importante avec l'exponentielle en physique est celle que nous avions
démontrée lors de notre étude de la loi de Gauss-Laplace en statistiques et probabilités (détermination de la
moyenne).

8. Primitive de : (10.242)

en intégrant par parties nous trouvons :

(10.243)

Donc : (10.244)

9. Primitive de avec :

Une intégration par parties nous donne :

(10.245)

Donc : (10.246)

10. Primitive de pour : (10.247)

Ainsi il vient : (10.248)


Il vient : et (10.249)

d'où : (10.250)

11. Primitive de :

Pour ( ) sachant que (voir les propriétés des logarithmes dans le chapitre d'analyse fonctionnelle) :

(10.251)

nous avons en utilisant la primitive de ln(x) : (10.252)

12. Primitive de :

Nous avons : (10.253)

Nous utilisons le changement de variable et obtenons :

(10.254)

Donc : (10.255)

13. Primitive de :

Nous avons donc : (10.256)

Nous utilisons le changement de variable et obtenons:

(10.257)

Donc : (10.258)

14. Primitive de :

Nous intégrons par parties : (10.259)


Si nous posons ,( ) nous obtenons : (10.260)

Donc : . (10.261)

15. Primitive de :

Nous intégrons par parties : (10.262)

Si nous posons , ce qui nous donne , nous obtenons :

(10.263)

Donc finalement :

(10.264)

16. Primitive de :

Nous intégrons par parties : (10.265)

Si nous posons , ce qui nous donne , nous obtenons :

(10.266)

Donc finalement : (10.267)

17. Primitive de :

Nous intégrons par parties : (10.268)

Si nous posons ,( ) nous obtenons :

(10.269)

Donc finalement : (10.270)


18. Primitive de avec :

Posons . Une intégration par partie donne :

(10.271)

en remplaçant par dans la dernière intégrale, nous obtenons :

(10.272)

et donc : (10.273)

19. Primitive de avec :

Dans ce cas nous avons la formule de récurrence

(10.274)

qui se démontre de la même façon que la relation de récurrence précédente.

20. Primitive de :

Sachant que , nous avons : (10.275)

Donc : (10.276)

21. Intégrale de :

Sachant que , nous avons :

(10.277)

Donc : (10.278)

22. Primitive de :

En utilisant les relations trigonométriques remarquables, nous avons :

(10.279)

Selon la primitive . Donc : (10.280)


23. Primitive de :

En utilisant encore une fois les relations trigonométriques remarquables, nous avons :

(10.281)

Selon la primitive . Donc : (10.282)

24. Primitive de :

Nous faisons la substitution ( ). Sachant que : (10.283)

(cf. chapitre de Trigonométrie) nous obtenons alors : et (10.284)

(selon la dérivée de ). Donc : (10.285)

et : (10.286)

25. Primitive de :

Sachant que (cf. chapitre de Trigonométrie) nous avons :

(10.287)

Nous faisons le changement de variable ( ):

(10.288)

(selon la primitive de ). Donc : (10.289)


26. Primitive de :

Nous faisons la substitution ( ). Sachant que (cf. chapitre de Trigonométrie) :

(10.290)

nous obtenons : et (10.291)

(selon la dérivée de arctan(x)). Donc : (10.292)

et : (10.293)

27. Primitive de :

Nous faisons à nouveau la substitution (comme précédemment). Nous trouvons alors:

(10.294)

et donc: (10.295)

28. Primitive de :

Sachant que: (10.296)

Nous avons alors: (10.297)

En faisant le changement de variable: avec (10.298)

nous obtenons : (10.299)


D'où: (10.300)

29. Primitive de :

Par le même raisonnement que précédemment en utilisant le cosinus nous obtenons:

(10.301)

30. Primitive de avec :

Posons : (10.302)

Une intégration par partie donne (nous avons démontré lors des dérivées usuelles que la primitive du sinus
hyperbolique était le cosinus hyperbolique):

(10.303)

en remplaçant par dans la dernière intégrale, nous obtenons:

(10.304)

et donc : (10.305)

Ainsi: (10.306)

31. Primitive de avec :

Dans ce cas nous avons aussi la relation récurrence:

(10.307)

qui se démontre de la même façon que ci-dessus. Ainsi:

(10.308)

32. Primitive de :

Sachant que (démontré lors des dérivées usuelles) : (10.309)


nous avons: (10.310)

Donc: (10.311)

33. Primitive de :

Sachant que (démontré lors des dérivées usuelles): (10.312)

nous avons: (10.313)

Donc : (10.314)

34. Primitive de :

Nous avons en utilisant la primitive de :

(10.315)

Donc : (10.316) .

35. Primitive de :

Nous avons en utilisant la primitive de :

(10.317)

Donc:

36. Primitive de :

Nous faisons la substitution: avec (10.318)

Nous obtenons en utilisant la dérivée arctanh(x):

(10.319)

et: (10.320)
37. Primitive de :

Nous faisons la substitution: avec (10.321)

Nous obtenons en utilisant la dérivée arctan(x):

(10.322)

et donc: (10.323)

38. Primitive de :

Nous faisons la substitution : avec (10.324)

Nous obtenons:

(10.325)

Nous obtenons donc la primitive : (10.326)

39. Primitive de :

Nous faisons la substitution : avec (10.327)

Nous obtenons :

(10.328)

Nous obtenons donc la primitive: (10.329)

40. Primitive de :
Nous faisons la substitution : avec (10.330)

Nous obtenons: (10.331)

Or : (10.332)

D'où: (10.333)

Donc: (10.334)

41. Primitive de :

Nous faisons la substitution habituelle: avec (10.335)

Nous obtenons: (10.336)

Or : (10.337)

D'où: (10.338)

Donc: (10.339)

42. Primitive de avec :

Une première intégration par parties donne:

(10.340)
Une deuxième intégration par parties donne:

(10.341)

d'où l'égalité : (10.342)

Ainsi en redistribuant la relation précédente:

(10.343)

43. Primitive de avec :

Un raisonnement analogue à celui d'avant montre que :

(10.344)

44. Primitive de avec :

Une intégration par parties nous donne:

(10.345)

45. Primitive de avec :

Une intégration par parties nous donne:

(10.346)

46. Primitive de avec :

Nous avons la relation suivante: (10.347)

Par suite:

(10.348)
Ainsi: (10.349)

47. Primitive de avec :

Nous avons en utilisant le résultat précédent:

(10.350)

Donc: (10.351)

48. Primitive de avec :

En faisant le changement de variable : avec (10.352)

Nous obtenons en utilisant la dérivée de arctan(x) :

(10.353)

49. Soit : (10.354)

avec . Nous avons:

(10.355)

Or cette dernière intégrale se résout par parties:

(10.356)

Donc: (10.357)

Que nous retrouvons plus fréquemment dans la littérature sous la forme:


(10.358)

Identiquement au développement suivant, nous avons pour (le signe change):

(10.359)

la relation suivante: (10.360)

Vous pourrez trouver une application de ces deux primitives dans le modèle cosmologique newtonien de
l'univers dans le chapitre d'Astrophysique ainsi que dans le chapitre de Relativité Générale dans le cadre de
l'étude de l'effet Shapiro!

50. Primitive de :

Nous avons en utilisant les primitives de (vu avant) et (vu plus haut):

(10.361)

51. Primitive de :

Nous avons en utilisant les primitives de (vu avant) et (vu plus haut):

(10.362)

52. Primitive de avec :

Nous pouvons sans perte de généralité supposer . Remarquons que le domaine de définition de f est
. Dans un premier temps nous allons déterminer une primitive de f sur l'intervalle
.

Faisons le changement de variable: (10.363)

avec donc: (10.364)


où nous considérons la fonction avec pour réciproque la fonction
donnée par (cf. chapitre de Trigonométrie):

(10.365)

Nous obtenons alors en utilisant la primitive de :

(10.366)

or (cf. chapitre de Trigonométrie) comme : (10.367)

Donc: (10.368)

et en utilisant un autre résultat du chapitre de Trigonométrie:

(10.369)

nous avons alors:

(10.370)

étant donné que les primitives sont données à une constante près, nous pouvons écrire:

(10.371)

pour . F est donc une primitive de sur .

53. Primitive de avec :

Nous pouvons sans perte de généralité supposer . Remarquons que le domaine de définition de f est [-
a, a].

Nous faisons la substitution: (10.372)

avec: (10.373)
Nous obtenons:

(10.374)

où nous avons utilisé la primitive de avec démontrée plus haut. Or nous avons:

(10.375)

Donc:

(10.376)

et: (10.377)

54. Primitive de avec :

Nous pouvons sans perte de généralité supposer .

Faisons le changement de variable: (10.378)

avec donc: (10.379)

Nous obtenons: (10.380)

en ayant utilisé la primitive de démontrée plus haut.

Ainsi: (10.381)

Mais comme nous avons vu dans le chapitre de Trigonométrie:

(10.382)

et: (10.383)
Donc nous avons finalement: (10.384)

où le ln(a) a encore une fois été omis car les primitives sont données à une constante près.

55. Primitive de avec :

Nous pouvons sans perte de généralité supposer .

Nous faisons la substitution: (10.385)

avec: (10.386)

Nous obtenons:

(10.387)

56. Primitive de avec :

Nous pouvons sans perte de généralité supposer .

Faisons le changement de variable: (10.388)

avec : (10.389)

Nous obtenons de la même manière que pour les intégrales usuelles précédentes:

(10.390)

et sachant que (cf. chapitre de Trigonométrie):

(10.391)

Nous obtenons alors au final la primitive importante suivante:

(10.392)

où le ln(a) a encore une fois été omis car les primitives sont données à une constante près!
En procédante de même, mais en utilisant le cosinus hyperbolique au lieu du sinus hyperbolique, nous avons

bien évidemment: (10.393)

Nous réutiliserons ces deux dernières relations dans des cas pratiques importants des chapitres de Mécanique
Analytique, Génie Civil (où la constante a valant 1, ln(a) est de toute façon nul!) et de Relativité Générale
(où a sera non nul et donc il ne sera pas possible d'omettre la constante ln(a)).

FONCTION DE DIRAC

La fonction de Dirac ou "fonction delta" joue un rôle pratique très important aussi bien en électronique et
informatique qu'en physique quantique ondulatoire et physique quantique des champs (cela permet de
discrétiser un continuum). Pour l'introduire simplement, considérons la fonction définie par:

(10.394)

La représentation de est un rectangle de largeur a, de hauteur 1/a et de surface unité. La fonction


de Dirac peut être considérée comme la limite, lorsque de la fonction f(x). On a donc:

(10.395)

avec: (10.396)

où est un nombre plus grand que 0 aussi petit que nous le voulons. Pour une fonction g(x) continue en

x=0 on a: (10.397)

Par extension nous avons : (10.398)

et pour une fonction g(x) continue en : (10.399)

Il est alors assez aisé de définir la fonction de Dirac dans l'espace à 3 dimensions par:

(10.400)

FONCTION GAMMA D'EULER

Nous définissons la fonction Gamma d'Euler (intégrale Eulérienne de deuxième espèce) par l'intégrale

suivante: (10.401)
avec x appartenant à l'ensemble des nombres complexes dont la partie réelle est positive et non nulle (donc
les réels strictement positifs sont inclus dans le domaine de définition aussi...)! Effectivement, si nous
prenons des complexes avec une partie réelle nulle ou négative, l'intégrale diverge et est alors non définie!

Remarque: Nous avons déjà rencontré cette intégrale et certaines de ses propriétés (qui vont être démontrées
ici) lors de notre étude des fonctions de distribution Bêta, Gamma, Khi-deux, Student et Fisher en
statistiques (cf. chapitre de Statistiques). Nous utiliserons également cette intégrale en maintenance (cf.
chapitre de Techniques De Gestion), en théorie des cordes (cf. chapitre de Théorie Des Cordes) et dans
d'autres domaines de l'ingénierie (voir la section correspondante).

Voici un tracé graphique du module de la fonction Gamma d'Euler pour x parcourant un intervalle des
nombres réels (attention dans Maple à bien écrire GAMMA en majuscules!!!):

>with(plots):
> plot(GAMMA(x),x=-Pi..Pi,y=-5..5);

(10.402)

et la même fonction tracée avec Maple mais dans le plan complexe cette fois-ci et toujours avec en ordonnée
le module de la fonction Gamma d'Euler:

>with(plots):
>plot3d(abs(GAMMA(x+y*I)),x=-Pi..Pi,y=-Pi..Pi,view=0..5, grid=[30,30],orientation=[-
120,45],axes=frame,style=patchcontour);
(10.403)

Cette fonction est intéressante si nous imposons que la variable x appartienne aux entiers positifs et que nous
l'écrivons sous la forme suivante :

(10.404)

Intégrons par partie cette dernière fonction:

(10.405)

Comme la fonction exponentielle décroît beaucoup plus vite que nous avons alors:

(10.406)

Dans la littérature, nous retrouvons fréquemment les notations suivantes (qui portent alors à confusion) :

(10.407)

Ce qui nous amène à récrire le résultat sous une forme plus classique :

(10.408)

De la relation , il vient par récurrence :

(10.409)
Or : (10.410)

ce qui donne : (10.411)

Donc: (10.412)

ou autrement écrit pour : (10.413)

Un autre résultat intéressant de la fonction gamma d'Euler est obtenu lorsque nous remplaçons t par et
calculons celle-ci pour .

D'abord, nous avons : (10.414)

ensuite : (10.415)

Or, comme nous l'avons démontré dans le chapitre de statistiques lors de notre étude de loi de de Gauss-
Laplace, cette dernière intégrale vaut :

(10.416)

CONSTANTE D'EULER-MASCHERONI

Ce petit texte fait juste office de curiosité relativement à la constante d'Euler e et à presque tous les outils de
calcul différentiel et intégral que nous avons vu jusqu'à maintenant. C'est un très joli exemple (presque
artistique) de ce que nous pouvons faire avec les mathématiques dès que nous avons suffisamment d'outils à
notre disposition.

De plus, cette constante est utile dans certaines équations différentielles où nous la retrouverons.

Nous avions vu dans le chapitre d'analyse fonctionnelle que la constante d'Euler e est définie par la limite :

(10.417)

Dans un cas plus général nous pouvons très facilement démontrer de la même façon que:

(10.418)

Cela suggère évidemment: (10.419)


par changement de variable nous écrivons :

(10.420)

Pour transformer cette expression nous pouvons écrire :

(10.421)

Or la quantité: (10.422)

tend vers la limite , appelée "constante d'Euler-Mascheroni" ou également "constante Gamma


d'Euler", lorsque n tend vers l'infini.

D'où: (10.423)

Divisons chacun des termes du produit par l'entier correspondant pris dans n!, nous obtenons
donc:

(10.424)
10. CALCUL DIFFÉRENTIEL ET INTÉGRAL (2/2)

ÉQUATIONS DIFFÉRENTIELLES

Définition: En mathématique, une "équation différentielle" (E.D.) est une relation entre une ou plusieurs
fonctions inconnues et leurs dérivées jusqu'à l'ordre n. "L'ordre" d'une équation différentielle correspond au
degré maximal de différentiation auquel une des fonctions inconnues y a été soumise.

Par rapport à notre objectif d'essayer de voir comment les mathématiques décrivent la réalité, les équations
différentielles remportent un franc succès, mais sont également la source de bien des soucis. D'abord des
difficultés de modélisation (voir par exemple le système d'équation différentielles de la relativité générale...),
des difficultés de résolution (il n'existe pas de méthode générale!), puis des difficultés proprement
mathématiques, enfin des difficultés liées au fait que certaines équations différentielles ne sont pas stables
par nature et donnent des solutions chaotiques (voir le chapitre de dynamique des populations pour des
exemples simples flagrants!).

Remarque: Les équations différentielles sont utilisées pour construire des modèles mathématiques de
phénomènes physiques et biologiques, par exemple pour l'étude de la radioactivité ou la mécanique céleste.
Par conséquent, les équations différentielles représentent un immense champ d'étude, aussi bien en
mathématiques pures qu'appliquées

L'équation différentielle d'ordre n la plus générale peut toujours s'écrire sous la forme :

(10.1)

Nous ne considérons sur ce site que le cas où x et y sont à valeur dans . Une solution à une telle E.D. sur
l'intervalle est une fonction (une fonction qui est n fois continûment
dérivable) telle que pour tout , nous ayons :

(10.2)

Remarques:

R1. Pour des raisons qui seront développés par la suite, nous disons aussi "intégrer l'E.D." au lieu de
"trouver une solution à l'E.D.".

R2. Etant donné que tout le site internet est bourré d'exemples d'équations différentielles et de méthodes de
résolutions dans les chapitres sur la mécanique, la physique atomique, la cosmologie, l'économétrie, les
suites et séries, etc., nous ne ferons pas d'exemples ici et nous intéresserons donc qu'à l'aspect théorique
minimal.

ÉQUATIONS DIFFÉRENTIELLES DU 1ER ORDRE

Une équation différentielle du 1er ordre est donc une E.D. qui ne fait intervenir que la première dérivée y'.

Définition: Une équation différentielle du 1er ordre est dite "E.D. d'ordre 1 à variables séparées" si elle peut
s'écrire sous la forme :

(10.3)

Une telle équation différentielle peut s'intégrer facilement. En effet, nous écrivons : (10.4)
Puis symboliquement : (10.5)

Remarque: Nous écrivons ici explicitement la constante d'intégration arbitraire (qui est
implicitement présente dans les intégrales indéfinies) pour ne pas l'oublier!

Il s'agit donc d'abord de trouver des primitives F et G de f et de g, et ensuite d'exprimer y en terme de x (et
de C) : (10.6)

La constante d'intégration est fixée lorsqu'on demande que pour un donnée, nous ayons une valeur
donnée de . Nous parlons alors de "problème aux valeurs initiales".

ÉQUATIONS DIFFÉRENTIELLES LINÉAIRES

Définition: Une équation différentielle d'ordre n est dite "E.D. linéaire" (E.D.L.) si et seulement si elle est
de la forme : (10.7)

Avec : (10.8)

Voyons maintenant une propriété qui peut sembler négligeable du premier coup d'oeil qui va prendre de
l'importance plus loin!

Nous allons montrer que L est une application linéaire :

(10.9)

Et pour tout : (10.10)

Définition: L'équation différentielle (c'est la plus courante en physique) :

(10.11)

s'appelle "équation homogène" (E.H.) ou "équation sans second membre" (ESSM) associée à :

(10.12)

Nous allons maintenant démontrer une propriété importantes des E.H. : l'ensemble des solutions de
E.H. est le noyau de l'application linéaire L (ce qui rappelons-le signifie : ) et l'ensemble {S} des

solutions à est donné par : avec (10.13)

c'est-à-dire que les solutions de la forme: (10.14)

où est une "solution particulière" de et la "solution homogène", parcourent toutes les


solutions de l'E.D.
Démonstration:

La première affirmation sera supposée évidente.

En ce qui concerne la 2ème partie, toute fonction de la forme est solution de .

En effet c'est trivial et cela découle de la définition du concept de noyau (cf. chapitre de Théorie Des
Ensembles) : (10.15)

Ce qu'il est important aussi de comprendre avec les E.D. linéaires avec second membre, c'est que si nous
trouvons des solutions à L(y) avec un second membre donné et des solutions à la même E.D. avec un autre
second membre (différent!), alors la somme de toutes ces solutions, sera solution de l'E.D. avec la somme
des seconds membres!!!

Il existe de nombreuses manières de résoudre les équations différentielles linéaires ou non linéaires de
manière exacte ou approchée. Citons les quelques méthodes que nous analyserons plus loin par l'exemple
(mais qui se trouvent déjà de nombreuses fois dans le chapitres de physique) :

- La méthode du polynôme caractéristique (voir plus bas)

- La méthode des perturbations (voir plus bas)

La méthode de variation de la constante ne sera pas présentée car basée sur une hypothèse empirique elle est
dangereuse d'usage en physique!

MÉTHODE DU POLYNÔME CARACTÉRISTIQUE

La résolution des équations différentielles simples (à coefficients constants et sans seconde membre la
plupart du temps...) utilise une technique faisant appel à un polynôme caractéristique de l'équation
différentielle dont nous verrons les détails dans les développements à suivre sur quelques cas particuliers
courants en physique.

C'est une méthode relativement simple à mettre en place lorsque nous cherchons les solutions homogènes de
l'équation sans second membre (ESSM). Dans le cas contraire, celui de la présence d'un seconde membre,
nous additionnons les solutions de l'équation homogènes aux solutions particulières.

RÉSOLUTION L'E.H. DE L'E.D.L. A COEFFICIENTS CONSTANTS D'ORDRE 1

Considérons l'E.D.L. à coefficient constant suivante: (10.16)

Nous écrivons son équation homogène associée: (10.17)

Ce qui peut s'écrire: (10.18)

d'où : (10.19)

Il y a derrière cette solution homogène une infinité de solutions : à chaque valeur donnée à C correspond une
solution.
Il faut encore à cette solution homogène ajouter la solution particulière et nous disposons pour cela d'une
collection de recettes, qui dépendent du type de la fonction f(x) du second membre de l'équation. Nous les
verrons au cas par cas dans les différents chapitres de Physique.

RÉSOLUTION L'E.H. DE L'E.D.L. A COEFFICIENTS CONSTANTS D'ORDRE 2

Considérons l'E.D.L. à coefficient constant suivante: (10.20)

Nous écrivons son équation homogène associée: (10.21)

dans laquelle la fonction second membre est nulle. Nous pouvons immédiatement entrevoir une solution du
type (en s'inspirant de la forme des solutions des E.D. du 1er ordre): (10.22)

où est une constante.

Ce qui nous donne alors: (10.23)

Ce que nous pouvons simplifier en: (10.24)

Si notre hypothèse de départ est bonne, nous n'avons qu'à résoudre en K cette "équation caractéristique"
(ECAR) ou "polynôme caractéristique" de l'équation homogène pour trouver la solution homogène:

(10.25)

dont les solutions dépendent du signe du discriminant du polynôme caractéristique : (10.26)

- Si le discriminant est strictement positif, soit :

Alors nous savons que le polynôme caractéristique possède deux racines distinctes et nous avons alors:

(10.27)

où et . Nous disons alors que la solution est "retardée" ou "avancée" selon les valeurs
de ces constantes. Mais l'essentiel est de remarque que si est solution, alors est toujours
solution!

Nous parlons alors de "solution générale de l'équation homogène". Il y a derrière ce résultat une infinité de
solutions : à chaque valeur donnée aux constantes A, B correspond une solution.

Les physiciens écrivent aussi parfois cela sous une forme particulière en posant d'abord:

(10.28)
avec donc: (10.29)

Et en utilisant les fonctions de trigonométrie hyperbolique (cf. chapitre de Trigonométrie):

(10.30)

d'où finalement la possibilité d'écrire la solution homogène sous la forme (lorsque nous omettons l'avance ou
le retard ): (10.31)

Par ailleurs, montrons que les solutions de l'ESSM forment un espace vectoriel de dimension 2 (correspond
donc à l'ordre de notre E.D.)!

En effet:

- La fonction zéro: est solution de l'ESSM (ça c'est inutile à démontrer... évident!).

- La somme ou soustraction des solutions reste solution (ça nous l'avons déjà démontré plus haut)

- Les éléments de la base de l'espace vectoriel (les solutions de l'ESSM) sont linéairement indépendants (ça
c'est intéressant car nous en aurons besoin!).

Posons: (10.32)

Alors: (10.33)

Donc l'équation différentielle à coefficients constants : (10.34)

s'écrit alors:

(10.35)

Donc nous avons bien une structure d'espace vectoriel.

Rappelons que inversement deux fonction sont linéaire dépendantes si: (10.36)

- Si le discriminant est nul, soit :

L'équation caractéristique possède une racine double réelle K.

En allant un peu vite nous dirons alors: (10.37)


et que c'est fini... mais au fait ce serait oublié que la base vectorielle doit être formée de deux solutions
indépendantes!

Donc la deuxième solution est probablement de la forme: (10.38)

Alors: (10.39)

Si nous l'injectons dans l'ESSM: (10.40)

alors:

(10.41)

Or : (10.42)

Donc: (10.43)

Donc finalement: (10.44)

Ce qui donne pour la solution générale de l'ESSM: (10.45)

- Si le discriminant est nul, soit :

L'équation caractéristique possède deux racines complexes conjuguées (cf. chapitre d'Algèbre):

(10.46)

Dès lors:

(10.47)
Or, si nous cherchons plutôt des solutions réelles, nous pouvons toujours poser A et B égaux tels que:

(10.48)

Et si nous posons que le retard, ou l'avance est nulle ( ), alors nous retrouvons la relation disponible
dans la plupart des livres: (10.49)

où A' et B' sont donc deux constantes réelles quelconques. Il existe une autre forme importante à cette
dernière relation (souvent utilisée en électronique par exemple). Effectivement, Il est possible, pour tout A'
et B' réels, de trouver C' et réels tels que l'égalité suivante est vérifiée:

(10.50)

Nous posons: (10.51)

alors: (10.52)

Il est alors possible de trouver tel que : et (10.53)

La quantité de départ s'écrit ainsi:

(10.54)

Finalement: (10.55)

METHODE RÉGULIÈRE DES PERTURBATIONS

Très fréquemment en physique (de pointe), un problème mathématique ne peut pas être résolu de manière
exacte. Si la solution est connue il y a parfois une telle dépendance de paramètres que la solution est difficile
à utiliser en tant que tel.

Il peut être le cas, cependant, qu'un paramètre identifié, disons par tradition, tel que la solution est
disponible est raisonnablement simple pour .

Le souci ensuite est de savoir comme la solution est altérée pour un non-nul mais petit quand même. Cette
étude est le centre de la théorie des perturbations que nous utilisons par exemple dans le chapitre de
relativité générale pour calculer la précession du périhélie de Mercure.

Comme la théorie dans le cadre général est trop complexe par rapport aux objectifs du site, nous nous
proposons une approche par l'exemple d'abord avec une simple équation algébrique et ensuite avec ce qui
nous intéresse : une E.D.
THÉORIE PERTURBATIVE DES ÉQUATIONS ALGÉBRIQUES

Considérons l'équation polynômiale suivante : (10.56)

Nous savons de par notre étude du chapitre d'analyse fonctionnelle, que cette équation polynômiale admet

deux racines qui sont trivialement : (10.57)

Pour petit, ces racines peuvent être approximées par le premier terme en développement de série de

Taylor (cf. chapitre de Suites Et Séries) : (10.58)

La question et de savoir si nous pouvons obtenir les deux relations précédentes sans à priori de
connaissances sur la solution exacte de l'équation polynômiale initiale? La réponse est bien évidemment
affirmative avec l'aide de la théorie des perturbations.

La technique se base en quatre étapes :

1. Dans la première étape, nous assumons que la solution de l'équation polynômiale est un expression du
type série de Taylor en . Nous avons alors : (10.59)

où sont bien évidemment à déterminer.

2. Dans la deuxième étape, nous injectons la solution hypothétique dans notre équation polynômiale :

(10.60)

Comme :

(10.61)

et : (10.62)

Il vient finalement que l'équation polynômiale s'écrit :

(10.63)
3. Dans la troisième étape nous égalisons successivement les termes avec 0 tel que :

(10.64)

4. Quatrième et dernière étape, nous résolvons successivement les équations polynômiales ci-dessus pour

obtenir : (10.65)

En injectant ces résultants dans la solution hypothétique : (10.66)

il est évident d'observer que nous retombons sur la solution certaine :

(10.67)

THÉORIE PERTURBATIVE DES ÉQUATIONS DIFFÉRENTIELLES

La théorie des perturbations est aussi souvent utilisée pour résoudre un bon nombre d'équations
différentielles. C'est le cas par exemple en mécanique des fluides, en relativité générale ou en physique
quantique.

A nouveau, plutôt que de faire une théorie ultra abstraite et générale, voyons le concept sur un exemple tel
que précédemment.

Considérons l'équation différentielle suivante : (10.68)

ou autrement écrit : (10.69)

avec les conditions aux limites .

La résolution exacte est relativement facile à obtenir:

D'abord nous commençons par l'équation homogène : (10.70)

C'est donc une équation différentielle linéaire d'ordre 2 avec des coefficients constants, équation qu'il est
relativement aisé de résoudre dans le cas général. Soit l'équation : (10.71)

Supposons que la fonction y qui satisfait cette équation différentielle soit de la forme où K peut être
un nombre complexe. Nous avons alors : ou (10.72)

pourvu, bien sûr, que . Cette dernière relation est donc l'équation quadratique auxiliaire de l'équation
différentielle (polynôme caractéristique). Elle a deux solutions/racines (c'est une simple résolution d'un
polynôme du deuxième degré) que nous noterons dans le cas général : . Ce qui signifie que :
et (10.73)

est satisfait pour les deux racines. Si nous faisons la somme puisque les deux sont égales à la même
constante :

(10.74)

Ainsi, il est immédiat que la solution générale de l'équation homogène de y est du type :

(10.75)

où A, B sont bien évidemment des constantes à déterminer. Nous résolvons maintenant le polynôme
caractéristique : (10.76)

Il vient immédiatement que : (10.77)

Donc : (10.78)

Maintenant une solution particulière à : (10.79)

est relativement trivialement une solution du type : (10.80)

où B est bien évidemment une constante à déterminer et qui vaut simplement une fois injectée dans

l'équation différentielle : (10.81)

Soit : (10.82)

D'où finalement la solution générale : (10.83)

Ensuite, avec les conditions initiales il est très facile de trouver A :

(10.84)

et : (10.85)

Il est loisible de choisir que .

Donc : (10.86)
Maintenant que nous avons la solution générale, si est petit nous pouvons prendre le développement
d'ordre 4 en série de MacLaurin de l'exponentielle (cf. chapitre de Suites Et Séries). Tel que :

(10.87)

Injecté dans y cela donne :

(10.88)

Maintenant que nous avons ce développement, ce que nous souhaitons montrer c'est qu'à partir d'un
développement perturbatif nous pouvons retrouver le même résultat en série et ce sans aucune connaissance
préalable sur la solution.

A nouveau, le développement pour cela ce fait en 4 étapes :

1. Dans la première étape, nous assumons que la solution de l'équation différentielle est un expression du
type série de Taylor en . Nous avons alors : (10.89)

où sont bien évidemment à déterminer.

2. Dans la deuxième étape, nous injectons la solution hypothétique dans notre équation différentielle dans
celle-ci avec les conditions initiales et nous développons le tout.

D'abord l'équation différentielle :

(10.90)

ensuite les conditions initiales : (10.91)

3. Dans la troisième étape nous égalisons successivement les termes avec 0 tel que :

(10.92)
4. Dans la quatrième étape nous résolvons les équations différentielles listées précédemment (si vous ne
voyez pas comment nous les résolvons n'hésitez pas à nous contacter!) :

(10.93)

En injectant ces relations dans la solution supposée développée en série de Taylor et injectée dans l'équation
différentielle : (10.94)

Nous retombons sur :

(10.95)

SYSTÈMES D'ÉQUATIONS DIFFÉRENTIELLES

Voyons maintenant des développements qui vont aussi bien être utiles en physique quantique que dans la
résolution de systèmes d'équations différentielles (et particulièrement une qui est connue en théorie du
chaos!).

Avant cela, il va nous falloir introduire le concept d'exponentialisation d'une matrice:

L'ensemble des matrices à coefficients dans noté est un espace vectoriel pour l'addition des
matrices et la multiplication par un scalaire. Nous notons I la matrice identité.

Nous admettrons qu'une suite de matrices convergent vers une matrice A si et seulement si les suites de
coefficients des matrices convergent vers les coefficients correspondent de A.

Exemple:

Dans la suite de matrices: (10.96)

converge vers: (10.97)

lorsque .

Si , nous avons vus lors de notre étude des nombres complexes (cf. chapitre sur les Nombres) que la

série: (10.98)
converge et sa limite est notée . En fait ici il n'y a aucune difficulté à remplacer x par une matrice A
puisque nous savons (nous l'avons montré lors de notre étude des nombres complexes) que tout nombre
complexe peut s'écrire sous la forme suivante (le corps des nombres complexes est donc isomorphe au corps
des matrices réelles carrées de dimensions 2 ayant cette forme):

(10.99)

et qu'un nombre complexe au carré est équivalent à mettre sa forme matricielle au carré:

(10.100)

Effectivement: (10.101)

Nous définissons alors l'exponentielle d'une matrice comme la matrice limite de la suite:

(10.102)

Si la matrice A est diagonale il est évident que son exponentielle est facile à calculer. En effet, si:

(10.103)

Par suite: (10.104)

Or, il apparaît évident qu'une matrice non diagonale va être beaucoup plus compliquée à traiter! Nous allons
alors utiliser la technique de diagonalisation soit une réduction des endomorphismes (cf. chapitre d'Algèbre
Linéaire).

Alors, remarquons que si est inversible et si alors: (10.105)

Ceci découle du fait que (penser au changement de base d'une application linéaire comme ce qui a été étudié

dans le chapitre d'Algèbre Linéaire): (10.106)

Donc: (10.107)
Ce développement va nous permettre de ramener le calcul de l'exponentielle d'une matrice diagonalisable à
la recherche de ses valeurs propres et de ses vecteurs propres.

Exemple:

Calculons où: (10.108)

Les valeurs propres de A sont , et les vecteurs propres associés sont:

(10.109)

Effectivement: et (10.110)

En posant: (10.111)

Nous avons: (10.112)

avec: (10.113)

Par conséquent:

(10.114).

Maintenant, rappelons que dans le cas des nombres réels nous savons que si alors . Dans
le cas des matrices nous pouvons que si sont deux matrices qui commutent entre-elles c'est-à-
dire telles que . Alors .

La condition de commutativité vient au fait que l'addition dans l'exponentielle est elle commutative. La
démonstration est donc intuitive.

Un corollaire important de cette proposition est que pour toute matrice , est inversible. En
effet les matrices et commutent, par conséquent: (10.115)

Nous rappelons qu'une matrice à coefficients complexes est unitaire si: (10.116)

La proposition suivante nous servira par la suite.


Montrons que si A est une matrice hermitienne (dite aussi "autoadjointe") (cf. chapitre d'Algèbre Linéaire)
alors pour tout , est unitaire.

Démonstration: (10.117)

Donc: (10.118)

Rappelons que cette condition pour une matrice autoadjointe est liée à la définition de groupe unitaire
d'ordre n (cf. chapitre d'Algèbre Ensembliste).

Une des premières applications de l'exponentielle de matrices est la résolution des équations différentielles
ordinaires. En effet, de l'équation différentielle linéaire ci-dessous avec comme condition initiale
et où A est une matrice : (10.119)

la solution est donnée (cf. chapitre de Calcul Différentiel et Intégral) par: (10.120)

Nous retrouvons fréquemment ce genre de systèmes d'équations différentielles en biologie (dynamique des
populations), en astrophysique (étude des plasmas) ou en mécanique des fluides (théorie du chaos) ainsi que
mécanique classique (systèmes couplés), en astronomie (orbites couplées), en électrotechnique, etc.

Exemple:

Supposons que nous ayons le système d'équations différentielles suivant:

(10.121)

La matrice associée est alors: (10.122)

et son exponentielle (voir les développements faits plus haut):

(10.123)

La solution générale du système est donc:

(10.124)

Nous avons donc: (10.125)

Après recherche des constantes nous trouvons:


(10.126)

ce qui nous donne finalement: (10.127)


11. SUITES ET SÉRIES

L es suites et séries ont une très grande importance dans les mathématiques appliquées c'est la raison pour
laquelle nous y consacrons un chapitre entier. Nous les retrouverons par ailleurs souvent en physique lorsque
nous aurons besoin de faire quelques approximations mineures (...) ainsi qu'en économétrie pour le calcul
des rentes. Il conviendra cependant de la part du lecteur de ne pas confondre dans ce qui va suivre le concept
de "suite" de celui de "série" qui tout en étant similaires sur le fond ne s'analysent mathématiquement pas
toujours de la même manière.

Nous avons souhaité dans ce chapitre rester dans des choses simples sans trop partir dans les concepts
topologiques des suites et séries. Cependant, la personne intéressée par des définitions plus rigoureuses
pourra se reporter dans le chapitre traitant des Fractales (section d'Informatique Théorique) et de Topologie
ou de nombreux concepts sur les suites sont définis (supremum, infimum, sous-suite, théorème de Bolzano-
Weierstrass, etc.).

SUITES

Définition: Une "suite" d'un ensemble est une famille d'éléments indexée par l'ensemble des entiers naturels
(cf. chapitre sur les Nombres) ou par une partie de celui-ci. De manière vulgarisée, nous disons qu'une suite
est une liste d'objets mis en ordre, chacun ayant un numéro d'ordre. Nous notons classiquement une suite
par:

ou (11.1)

où l'indexation se fait parfois (par tradition...) sans le 0.

Pour quelques suites, nous indiquons le premier terme (si l'indexation commence par 1 au lieu de 0),
ainsi qu'une formule pour obtenir n'importe quel terme à partir du terme précédent quel que soit
. Nous appelons une telle formulation une "définition récurrente", et la suite est dite définie "par
récurrence" (et de même si elle est indexée à partir de 0 au lieu de 1).

Avant de voir quelques exemples de familles de suites qui seront utilisées dans les différents chapitres du
site (dynamiques des populations, économétrie, physique nucléaire, etc.) voyons un petit paquet de
définitions comme il est de tradition en mathématique...

Définitions:

D1. Des nombres (en suite) sont en "progression arithmétique" si la différence de deux termes consécutifs
est une constante r appelée la "raison".

D2. Des nombres (en suite) sont en "progression géométrique" si le rapport de deux termes consécutifs est
une constante r appelée aussi la "raison".

D3. Des nombres (en suite) sont en "progression harmonique" si les inverses de deux termes consécutifs
sont en progression arithmétique.

Dès lors, une "suite" est arithmétique, géométrique, harmonique si ses termes sont respectivement en
progression arithmétique, géométrique, harmonique et b est la moyenne arithmétique, géométrique,
harmonique de a et c si les nombres a,b,c sont en progression arithmétique, géométrique, harmonique.
Remarque: Pour les définitions des moyennes citées ci-dessus voir le chapitre de Statistiques

D4. Une "suite majorée", est une suite tel qu'il existe un réel M tel que

D5. Une "suite minorée", est une suite tel qu'il existe un réel M tel que

D6. Une "suite bornée", est une suite tel qu'elle est à la fois majorée et minorée.

D7. Une suite est appelée "suite croissante" si

D8. Une suite est appelée "suite décroissante" si

D9. Une suite est "suite constante constante" si

SUITES ARITHMÉTIQUES

Définition: Nous disons que des nombres ou que des "termes" en progression forment une "suite
arithmétique" lorsque leurs valeurs numériques différent d'une valeur r appelée la "raison" de la suite tel
que: (11.2)

où r est donc la "raison" de la progression. Nous avons alors bien évidemment si l'indexation commence à
partir de 0: (11.3)

Ainsi, la suite : (11.4)

où n est une constante est une suite arithmétique de raison .

La suite : (11.5)

est une suite arithmétique de raison , etc.

Ainsi, si nous notons par un terme quelconque de la suite ( ) de raison r, nous avons :

(11.6)

Nous avons les propriétés suivantes pour un tel type de suite :

P1. Un terme dont le rang est la moyenne arithmétique des rangs de deux autres termes est la moyenne
arithmétique de ces deux termes.

Démonstration:

Considérons maintenant ( ) une suite arithmétique de raison r donné selon le développement précédent :

(11.7)

et soient tels que , nous avons alors :


(11.8)

et donc : avec (11.9)

P2. Pour trois termes consécutifs en progression arithmétique, le deuxième terme est la moyenne
arithmétique des deux autres.

Démonstration:

avec (11.10)

Si est une progression arithmétique de raison r, alors la n-ème somme partielle


(c'est-à-dire, la somme des n premiers termes à la puissance 1) est donnée par:

ou (11.11)

lorsque l'indexation se fait à partir de 1.

Démonstration:

Nous pouvons écrire la série:

(11.12)

En jouant avec la deuxième ligne, nous obtenons:

(11.13)

Ce qui se simplifie encore: (11.14)

Nous démontrerons quelques lignes plus bas que la série de Gauss simple: (11.15)

est égale à : (11.16)

Nous avons alors pour: (11.17)

la relation suivante: (11.18)

Il vient alors: (11.19)


Nous voyons avec cette dernière relation que si nous retombons sur la série de Gauss simple.

Comme : (11.20)

lorsque l'indexation se fait à partir de 1. Il vient alors: (11.21)

Nous verrons d'autres types de sommations lors de notre étude des séries un peu plus bas lors de notre étude
des séries!

SUITES HARMONIQUES

Définition: Nous disons que des nombres (1/a, 1/b, 1/c,...) forment une "suite harmonique" lorsque leurs
inverses sont en progression arithmétique. Nous représentons cette progression par :

(11.22)

où a, b, c, ..., h, k, l désignant des termes au dénominateur en progression arithmétique de raison r.


D'ailleurs, nous supposerons, dans ce qui suit, qu'il n'y a aucun dénominateur nul.

En partageant cette série en groupes renfermant successivement termes, nous observons que chacun de
ceux-ci est plus grand que le dernier de son groupe:

(11.23)

et que la somme des termes de chaque groupe est plus grande que 1/2 . La somme des termes de la série
augmente donc indéfiniment; nous disons alors que la série est une "série divergente" (nous reviendrons plus
en détail sur ces concepts de convergence et divergence plus bas).

SUITES GÉOMETRIQUES

Définition : Une "suite géométrique" est une suite de nombres tels que chacun d'eux est égal au précédent n
multiplié par un nombre constant q que nous appelons la "raison" de la progression. Nous désignerons par:

(11.24)

Ainsi, si nous notons par un terme quelconque de la suite ( ), nous avons (trivial) :

(11.25)

Voici quelques propriétés pour un tel type de suite (sans démonstration pour l'instant... sauf demande car
triviales pour la plupart) :

P1. (triviale) Le quotient de deux termes d'une même suite est une puissance de la raison dont l'exposant
égale la différence des rangs des deux termes (simple rapport de termes de puissance).

P2. (triviale) Si nous multiplions ou divisons terme à terme deux suites géométriques, nous obtenons une
troisième suite géométrique dont la raison égale le produit (respectivement le quotient) des raisons des
progressions données (simple opération avec les raisons des deux séries d'origine).
P3. Dans une suite géométrique, un terme dont le rang est la moyenne arithmétique des rangs de deux autres
termes est la moyenne géométrique (cf. chapitre de Statistiques) de ces deux termes (relisez plusieurs fois au
besoin).

Démonstration:

Soit une suite géométrique réelle positive de raison q, nous avons : (11.26)

Soit a,b deux termes de la suite géométrique, nous avons alors :

(11.27)

et ainsi : (11.28)

Nous avons comme corolaire que pour trois termes consécutifs en progression géométrique, le deuxième
terme est la moyenne géométrique des deux autres.

Démonstration: (11.29)

avec : (11.30)

Il existe cependant quelques suites particulières qui ont des propriétés particulières que nous retrouvons très
fréquemment en mathématique ou physique théorique. Sans trop entrer dans les détails, voici une petite liste
(non exhaustive de ces dernières) :

SUITE DE CAUCHY

Il est souvent intéressant pour le mathématicien, autant que pour le physicien, de connaître les propriétés
d'une suite ayant un type de progression donnée. La propriété la plus importante étant la limite vers laquelle
elle tend.

Remarque: Le lecteur qui n'est pas à l'aise avec la topologie peut sauter le texte qui va suivre en attendant...
et celui qui souhaite en savoir plus sur les suites de Cauchy peut se reporter au chapitre de topologie et
particulièrement dans le chapitre consacré aux fractales (section d'Informatique Théorique).

Définition: Soit (X, d) un espace métrique (cf. chapitre de Topologie), nous disons que la suite:

(11.31)

converge vers si par définition :

(11.32)

En d'autres termes plus nous avançons dans la suite, plus les points sont proches (au sens de la métrique d )
les uns des autres.

Cependant la définition précédente de la convergence pose problème car la limite x doit être connue. Dans la
plupart des cas intéressants, x est malheureusement inconnue. Pour sortir de cette impasse, Cauchy a l'idée
de proposer la définition suivante:
Nous disons par définition que la suite d'éléments de X est une "suite de Cauchy" si :

(11.33)

Il est clair alors que toute suite convergente est une suite de Cauchy (bon il y a quelques subtilités
auxquelles nous ne ferons pas référence pour l'instant).

Remarque: Ce critère facilite certaines démonstrations car il permet de montrer l'existence d'une limite sans
faire intervenir sa valeur, en général inconnue.

Maintenant, montrons qu'une suite convergente est de Cauchy.

Démonstration:

Soit une suite convergeant vers l (qui nous est inconnu donc!) et (choisi au hasard). Il existe alors
selon la définition d'une suite convergente, tel que :

(11.34)

le choix d'écrire est complètement arbitraire mais au fait nous anticipons juste le résultat de la
démonstration afin que celui-ci soit plus esthétique.

Alors pour (au fait connaître le N en question importe peu puisque cela doit marcher pour n'importe
lequel... bon n'oublions pas quand même que N dépend de ) nous avons selon l'inégalité triangulaire :

(11.35)

et puisque : (11.36)

ce qui revient à écrire : (11.37)

C'est peut être un peu abstrait alors voyons un exemple avec la suite harmonique (divergente comme nous le

savons déjà) . D'abord, rien ne nous interdit de prendre (sinon cela va être dur de faire une
différence entre deux termes...).

Dès lors nous prenons la distance euclidienne :

(11.38)

D'abord le lecteur remarquera que dans tous les cas puisque compris entre et . Ce qui nous
amène à pouvoir écrire :

(11.39)
Donc à partir de cette égalité il vient automatique que chaque terme de la somme de gauche ci-dessous sera
plus grand que chaque terme de la somme de droite suivant :

avec (11.40)

maintenant l'idée est de voir que la somme de gauche est donc plus grande ou égale à et cela
quelque soit n. Ainsi, l'idée c'est que nous ayons trouvé un epsilon pour lequel le critère de Cauchy est mis
en défaut. Car dans le cas contraire nous aurions du avoir :

(11.41)

donc la suite n'est pas convergente.

Donc, ce n'est pas parce que des points se rapprochent les uns des autres qu'ils convergent vers un point, car
ce point n'existe peut-être pas.

Exemple:

Le meilleur exemple est certainement le suivant :

Prenons et: (11.42)

Soit z un nombre irrationnel et , avec .

Les forment une suite de Cauchy. En effet :

(11.43)

et donc si . Nous avons donc trouvé un N qui satisfait à notre définition d'une suite
de Cauchy. Or cette suite ne converge pas dans sinon z serait rationnel.

Remarque: Les mathématiciens utilisent ce fait pour définir l'ensemble des irrationnels en utilisant quelques
concepts topologique supplémentaires.

Nous venons de voir qu'une suite de Cauchy n'est pas forcément une suite convergente dans X. La
réciproque toutefois est vraie : toute suite convergente est une suite de Cauchy.

SUITE DE FIBONACCI

Si nous calculons une suite de nombres commençant par 0 et 1, de telle sorte que chaque terme soit égal à la
somme des deux précédents, nous pouvons former la suite:

1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, 144... (11.44)

par conséquent, si nous désignons les différents termes par : (11.45)


nous avons la loi de formation: (11.46)

La suite de Fibonacci possède des propriétés nombreuses fortes intéressantes, qui seront développées
ultérieurement. Il s'agit cependant de la première "suite récurrente" connue (d'où le fait que nous en parlions
sur ce site).

L'origine de cette suite viendrait d'un problème de lapins posé à Fibonacci en 1202. Partant d'un couple,
combien de couples de lapins obtiendrons-nous après un nombre donné de mois sachant que chaque couple
produit chaque mois un nouveau couple, lequel ne devient productif qu'après deux mois. Nous avons alors:

- Début: Un couple de bébés lapins qui vont grandir

- Premier mois: Un couple de lapins adultes (qui feront des bébés le mois prochain...)

- Deuxième mois: Un couple de lapins adultes et un couple de bébés donc 2 couples

- Troisième mois: Deux couples de lapins adultes et un couple de bébés donc 3 couples

- Quatrième mois: Trois couples de lapins adultes et deux couples de bébés donc 5 couples.

etc.

Prenons un exemple réel, cette fois-ci : le coeur de certaines fleurs, les écailles d'un ananas ou d'une pomme
de pin forment deux familles de spirales enroulées en sens inverse. Sur une pomme de pin, vous compterez 5
spirales dans un sens et 8 dans l'autre, sur l'ananas, 8 et 13, sur la fleur de tournesol 21 et 34. Chaque fois ,
nous obtenons des nombres de Fibonacci !

Une illustration de ceci consiste à faire le simple schéma suivant (appelé "spirale de Fibonnacci") qui
reproduit les nombres de fibonnaci sur un plan quadrillé:

(11.47)

Nous utilisons également ce genre de suite pour montrer l'utilité du principe d'induction présenté dans le
chapitre de Théorie Des Nombres se trouvant dans la section d'Arithmétique.
SÉRIES

Le physicien a souvent besoin pour résoudre simplement et formellement des problèmes, d'approximer
certains "termes" (cf. chapitre de Théorie De La Démonstration) de ses équations. Pour cela, il utilisera les
propriétés de certaines séries.

Il existe, une quantité phénoménale de séries et de théories gravitant autour de ces dernières, mais nous
citerons en particulier les séries de Taylor (utilisées un peu partout), les séries de Fourier (théorie du signal
et en mécanique ondulatoire) et les séries ou fonctions de Bessel (physique nucléaire) dont nous ferons une
étude sommaire ici.

Définition: Soit donnée une suite numérique infinie : (11.48)

L'expression : (11.49)

est appelée "série numérique".

Définition: La somme partielle des n premiers termes de la série est appelée "somme partielle" et notée :

(11.50)

Si la limite notée S suivante existe et est finie : (11.51)

nous l'appelons la "somme de la série" et nous disons que la "série converge" (elle est donc de Cauchy).
Cependant, si la limite n'existe pas, nous disons que la "série diverge" et n'a pas de somme (pour plus de
détails voir le sous-chapitre plus loin traitant des critères de convergence).

Montrons par ailleurs que si est une série numérique convergente alors :

(11.52)

Démonstration:

Nous supposons d'abord que est bien une série convergente et notons par S sa limite. Posons :

(11.53)

Alors : (11.54)

Or, si la série est convergente : (11.55)

Donc : (11.56)

Voyons comment calculer la somme partielle des quelques séries classiques :


SÉRIES DE GAUSS

Les séries arithmétiques de Gauss sont l'expression de la somme de n premiers entiers non nuls élevés à une
puissance donnée sous une forme condensée. L'application de cette forme condensée de série à une utilité
pratique en physique lorsque l'on souhaite simplifier l'expression de certains résultats.

Gauss avait trouvé une méthode séduisante en 1786 pour déterminer cette expression lorsqu'il avait 9 ans
(...):

(11.57)

En simplifiant, nous trouvons facilement: (11.58)

pour .

Nous pouvons continuer ainsi pour des ordres supérieurs (nous les présentons non en tant qu'exercices mais
parce que ces relations sont utiles!):

Calculons maintenant la somme des n premiers carrés (toujours non nuls). Posons:

(11.59)

nous savons que (binôme de Newton):

nous pouvons donc écrire et ajouter membre à membre les n égalités suivantes:

(11.60)

Avec quelques manipulations algébriques élémentaires:

(11.61)

d'où: (11.62)
Finalement: (11.63)

Terminons avec la somme des n premiers cubes (non nuls). Le principe étant le même que précédemment,
nous posons:

(11.64)

Nous savons par ailleurs que (binôme de Newton):

(11.65)

Nous obtenons en faisant varier k de 1 à n, n relations que nous pouvons ajouter membre à membre:

(11.66)

Nous avons donc: (11.67)

Ce qui donne après développement:

(11.68)

Et après une première simplification:

(11.69)

et une deuxième: (11.70)

Le résultat final est donc : (11.71)

ou écrit autrement: (11.72)


Evidemment, nous pouvons continuer ainsi longtemps mais à partir d'une certaine valeur de l'élévation de la
puissance les choses se compliquent un petit peu (de plus, la méthode est un peu longue). Ainsi, un des
membres de la famille des Bernoulli (c'était une famille de mathématiciens assez doués...) a montré une
relation générale fonctionnant pour n'importe quelle puissance en définissant ce que nous appelons le
"polynôme de Bernoulli".

NOMBRES ET POLYNÔMES DE BERNOULLI

Comme nous venons de le voir plus haut il est possible d'exprimer la somme des n premiers entiers non nuls
élevés à une puissance donnée selon (les quatre premiers ont été démontrés précédemment) les relations
suivantes où nous avons posé avec n' le nombre de termes dont nous voulons la somme 0 non
compris (d'où le signe négatif que nous n'avions pas plus haut) :

(11.73)

Jacob Bernoulli remarqua ensuite que les polynômes avaient la forme :

(11.74)

Dans cette expression, les nombres semblent ne pas dépendre de p. Plus généralement,
après tâtonnement on remarque que le polynôme peut être écrit sous la forme :

(11.75)

Ce qui donne par identification les "nombres de Bernoulli" :

(11.76)

Par la suite, les mathématiciens dans leurs recherches sont tombés au hasard sur le fait que les nombres de

Bernoulli pouvaient être exprimés par la série : avec (11.77)


En d'autres termes, la fonction génératrice des nombres de Bernoulli serait G(z). Si nous développons les
premiers termes de cette série :

(11.78)

Démonstration:

Nous avons vu dans notre étude des nombres complexes (cf. chapitre sur les Nombres) que :

(11.79)

Dès lors : (11.80)

Posons maintenant : (11.81)

Nous avons alors : . (11.82)

Nous voyons (en distribuant) que :

(11.83)

par suite pour que tout cela soit égal à l'unité il faut que :

(11.84)

De la deuxième équation nous tirons : (11.85)

De la troisième équation nous tirons : (11.86)

etc.
En continuant ainsi nous montrons que : ... (11.87)

Il est évident que cette méthode nous permet de calculer à la main que les premiers termes de cette série.

Ainsi, en se basant sur : (11.88)

nous trouvons que les premiers nombres de Bernoulli sont les suivants:

k
0 1
1 −1/2
2 1/6
3 0
4 −1/30
5 0
6 1/42
7 0
8 −1/30
9 0
10 5/66
11 0
12 −691/2730
13 0
14 7/6
Tableau: 11.1 - Nombres de Bernouilli

Le lecteur aura remarqueré que lorsque n est impair et différent de 1.

C.Q.F.D.

Nous voyons bien par ailleurs, que les valeurs des nombres de Bernoulli ne peuvent pas être décrits
simplement. En fait, ce sont essentiellement des valeurs de la fonction ζ de Riemann (voir plus bas) pour des
valeurs entières négatives de la variable, et sont associés à des propriétés théoriques profondes qui dépassent
le cadre de ce site. Par ailleurs, les nombres de Bernoulli apparaissent également dans le développement en
série de Taylor des fonctions tangentes circulaire et hyperbolique, dans la formule d'Euler-MacLaurin ainsi
(voir plus bas).

Avec une petite modification, il est possible de définir les "polynômes de Bernoulli" par :

(11.89)

avec donc : (11.90)


Par ailleurs, il est aisé de remarquer que: (11.91)

et donc il est facile d'en déduire: (11.92)

Démonstration:

D'un côté nous avons: (11.93)

et d'un autre nous avons: (11.94)

Donc: (11.95)

Et par identification des coefficients nous en déduisons: (11.96)

et pour : (11.97)

Il est alors aisé de déduire que les sont des polynômes de degré k:

(11.98)

Voici un tracé de ces polynômes:


(11.99)

Ce qui est remarquable c'est qu'à l'aide des polynômes de Bernoulli, nous voyons qu'il est possible d'écrire

les sous la forme suivante: (11.100)

Certains écrivent cette relation encore autrement. Effectivement, de la relation précédente, nous pouvons

écrire: (11.101)

Et en utilisant: (11.102)

Il vient: (11.103)

Donc nous venons de démontrer: (11.104)

Cependant, nous pouvons maintenant nous demander ce qu'il advient de la somme partielle de suites
arithmétiques et géométriques telles que présentées au début de ce chapitre.

SÉRIES ARITHMÉTIQUES

Nous avons démontré plus haut que la somme partielle de la série de Gauss (analogue à la somme des
termes d'une suite arithmétique de raison r=1) s'écrivait donc:

(11.105)
si nous notons non pas n la valeur n-ème terme mais , le développement que nous avions fait pour la série

de Gauss nous amène alors à: (11.106)

et si nous notons le premier terme 1 de la Série de Gauss par , nous avons alors:

(11.107)

ce qui nous donne la somme partielle des n-termes d'une suite arithmétique de raison r quelconque (ou plus
simplement : la somme partielle de la série arithmétique de raison r)

Remarque: Le lecteur aura observé que la raison r n'apparaît pas dans la relation. Effectivement, en
reprenant (toujours) le même développement fait que pour la série de Gauss, le terme r se simplifie.

SÉRIES GÉOMÉTRIQUES

De même, avec un somme géométrique où nous avons pour rappel:

(11.108)

nous avons donc: (11.109)

La dernière relation s'écrit (après simplification):

(11.110)

et si , nous avons: (11.111)

ce qui peut s'écrire en factorisant : (11.112)

Exemple:

Soit la suite de raison q=2 suivante:

(11.113)

pour calculer la somme des quatre premiers termes , nous prenons la puissance de 2 équivalent

(le zéro n'étant pas pris en compte). Nous obtenons alors bien .
FONCTION ZÊTA ET IDENTITÉ D'EULER

L'allemand Riemann a baptisé "zêta" une fonction déjà étudiée avant lui, mais qu'il examine lorsque la
valeur est un nombre complexe (cf. chapitre sur les Nombres). Cette fonction se présente comme une série
de puissances inverses de nombres entiers. C'est la série:

(11.114)

Remarque: Il est traditionnel de noter s la variable dont dépend cette série.

Cette série a une propriété intéressante mais si l'on reste dans le cadre des puissances entières positives et

non nulles: (11.115)

quand nous avons alors: (11.116)

Si nous faisons , nous obtenons la somme des puissances inverses de 2 et de mêmes avec tel

que: (11.117)

Si nous faisons le produit de ces deux expressions, nous obtenons la somme des puissances de toutes les
fractions dont le dénominateur est un nombre produit de 2 et de 3:

(11.118)

Si nous prenons tous les nombres premiers à gauche, nous obtiendrons à droite tous les nombres entiers,
puisque tout entier est produit de nombres premiers selon le théorème fondamental de l'arithmétique (cf.
chapitre de Théorie Des Nombres), et c'est l'identité fondamentale d'Euler : ce que nous appelons maintenant
la "fonction zêta de Riemann" est à la fois un produit fini et la somme des puissances inverse de tous les

entiers: (11.119)

En notation condensée, "l'identité d'Euler" est: (11.120)

où p sont les nombres premiers.


SÉRIES DE TAYLOR ET DE MACLAURIN

Soit un polynôme (à une variable): (11.121)

Nous avons trivialement pour ce dernier: (11.122)

Soit maintenant la dérivée du polynôme P(x) : (11.123)

donc: (11.124)

et ainsi de suite avec P''(x),P'''(x),... tel que:

(11.125)

Il s'ensuit que:

(11.126)

Donc finalement notre polynôme peut s'écrire: (11.127)

relation que nous appelons "série de MacLaurin limitée" ou tout simplement "série de MacLaurin".

En appliquant maintenant le même raisonnement mais en centrant le polynôme sur la valeur , nous
avons:

(11.128)

et ainsi le développement précédent devient:

(11.129)

qui n'est d'autre que l'expression générale d'un polynôme exprimé sous une forme dite de "série de Taylor
limitée". Cette fonction peut être assimilée à un polynôme tant que n est fini. Mais si n est infini, comme
nous le verrons plus loin, cette série converge vers la fonction dont nous cherchons la représentation sous
forme de somme de termes.
Ainsi, certaines fonctions f(x) pouvant être approchés par un polynôme P(x) (une somme de puissances
autrement dit...) centré sur la valeur peuvent êtres exprimées sous la forme:

(11.130)

Par contre cette dernière relation n'est pas juste pour toutes les fonctions ne pouvant pas s'exprimer sous
forme de polynômes. Dès lors nous disons que la série n'est pas convergente pour ces dernières. Nous en
verrons un exemple plus bas.

La dernière relation s'écrit aussi de manière plus conventionnelle... :

(11.131)

Revenons brièvement à l'approximation de f(x) proche et centrée en :

(11.132)

Certaines personnes n'aiment pas utiliser cette formulation car on risque d'oublier que l'approximation pour
quelques termes n'est bonne tant que l'on ne s'éloigne pas trop de avec x.

Raisons pour laquelle il arrive souvent que nous posions: (11.133)

avec fixé et h variable mais petit (!) et dès lors il vient alors une forme d'écriture courante des séries de
Taylor:

(11.134)

Voyons un exemple d'application avec une série de MacLauin (avec étant nul) de la fonction sin(x) et
Maple:

>p[n](x) = sum((D@@i)(f)(a)/i!*(x-a)^i,i=0..n);
>p11 := taylor(sin(x),x=0,12);
>p11 := convert(p11,polynom);
>with(plots):
>tays:= plots[display](sinplot):
for i from 1 by 2 to 11 do
tpl := convert(taylor(sin(x), x=0,i),polynom):
tays := tays,plots[display]([sinplot,plot(tpl,x=-Pi..2*Pi,y=-2..2,
color=black,title=convert(tpl,string))]) od:
>plots[display]([tays],view=[-Pi..2*Pi,-2..2]);
(11.135)

Nous voyons donc bien dans cet exemple que la série de MacLaurin ne permet que d'approcher une fonction
en un point avec un nombre limités de points. Mais plus nous prenons de termes (mettre 100 termes dans
l'exemples précédent) plus la validité est grande sur tout le domaine de définition de la fonction. Au fait il
est possible de démontrer que la fonction sin(x) est exactement exprimable en série de MacLaurin lorsque le
nombre de termes est infini. Nous disons alors que son "reste" est nul.

Par contre ceci n'est pas vrai pour toutes les fonctions. Par exemple:

>p[n](x) = sum((D@@i)(f)(a)/i!*(x-a)^i,i=0..n);
>p10 := taylor(1/(1-x^2),x=0,10);
>p10 := convert(p10,polynom);
>with(plots):
>tays:= plots[display](xplot):
for i from 1 by 2 to 10 do
tpl := convert(taylor(1/(1-x^2), x=0,i),polynom):
tays := tays,plots[display]([xplot,plot(tpl,x=-2..2,y=-2..2,
color=black,title=convert(tpl,string))]) od:
>plots[display]([tays],view=[-2..2,-2..2]);

(11.136)
Nous voyons bien ci-dessus que peu importe le nombre de termes que nous prenons, la série de MacLaurin
converge seulement dans un domaine de définition compris entre ]-1,1[. Cette intervalle est appelé le "rayon
de convergence" et sa détermination (celle des singularités) est un point crucial dans de nombreux domaines
de l'ingénierie, de la physique et de l'analyse. Nous y reviendrons plus en détails dans le chapitre d'Analyse
Complexe.

Par contre nous pouvons décaler la série de MacLaurin de la fonction précédente afin d'approcher la fonction
avec une série de Taylor en un autre point non singulier comme par exemple en valant 2:

>p[n](x) = sum((D@@i)(f)(a)/i!*(x-a)^i,i=0..n);
>p10 := taylor(1/(1-x^2),x=2,10);
>p10 := convert(p10,polynom);
>with(plots):
>tays:= plots[display](xplot):
for i from 1 by 2 to 10 do
tpl := convert(taylor(1/(1-x^2), x=2,i),polynom):
tays := tays,plots[display]([xplot,plot(tpl,x=0..5,y=-2..2,
color=black,title=convert(tpl,string))]) od:
>plots[display]([tays],view=[-0..5,-2..2]);

(11.137)

Nous étudierons une généralisation au plan complexe des séries de Talyor précédentes dans le chapitre
d'Analyse Complexe pour obtenir un résultat très puissant permettant aux physiciens de calculer des
intégrales curvilignes compliquées.
SÉRIES DE TAYLOR D'UNE FONCTION A 2 VARIABLES

Nous allons voir ici comment approcher une fonction f(x, y) de deux variables réelles en une somme de
puissances (série de Taylor). Ce type d'approximation est très utilisé dans de nombreux domaines de
l'ingénierie (cf. chapitre de Génie Industriel).

Nous cherchons donc une approximation de f(x, y) au point .

Pour cela, posons (rien ne nous interdit à priori de la faire) que:

et (11.138)

Nous avons alors: (11.139)

La valeur de (l'astuce est là!): (11.140)

peut être approchée en utilisant son expression en série de Taylor autour de la valeur 0 tel que:

(11.141)

(11.142)

(11.143)
Selon le théorème de Schwarz (cf. chapitre de Calcul Intégral Et Différentiel): (11.144)

Nous avons alors:

(11.145)

et on démontre par récurrence que: (11.146)

Nous avons alors finalement:

(11.147)

ou sous une autre forme équivalente:

(11.148)

RESTE DE LAGRANGE

Il peut y avoir un intérêt dans certaines applications numériques (cf. chapitre de Méthodes Numériques) à
connaître l'erreur d'approximation du polynôme par rapport à la fonction .

Définissons pour cela un "reste" , tel que: (11.149)

La fonction est appelée "reste de Lagrange".


Considérons maintenant une fonction f(x) qui est fois dérivable sur un intervalle qui contient .
Pour une valeur x de l'intervalle, différente de , nous nous proposons de démontrer qu'il existe un nombre
z situé entre et x tel que:

(11.150)

Démonstration:

Soit une fonction g(t) une fonction définie par la différence d'une fonction f(x) supposé connue et une
approximation de Taylor de cette même fonction:

(11.151)

avec bien sûr: (11.152)

Nous voyons que g(t) s'annule bien pour la valeur .

Dérivons maintenant g(t) par rapport à t, nous trouvons:

(11.153)

Après simplification:

(11.154)

Selon le théorème de Rolle (cf. chapitre de Calcul Différentiel Et Intégral), il existe une valeur pour
lequel la dérivée s'annule. Donc:

(11.155)

Nous pouvons simplifier l'équation par :

(11.156)
ce qui s'écrit aussi: (11.157)

et nous trouvons donc pour maximum de : (11.158)

Nous voyons que plus le polynôme est de degré élevé, plus il approxime la fonction f(x) avec
exactitude. Que se passe-t-il lorsque ?

(11.159)

Supposons que f(x) admette des dérivées de tout ordre (ce que nous notons ) pour toutes les valeurs d'un
intervalle quelconque contenant et soit le reste de Lagrange de f(x) en . Si, quel que soit x dans

l'intervalle: (11.160)

alors f(x) est exactement représentée par P(x) sur l'intervalle.

Démonstration:

Elle découle simplement de l'expression de lorsque .

Effectivement, si nous prenons une infinité de termes pour , la correspondance avec la fonction
approchée est parfaite et donc le reste est nul.

Le polynôme: (11.161)

est appelé "polynôme de Taylor" ou "série de Taylor". Si , il est appelé "polynôme de MacLaurin" ou
"série de MacLaurin".

SÉRIES DE FOURIER

Nous appelons par définition "série trigonométrique" une série de la forme:

(11.162)

ou sous une forme plus compacte: (11.163)

Les constantes sont les coefficients de la série trigonométrique plus souvent


nommés "coefficients de Fourier".

Remarque: Nous avions déjà fait mention de ce type de série lors de notre étude des types de polynômes
existants puisque les séries de Fourier ne sont au fait que des polynômes trigonométriques. (cf. chapitre de
Calcul Algébrique). Par ailleurs, nous avons vu comme exemple dans le chapitre d'Analyse Fonctionnelle
lors de notre étude du produit scalaire fonctionnel que les fonctions sinus et cosinus constituaient les bases
d'un espace vectoriel.

Si la série converge, sa somme est une fonction périodique f(x) de période , étant donné que sin(nx)
et cos(nx) sont des fonctions périodiques de période . De sorte que:

(11.164)

Posons maintenant le problème suivant : Nous nous donnons une fonction connue, périodique quelconque
f(x) continue par morceaux de période . Nous demandons s'il existe une série trigonométrique
convergeant vers f(x) moyennant des conditions sur cette série.

Supposons maintenant que la fonction f(x), périodique et de période , puisse être effectivement
représentée par une série trigonométrique convergent vers f(x) dans l'intervalle [0, T], c'est-à-dire qu'elle soit
la somme de cette série:

(11.165)

Supposons que l'intégrale de la fonction du premier membre de cette égalité soit égale à la somme des
intégrales des termes de la série ci-dessus. Ceci aura lieu, par exemple, si nous supposons que la série
trigonométrique proposée converge absolument, c'est-à-dire que la série numérique suivante converge (de
par la propriété bornée des fonctions trigonométriques):

(11.166)

La série: (11.167)

est alors majorable et peut être intégrée terme à terme de 0 à T (où ) ce qui nous permet de
déterminer les différents coefficients de Fourier. Mais avant de commencer exposons les intégrales suivantes
qui nous très seront utiles par la suite:

(11.168)

Avec et Avec et

Avant de continuer, démontrons la valeur que prennent ces six intégrales (suite à la demande des
internautes). Mais d'abord, rappelons que comme alors et

1. Nous procédons en utilisant les relations trigonométriques remarquables (cf. chapitre de Trigonométrie) et
les primitives des fonctions trigonométriques élémentaires (cf. chapitre de calcul Différentiel Et Intégral):
(11.169)

car comme nous l'avons vu en trigonométrie et comme , les deux différences


précédentes ont tous les termes qui sont nuls tel que:

(11.170)

2. Pour la deuxième intégrale, nous procédons selon les mêmes techniques et mêmes propriétés des
fonctions trigonométriques:

(11.171)

3. Et nous continuons ainsi pour la troisième, toujours selon les mêmes propriétés:

(11.172)

4. Encore une fois selon les mêmes méthodes (cela devient routinier...) pour d'abord:

(11.173)
et pour il vient immédiatement:

(11.174)

5. Encore une fois... (bientôt au bout...) pour d'abord:

(11.175)

et pour il vient immédiatement: (11.176)

6. Et enfin la dernière (...):

(11.177)

Ce petit travail fait, revenons maintenant à nos moutons... Pour déterminer les coefficients multiplions les
deux membres de l'égalité:

(11.178)

par : (11.179)

La série du second membre de l'égalité est majorable, étant donné que ses termes ne sont pas supérieurs en
valeur absolue aux termes de la série positive convergente. Nous pouvons donc l'intégrer terme à terme sur
tout segment borné de 0 à T :

(11.180)

Nous avons démontré plus haut que quelque soient les valeurs entières que prennent k ou n le deuxième
terme de la paranthèse est toujours nul. Il ne reste alors plus que:
(11.181)

Or, nous avons démontré plus haut que l'intégrale à droite est toujours nulle si n et k sont différents. Il ne
reste alors que le cas où n et k sont égaux. C'est-à-dire:

(11.182)

Dans cette situation, nous avons d'abord le cas particulier k où est nul. Dans ce cas:

(11.183)

Soit: (11.184)

Il est évident que le coefficient représente donc la moyenne du signal ou la composante continue si elle
existe.

Dans le cas où k n'est pas nul, nous avons: (11.185)

D'où nous tirons: (11.186)

Pour déterminer les coefficients nous procédons de la même manière mais en mulitpliant cette fois-ci les
deux membres de l'égalité par :

(11.187)

La série du second membre de l'égalité est majorable, étant donné que ses termes ne sont pas supérieurs en
valeurs absolues aux termes de la série positive convergente. Nous pouvons donc l'intégrer terme à terme sur
tout segment borné de 0 à T :

(11.188)

Nous avons démontré plus haut que quelque soient les valeurs entières que prennent k ou n le premier terme
de la paranthèse est toujours nul. Il ne reste alors plus que:
(11.189)

Or, nous avons démontré plus haut que l'intégrale à droite est toujours nulle si n et k sont différents. Il ne
reste alors que le cas où n et k sont égaux. C'est-à-dire:

(11.190)

Dans cette situation, nous avons d'abord le cas particulier k où est nul. Mais nous voyons de suite que nous
avons une division par zéro. Il vaut mieux alors considérer le cas général d'où nous tirons

D'où nous tirons aisément que: (11.191)

Dès lors, pour la situation où k est nul le coefficient est alors nul!

Donc finalement les coefficients de Fourier sont donc déterminés par les intégrales:

(11.192)

Mais comme c'est embêtant d'avoir trois résultats pour les coefficients nous allons jouer un peu avec la
définition de la série de Fourier.

Effectivement en sommant de 1 à l'infini plutôt que de 0 à l'infini nous avons :

(11.193)

Ce qui permet alors de n'avoir qu'à se rappeler de ( inclus donc!) :

(11.194)

Les physiciens ont eux pour habitude de noter ces relations sous la forme suivante :

(11.195)

Cette décomposition possible de toute fonction périodique continue par morceaux approchée par une somme
infinie de fonctions trigonométriques (sinus ou cosinus) consistant en une fonction fondamentale et ses
harmoniques est appelé "théorème de Fourier" ou encore "théorème de Fourier-Dirichlet".
(11.196) Source : Mathworld

La série de Fourier permet donc implicitement de représenter toutes les fréquences contenues dans un signal
périodique dont la fonction est connue mathématiquement. On se demande bien pourquoi parler des séries
de Fourier quand, dans la pratique, nous ne connaissons pas vraiment la représentation mathématique de ce
signal? Cela nous amènera à mieux comprendre le concept de la transformée de Fourier à temps discret
(DTFT), que nous verrons un peu plus loin, qui n'a nul besoin d'une représentation mathématique d'un signal
continu échantillonné dans le temps.

Nous constatons par ailleurs que si f(x), soit la fonction périodique dont nous cherchons l'expression en série
trigonométrique de Fourier, est paire alors la série devra être paire aussi et donc ne comporter que des
termes en cosinus (le cosinus étant pour rappel une fonction paire) ce qui implique que et dans le cas
contraire d'une fonction impaire (le sinus étant pour rappel une fonction impaire)!

Il convient de noter, et c'est important pour la suite, que comme nous l'avons vu dans le chapitre de Calcul
Algébrique lors de notre étude des polynômes trigonométriques, que les séries de Fourier pouvaient donc
s'écrire sous la forme complexe suivante (en changeant un peu les notations et en passant la somme à
l'infini):

(11.197)

et nous avions vus que: (11.198)

Soit: (11.199)

Ce qui nous donne:


(11.200)

Exemple:

E1. Lors de la décomposition d'un signal continu, nous disons abusivement que les coefficients
représentent chacun (implicitement) une fréquence distincte associée à une amplitude que nous
visualisons sur un graphique par des lignes verticales. Ce graphique représente le spectre en fréquence du
signal décomposé. Nous pouvons également adjoindre une autre représentation qui se nomme "spectre de
phase". Ce spectre nous donne la phase du signal harmonique (en avance ou en retard de phase).

(11.201)

Voyons maintenant comment décomposer un signal périodique connu en plusieurs signaux d'amplitudes et
de fréquences distinctes.

Prenons comme exemple, un signal à onde carrée périodique défini sur une période T=2 et d'amplitude A tel
que:

(11.202)

A la période T=2 correspond comme nous le savons une pulsation: (11.203)

Calculons en premier lieu les coefficients à l'aide de l'intégrale permettant de déterminer ces coefficients
(le choix des bornes de l'intégrale supposent donc que le signal est périodique par construction!):
(11.204)

En prenant k = 2, nous avons: (11.205)

De même pour k = 4,6,8 ainsi que tout nombre pair.

Pour ce qui est des nombres impairs, nous aurons:

(11.206)

Les coefficients seront alors: (11.207)

Il y a un seul hic dans cette relation, le coefficient ne peut être calculé selon cette relation car on peut voir
que si k = 0 dans le résultat ci-haut, nous aurons une valeur infinie et c'est du moins impossible. Le
coefficient est soit nul ou non nul mais jamais infini.

Pour trouver le coefficient , nous devons calculer l'intégrale pour k=0. Le coefficient est alors
déterminé par:

(11.208)

Le spectre en "fréquence" (attention à l'abus de langage) et en amplitude sera alors de la forme suivante pour
et les fréquences nulles n'étant pas représentées:
(11.209)

L'abus de parler de fréquence pour les coefficients de Fourier amène dont à avoir des fréquences négatives...
mais ce n'est qu'une question de vocabulaire auquel il faut s'habituer.

Le spectre d'amplitude et de phase se calcule selon les relations:

(11.210)

Il est alors relativement aisé de remarquer que si T tend vers un nombre de plus en plus grand, les pics du
spectre se rapprochent de plus en plus. Ainsi, lorsque T tend vers l'infini le spectre devient continu.

Le spectre de phase donnera ce qui suit pour les valeurs impaires:

(11.211)
Il est même possible pour l'exemple d'obtenir très facilement le spectre des fréquences dans MS Excel !!!

Effectivement, il suffit pour cela d'échantillonner par exemple notre signal 128 fois (MS Excel a besoin de
échantillons). Nous divisons alors l'intervalle en 64 échantillons et idem pour l'intervalle
:
Tableau: 11.2 - Echantillonage Signal

Ce qui donne sous forme graphique:

(11.212)

Ensuite, il suffit d'aller dans le menu Outils/Utilitaire d'analyse et choisir l'option Analyse de Fourier:

(11.213)

Vient ensuite la boîte de dialogue suivante qu'il faut remplir comme indiqué:
(11.214)

Vient alors le résultant suivant pour les coefficients le tableau suivant:


Tableau: 11.3 - Coefficients de Fourier

Il reste à calculer le module des nombres complexes avec la fonction MODULE.COMPLEXE( ) de MS


Excel et de diviser le résultat par 128 pour chacun des coefficients mais nous voyons déjà que chaque
coefficient pair est nul ce qui correspond bien au résultat théorique.

Nous avons alors en mettant l'indice n en face de chaque module:


Tableau: 11.4 - Module coefficients complexes

En en traçant un graphique MS Excel à points un peu personnalisé des colonnes D et E, nous obtenons
finalement:

(11.215)

E2. Prenons un autre exemple identique au précédent mais sous une autre approche. Nous définissons une
fonction périodique de période comme suit:

(11.216)

Calculons les coefficients de Fourier:

(11.217)

et:
(11.218)

Nous remarquons que vaut 0 pour n pair et vaut pour n impair.

La série de Fourier de la fonction considérée s'écrit donc:

(11.219)

Ce qui en Maple s'écrit:

S:=(4/Pi)*Sum(sin((2*n+1)*x)/(2*n+1),n=0..N);

et que nous pouvons tracer à l'aide de la fonction:

plot({subs(N=4,S),subs(N=8,S),subs(N=16,S)},x=-Pi..Pi,color=[red,green,blue],numpoints=200);

Ce qui donne trois traces pour 4, 8 et 16 termes de la série en rouge, vert et bleu:

(11.220)

Pour 50 termes nous obtenons:


> plot(subs(N=50,S),x=-Pi..Pi,numpoints=800);

(11.221)

Nous voyons les effets de bord appelés "phénomène de Gibbs". Il est possible de montrer avec pas mal de
développements que ceux-ci arrivent à la valeur de l'abscisse correspondant à et que le
dépassement et que le pic va à 1.179 pour toute valeur de n.

PUISSANCE D'UN SIGNAL

Un signal périodique possède une énergie infinie et une puissance moyenne finie (cf. chapitre
d'Électrocinétique). Sa puissance moyenne sur une période est définie par:

(11.222)

Si nous développons cette équation, nous avons:

(11.223)

Cela signifie que la puissance d'un signal à temps continu périodique est égale à la somme des coefficients
de Fourier au carré. C'est ce que l'on nomme le "théorème de Parseval". Cela signifie que si nous avons un
signal quelconque que nous pouvons décomposer en série de Fourier, nous pouvons connaître la puissance
de ce signal uniquement à l'aide des coefficients spectraux.

Dans la réalité, comme nous ne pouvons déterminer mathématiquement l'expression de ce signal, nous
utilisons la discrétisation ou l'échantillonnage et ensuite à l'aide d'une transformée de Fourier discrète, nous
pouvons calculer la puissance de ce signal en utilisant uniquement les coefficients spectraux. Cela nous
donne une caractéristique du signal.

TRANSFORMÉE DE FOURIER

Les séries de Fourier sont un outil très puissant pour l'analyse de signaux périodiques par exemple, mais
l'ensemble des fonctions périodiques est petit comparé à l'ensemble des fonctions que nous rencontrons dans
les problèmes physiques. Ainsi, nous allons introduire un nouvel outil d'analyse extrêmement puissant qui
s'étend à une classe de fonctions plus générale.

La transformée de Fourier est ainsi utilisée autant pour les signaux périodiques que pour les signaux
apériodiques.

Pour cela, nous repartons de notre étude sur les séries de Fourier en notation complexe d'une fonction
périodique de période T quelconque et nous faisons tendre .

Ainsi, reprenons les expressions démontrées avant:

(11.224)

que nous pouvons écrire de manière équivalente sous la forme:

(11.225)

et écrivons encore cela pour des besoins ultérieurs sous la forme suivante:

(11.226)

et posons: (11.227)

Ainsi, quand , nous passons de valeur discrète à valeur continue qui parcourt l'ensemble
des réels (pour tous les k). Donc de:

(11.228)

nous passons à la limite soit:

(11.229)

et obtenons ainsi pour les coefficients (nous changeons de notation car l'ancienne est inadaptée):

(11.230)

et pour la série infinie: (11.231)


Attention!!! Pour faire la différence entre la fonction donnée et son équivalent dont nous cherchons
l'expression en somme infinie, nous les noterons dorénavant différemment. Ainsi, il vient:

(11.232)

Définitions:

D1. Nous appelons "transformée de Fourier" de f la relation:

(11.233)

D2. Nous appelons "transformée de Fourier inverse" de F la relation:

(11.234)

Remarque: Il existe de nombreuses manière d'écrire la transformée de Fourier en fonction du choix de la


valeur initiale de T .

Certains physiciens préfèrent symétriser ces deux expressions en mettant le même coefficient dans les deux
sens, qui sera par exemple . Cela donnera:

(11.235)

Donnons également la forme tridimensionnelle qui nous servira de nombreuses fois en mécanique
ondulatoire, électrodynamique, optique ondulatoire ou encore dans les divers chapitres de physique
quantique:

(11.236)

Pour que les choses soient peut-être plus claires, montrons de manière générale que la transformée de
Fourier précédemment écrite est une isométrie (conserve la norme).

Remarquons tout d'abord que pour tout f, g nous avons le produit scalaire fonctionnel:

(11.237)

Mais puisque les fonctions sont dans l'espace des complexes, comme nous l'avons vu dans le chapitre de
calcul vectoriel, nous devons alors utiliser la notation du produit hermitien:

(11.238)
Rappelons quand même que: (11.239)

Démonstration:

D'abord, nous avons donc: (11.240)

Mais les variables à intégrer doivent être les mêmes et pour que soit implicitement dépendant de il
faut donc prendre la transforme de Fourier en . Tel que:

(11.241)

Ainsi:

(11.242)

Soit en utilisant le théorème de Fubini (cf. chapitre de Calcul Différentiel Et Intégral):

(11.243)

A l'aide de ce résultat, nous avons donc démontré que:

(11.244)

Nous n'avons pas précisé les bornes :elles sont infinies dans chaque définition (nous intégrons sur tous les
ou possibles).

Voyons maintenant deux propriétés intéressantes de la transformée de Fourier:

P1. Si f est paire, il vient une simplification de la transformée telle que:

(11.245)
P2. Si f est impaire, nous procédons de la même manière que ci-dessus et nous obtenons:

(11.246)

Remarque: La branche de "l'analyse harmonique", ou "analyse de Fourier 2D", est la branche des
mathématiques qui étudie la représentation des fonctions ou des signaux comme superposition d'ondes de
base. Elle approfondit et généralise les notions de série de Fourier et de transformée de Fourier. Les ondes
de base s'appellent les harmoniques, d'où le nom de la discipline. Durant ces deux derniers siècles, elle a eu
de nombreuses applications en physiques sous le nom d'analyse spectrale, et connaît des applications
récentes notamment en traitement des signaux, mécanique quantique, neurosciences, stratigraphie,
statistiques...

Exemple:

Voyons donc un exemple (parmi les deux fondamentaux) d'une transformée de Fourier que nous retrouvons
en physique quantique aussi bien qu'en optique ondulatoire.

Nous allons calculer la transformée de Fourier de la fonction suivante:

(11.247)

Nous avons donc:

(11.248)

où sinc est le sinus cardinal. Nous retombons donc sur le sinus cardinal (si nous prenons le module au carré)
de la décomposition d'une onde monochromatique diffractée par une fente rectangulaire. Ainsi, il semble
possible d'étudier les phénomènes de diffraction en utilisant la transformée de Fourier et ce domaine se
nomme "l'optique de Fourier".
SÉRIES DE BESSEL

Les fonctions de Bessel sont très utiles dans de nombreux domaines de pointe de la physique faisant
intervenir des équations différentielles délicates à résoudre. Les domaines dans lesquelles nous les trouvons
le plus souvent sont la calorimétrie (conduction de la chaleur), la physique nucléaire (physique de réacteurs),
et la mécanique des fluides.

Ces séries sont cependant très peu détaillées dans les écoles universitaires et il est souvent du rôle de l'élève
de chercher les compléments d'informations dont il a besoin sur le sujet dans la bibliothèque de son école.
Nous avons voulu présenter ici les développements permettant d'éviter cette démarche tout en restant chez
soi devant son ordinateur (de plus les livres sur le sujet sont assez rares...).

Remarque: Nous parlons habituellement par abus de langage des "fonctions de Bessel" au lieu des "séries de
Bessel".

Il existe une quantité non négligeable de fonctions de Bessel mais nous allons nous restreindre à l'étude de
celles qui sont les plus utilisées en physique.

FONCTION DE BESSEL D'ORDRE ZÉRO

La fonction connue sous le nom de "fonction de Bessel d'ordre zéro", est définie par la série de puissances:

(11.249)

C'est lors de l'étude des propriétés de dérivation et d'intégration que Bessel a trouvé que cette série de
puissance est une solution à une équation différentielle que l'on retrouve assez fréquemment en physique.
C'est pourquoi elle porte son nom.

Si représente le r-ème terme de la série, nous voyons aisément que:

(11.250)

qui tend vers zéro quand , quelque soit la valeur de x. Cela a pour conséquence que la série converge
pour toutes les valeurs de x. Comme il s'agit d'une série de puissance positive, la fonction et toutes ses
dérivées sont continues pour toutes valeurs de x, réelles ou complexes.

FONCTION DE BESSEL D'ORDRE N

La fonction , connue sous le nom de "fonction de Bessel d'ordre n", est définie, lorsque n est un entier
positif, par la série de puissance:

(11.251)

qui converge pour toutes valeurs de x, réelles ou complexes.


(11.252)

En particulier, pour nous avons:

(11.253)

et quand :

(11.254)

Nous pouvons noter que est une fonction paire de x quand n est paire, et impaire quand n est impaire
(cf. chapitre d'Analyse Fonctionnelle).

En dérivant la fonction et en comparant le résultat avec la série , nous voyons sans trop de peine
que:

(11.255)

Nous trouvons également sans trop de difficulté, la relation suivante:

(11.256)

En utilisant le fait que:


(11.257)

et en l'incluant dans la précédente relation, nous trouvons:

(11.258)

ou écrit autrement:

(11.259)

est donc une solution de l'équation différentielle du second ordre:

(11.260)

ou écrit autrement:

(11.261)

ou encore:

(11.262)

Une solution à une équation de Bessel de paramètre n qui n'est pas un multiple de est appelé
"fonction de Bessel du second type". Supposons que u est une telle fonction et posons ; alors
d'après la relation:

(11.263)

nous avons:

et (11.264)

En multipliant la première relation par v et la seconde par u et après soustraction, nous obtenons:

(11.265)

nous avons donc également:

(11.266)
nous pouvons donc écrire: (11.267)

effectivement car si nous développons, nous trouvons:

(11.268)

Pour que l'égalité: (11.269)

soit satisfaite, nous avons: (11.270)

En divisant par , nous avons: (11.271)

ce qui est équivalent à: (11.272)

de suite, par intégration il vient: (11.273)

où A est une constante. Consécutivement nous avons, puisque :

(11.274)

où rappelons-le, A et B sont des constantes, et si u n'est pas un multiple de par définition.

Si dans la dernière relation, est remplacé par son expression en termes de série nous avons:

(11.275)

dès lors: (11.276)

consécutivement si nous posons: (11.277)


où est une fonction de Bessel particulière du second type appelée "fonction de Bessel-Neumann du
second type d'ordre nul".

Identiquement au fait que quand , l'expression à cause du terme quand x est


petit tend vers quand .

Finalement, il vient de ce que nous avons vu précédemment que et sont des solutions
indépendantes de l'équation différentielle:

(11.278)

La solution générale étant donc: (11.279)

où A,B sont des constantes arbitraires et afin que soit réel.

Si nous remplaçons x par kx, où k est une constante, l'équation différentielle devient:

(11.280)

en multipliant le tout par , nous trouvons la forme générale de l'équation différentielle:

(11.281)

dont la solution générale est: (11.282)

où afin que soit réel quand .

Au fait, les fonctions de Bessel viennent des solutions de l'équation différentielle étudiée précédemment et
solutionnées par la méthode de Frobenius. Posons:

(11.283)

et faisons la substitution: (11.284)

en substituant dans Ly, nous obtenons:

(11.285)

Choisissons maintenant les afin de satisfaire l'équation différentielle tel que:


(11.286)

Dès lors, à moins que soit un entier négatif, nous avons:

(11.287)

En substituant ces valeurs dans la relation: (11.288)

nous obtenons: (11.289)

dès lors: (11.290)

si nous posons dans l'avant-dernière relation, nous obtenons:

(11.291)

ÉQUATION DIFFÉRENTIELLE DE BESSEL D'ORDRE N

Nous avons défini les séries de Bessel comme étant :

(11.292)

Posons : (11.293)

et dérivons ainsi : (11.294)

Mais nous avons aussi : (11.295)


Par soustraction : (11.296)

Ce qui donne finalement : (11.297)

Ce qui s'écrit également : (11.298)

Qui est appelé "l'équation différentielle de Bessel d'ordre n" ou plus simplement "équation de Bessel". Au
fait, la plupart des écoles ou sites Internet donnent cette équation différentielle comme une définition et
pourtant il est clair qu'il y a raisonnement rigoureux derrière cette équation.

La solution est donc du type : (11.299)

ce qui s'écrit encore parfois en utilisant la fonction gamma d'Euler :

(11.300)

Il s'ensuite que : (11.301)

et donc que est solution de cette équation différentielle.

CRITÈRES DE CONVERGENCE

Lorsque nous étudions une série, l'une des questions fondamentales est celle de la convergence ou de la
divergence de cette série.

Si une série converge, son terme général tend vers zéro lorsque n tend vers l'infini :

(11.302)

Ce critère est nécessaire mais non suffisant pour établir la convergence d'une série. Par contre, si ce critère
n'est pas rempli, on est absolument sûr que la série ne converge pas (donc elle diverge!).

Trois méthodes sont proposées pour approfondir le critère de convergence :

1. Le test de l'intégrale

2. La règle d'Alembert

3. La règle de Cauchy

Dans les paragraphes suivants, nous admettrons des séries à terme positifs. Le cas de la série alternée sera vu
ultérieurement.

TEST DE L'INTÉGRALE

Soit la série à termes positifs décroissants : (11.303)


c'est-à-dire : (11.304)

et soit une fonction continue décroissante telle que : (11.305)

nous pouvons alors affirmer que : 1. Si l'intégrale : (11.306)

converge, la série converge également.

2. Si l'intégrale : (11.307)

diverge, la série diverge également.

Remarque: En aucun cas l'intégrale ne donne la valeur de la somme de la série ! Le test de l'intégrale donne
simplement une indication sur la convergence de la série. Avant de faire le test de l'intégrale, il est important
de vérifier que les termes de la série soient strictement décroissants afin de remplir la condition
.

RÈGLE D'ALEMBERT

Si dans une série à termes positifs : (11.308)

le rapport (assimilable à une fonction prise en son entier) a une limite finie L lorsque :

(11.309)

1. Si , la série converge

2. Si , la série diverge

3. Si on ne peut rien dire

et nous définissons le "rayon de convergence" comme : (11.310)

RÈGLE DE CAUCHY

Si dans une série à termes positifs : (11.311)

la quantité a une limite finie L lorsque telle que : (11.312)

avec à nouveau les mêmes considérations que pour la règle d'Alembert :

1. Si , la série converge

2. Si , la série diverge
3. Si on ne peut rien dire

THÉOREME DE LEIBNIZ

Nous avons considéré jusqu'à présent des séries à termes positifs. Nous allons considérer dans cette partie
des séries dont les termes sont alternés, c'est-à-dire des séries de la forme :

(11.313)

Définition: Une série est dite "série alternée" si deux termes consécutifs de cette série sont de signe
contraire.

Si dans une série alternée les termes en valeur absolue vont en décroissant :

(11.314)

et si : (11.315)

alors la série converge, sa somme est positive et n'est pas supérieure au premier terme.

Si S est la somme de la série et une somme partielle, alors : (11.316)

Remarque: Il est important de vérifier que les valeurs absolues des termes de la série soient strictement
décroissantes afin de remplir la condition précédente.

CONVERGENCE ABSOLUE

Définition: Une série à termes variables est dite absolument convergente si la série formée avec la valeur
absolue de ses termes converge :

(11.317)

Si une série alternée de termes est absolument convergente, la série absolue qui en découle converge aussi.

Nous pouvons généraliser la règle d'Alembert au cas des séries à termes quelconques :

(11.318)

Ainsi, le rapport a une limite finie L lorsque pour nous avons :

(11.319)

toujours avec les mêmes conclusions que pour la règle d'Alembert normale.

THÉOREME DU POINT FIXE

Le théorème du point fixe n'est pas vraiment utile en physique (implicitement il est indispensable mais les
physiciens utilisent souvent des outils mathématiques dont les propriétés ont déjà été validées au préalable
par des mathématiciens), cependant nous le retrouvons en théorie du chaos (les vortex, tourbillons, etc...)
ainsi qu'en informatique théorique (voir chapitre traitant des fractales en particulier le triangle de Sierpinski).
Nous ne saurions donc que recommander au lecteur de prendre le temps de lire et de comprendre les
explications qui vont suivre.

Soit (X,d), un espace métrique complet (cf. chapitre de Topologie ou des Fractales) et soit une
application strictement contractante de constante L (voir les fonctions lipschitziennes chapitre de topologie),
alors il existe un unique point tel que . est alors dit le "point fixe" de T. De plus si nous
notons par :

(11.320)

l'image de x par le n-ème itéré de T, nous avons alors : (11.321)

et la vitesse de convergence peut d'ailleurs être estimée par : (11.322)

Démonstration:

Soit nous considérons la suite définie comme ci-dessus. Nous allons d'abord montrer que
cette suite est une suite de Cauchy (voir plus haut sur la présente page ce qu'est une suite de Cauchy).

En appliquant l'inégalité triangulaire (cf. chapitre d'Analyse Vectorielle) plusieurs fois nous avons :

(11.323)

Or : (11.324)

donc :

(11.325)

pour finir : (11.326)

c'est-à-dire que dans un premier temps est bien une suite de Cauchy.

(X,d) étant un espace complet nous avons que converge, et nous posons :

(11.327)

A présent, nous vérifions que est bien un point fixe de T. En effet T est uniformément continue (car
lipschitzienne - voir le chapitre de Topologie) donc à fortiori continue ainsi:
(11.328)

Il reste à vérifier que est l'unique point fixe (du coup nous aurons démontré que ne dépend pas du
choix de x). Supposons que nous ayons aussi alors :

(11.329)

Une estimation de la vitesse de convergence est donnée par:

(11.330)

est continue par rapport à chacune des variables donc:

(11.331)

et les limites préservent les inégalités (non strictes) donc: (11.332)


12. CALCUL VECTORIEL

L e calcul vectoriel ou "analyse vectorielle" est une branche des mathématiques qui étudie les champs de
scalaires et de vecteurs suffisamment réguliers des espaces euclidiens (voir définition plus loin).

L'importance du calcul vectoriel provient de son utilisation intensive en physique et dans les sciences de
l'ingénieur. C'est de ce point de vue que nous la présenterons, et c'est pourquoi nous nous limiterons le plus
souvent au cas de l'espace usuel à trois dimensions. Dans ce cadre, un champ de vecteurs associe à chaque
point de l'espace un vecteur (à trois composantes réelles), tandis qu'un champ de scalaires y associe un réel.

Remarque:Imaginons par exemple l'eau d'un lac. La donnée de sa température en chaque point forme un
champ de scalaires, celle de sa vitesse en chaque point, un champ de vecteurs (voir définition plus loin).

Des notions physiques telles que la force ou la vitesse sont caractérisées par une direction, un sens et une
intensité. Ce triple caractère est mis en évidence par les flèches. Celles-ci sont à l'origine de la notion de
vecteur et en constituent l'exemple le plus suggestif. Bien que leur nature soit essentiellement géométrique,
c'est leur aptitude à se lier les unes aux autres, donc leur comportement algébrique, qui retiendra
principalement notre attention. Partagé en classes d'équivalence l'ensemble qu'elles forment représente le
modèle classique d'un "espace vectoriel". Un de nos premiers objectifs est la description détaillée de ce
modèle.

Remarques:

R1. Avant de lire ce qui va suivre, nous conseillons au lecteur d'avoir au moins parcouru en diagonale le
chapitre traitant de la théorie des ensembles dans la section d'arithmétique. Nous y définissons ce qu'est un
"espace vectoriel" en utilisant les outils de la théorie des ensembles. Ce concept bien que non absolument
indispensable vaut la peine quand même de s'y attarder pour voir comment deux domaines des
mathématiques s'imbriquent et aussi histoire... d'aborder les choses au moins un peu rigoureusement.

R2. L'analyse vectorielle contient beaucoup de termes et de définitions qu'il faut apprendre par coeur. Ce
travail est pénible mais malheureusement nécessaire.

NOTION DE FLÈCHE

Nous désignerons par U l'espace ordinaire de la géométrie élémentaire et par P, Q, ... ses points. Nous
appellerons "flèche" tout segment de droite orienté (dans l'espace).

La flèche d'origine P et d'extrémité Q sera notée ou abrégé par une lettre unique (latine ou grecque)
choisie arbitrairement tel que par exemple : .

Nous considérerons comme évident que toute flèche est caractérisée par sa direction, son sens (car pour une
direction donnée elle peut pointer dans deux sens), son intensité ou grandeur (longueur) et ainsi que son
origine.

ENSEMBLE DES VECTEURS

Définitions:

D1. Nous disons que deux flèches sont "équivalentes" si elles ont la même direction, le même sens et la
même intensité.

D2. Nous disons que deux flèches sont "colinéaires" si elles ont seulement la même direction
Partageons l'ensemble des flèches en classes d'équivalences : deux flèches appartiennent à une même classe
si et seulement si elles sont équivalentes.

D3. Chaque classe d'équivalence de flèches constitue un "vecteur" ou plus exactement un "vecteur libre" car
son origine n'est pas prise en compte (dans le cas où son origine est bien définie, nous avons alors un
"vecteur lié").

Rangeons, en outre, les flèches dégénérées (c'est-à-dire de la forme ) en une classe distinguée que nous
appellerons "vecteur nul" et noterons qui ont une direction et un sens non définis... et instensité nulle.

L'ensemble des vecteurs sera lui désigné par V. Il faut souligner que les éléments de V sont des classes de
flèches et non pas des flèches individuelles. Il est cependant clair qu'une flèche quelconque suffit cependant
à déterminer la classe à laquelle elle appartient et il est donc naturel de l'appeler "représentant de la classe"
du vecteur.

Traçons le représentant d'un vecteur à partir de l'extrémité d'un représentant d'un vecteur . La flèche
dont l'origine est celle du représentant de et l'extrémité celle du représentant de détermine un vecteur
que nous noterons . L'opération qui associe à tout couple de vecteurs leur somme s'appelle "addition
vectorielle".

(12.1)

A l'aide d'une figure, il est facile de montrer que l'opération d'addition vectorielle est associative et
commutative, autrement dit, que: (12.2)

et: (12.3)

Il est en outre évident que le vecteur nul est l'élément neutre de l'addition vectorielle, autrement dit, que:

et (12.4)

où désigne le vecteur opposé de , c'est-à-dire le vecteur dont les représentants ont la même direction et
la même intensité que ceux de , mais le sens opposé. Deux vecteurs dont la somme est nulle sont alors
appelés "vecteurs opposés" puisque la seule chose qui les différencie est leur sens...

Il s'ensuit aussi que si deux ou plusieurs vecteurs ont la même direction, la même intensité et le même sens
alors ce sont des "vecteur égaux".

L'opération inverse de l'addition vectorielle est la soustraction vectorielle. Soustraire un vecteur revient à
additionner le vecteur opposé.

Remarques:

R1. L'addition s'étend, par récurrence, au cas d'une famille finie quelconque de vecteurs. En vertu de
l'associativité, ces additions successives peuvent être effectuées dans n'importe quel ordre, ce qui justifie
l'écriture sans parenthèses.
R2. La multiplication entre deux vecteurs est un concept qui n'existe pas. Par contre, comme nous le verrons
un peu plus loin, nous pouvons multiplier les vecteurs par certaines propriétés d'autres vecteurs que nous
appelons la "norme" et encore d'autres petites choses...

PSEUDO-VECTEURS

En physique, lors de l'énoncé de ce que nous appelons le "principe de Curie", les physiciens font mention de
ce qu'ils appellent des "pseudo-vecteurs". Il s'agit du vocabulaire simple pour parler de quelque chose de
tout aussi trivial mais fondamentalement peu de gens en font vraiment usage. Mais il peut quand même être
utile de présenter de quoi il s'agit.

Au fait, vecteurs et pseudo-vecteurs se transforment de la même manière dans une rotation ou une
translation (nous verrons plus tard dans ce chapitre comment effectuer mathématiquement ces
transformations). Il n'en est pas de même dans la symétrie par rapport à un plan ou à un point. Dans ces
transformations nous avons par définition les propriétés suivantes :

P1. Un vecteur est transformé en son symétrique

P2. Un pseudo-vecteur est transformé en l'opposé du symétrique

Voici une figure avec des exemples types (le choix des lettre représentant les vecteurs ne sont pas du au
hasard, elles sont un clin d'oeil aux propriétés des champs électriques et magnétique étudiés en physique) :

(12.5)

Ben voilà... c'est tout sur les pseudo-vecteurs...

MULTIPLICATION PAR UN SCALAIRE

Le vecteur appelé "produit du nombre par ", est défini de la manière suivante:

Prenons une flèche représentative de et construisons un flèche de même direction, de même sens ou de
sens opposé, suivant que est positif ou négatif, et d'intensité fois l'intensité de la flèche initiale; la
flèche ainsi obtenue est un représentant du vecteur ; si ou , nous posons .

L'opération qui consiste à effectuer le produit d'un nombre par un vecteur est appelé "multiplication par un
scalaire".

Nous vérifions aisément que la multiplication par un scalaire est associative et distributive par rapport à
l'addition numérique vectorielle, autrement dit que:
(12.6)

Voyons de suite un exemple concret mondialement connu des vecteurs :

RÈGLE DE TROIS

Revenons un peu sur la "règle de trois" (appelée parfois "règles des rapports et proportions" ou encore
"méthode de réduction à l'unité") souvent définie dans les petites classes de manière intuitive mais sans
démonstration digne de ce nom. Cette règle est certainement l'algorithme le plus usité de par le monde qui
sert à identifier un quatrième nombre quand trois sont donnés et que les quatre nombres sont linéairement
dépendants.

La règle de trois est dérivée sous deux versions:

V1. Simple et directe si les grandeurs sont directement proportionnelles

V2. Simple et inverse si les grandeurs sont inversement proportionnelles

et lorsque deux variables X et Y sont proportionnelles nous le notons : (12.7)

Supposons maintenant que X puisse prendre les valeurs et Y prendra les valeurs linéairement
dépendantes alors:

- Le rapport proportionnel suivant : (12.8)

est dit "rapport simple et directe".

Démonstration:

Soient deux vecteurs colinéaires et donc proportionnels à un facteur près tel que :

(12.9)

Remarque: Si ce rapport n'est pas égal, alors il faut passer à l'utilisation d'autres outils tel que la régression et
in extenso l'extrapolation.

- Le rapport proportionnel suivant : (12.10)

est dit "rapport simple et inverse".

Démonstration:

Soient deux vecteurs colinéaires et donc proportionnels à un facteur près tel que :
(12.11)

Remarque: Si ce rapport n'est pas égal, alors il faut passer à la régression linéaire (cf. chapitre de Méthodes
Numériques).

En gros, il suffit que nous connaissions trois variables sur les quatre pour résoudre cette simple équation du
premier degré.

Les conversions de monnaies ou d'unités de mesure se font à l'aide de la règle de trois simple directe ou
indirecte. Les calculs de parités (calcul prévisionnel fait par un importateur d'un certain pays ayant ses
propres unités de mesures et de monnaie, qui recherche parmi plusieurs offres étrangères (dans des systèmes
d'unités de mesures et de monnaies qui diffèrent de l'importateur), laquelle est la plus avantageuse ou
inversement) se font également avec la règle de trois.

Remarque: Nous appelons également "règle conjointe simple ou inverse", une série de règle de trois directes
ou indirectes.

Dans de tels calculs, les agents du marché d'échange ont remarqué que la plupart du temps, les rapports
étaient des valeurs proches de l'unité. Ils ont été ainsi naturellement amenés à définir "le pourcentage"
comme étant la proportion d'une quantité ou d'une grandeur par rapport à une autre, évaluée à la centaine (en
général du moins ... ) :

Soit un nombre alors sa notation en pourcentage sera: (12.12)

Soit un nombre alors sa notation en pour-mille sera (12.13)

ESPACES VECTORIELS

Définition: Nous appelons "espace vectoriel" un ensemble E d'éléments désignés par et appelés
"vecteurs", muni d'une "structure algébrique vectorielle" définie par la donnée de l'addition (soustraction)
vectorielle et la multiplication par un scalaire. Ces deux opérations satisfaisant les lois associativité, de
commutativité, de distributivité, d'élément neutre et d'opposé comme nous l'avons déjà vu dans le chapitre
de Théorie Des Ensembles.

Pour plus d'informations sur ce qu'est un espace vectoriel dans le sens "ensembliste" le lecteur devra se
reporter au chapitre de Théorie Des Ensembles où ce concept est défini avec plus de rigueur.

Remarque: Muni de ces deux opérations, un espace vectoriel est dit "vectorialisé".

Pour tout entier positif n, désignera l'ensemble des n-uplets de nombres disposés en colonne :

(12.14)

et est à l'évidence munie d'une structure d'espace vectoriel. Les vecteurs de cet espace seront appelés
"vecteurs-colonne". Il seront souvent désignés plus brièvement par : (12.15)
ou encore plus simplement par : (12.16)

Le nombre est parfois appelé "terme" ou "composante d'indice i" de .

COMBINAISONS LINEAIRES

Dorénavant, sauf mention explicite du contraire, les vecteurs seront les éléments d'un espace vectoriel E.

Définition: Nous appelons "combinaison linéaire" des vecteurs tout vecteur de la forme :

(12.17)

ou sont des nombres appelés "coefficients de la combinaison linéaire".

Le vecteur nul est combinaison linéaire de avec tous les coefficients égaux à zéro.
Nous parlons dès lors de "combinaison linéaire triviale".

Définition: Nous appelons "combinaison convexe", toute combinaison linéaire dont les coefficients sont
non négatifs et de somme égale à 1. L'ensemble des combinaisons convexes de deux points P et Q d'un
espace ponctuel (ayant un origine) est le segment de droite P et Q. Pour s'en rendre compte, il suffit
d'écrire: (12.18)

de faire varier de 0 à 1 et de constater que tous les points du segment sont ainsi obtenus.

Si le vecteur est combinaison linéaire des vecteurs et chacun de ces vecteurs est combinaison
linéaire des vecteurs , alors est combinaison linéaire de .

SOUS-ESPACES VECTORIELS

Définition: Nous appelons "sous-espace vectoriel de E" tout sous-ensemble de E qui est lui-même un espace
vectoriel pour les opérations d'addition et de multiplication par un scalaire définies dans E.

Un sous-espace vectoriel, en tant qu'espace vectoriel, ne peut être vide puisqu'il comprend au moins un
vecteur, à savoir son vecteur nul, celui-ci étant d'ailleurs forcément le vecteur nul de E. En outre, en même
temps que les vecteurs et (s'il en contient d'autres que le vecteur nul), il comprend également toutes
leurs combinaisons linéaires .

Inversement, nous voyons aussitôt que tout sous-ensemble jouissant de ces propriétés est un sous-espace
vectoriel. Nous avons ainsi établi la proposition suivante :

Un sous ensemble S de E est un sous-espace vectoriel de E si et seulement si S est non vide et


appartient à S pour tout couple de vecteurs de S et tout couple .
FAMILLES GÉNÉRATRICES

Il en découle que si nous avons une famille de vecteurs l'ensemble des combinaisons linéaires
de peut être un sous-espace vectoriel S de E, plus précisément le plus petit sous-espace vectoriel
de E comprenant .

Les vecteurs qui satisfont à la condition ci-dessus sont appelés "générateurs" de S et la famille
, famille génératrice de S. Nous disons aussi que ces vecteurs ou cette famille engendrent S.

Remarque: Le sous-espace vectoriel engendré par un vecteur non nul est formé de tous les multiples de ce
vecteur. Nous appelons un tel sous-espace "droite vectorielle". Un sous-espace vectoriel engendré par deux
vecteurs non multiples l'un de l'autre est appelé "plan vectoriel".

DÉPENDANCE ET INDÉPENDANCES LINÉAIRES

Ce qui va suivre est très important en physique nous conseillons donc au futur physicien de prendre
vraiment le temps de bien lire les développements qui vont suivre.

Si sont trois vecteurs de dont les représentants ne sont pas parallèles à un même plan (par
convention une flèche d'intensité nulle est parallèle à tout plan), alors tout vecteur de peut s'écrire de
manière unique sous la forme : (12.19)

où sont des nombres.

(12.20)

En particulier, la seule possibilité d'obtenir le vecteur nul comme combinaison linéaire de est
d'attribuer la valeur triviale 0 à .

Réciproquement, si pour trois vecteurs de la relation : (12.21)

implique , aucun des vecteurs ne peut être combinaison linéaire des deux autres, autrement
dit, leurs représentants ne sont pas parallèles à un même plan.

Sur la base de ces observations, nous allons étendre la notion d'absence de parallélisme à un même plan au
cas d'un nombre quelconque de vecteurs d'un espace vectoriel E.
Nous disons que les vecteurs sont "linéairement indépendants" si la relation :

(12.22)

implique nécessairement , autrement dit, si la combinaison linéaire triviale est la seule


combinaison linéaire de qui soit nulle. Dans le cas contraire, nous disons que les vecteurs
sont "linéairement dépendants".

Si l'attention est fixée sur la famille plutôt que sur les termes dont elle est constituée, nous
disons que celle-ci est une "famille libre" ou "famille liée" suivant que les vecteurs sont
linéairement indépendants ou dépendants.

BASES D'UN ESPACE VECTORIEL

Définition: Nous disons qu'une famille finie de vecteurs est une base de E si et seulement si :

1. Elle est libre

2. Elle engendre E

D'après cette définition, toute famille libre est une base du sous-espace vectoriel qu'elle
engendre.

Exemple:

Si nous considérons comme -espace vectoriel (cf. chapitre de Théorie des Ensembles), alors puisque
tous les éléments de s'écrivent , les éléments qui engendrent sont 1 et i (les deux sont libres).

Une base de (qui est de dimension 2) comme -espace vectoriel est donc la famille finie libre {1,i}.

Pour qu'une famille de vecteurs soit une base de E, il faut et il suffit donc que tout vecteur
de E s'exprime de manière unique sous la forme d'une combinaison linéaire des vecteurs :

(12.23)

La relation ci-dessus est une décomposition de suivant la base où les coefficients


sont les composantes de dans cette base. En présence d'une base, tout vecteur est donc
entièrement déterminé par ses composantes.

Proposition:

Si sont les composantes de et celles de , alors:

(12.24)

sont les composantes de .


En d'autres termes, additionner deux vecteurs revient à additionner leurs composantes et multiplier un
vecteur par un scalaire revient évidemment à multiplier ses composantes par ce même scalaire. La base est
donc un outil important car elle permet d'effectuer les opérations sur les vecteurs au moyen d'opérations sur
les nombres.

Exemple:

Les vecteurs colonnes de : (12.25)

forment un base que nous appelons "base canonique" de (nous travaillerons dans les espaces complexes
dans un autre chapitre).

Remarque: Dans le cadre de l'espace à trois dimensions, les bases sont très souvent assimilées à un trièdre
(effectivement si vous reliez les extrémités des trois vecteurs par des traits vous obtiendrez un trièdre
imaginaire).

ANGLES DIRECTEURS

Il est clair qu'un seul angle ne peut décrire la direction d'un vecteur dans l'espace. Nous utilisons alors la
notion "d'angles directeurs". Il s'agit de mesurer l'angle du vecteur par rapport à chacun des axes positifs
de la base :

(12.26)

Si : (12.27)

alors: (12.28)

Les valeurs : (12.29)


sont appelées les "cosinus directeurs" de .

Les 3 angles mentionnés ne sont pas complètement indépendants. En effet, 2 suffisent pour déterminer
complètement la direction d'un vecteur dans l'espace, le troisième pouvant se déduire de la relation suivante
(obtenue à partir du calcul de la norme du vecteur, concept que nous verrons un peu plus loin):

(12.30)

De plus, les cosinus directeurs sont les composantes scalaires d'un vecteur de norme unitaire ayant la

même direction que : (12.31)

DIMENSIONS D'UN ESPACE VECTORIEL

Nous disons que E est de "dimension finie" s'il est engendré par une famille finie de vecteurs. Dans le cas
contraire, nous disons que E est de "dimension infinie" (nous aborderons ce type d'espaces dans un autre
chapitre). Tout espace vectoriel de dimension finie et non réduit au vecteur nul admet une base. En fait, de
toute famille génératrice d'un tel espace nous pouvons extraire une base.

La dimension d'un espace vectoriel est notée: dim(E) (12.32)

Tout espace vectoriel E de dimension finie non nulle n peut être mis en correspondance biunivoque (c'est-à-
dire en bijection) avec . Il suffit de choisir une base de E et de faire correspondre à tout vecteur de E le
vecteur-colonne dont les termes sont les composantes de dans la base choisie (c'est du bla bla de
mathématicien mais ce sera utile quand nous aborderons des espaces plus complexes) :

(12.33)

Cette correspondance conserve les opérations d'addition et de multiplication par un scalaire que nous avons
déjà vues; en d'autres termes, elle permet d'effectuer les opérations sur les vecteurs par des opérations sur les
nombres.

Remarque: Nous disons alors que E et sont "isomorphes" ou que la correspondance est un isomorphisme
(cf. chapitre de Théorie Des Ensembles).

PROLONGEMENT D'UNE FAMILLE LIBRE

Soit une famille libre et une famille génératrice de E. Si n'est pas


une base de E, nous pouvons extraire une sous-famille de de telle manière que
la famille soit une base de E.

Remarque: Une telle étude a son utilité lors de passage d'espace mathématique ayant des propriétés données
à un autre espace ayant des propriétés mathématiques différentes.
Démonstration:

H1. Nous supposons qu'au moins un des vecteurs n'est pas combinaison linéaire des vecteurs ,
sinon engendrerait E et serait donc une base possible de E. Notons ce vecteur . La famille
est alors une famille libre. En effet, la relation : (12.34)

implique alors tout d'abord que , autrement serait combinaison linéaire des vecteurs ,
et ensuite , puisque les vecteurs sont linéairement indépendants.

Si la famille engendre E, elle est une base possible de E et le théorème est démontré. Dans
le cas contraire, le même raisonnement nous assure l'existence d'un autre vecteur .... Si la nouvelle
famille en découlant n'est pas un base de E, alors le procédé d'extraction de vecteurs de se
poursuit. Lorsqu'il s'arrête, nous aurons obtenu un "prolongement" de en une famille libre
engendrant E, c'est-à-dire une base de E.

Il en retourne un corollaire: Tout espace vectoriel de dimension finie et non réduit au vecteur nul admet une
base. En fait, de toute famille génératrice d'un tel espace, nous pouvons donc extraire une base.

RANG D'UNE FAMILLE FINIE

Définition: Nous appelons "rang d'une famille" de vecteurs la dimension du sous-espace vectoriel de E
qu'elle engendre.

Montrons que le rang d'une famille de vecteurs est inférieur ou égal à k et qu'il est égal à k si et
seulement si cette famille est libre.

Démonstration:

Ecartons d'abord le cas trivial où le rang de la famille est nul. D'après le corollaire vu
précédemment, nous pouvons alors extraire de cette famille une base du sous-espace vectoriel qu'elle
engendre. Le rang est donc inférieur ou égal à k suivant que est une famille liée ou non.

SOMMES DIRECTES

Définition: Nous disons que la somme S+T de deux sous-espaces vectoriels S et T de E (cas particulier
appliqué à un espace de dimensions 2 !) est une "somme directe" si : (12.35)

Dans ce cas, nous la notons : (12.36)

En d'autres termes, la somme de deux sous-espaces vectoriels S et T de E est directe si la décomposition de


tout élément de S+T en somme d'un élément de S et d'un élément de T est unique.

Ce concept de décomposition trivial va nous être très utile dans certains théorèmes dont le plus important sur
ce site est certainement le théorème spectral (cf. chapitre d'Algèbre Linéaire).

De la somme directe nous pouvons introduire la notion de "sous-espace complémentaire" appelé encore
"sous-espace supplémentaire" (selon les pays...) :
Supposons que E soit de dimension finie. Pour tout sous-espace vectoriel S de E, il existe un sous-espace
vectoriel T (non unique) de E tel que E soit somme directe de S et T. Nous disons alors que T est un "sous-
espace complémentaire" de S dans E.

Démonstration:

Ecartons d'abord les cas triviaux où et S=E. Le sous-espace vectoriel S admet une base ,
où est inférieur à la dimension n de E. Par le théorème du prolongement d'une famille libre, cette base peut
se prolonger en une base de E. Soit T le sous-espace vectoriel engendré par la famille
. Si est un vecteur quelconque de E, alors , où est un vecteur de S et un vecteur
de T. En outre, car aucun vecteur, excepté le vecteur nul, ne peut être combinaison linéaire des
vecteurs et des vecteurs . Nous en concluons donc que : (12.37)

ESPACE AFFINE

L'espace G de la géométrie élémentaire est à la fois usuel et la source de la notion "d'espace affine" que nous
allons introduire.

Cet espace G est associé à "l'espace vectoriel" géométrique V par la correspondance entre flèches et vecteurs
étudiés jusqu'ici! La définition suivante ne fait que mettre en évidence les traits dominants de cette
correspondance :

Définition: Soit U un ensemble non vide d'éléments que nous appellerons "points" et désignerons par les
lettres P, Q, ... ; soit en outre E un espace vectoriel. Supposons qu'à tout couple de points (P,Q) corresponde
un vecteur noté . Nous disons alors que U est un "espace affine" d'espace directeur (ou dit simplement
abusivement de "direction") E si les conditions suivantes sont satisfaites :

C1. Pour tout point P fixé, la correspondance entre couples (P,Q) et vecteurs est biunivoque, autrement
dit, pour tout vecteur il existe un point Q et un seul tel que .

C2. Pour tout triplet de points (P,Q,R) : (12.38)

C'est la fameuse "relation de Chasles"-

C3. Si P est un point et un vecteur, pour exprimer que Q est l'unique point tel que , nous écrivons:

(12.39)

Bien qu'un peu abusive, cette écriture est conforme à l'usage et suggère bien le sens de l'opération qu'elle
désigne.

Les propriétés suivantes découlent directement de la définition d'espace affine :

P1.

P2. Pour tout point P, . Cela résulte de la condition dans le cas où nous avons
.
P3. . Il suffit de poser R=P dans la relation de Chasles .

P4. Règle du parallélogramme :

Soit le polygone de sommets (dans le sens des aiguilles d'un montre) et arêtes
:

Nous avons : (12.40)

si et seulement si : (12.41)

ce qui donnerait alors un parallélogramme!

En effet, en remplaçant R par Q' dans la relation de Chasles il vient : (12.42)

et en faisant de même mais en remplaçant R par Q' et Q par P' nous avons : (12.43)

Nous avons alors en égalisant ces deux dernières relations : (12.44)

ce qui force l'égalité susmentionnée que nous voulions démontrer.

Précédemment, nous avons vu ce qui faisait qu'un espace G pouvait être muni d'une structure d'espace
vectoriel (nous avons vu que nous disons que ce dernier était dès lors "vectorialisé"). Dans le cas général
d'un espace affine U, le procédé est le même :

Nous choisissons un point quelconque O de U. La correspondance entre couples et vecteurs de


l'espace directeur étant alors biunivoque nous définissons l'addition de points et la multiplication d'un point
par un scalaire par les opérations correspondantes sur les vecteurs de E. Muni de ces deux opérations, U
devient un espace vectoriel, appelé "vectorialisé de U relativement à O". Nous désignerons cet espace par
et appellerons O "l'origine".

Vu la manière dont les opérations ont été définies, il résulte que est isomorphe à l'espace directeur E:

(12.45)

Toutefois, cet isomorphisme dépend du choix de l'origine O et en pratique cette origine est choisie sur la
base, de données inhérentes aux problèmes posés. Par exemple, si une transformation affine admet un point
invariant (qui ne bouge pas), il y a avantage à choisir ce point comme origine.
Remarques:

R1. Lorsque nous parlons de dimension d'un espace affine, nous parlons de la dimension de son espace
directeur.

R2. L'espace G de la géométrie élémentaire est un espace affine. En effet, sa direction est l'espace
géométrique V et les conditions de définition d'un espace affine sont satisfaites. Il faut bien noter qu'au
couple de points est associé le vecteur et non pas la flèche PQ. En fait, la flèche pouvant être
identifiée au couple de points, nous voyons que ce que postule la définition d'un espace affine n'est rien
d'autre qu'une forme abstraite de correspondance entre flèches et vecteurs.

R3. Tout espace vectoriel E peut être considéré comme un espace affine de direction E lui-même si au
couple de vecteurs est associé le vecteur . En effet, les conditions de définition d'un espace
affine sont dès lors satisfaites.

ESPACES VECTORIELS EUCLIDIENS

Avant de définir ce qu'est un espace vectoriel euclidien, nous allons au préalable définir quelques outils
mathématiques et quelques concepts.

Nous pouvons, en choisissant une unité de longueur, mesurer l'intensité de chaque flèche, autrement dit,
déterminer sa longueur. Nous pouvons aussi mesurer l'écart angulaire de deux flèches (ou vecteurs)
quelconques d'origine commune (non nécessairement distinctes) en prenant comme unité de mesure d'angle
par exemple le radian. La mesure de cet écart est alors un nombre compris entre 0 et , appelé "angle" des
deux flèches. Si les deux flèches ont même direction et même sens, leur angle est nul et si elles ont même
direction et sens opposé, ce même angle est .

Les flèches représentatives d'un même vecteur ont toutes la même longueur. Nous désignerons cette
longueur par la notation: (12.46)

et l'appellerons "norme" de . Il est clair que la longueur d'un vecteur est nulle si et seulement si sa norme
est nulle. Nous dirons qu'un vecteur est unitaire si sa norme est 1.

Si est un vecteur non nul : (12.47) est un vecteur unitaire colinéaire (nécessairement...) à
dont la norme est égale à l'unité et que nous notons .

Nous appellerons "angle des vecteurs non nuls" et l'angle de deux flèches d'origine commune
représentant l'une et l'autre . Plus rigoureusement cependant une "norme" sur un espace vectoriel
réel (ou complexe) E est une application vérifiant les propriétés :

P1. Positivité : (12.48)

P2. Linéarité : (12.49)

P3. Nullité : (12.50)

P4. Inégalité de Minkowski (inégalité triangulaire) : (12.51)


Remarques:

R1.Ces propriétés sont principalement imposées par notre approche intuitive de l'espace euclidien et de son
interprétation géométrique.

R2. Nous démontrerons un peu plus loin la propriété P4 sous la dénomination "d'inégalité triangulaire" et
nous ferons une étude un peu plus générale de cette inégalité sous la dénomination "d'inégalité de
Minkowski" dans le chapitre de Topologie.

PRODUIT SCALAIRE VECTORIEL

Définition: Un "espace vectoriel euclidien", est un espace vectoriel (réel et de dimension finie pour les
puristes) possédant une opération particulière, le "produit scalaire" que nous noterons (notation spécifique à
ce site Internet) en ce qui concerne le cas particulier des vecteurs : (12.52)

Remarques:

R1. Nous trouvons dans certains ouvrages (pour information) la notation ou encore lors de la
généralisation de cette définition comme nous le verrons un peu plus loin.

R2. Le produit scalaire à une importance énorme dans l'ensemble du domaine des mathématiques et de la
physique, ainsi nous le retrouvons dans le calcul différentiel et intégral (de par le produit scalaire
fonctionnel), en topologie, en physique quantique en analyse du signal etc... il convient donc de bien
comprendre ce qui va suivre.

R3. Le produit scalaire peut être vu comme une projection de la longueur d'un vecteur sur la longueur d'un
autre.

Ce produit scalaire possède les propriétés suivantes (dont la plupart découlent de la définition même du
produit scalaire) dans un espace euclidien:

P1. Commutativité :

P2. Associativité :

P3. Distributivité :

P4. Si

P5. et si

P6.

Seule cette dernière propriété nécessite peut-être une démonstration (de plus un des résultats de la
démonstration nous servira à démontrer une autre propriété très importante du produit scalaire):

Démonstration:

Soit : (12.53)
qui constitue la "projection orthogonale vectorielle" (le v en indice du proj signifiant "vectoriel) du vecteur
sur la normalisation à l'unité du vecteur .

A l'aide du produit scalaire, le vecteur peut être exprimé autrement il suffit de prendre la relation que

nous avons vu plus haut: (12.54)

et de l'introduire dans avec les vecteurs adéquats pour obtenir :

(12.55)

Cette expression vaut également dans le cas où est nul, à condition d'admettre que la projection
orthogonale de vecteur nul est nul.

La norme de s'écrit : (12.56)

Si est unitaire, les relations de projections précédentes se simplifient et deviennent :

et (12.57)

Par des considérations géométriques élémentaires (distributivité du produit scalaire), il est facile de se rendre
compte que :

et (12.58)

Si nous revenons maintenant à la démonstration de : (12.59)

Nous avons donc dans un premier temps:

(12.60)

et d'après la définition la propriété de la projection orthogonale il vient alors immédiatement en faisant la

correspondances terme à terme: (12.61)

d'où la propriété P6 qui s'ensuit par multiplication des deux membres de l'égalité par .

Définitions:

D1. L'espace vectoriel E est dit "espace vectoriel proprement euclidien" si

D2. Nous disons que les vecteurs et sont des "vecteurs orthogonaux" s'ils sont non nuls et que leur
produit scalaire est nul (leur angle est égal à ).
Une base de V est dite "base orthonomormale" si les vecteurs sont orthogonaux deux à
deux et unitaires (donc constituant une famille libre).

Remarque: Nous verrons en calcul tensoriel (nous aurions pu le faire ici aussi mais bon...) comment à partir
d'un ensemble de vecteurs indépendants construire une base orthogonale. C'est ce que le lecteur pourra
trouver sous le nom de "méthode d'orthogonalisation de (Grahm-)Schmidt".

Par le raisonnement géométrique, nous voyons que tout vecteur est la somme de ses projections
orthogonales sur les vecteurs d'une base orthonormale, autrement dit, si est une base
orthonormale: (12.62)

Cette décomposition s'obtient également par la propriété de P6 du produit scalaire. En effet, étant
les composantes de :

(12.63)

puisque et de même : et (12.64)

d'où la décomposition.

Soit et les composantes respectives des vecteurs et dans une base orthonormale
canonique nous pouvons écrire le produit scalaire sous la forme :

(12.65)

de la propriété P6 du produit scalaire :

(12.66)

en utilisant la propriété P1 et à nouveau P6 :

(12.67)

Ce qui nous donne finalement la décomposition : (12.68)

qui constitue l'une des relations les plus importantes dans le domaine du calcul vectoriel et que nous
appelons "produit scalaire canonique".
INÉGALITÉ DE CAUCHY-SCHWARZ

La relation: (12.69)

s'écrit également trivialement sous la forme suivante si nous utilisons la notion de norme et la définition du

produit scalaire : (12.70)

Il est intéressant de remarque que si les deux vecteurs et sont orthogonaux, nous retrouvons le résultat
d'un théorème fameux: le théorème de Pythagore!

Effectivement, dès lors nous avons si les deux vecteur sont orthogonaux: (12.71)

Ce qui nous donne: (12.72)

Cette relation est très importante en physique-mathématique. Il faut s'en souvenir !

Nous appelons également "inégalité de Cauchy-Schwarz" l'inégalité, valable pour tout choix des vecteurs
et , la relation : (12.73)

Ce qui s'écrit aussi : (12.74)

D'abord nous considérerons comme évident que l'égalité n'a lieu qu'en cas de colinéarité des deux vecteurs.

Démonstration:

Nous nous plaçons dans le cas où . Alors, pour nous avons trivialement selon les propriétés
du produit scalaire : (12.75)

Il s'agit donc d'une simple équation du deuxième degré où la variable est . En se rappelant de ce que nous
avons vu lors de notre étude des polynômes du deuxième degré (cf. chapitre de Calcul Algébrique) la
relation précédente (le fait qu'elle soit toujours supérieure ou égale à zéro) est satisfaite que si le
discriminant est négatif ou nul. En d'autres termes, si :

(12.76)

Soit après simplification : (12.77)

Lorsque E est , l'inégalité de Cauchy-Schwarz s'écrit avec les composantes des vecteurs :

(12.78)

Dans le cas particulier où elle devient: (12.79)


ou encore: (12.80)

ce qui montre que le carré de la moyenne arithmétique est inférieur ou égal à la moyenne arithmétique des
carrés. Ce résultat est important pour l'étude des statistiques.

Par ailleurs, en vertu de la propriété du cosinus et de l'inégalité de Cauchy-Schwarz nous pouvons écrire:

(12.81)

relation que nous retrouvons également dans le cadre de l'étude des statistiques (cf. chapitre de Statistiques).

INÉGALITÉ TRIANGULAIRE

En majorant par (de par l'inégalité de Cauchy-Schwarz!) et en mettant ceci dans la relation

établie déjà précédemment: (12.82)

Nous obtenons: (12.83)

ce qui entraîne la fameuse "inégalité triangulaire" (très utile dans l'étude des suites et séries pour l'étude des
convergences ainsi qu'en topologie) : (12.84)

Remarque: La généralisation de cette inégalité relativement aux propriétés des normes telles que nous le
verrons en topologie, donne ce que nous appelons "l'inégalité de Minkowski".

En appliquant une fois l'inégalité triangulaire aux vecteurs et et une autre fois aux vecteurs

et nous obtenons la variante : (12.85)

PRODUIT SCALAIRE (GÉNÉRAL)

Voyons maintenant une autre manière un peu plus générale (s'appliquant à des vecteurs ou fonctions),
formelle et abstraite pour définir le produit scalaire tout en tentant de rester le plus simple possible (attention
dans le cas général la notation du produit scalaire change!) :

Définition: Soit E un espace vectoriel réel (!). Une "forme bilinéaire symétrique positive" sur E, est une

application : (12.86)

qui vérifie (par définition!):

P1. La positivité : (12.87)

P2. La nullité (définie) : (12.88)

P3. La symétrie : (12.89)


P4. La bilinéarité (forme bilinéaire) avec, dans l'ordre, la "linéarité à gauche" et la "linéarité à droite":

(12.90)

Remarque: A nouveau, ces propriétés sont principalement imposées par notre approche intuitive de l'espace
euclidien et de son interprétation géométrique.

Définition: Un espace E muni d'un produit scalaire est appelé un "espace préhilbertien". Si E est de
dimension finie, nous parlons alors "d'espace euclidien".

Nous avons vu en topologie (cf. chapitre de Topologie) que les propriétés du produit scalaire sont les briques
de bases pour définir une norme et donc une distance dans un espace métrique. Cette distance sera alors
donnée selon ce que nous avons obtenu en topologie :

(12.91)

Définition: Nous disons qu'un espace E muni d'un produit scalaire est un "espace Hilbertien" ou
"espace de Hilbert" si cet espace est complet pour la métrique définie ci-dessus.

En d'autres termes, avoir un espace métrique muni donc d'une distance générée par un produit scalaire est
une chose. Ensuite, avoir une distance mesurable en est une autre. Un espace de Hilbert a donc des distances
mesurables au sens topologique du terme car l'ensemble sur lequel on travaille est continu et n'importe quel
point peut-être approché indéfiniment (imaginez avoir une règle et que vous ne pouvez pas avec cette règle
approcher les points qui définissent les dimensions de votre objet... ce serait gênant...). Donc sans espace
complet une grande partie des théorèmes de l'analyse fonctionnelle ne pourraient pas être utilisés dans
l'étude des espaces vectoriels et cela serait très gênant en physique quantique ondulatoire par exemple...

Formellement, rappelons qu'un espace métrique est complet si toutes les suites de Cauchy (cf. chapitre des
Suites Et Séries) de cet espace sont convergentes (cf. chapitre sur les Fractals) dans un espace métrique (cf.
chapitre de Topologie).

PRODUIT VECTORIEL

Le produit vectoriel de deux vecteurs est une opération propre à la dimension 3. Pour l'introduire, il faut
préalablement orienter l'espace destiné à le recevoir. L'orientation étant définie au moyen de la notion de
"déterminant", nous commencerons par une brève introduction à l'étude de cette notion. Cette étude sera
reprise plus tard dans le détail lors de l'analyse des systèmes linéaires dans le chapitre d'algèbre linéaire.

Définition: Nous appelons "déterminant" des vecteurs-colonnes de (pour la forme générale du

déterminant se reporter au chapitre d'Algèbre Linéaire) : (12.92)

et nous notons: (12.93)

le nombre (produit soustrait en croix) : (12.94)

Nous appelons déterminant des vecteurs-colonnes de (cf. chapitre d'Algèbre Linéaire):


(12.95)

et nous notons : (12.96)

le nombre : (12.97)

Ainsi, la fonction qui associe à tout couple de vecteurs-colonnes de (à tout triplet de vecteurs-colonnes
de ) son déterminant est appelé "déterminant d'ordre 2" (respectivement d'ordre 3).

Le déterminant a comme propriété d'être multiplié par -1 si l'un de ses vecteurs colonnes est remplacé par
son opposé ou si deux de ses vecteurs-colonnes sont échangés (la vérification étant simple nous nous
abstiendrons de la démonstration, sauf sur demande). En plus, le déterminant est non nul si et seulement si
ses vecteurs-colonnes sont linéairement indépendants (la démonstration se trouve quelques lignes plus bas et
est d'une grande importance en mathématique).

Définition: Soit et les composantes respectives des vecteurs et dans la base


orthonormale . Nous appelons "produit vectoriel" de et , et nous notons indistinctement:

(12.98)

le vecteur : (12.99)

ou sous forme de composantes : (12.100)

Remarques:

R1. La première notation est la notation internationale due à Gibbs (que nous utiliserons tout au long de ce
site), la deuxième est la notation français due à Burali-Forti (assez embêtant car se confond avec l'opérateur
ET en logique).

R2. Il est assez embêtant de retenir par coeur les relations qui forment le produit vectoriel habituellement.
Mais heureusement il existe au moins trois bons moyens mnémotechniques :

1. Le plus rapide consiste à retrouver l'une des expressions des composantes du produit vectoriel et ensuite
par décrémentation des indices (en recommencent à 3 lorsque qu'on arrive à 0) de connaître toutes les autres
composantes. Encore faut-il trouver un moyen simple de se souvenir d'une des composantes. Un bon moyen
est la propriété mathématique suivante de deux vecteur colinéaires permettant facilement de retrouver la
troisième composante (celle selon l'axe Z) :

Soit deux vecteurs colinéaires dans un même plan, alors :


(12.101)

Nous retrouvons donc bien l'expression de la troisième composante du produit vectoriel de deux vecteurs
(non nécessairement colinéaires... eux!).

2. La seconde mais que nous verrons lors de notre étude du calcul tensoriel consiste à utiliser le symbole
d'antisymétrie (également appelé "tenseur de Levi-Civita"). Cette méthode est certainement la plus
esthétique d'entre toutes mais pas nécessairement la plus rapide à développer. Nous donnons ici juste
l'expression sans plus d'explications pour l'instant (elle est également utile pour l'expression du déterminant
par extension) : (12.102)

3. Cette dernière méthode est assez simple et triviale aussi mais elle utilise implicitement la première
méthode: la i-ème composante est le déterminant des deux colonnes privées de leur i-ème terme, le
deuxième déterminant étant cependant pris avec le signe "-" tel que :

(12.103)

Il est important, même si c'est relativement simple, de se rappeler que les différents produits vectoriels pour
les vecteurs d'une base orthogonale sont :

(12.104)

Le produit vectoriel jouit aussi propriétés suivantes que nous allons démontrer :

P1. Antisymétrie : (12.105)

P2. Linéarité : (12.106)

P3. Si et seulement si et sont linéairement indépendants (très important !) : (12.107)

P4. Non associativité : (12.108)

Les deux premières propriétés découlent directement de la définition et la propriété P4 se vérifié aisément en
développant les composantes et en comparant les résultats obtenus.

Démontrons alors la troisième propriété qui est très importante en algèbre linéaire.

Démonstration:

Soient deux vecteurs et . Si les deux vecteurs sont linéairement dépendants alors il
existe tel que nous puissions écrire: (12.109)

Si nous développons le produit vectoriel des deux vecteurs dépendants à un facteur près, nous obtenons:

(12.110)
Il va sans dire que le résultat ci-dessus est égal au vecteur nul si effectivement les deux vecteurs sont
linéairement dépendants.

Si nous supposons maintenant que les deux vecteurs et sont linéairement indépendants et non nuls,
nous devons démontrer que le produit vectoriel est:

P3.1. Orthogonal (perpendiculaire) à et

P3.2. De norme , où est l'angle entre et

Démonstration:

Commençons par la première propriété P3.1 (première importance en physique!) :

(12.111)

ce qui montre bien que le vecteur est perpendiculaire au vecteur résultant du produit vectoriel entre et
!

Terminons avec la deuxième propriété P3.2 (aussi de première importance en physique!) :

Démonstration:

Soit le carré de la norme du produit vectoriel . D'après la définition du produit vectoriel nous avons:

(12.112)

Donc finalement: (12.113)

Nous remarquerons que dans le cas où E est l'espace vectoriel géométrique, la norme du produit vectoriel
représente l'aire du parallélogramme construit sur des représentants et d'origine commune.

(12.114)
Si et sont linéairement indépendants, le triplet et donc aussi le triplet sont
directs.

En effet, étant les composantes de (dans la base ), le déterminant de passage de


à (par exemple) s'écrit:

(12.115)

Ce déterminant est donc positif, puisqu'au moins un des n'est pas nul, d'après la troisième propriété
d'indépendance linéaire du produit vectoriel.

Voici encore quelques propriétés très importantes d'utilité pratique du produit vectoriel (en physique
particulièrement) qui sont triviales à vérifier si les développements sont effectués (nous pouvons les faire sur
demande si jamais!) :

P1.

Remarque: Cette relation est appelée la "règle de Grassmann" et il est important de noter que sans les
parenthèses le résultat n'est pas unique.

P2.

P3.

P4.

P5.

PRODUIT MIXTE

Nous pouvons étendre la définition du produit vectoriel à un autre type d'outil mathématique que nous
appelons le "produit mixte" :

Définition: Nous appelons "produit mixte" des vecteurs x, y, z le double produit :

(12.116)

souvent condensé sous la notation suivante : (12.117)

D'après ce que nous avons vu lors de la définition du produit scalaire et vectoriel , le produit mixte peut
également s'écrire : (12.118)

Nous remarquerons que dans le cas où E est l'espace vectoriel eucliden , la valeur absolue du produit
mixte symbole le volume (orienté) du parallélépipède, construit sur des représentants x, y, z d'origine
commune.
Remarque: Il est assez trivial que le produit mixte est une extension à 3 dimension du produit vectoriel.
Effectivement, dans l'expression du produire mixte, le produit vectoriel représente la surface de base du
parallélépipède et le produit scalaire projette un des vecteurs sur le vecteur résultant du produit vectoriel ce
qui donne la hauteur h du parallélépipède.

De par les propriétés de commutativité du produit scalaire, nous avons :

(12.119)

et le lecteur vérifiera sans aucune peine (nous le ferons s'il y a demande) en développant les composantes
que : (12.120)

Le produit mixte jouit également des propriétés que le lecteur ne devrait avoir aucun mal à vérifier en
développant les composantes mis à part peut-être P3 qui découle des propriétés du produit scalaire et
vectoriel (nous pouvons développer sur demande si jamais!) :

P1.

P2.

P3. si et seulement si x, y, z sont linéairement indépendants

P4.

Remarque: Nous reviendrons sur le produit mixte lors de notre étude du calcul tensoriel car il permet
d'arriver à un résultat très intéressant en particulier en ce qui concerne la relativité générale!

ESPACES VECTORIELS FONCTIONNELS

Soit l'ensemble des fonctions réelles k-fois dérivables dans l'intervalle fermé . Nous désignerons
les éléments de cet ensemble par les lettres

La valeur de au point t sera bien évidemment notée . Dire que équivaudra donc à dire que :

(12.121)

De manière abrégée, nous écrirons , le signe indiquant ainsi que les deux membres sont égaux
pour tout t de l'intervalle .

Considérons les deux opérations suivantes :

- définie par la formule

- définie par la formule

Ces deux opérations satisfont à toutes les conditions des vecteurs d'un espace vectoriel que nous avons déjà
définies au début de ce chapitre (associativité, commutativité, vecteur nul, vecteur opposé, distributivité,
élément neutre) et munissent donc d'une structure d'espace vectoriel. Le vecteur nul de cet espace
étant bien évidemment la fonction nulle et l'opposé de étant la fonction .

Il est intéressant de constater que en tant qu'espace vectoriel est une généralisation de au cas
continu. Nous pouvons en effet concevoir tout vecteur de sous la forme d'une fonction réelle
définie dans l'ensemble : la valeur de cette fonction au point i est tout simplement .

Remarque: Les polynômes de degré n et à une inconnue forment aussi un exemple d'espace vectoriel
fonctionnel de dimension n+1 (à chaque coefficient du polynôme correspond une composante du vecteur).

Le champ d'application privilégié de la théorie abstraite du produit scalaire est constitué par les espaces
vectoriels fonctionnels. Nous appelons ainsi aussi produit scalaire canonique dans l'opération définie

par la relation : (12.122)

Cette opération définit bien un produit scalaire, les propriétés de ce dernier sont vérifiées et, en outre,

l'intégrale : (12.123)

est positive si la fonction continue n'est pas identiquement nulle.

ESPACES VECTORIELS HERMITIENS

L'objectif de ce qui va suivre n'est pas de faire une étude détaillée du sujet des espaces vectoriels complexes
mais juste de donner le bagage et le vocabulaire minimum nécessaire à l'étude de certaines théories
physiques comme la physique quantique par exemple.

Lorsque les scalaires qui apparaissent dans la définition de la notion d'espace vectoriel sont des nombres
complexes (cf. chapitre sur les Nombres), et non plus des nombres réels, nous parlons alors "d'espaces
vectoriels complexes".

Remarque: Rigoureusement dans la communication courante, il devrait systématiquement être fait mention
si nous parlons d'espace vectoriel réel ou d'espace vectoriel complexe...

Citons quelques exemples d'espaces vectoriels complexes :

E1. L'espace vectoriel des vecteurs-colonnes à n termes complexes ( étant identifié à ). Nous
rencontrerons, entre autres, de tels vecteurs dans le chapitre de Physique Quantique Relativiste.

E2. L'espace vectoriel des polynômes à coefficients complexes en une indéterminée. Nous rencontrerons ce
genre d'espaces dans les chapitres de Physique Quantique Ondulatoire ou encore de Chimie Quantique.

E3. L'espace vectoriel des fonctions complexes d'une variable réelle ou complexe dérivable ou non. Nous
rencontrerons ce genre d'espace très fréquemment dans la section de Mécanique globalement et surtout dans
les chapitres d'Électrodynamique ou encore de Mécanique Ondulatoire.

Il s'agit ici d'adapter ce que nous avons fait précédemment au espace vectoriels complexes. L'exemple
suivant nous montre que nous ne pouvons pas transposer tel quel les définitions précédentes. En effet,
considérons l'espace vectoriel . Comme pour , nous pourrions être tenté de définir un produit scalaire

sur par : (12.124)

avec .

Malheureusement, nous nous apercevons que cette définition n'est pas satisfaisante car nous aurions alors :

(12.125)

et cette quantité n'est pas en général un nombre réel dans l'espace des complexes ce qui viole la propriété de
positivité du produit scalaire et donc empêche d'introduire tout concept de distance.

Nous ne pourrions donc plus définir une norme en posant . Pour que soit un nombre réel
positif nous voyons qu'il faudrait plutôt définir le produit scalaire comme ceci :

(12.126)

Dans ce cas nous avons : (12.127)

qui est bien un nombre réel positif. A partir de là, nous pouvons à nouveau définir une norme sur l'espace

vectoriel complexe en posant : (12.128)

Nous allons à présent montrer comment définir un produit scalaire sur en espace vectoriel complexe dans le
cas général.

PRODUIT HERMITIEN

Définition: Soit H un espace vectoriel complexe (!). Nous appelons "produit scalaire" ou plus exactement

"produit hermitien" sur H, une application : (12.129)

qui vérifie :

P1. La positivité : (12.130)

P2. Nullité (définie): (12.131)

P3. Symétrie hermitienne : (12.132)

P4. La bilinéarité (forme bilinéaire) change un peu aussi... ce qui fait que nous parlons alors de
"sesquilinéarité". Nous parlons alors, dans l'ordre, d'anti-linéarité à gauche et de linéarité à droite tel que :
(12.133)

Remarques:

R1. Certains mathématiciens mettent l'antilinéarité à droite. C'est simplement une question de convention
qui n'a aucune importance.

R2. Le lecteur remarquera peut-être sans peine que si les éléments des définitions précédentes sont tous dans
alors la sesquilinéarité se réduit à la bilinéarité et le caractère hermitien à la symétrie. Donc le produit
hermitien se réduit au produit scalaire.

R3. Nous souhaitons donner pour l'instant uniquement le minimum sur le vaste sujet que sont les espaces
vectoriels complexes afin que le lecteur puisse lire sans trop de peine le début du chapitre de Physique
Quantique Ondulatoire.

Lorsque nous munissons un espace vectoriel complexe d'un produit scalaire alors au même titre qu'un espace
vectoriel réel devient un espace vectoriel euclidien ou préhilbertien, l'espace vectoriel complexe devient
donc ce que nous appelons un "espace vectoriel hermitien" (terme assez souvent utilisé dans le chapitre de
Physique Quantique Ondulatoire).

Définition: Encore une fois, nous disons qu'un espace H muni d'un produit hermitien est un "espace
de Hilbert" si cet espace est complet pour la métrique définie ci-dessus.

Ainsi, les espaces de Hilbert sont une généralisation comprenant les produits scalaires et produits hermitiens
des espaces euclidiens, préhilbertiens et hermitiens.

TYPES D'ESPACES VECTORIELS

Pour résumer tout cela :

- Nous appelons espace préhilbertien (réel ou complexe) tout espace vectoriel, de dimension finie ou non,
muni d'un produit scalaire.

- Nous appelons espace de Hilbert (réel ou complexe) tout espace préhilbertien complet (en tant qu'espace
normé).

- Nous appelons espace euclidien tout espace vectoriel réel de dimension finie muni d'un produit scalaire.

- Nous appelons espace hermitien tout espace vectoriel complexe de dimension finie muni d'un produit
scalaire.

Nous savons que tout espace vectoriel (réel ou complexe) normé de dimension finie est complet. Ainsi, les
espaces euclidiens et les espaces hermitiens sont des espaces de Hilbert (respectivement réels ou
complexes).

SYSTÈMES DE COORDONNÉES

Nous allons aborder ici, l'aspect des changements de coordonnées des composantes de vecteurs non pas
d'une base à une autre (pour cela il faut aller voir le chapitre d'algèbre linéaire) mais d'un système de
coordonnées à un autre. Ce type de transformation à un fort potentiel en physique (ainsi qu'en
mathématique) lorsque nous souhaitons simplifier l'étude de systèmes physiques dont les équations
deviennent plus facilement manipulables dans d'autres systèmes de coordonnées.
Définition: En mathématiques, un "système de coordonnées" permet de faire correspondre à chaque point
d'un espace à n dimensions, un n-uplet de scalaires.

Remarque: Dans beaucoup de cas, les scalaires considérés sont des nombres réels, mais il est possible
d'utiliser des nombres complexes ou des éléments d'un quelconque corps (cf. chapitre de Théorie Des
Ensembles). Plus généralement, les coordonnées peuvent provenir d'un anneau ou d'une autre structure
algébrique apparentée.

Bien que nous soyons dans un chapitre et une section de mathématiques du site, nous nous permettrons dans
ce qui va suivre de faire une liaison directe avec la physique pour ce qui concerne les expressions de la
vitesse et de l'accélération dans différentes systèmes de coordonnées (désolé pour les matheux...)

SYSTÈME DE COORDONNÉES CARTÉSIENNES

Nous ne souhaitons pas trop nous attarder sur ce système car il est bien connu de tout le monde
habituellement. Rappelons cependant que la plupart du temps, en physique, les systèmes cartésiens dans
lesquels nous travaillons sont (deux dimensions spatiales), (trois dimensions spatiales) voir ou
(trois dimensions spatiales et une temporelle) lorsque nous travaillons en relativité.

Les systèmes cartésiens sont représentés par des vecteurs de base orthonormés (dans le sens qu'ils sont
linéairement indépendant et de norme unité) qui forment une "base euclidienne" d'un espace vectoriel
euclidien...

Dans (cas le plus fréquent), il y a trois vecteurs de base notés traditionnellement: (12.134)

Dans ce système, la position d'un point P (repérable par un vecteur ) est défini par le triplet de nombres
noté (en calcul tensoriel): (12.135)

et en physique plus conventionnellement: (12.136)

où habituellement la coordonnée (z) représente la hauteur (la verticale), la coordonnée (x) la largeur et la
coordonnée (y) la longueur (évidemment ces choix sont complètement arbitraires).

Ce point P peut être repéré par un vecteur noté arbitrairement dans la base par la relation (utilisant la
notation tensorielle): (12.137)

En physique, si nous travaillons avec des coordonnées, c'est toujours pour pouvoir déterminer l'emplacement
d'un élément. Or, comme nous le verrons plus rigoureusement en mécanique analytique, le physicien
travaille avec les notions suivantes (chaque élément dépendant souvent du temps):

- Position:

- Vitesse:

- Accélération:

Maintenant voyons comment s'expriment ces différentes notions dans des systèmes telles que les
coordonnées sphériques, cylindriques et polaires.
SYSTÈME DE COORDONNÉES SPHÉRIQUES

Le choix de commencer avec ce système de coordonnées n'est pas un hasard. Il a pour avantage d'être une
généralisation des systèmes cylindrique et polaire dont nous en retrouverons par la suite plus facilement les
expressions de la position, de la vitesse et de l'accélération.

Nous représentons traditionnellement un système à coordonnées sphériques de la façon suivante:

(12.138)

Nous voyons très bien si nous connaissons bien les relations trigonométriques élémentaires (voir le chapitre
du même nom dans la section de géométrie) que nous avons les transformations:

(12.139)

et inversement: (12.140)

Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base sphérique que nous
choisissons de noter avec les vecteurs de la base cartésienne .

Nous avons, comme nous pouvons le voir sur le schéma ci-dessus:


(12.141)

Indiquons qu'divisant par pour le deuxième vecteur de base, nous nous assurons ainsi de par les

propriétés de la norme du produit vectoriel que: (12.142)

sera bien normalisé à l'unité!

Remarque: Il est important de remarquer que le produit vectoriel de deux vecteurs de base donne toujours le
troisième vecteur de base perpendiculaire (comme pour les coordonnées cartésiennes donc!).

Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces coordonnées:

(12.143)

Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation exprimée en
coordonnées sphériques:
(12.144)

Pour exprimer la vitesse et l'accélération en coordonnées sphériques, nous aurons également besoin des
dérivées par rapport au temps:

(12.145)

Donc si nous faisons maintenant un peu de physique, nous avons:

(12.146)

ce qui nous amène donc à (nous aurons besoin de cette relation en astrophysique) :

(12.147)

Il est intéressant de remarquer que nous arrivons au même résultat en passant par la méthode suivante qui est
peut-être moins intuitive: (12.148)

et en y substituant la dérivée obtenue plus haut: (12.149)

En ce qui concerne l'accélération nous obtenons :


(12.150)

Or, nous avons:

(12.151)

Donc il vient: (12.152)

Soit au final: (12.153)

SYSTÈME DE COORDONNÉES CYLINDRIQUES

Le système de coordonnées cylindriques (très utile dans l'étude des systèmes à mouvements hélicoïdaux) est
assez semblable à celui des coordonnées sphériques puisqu'il peut être vu comme une tranche de la sphère.
Soit le schéma:
(12.154)

il vient sans peine qu'en coordonnées polaires:

et (12.155)

et inversement: (12.156)

Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base polaire que nous
choisissons de noter (au lieu de comme cela se fait traditionnellement) avec les vecteurs de
la base cartésienne . Nous avons, identiquement à ce que nous avons fait pour les coordonnées

sphériques: (12.157)

Indiquons qu'en divisant par , nous nous assurons de par les propriétés de la norme du produit

vectoriel que: (12.158)

sera bien normalisé à l'unité! Dans le cas des coordonnées cylindriques l'angle étant de toute façon droit,
nous ne serions pas obligé d'indiquer cette division, mais nous avons fait ce choix par souci d'homogénéité
avec les développements précédents...

Remarque: Il est important de remarquer que le produit vectoriel de deux vecteurs de base donne toujours le
troisième vecteur de base perpendiculaire (comme pour les coordonnées cartésiennes et sphériques donc!).

Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces coordonnées:
(12.159)

Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation exprimée en
coordonnées cylindriques:

(12.160)

Pour exprimer la vitesse et l'accélération en coordonnées cylindriques, nous aurons également besoin des

dérivées par rapport au temps: (12.161)

Donc si nous faisons maintenant un peu de physique, nous avons (rappelons que la composante z est

indépendante des autres composantes cylindriques): (12.162)

ce qui nous amène à: (12.163)

Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer l'expression de

la vitesse): (12.164)

SYSTÈME DE COORDONNÉES POLAIRES

Le système de coordonnées polaires est très semblable à celui des coordonnées cylindriques puisqu'il peut
être vu comme un retranchement d'une dimension (la hauteur) du système cylindrique.

(12.165)

Ainsi, il vient sans peine qu'en coordonnées polaires:


et (12.166)

et inversement: (12.167)

Maintenant il nous faut trouver les expressions qui relient les vecteurs de la base polaire que je choisis de
noter (au lieu de comme cela ce fait traditionnellement) avec les vecteurs de la base cartésienne
. Nous avons identiquement à ce que nous avions fait pour les coordonnées sphériques:

(12.168)

Explications pour la seconde ligne : en divisant par , nous nous assurons de par les propriétés de la

norme du produit vectoriel que sera bien normalisé à l'unité. Dans le cas des
coordonnées polaires l'angle étant de toute façon droit, nous ne serions pas obligé d'indiquer cette division,
mais nous avons fait ce choix par souci d'homogénéité avec les développements précédents.

Pour des besoins ultérieurs, déterminons les différentielles partielles de chacune des ces coordonnées:

(12.169)

Nous allons également utiliser plus tard (pour l'étude des opérateurs vectoriels) la variation exprimée en
coordonnées cylindriques:

(12.170)

Pour exprimer la vitesse et l'accélération en coordonnées sphériques, nous aurons également besoin des

dérivées par rapport au temps: (12.171)

Donc si nous faisons maintenant un peu de physique, nous avons: (12.172)

ce qui nous amène à: (12.173)

où le premier terme est la composante radiale de la vitesse et le second la composante tangentielle de la


vitesse (angulaire).
Pour l'accélération nous obtenons (exactement dans la même démarche que pour déterminer l'expression de
la vitesse): (12.174)

où le premier terme est l'accélération radiale, le second l'accélération centripète, le troisième l'accélération
de Coriolis et le quatrième l'accélération tangentielle.

OPRÉRATEURS DIFFÉRENTIELS

Définition: Un champ scalaire, vectoriel ou tensoriel, dans un volume V, est une application qui, à tout point
de ce volume V, associe respectivement une grandeur scalaire, vectorielle ou tensorielle.

Ainsi, l'application f qui, à tout point de V, de coordonnées spatiales x, y, z associe la valeur scalaire
est un champ scalaire dans V.

En chaque point d'un volume traversé par un fluide en mouvement, le vecteur qui coïncide à chaque instant
avec la vitesse de la particule changeante qui passe en ce point à ce même instant définit un champ vectoriel
3D, éventuellement variable dans le temps. Les champs ainsi définis constituent un outil mathématique de
base dans l'ensemble de la physique.

Remarque: Lorsque nous représentons graphiquement un champ scalaire, l'ensemble des points continus de
valeur égale constituent ce que l'on appelle des "isolignes" ou plus couramment "courbes de niveau".

Le gradient, la divergence et le rotationnel sont les trois principaux opérateurs différentiels linéaires du
premier ordre que nous allons présenter ici. Cela signifie qu'ils ne font intervenir que des dérivées partielles
(ou différentielles) premières des champs, à la différence, par exemple, du laplacien qui fait intervenir des
dérivées partielles d'ordre 2.

Nous les rencontrerons en particulier en mécanique des fluides et en électromagnétisme ainsi que physique
quantique ondulatoire où ils permettent d'exprimer facilement certaines propriétés.

GRADIENTS D'UN CHAMP SCALAIRE

Le gradient est un opérateur qui s'applique à un champ de scalaires et le transforme en champ de vecteurs.
Intuitivement, le gradient indique la direction de la plus grande variation du champ scalaire, et l'intensité de
cette variation. Par exemple, le gradient de l'altitude est dirigé selon la ligne de plus grande pente et sa
norme augmente avec la pente.

Soit un champ scalaire tridimensionnel , où x et y et z sont les coordonnées cartésiennes d'un point
M de l'espace. Lorsque M se déplace dans l'espace selon le vecteur de composantes dx, dy et dz, le
champ scalaire f varie de df selon la différentielle totale:

(12.175)

A partir de cette relation, nous pouvons définir "l'opérateur gradient" d'un champ scalaire tel que:

(12.176)

où : (12.177)
est un terme vectoriel appelé le "gradient du champ scalaire f". Pour condenser l'écriture, nous utilisons
parfois le symbole nommé le "nabla du champ scalaire f".

Le vecteur obtenu par le calcul du gradient a les quatre propriétés suivante :

P1. Ses composantes représentent la variation (pente) de la fonction f selon les différentes directions de
l'espace.

P2. Sa norme est la variation maximale de f en fonction de la distance.

P3. Sa direction est selon la variation maximale de f en fonction de la distance.

P4. Le sens indique les valeurs où f augmente.

A partir de la définition et de la différentielle totale, nous obtenons

(12.178)

Ce qui nous amène à poser que:

(12.179)

et donc que finalement l'opérateur "gradient en coordonnées cartésiennes" est donné par :

(12.180)

Finalement nous voyons que le gradient d'un champ scalaire est le champ vectoriel dont les
composantes en chaque point sont les trois dérivées du champ scalaire f par rapport aux trois coordonnées
spatiales, notées ici x, y, z.

La variation de f pour un déplacement est donc le produit scalaire de par le gradient du champ f. Or,
un déplacement infinitésimal effectué le long d'une isoligne (décrivant une isosurface), du champ scalaire
tridimensionnel f(x, y, z) n'engendre aucune variation df de f. Le produit scalaire évoqué est donc nul dans ce
cas, ce qui implique que et sont perpendiculaires.

En considérant cette fois un déplacement perpendiculaire aux isolignes, nous montrons facilement que le
vecteur gradient de f est dirigé depuis les faibles valeurs de f vers les fortes valeurs de f. Son module étant
d'autant plus grand que f varie rapidement au voisinage du point considéré.

Par sa direction, son sens et son module, le vecteur gradient d'un champ en un point comporte donc des
indications sur la manière dont varie le champ autour de ce point.

Remarque: Une des conditions nécessaire et suffisante pour qu'un champ de vecteurs soit le gradient d'un
champ scalaire f est que ce champ vectoriel soit irrotationnel (voir plus loin l'opérateur rotationnel d'un
champ vectoriel).

Après avoir défini le gradient en coordonnées cartésiennes x, y, z nous devons nous intéresser à l'expression
de cet opérateur dans d'autres systèmes de coordonnées. Il est fréquent en physique d'avoir à utiliser les
coordonnées cylindriques, polaires et sphériques pour simplifier l'étude formelle de systèmes physiques.
Ainsi, si nous faisons référence à notre étude des systèmes de coordonnées, nous avons (rappel) d'abord en
coordonnées polaires: (12.181)

Or, avec la définition du gradient en coordonnées cartésiennes, nous avons en coordonnées polaires la
définition suivante: (12.182)

Si nous exprimons la différentielle totale exacte (cf. chapitre de Calcul Différentiel Et Intégral) de df nous
obtenons les relations suivantes:

(12.183)

Ce qui nous permet d'obtenir la relation:

(12.184)

donc : (12.185)

ce qui nous amène à : (12.186)

Ainsi le "gradient en coordonnées polaires" s'exprime comme: (12.187)

Occupons nous maintenant de l'expression du gradient en coordonnées cylindriques. Rappelons que lors de
l'étude des différents systèmes de coordonnées nous avons obtenu pour les coordonnées cylindriques:

(12.188)

Donc nous savons déjà que l'expression du gradient en coordonnées cylindriques sera identique à celle en
coordonnées polaires à l'exception de l'ajout de la composante verticale z indépendante des autres
coordonnées. Ainsi, nous obtenons l'opérateur "gradient en coordonnées cylindriques" :

(12.189)

Occupons nous maintenant de l'expression du gradient en coordonnées sphériques. Rappelons que lors de
l'étude des différents systèmes de coordonnées nous avons obtenu pour les coordonnées sphériques:

(12.190)

Or, avec la définition du gradient en coordonnées cartésiennes, nous avons en coordonnées sphériques la
définition suivante:

(12.191)
Si nous exprimons la différentielle totale de df nous obtenons les relations suivantes:

(12.192)

Ce qui nous permet d'obtenir la relation (nous utilisons maintenant la notation qui use de l'opérateur
"nabla"):

(12.193)

La relation: (12.194)

Nous impose: (12.195)

Ainsi l'opérateur "gradient en coordonnées sphériques" s'exprime comme:

(12.196)

Nous avons donc finalement vu toutes les expressions du gradient dans les systèmes cartésiens, polaires,
cylindriques et sphériques.

GRADIENTS D'UN CHAMP DE VECTEURS

Le gradient d'un champ vectoriel est le champ dit "champ tensoriel" défini par les 9 relations
suivantes en coordonnées cartésiennes:

(12.197)

Nous utiliserons un tel gradient lors de notre étude dans le chapitre de Génie Météo de l'effet Papillon dont
l'origine vient de la détermination des équations de Navier-Stokes en Mécanique des Milieux Continus.

Par les 4 relations suivantes en coordonnées polaires:

(12.198)
Par les 9 relations suivantes en coordonnées cylindriques:

(12.199)

Par les 9 relations suivantes en coordonnées sphériques:

(12.200)

Nous avons donc finalement vu toutes les expressions du gradient d'un champ vectoriel dans les systèmes
cartésiens, polaires, cylindriques et sphériques.

DIVERGENCES D'UN CHAMP DE VECTEURS

La divergence s'applique à un champ de vecteurs et le transforme en un champ de scalaires. Intuitivement, et


dans les cas le plus courant, la divergence d'un champ vectoriel exprime sa tendance à provenir ou converger
vers certains points.

Cependant, il faut distinguer deux contributions à la divergence que nous définirons rigoureusement un peu
plus loin : l'une due aux variations de direction appelée la "divergence directionnelle" et l'autre due aux
variations de modules (norme) appelée la "divergence modulaire". Ainsi, pour des champs simples, nous
pouvons imaginer des cas où la divergence ne serait que modulaire et d'autres, où elle ne serait que
directionnelle. Nous pourrions aussi construire un champ où les deux types de divergence coexistent, mais
d'effets contraires (convergence modulaire et divergence directionnelle par exemple).

Prenons par exemple un vecteur de l'espace et faisons lui traverser une surface S quelconque. Les
physiciens assimilent alors la quantité qui se dirige suivant la normale à la surface au flux de à travers
S.

Pour se convaincre de cette analogie nous pouvons imaginer un fluide coulant sur une surface plane, le flux
à travers la surface est évidemment nul, par contre si le fluide coule verticalement à travers une surface
horizontale le flux sera maximal. Il est alors immédiat de vouloir représenter le flux par le produit scalaire
de avec la normale de la surface S.

Remarque: Il faut toujours prendre garde à la direction de car en un point quelconque d'une surface on a
en général deux normales.

Si la surface est plane la normale est la même partout mais si elle change suivant les endroits, nous nous
intéresserons alors à un petit élément de surface ds.
Si un petit élément de flux est défini par : (12.201)

alors le flux total sera donné par : (12.202)

ce qui est parfois noté (c'est un peu abusif mais pourquoi pas...) : (12.203)

Supposons maintenant que notre vecteur déplace un point de l'espace en


à travers un parallélépipède rectangle de côtés dx, dy et dz :

(12.204)

Nous pouvons décomposer le mouvement (flux) à travers chaque face du parallélépipède (décompositions
dans la base orthonormée). Par exemple, si nous nous intéressons à l'élément décomposé du flux à travers la
face (dy, dz) décrite par les sommets BCFG nous avons bien évidemment .

Il nous faut encore déterminer comment représenter le flux pour cette direction. Comme le flux est une
fonction, c'est-à-dire que chacune de ces composantes peut être dépendante des trois composantes de
l'espace (si nous prenons le cas particulier d'une fonction dans ) nous avons :

(12.205)

Remarque: Ceux qui ne sont pas convaincus peuvent aller lire le début du chapitre d'électrodynamique où
nous prenons le champ électrique comme (excellent) exemple.

Alors la variation du flux selon x sera donnée par :

(12.206)

ce qui nous donne :

(12.207)
De même pour les deux autres faces :

(12.208)

d'où en sommant : (12.209)

Par rapport à la première expression de , le terme dxdydz est donc un élément de volume et non plus de
surface. Nous avons aussi un résultat intéressant :

(12.210)

Remarque: Voir les exemples pratiques dans le chapitre d'électrodynamique où par exemple pour le champ
électrique la divergence est nulle pour un charge sphérique libre car les vecteurs pointent dans des directions
différentes (divergence directionnelle) et les modules décroissent comme l'inverse du carrée du rayon
(convergence modulaire). Les deux contributions sont en oppositions et donc la divergence totale est nulle.

Le développement ci-dessus est appelé "théorème d'Ostrogradsky" ou "théorème de Gauss-Ostrogradsky" ou


encore "théorème de la divergence" et définit en fait la divergence totale de dans un volume comme le
flux de à travers les parois du volume (surface Gauss), ce qu'exprime bien le nom divergence.

Nous définissons "l'opérateur divergence" par la relation suivante (la notation tensorielle a été utilisée afin
d'abréger l'écriture) dans un espace à n dimensions:

(12.211)

Ainsi, nous avons pour l'opérateur "divergence en coordonnées cartésiennes" :

(12.212)

Si la divergence d'un champ de vecteurs est identiquement nulle en tous les points d'un repère Eulérien,
l'intégrale triple du flux de ce champ à travers un volume V sera:

(12.213)

Il en résulte que le flux de ce champ de vecteurs à travers les bords du volume est nul, c'est-à-dire que le flux
entrant compense le flux sortant. Nous disons qu'un tel champ de vecteurs de divergence nulle présente un
flux conservatif.

Pour déterminer l'expression de la divergence en coordonnées polaires rappelons les relations démontrées
plus haut :
(12.214)

Soit à présent une fonction vectorielle. Nous avons :

(12.215)

Connaissant l'expression de en fonction de , à partir de l'expression ci-dessus nous en


déduisons :

(12.216)

La divergence de est définie par . Nous avons :

(12.217)

Le premier terme vaut (application du gradient en coordonnées cylindriques):

(12.218)

de la même façon nous obtenons (nous pouvons détailler sur demande) :

(12.219)

En additionnant les trois termes et en exprimant les dérivées partielles des fonctions en fonction des
dérivées partielles des fonctions à l'aide des relations :

(12.220)

Nous obtenons :
(12.221)

Après simplification : (12.222)

L'expression de l'opérateur "divergence en coordonnées polaires" est alors : (12.223)

Pour déterminer l'expression de l'opérateur divergence en coordonnées cylindriques rappelons les relations :

(12.224)

Soit à présent une fonction vectorielle. Nous avons :

(12.225)

Connaissant l'expression de en fonction de , à partir de l'expression ci-dessus nous en

déduisons : (12.226)

La divergence de est définie par . Nous avons :

(12.227)

Le premier terme vaut (application du gradient en coordonnées cylindriques):

(12.228)
de la même façon nous obtenons (nous pouvons détailler sur demande) :

(12.229)

et : (12.230)

En additionnant les trois termes et en exprimant les dérivées partielles des fonctions en fonction
des dérivées partielles des fonctions à l'aide des relations :

(12.231)

Nous obtenons :

(12.232)

Après simplification : (12.233)

L'expression de l'opérateur "divergence en coordonnées cylindriques" est alors :

(12.234)

Pour obtenir l'expression de la divergence en coordonnes sphériques, rappelons les relations :

(12.235)

Soit à présent une fonction vectorielle. Nous avons :

(12.236)
Connaissant l'expression de en fonction de , à partir de l'expression ci-dessus nous en

déduisons : (12.237)

La divergence de est définie par . Nous avons :

(12.238)

Le premier terme vaut (application du gradient en coordonnées sphériques):

(12.239)

de la même façon nous obtenons (nous pouvons détailler sur demande) :

(12.240)

et : (12.241)

En additionnant les trois termes et en exprimant les dérivées partielles des fonctions en fonction
des dérivées partielles des fonctions à l'aide des relations :

(12.242)

nous obtenons (nous pouvons développer les détails intermédiaires sur demande) :

(12.243)

Ainsi, l'expression de la divergence en coordonnées sphériques devient :


(12.244)

et donc l'opérateur de "divergence en coordonnées sphériques" est alors :

(12.245)

Nous avons donc finalement vu toutes les expressions de la divergence d'un champ vectoriel dans les
systèmes cartésiens, polaires, cylindriques et sphériques.

ROTATIONNELS D'UN CHAMP DE VECTEURS

Le rotationnel d'un champ de vecteurs peut être vu (c'est une simplification!) comme le champ de vecteurs
dont les lignes de champs sont perpendiculaires à celles dont nous avons calculé le rotationnel comme le
montre l'exemple particulier ci-dessous:

(12.246)

Le rotationnel transforme ainsi un champ de vecteurs en un autre champ de vecteurs. Plus difficile à se
représenter précisément que le gradient et la divergence, il exprime intuitivement la tendance qu'a un champ
à tourner autour d'un point (la manière dont il est tordu).

Exemples:

E1. Dans une tornade, le vent tourne autour de l'oeil du cyclone et le champ vectoriel vitesse du vent a un
rotationnel non nul autour de l'oeil.

E2. Le rotationnel du champ des vitesses d'un disque qui tourne à vitesse constante est constant, dirigé selon
l'axe de rotation et orienté de telle sorte que la rotation ait lieu, par rapport à lui, dans le sens direct.

Un champ de vecteurs est dit "irrotationnel" lorsque le rotationnel de ce champ est identiquement nul en tous
les points de l'espace. Dans le cas contraire, nous disons qu'il est "tourbillonnaire".

Dans le cas usuel où dx représente un élément de longueur, l'unité du rotationnel est alors l'unité du champ
considéré divisée par une unité de longueur. Par exemple, en mécanique des fluides: l'unité du rotationnel
d'un champ de vitesse est le radian par unité de temps, comme une vitesse angulaire!

La divergence donne certaines indications sur le comportement d'un vecteur ou d'un champ de vecteurs :
comment il se dirige par rapport à la normale et comment il traverse les surfaces, mais c'est insuffisant.
Prenons un champ qui aurait la forme d'un cylindre et un autre champ qui aurait la forme d'une hélice de
même diamètre que le cylindre. S'ils se dirigent dans la même direction leur divergence sera identique alors
que les mouvements sont bien différents. Il faut donc que nous déterminions la manière dont le champ est
courbé quand il traverse une surface : ceci va être déterminé par la circulation (comme le travail d'une force
par exemple) du vecteur le long d'une courbe fermée, obtenue avec la somme des produits scalaires

sur le contour : (12.247)

en fait ça revient au même de regarder comment est tordu le vecteur par rapport à la normale à la surface ce
qui nous amène à définir le "rotationnel" ou "vecteur tourbillon" en écrivant :

(12.248)

qui établit donc une relation entre l'intégrale curviligne et l'intégrale de surface (on transforme donc une
intégrale curviligne sur un parcours fermé en une intégrale de surface délimitée par ledit parcours).

En d'autres termes, le rotationnel se calcule en utilisant le fait que la circulation autour d'un circuit
élémentaire fermé d'un champ de vecteurs est égal au flux de son rotationnel à travers la surface élémentaire
immédiate engendrée par ce circuit.

Ceci est le "théorème de Stokes" (qui est plus rigoureusement démontrable avec un formalisme
mathématique assez lourd) qui est donc en fait une définition de l'opérateur rotationnel dont nous allons
chercher l'expression mathématique explicite :

Soit un champ vectoriel défini dans un espace donné. Nous voulons donc calculer la circulation du

autour d'un contour fermé C : (12.249)

Nous choisissons comme contour C le contour d'un rectangle infinitésimal de côté plongé dans
et parallèle au plan xOy (remarquez que nous parcourons le contour de façon a toujours avoir la surface
à notre gauche) :

(12.250)

Pour les deux côtés horizontaux, la contribution à la circulation est :

(12.251)

Ce qui nous autorise à écrire : (12.252)


De même, pour les faces verticales : (12.253)

Ainsi, nous avons la circulation selon z : (12.254)

Ce qui s'écrit aussi sous la forme générale traditionnelle suivante :

(12.255)

et constitue le non moins fameux "théorème de Green" ou appelé encore "théorème de Green-Riemann" que
nous retrouverons dans le chapitre d'Analyse Complexe.

Et que nous écrirons dans le cas qui nous intéresse :

(12.256)

Par permutation circulaire nous obtenons alors :

(12.257)

Soit sous forme vectorielle condensée : (12.258)

Ce qui permet de mieux comprendre la notation, ou la définition non intuitive du rotationnel dans beaucoup

d'ouvrages et qui est : (12.259)

soit le produit vectoriel de l'opérateur gradient avec le champ vectoriel.

Donc nous avons finalement démontré le théorème de Stokes qui donne bien :

(12.260)

et en même temps le rotationnel en coordonnées cartésiennes.

Cherchons maintenant à déterminer l'expression du rotationnel en coordonnées cylindriques ((le rotationnel


en coordonnées polaires n'étant pas définissable).
En réutilisant la même technique que pour le rotationnel en coordonnées cylindriques, nous écrivons la
circulation de le long d'un contour correspondant à un petit morceau de cylindre orthogonal à (Oz) :
.

(12.261)

Nous avons alors en fixant z (attention le n'a rien à voir avec le r du rayon du cylindre... la notation peut
être confuse nous en sommes désolé!) :

(12.262)

la circulation totale donne donc après regroupement des termes :

(12.263)

Nous ne pouvons pas à cette étape directement comparer avec le rotationnel car il nous est difficile de faire
apparaître la différentielle de la surface si nous regardons les différentielles qui apparaissent actuellement
dans la circulation. Le mieux est alors tout diviser par :

(12.264)

Donc : (12.265)
Maintenant nous déterminons le rotationnel en fixant . Le problème revient à avoir donc un rectangle dans
l'espace que nous parcourons pour déterminer la circulation. Or, nous savons déjà ce qu'est le résultat du
rotationnel pour un rectangle en coordonnées cartésiennes :

(12.266)

à la différence que dans les coordonnées cylindrique il faut substituer z par , x par z, y par r, par et
finalement par (ce choix s'impose toujours simplement parce que le circulation se fait de telle
manière que la surface soit toujours à notre gauche) . Ce qui nous donne :

(12.267)

Il ne nous reste plus qu'à trouver la composante du rotationnel en r (soit quand r est fixé). Le calcul est alors
plus délicat puisqu'il s'agit de parcourir (positivement toujours!) une surface courbée par la variation de
l'angle .

Nous avons alors en fixant r : (12.268)

la circulation totale donne donc après regroupement des termes :

(12.269)

Nous ne pouvons pas à cette étape directement comparer avec le rotationnel car il nous est difficile de faire
apparaître la différentielle de la surface si nous regardons les différentielles qui apparaissent actuellement
dans la circulation. Le mieux est alors tout diviser par :

(12.270)

Donc finalement : (12.271)

Et finalement le rotationnel en coordonnées cylindriques dans sa globalité est donné par :


(12.272)

Le lecteur pourrait aisément vérifier que ce résultat est simplement le gradient en coordonnées cylindriques
appliqué au champ vectoriel .

Pour s'en persuader, montrons maintenant directement l'expression du rotationnel en coordonnées sphériques
directement en montrant ceci via le produit vectoriel du gradient en coordonnées sphériques avec le champ
vectoriel .

D'abord rappelons que nous avons obtenu pour le gradient en coordonnées sphériques :

(12.273)

Donc il vient : (12.274)

ce que nous pouvons aussi écrire en décomposant à l'aide des vecteurs de base :

(12.275)

A l'aide des dérivées partielles que nous avions démontrées lors de notre introduction plus haut du système
de coordonnées sphériques il vient :
(12.276)

Les produits vectoriels avec le vecteur colinéaires s'annulent. Il reste donc :

(12.277)

Comme le produit vectoriel de deux vecteurs de base donne le vecteur orthogonal correspondant
(positivement ou négativement) nous avons alors :

(12.278)

En regroupant les termes il vient :

(12.279)

Soit en simplifiant :

(12.280)

Soit finalement :

(12.281)
LAPLACIENS D'UN CHAMP SCALAIRE

Le laplacien d'un champ scalaire est le champ scalaire qui mesure la différence entre la valeur de
la fonction en un point et sa moyenne autour de ce point. En d'autres termes, la dérivée partielle deuxième
mesure les variations de la pente au point étudiée dans un entourage immédiat et selon une dimension à la
fois. Si la dérivée partielle deuxième est nulle selon x, alors la pente est constante dans un entourage
immédiat et selon cette dimension, cela implique que la valeur de la fonction au point étudié est la moyenne
de son entourage (selon une dimension)

Cet opérateur s'obtient à partir de la divergence du gradient et nous la notons (écriture tensorielle):

(12.282)

Le laplacien est nul, ou assez petit, lorsque la fonction varie sans à-coup. Les fonctions vérifiant l'équation
de Laplace sont appelées "fonctions harmoniques".

Donc l'opérateur "laplacien en coordonnées cartésiennes" est :

(12.283)

Le laplacien d'un champ scalaire et dans d'autres systèmes de coordonnées est un peu plus long à
développer. Il existe plusieurs méthodes et parmi celles existantes j'ai choisi celles dont le type de
raisonnement et les outils utilisés semblaient pertinents. Il est intéressant d'aborder différentes stratégies
mais bien sûr il existe des méthodes plus simples que celle présentée ci-dessous.

Soit le laplacien en coordonnées cartésiennes dans d'un champ scalaire f :

(12.284)

Pour déterminer cette expression en coordonnées polaires, nous allons utiliser la différentielle totale et la
règle de chaîne en coordonnées polaires:

(12.285)

donc pour une dérivée seconde:

(12.286)

or, nous avons pour les coordonnées polaires: et (12.287)


d'où: et

et
(12.288)

d'où: (12.289)

et compte tenu que les dérivées partielles secondes sont continues, alors les dérivées croisées sont égales
selon le théorème de Schwarz (cf. chapitre de Calcul Différentiel Et Intégral):

(12.290)

Donc: (12.291)

De façon similaire, nous aurons :

(12.292)

d'où l'expression du laplacien en coordonnées polaires en sommant les deux dernières expressions :

(12.293)

Donc l'opérateur "laplacien en coordonnées polaires" est finalement donné par :

(12.294)

Pour trouver l'expression du laplacien en coordonnées sphériques, nous allons utiliser l'intuition du
physicien et les notions de similitude.

Nous allons tout d'abord nous aider de la figure ci-dessus pour savoir de quoi l'on parle:
(12.295)

Rappelons que les relations entre coordonnées cartésiennes et sphériques sont données par les relations:

(12.296)

Nous allons considérer maintenant les similitudes suivantes:

Coordonnées cylindriques: et

Coordonnées sphériques: et

Construisons un tableau de correspondance: (12.297)

L'objectif est de jouer avec cette correspondance avec d'abord le laplacien en coordonnées cylindriques où
l'on a soustrait des deux côtés de l'égalité le terme . Ainsi:

(12.298)

utilisons le tableau de correspondance et nous obtenons :

(12.299)

Le deuxième terme de l'égalité de cette dernière relation est l'équivalent sphérique du terme #1 du laplacien

en coordonnées cylindriques: (12.300)


Maintenant examinons le terme :

Identiquement lorsque nous avons déterminé la relation:

(12.301)

nous obtenons: (12.302)

avec: et (12.303)

ce qui nous permet d'écrire: (12.304)

si nous jouons encore avec le tableau de correspondance, nous avons:

(12.305)

nous divisons cette relation des deux côtés par et ainsi nous obtenons:

(12.306)

Nous avons donc ci-dessus l'équivalent sphérique du terme #2 du laplacien en coordonnées cylindriques:

(12.307)

Le troisième et dernier terme est très simple à déterminer. Nous remplaçons par afin d'obtenir:

(12.308)

En rassemblant tous les termes obtenus précédemment, nous obtenons enfin la forme étendue du laplacien
en coordonnées sphériques si utilisé en physique:

(12.309)

Nous pouvons raccourcir cette expression et factorisant les termes:


(12.310)

Si nous condensons encore un peu, nous obtenons l'expression finale de l'opérateur "laplacien en
coordonnées sphériques" appelé aussi "laplacien sphérique":

(12.311)

LAPLACIENS D'UN CHAMP VECTORIEL

Le laplacien d'un champ vectoriel est le champ vectoriel défini par (notation tensorielle):

(12.312)

dont les composantes sont les laplacien des composantes.

Ainsi, en coordonnées cartésiennes:

(12.313)

Le laplacien d'un champ de vecteurs, appelé fréquemment "laplacien vectoriel", en d'autres systèmes de
coordonnées est assez simple à obtenir à partir de la connaissance du laplacien d'un champ scalaire dans ces
mêmes coordonnées. Ainsi, en coordonnées polaires, nous avons pour le laplacien d'un champ vectoriel la
relation suivante:

(12.314)

et en coordonnées cylindriques:
(12.315)

et finalement en coordonnées sphériques :

(12.316)

IDENTITÉS

Les opérateurs différentiels scalaires et vectoriels ont des identités remarquables très simples que nous
retrouverons très souvent en physique.

Voyons d'abord les relations qui n'ont aucun sens (au cas où vous tomberiez dessus sans faire exprès...):

ou (12.317)

Le rotationnel d'une divergence n'existe pas puisque l'opérateur rotationnel s'applique à un champ vectoriel
alors que la divergence est un scalaire.

ou (12.318)

Le rotationnel d'un laplacien scalaire n'existe pas puisque l'opérateur rotationnel s'applique à un champ
vectoriel alors que par construction, le laplacien est un scalaire.

Voyons maintenant quelques propriétés remarquables sans démonstrations (cependant si vous en avez
besoin car vous n'y arrivez pas seul, n'hésitez pas à nous contacter, nous compléterons):

I1. Par construction le laplacien scalaire est la divergence du gradient du champ :

(12.319)

I2. Le rotationnel du gradient est nul :

(12.320)

I3. La divergence du rotationnel d'un champ vectoriel est toujours nulle :

ou (12.321)
Démonstration:

(12.322)

I4. Le rotationnel du rotationnel d'un champ vectoriel est égal au gradient de la divergence de ce champ
moins son laplacien vectoriel :

ou (12.323)

Démonstration:

(12.324)

Il est ensuite facile de vérifier que cette dernière égalité est égale à :
(12.325)

I5. La multiplication de l'opérateur nabla par le produit scalaire de deux vecteurs est égale à... (voir ci-
dessous), qui donne une relation très utile en mécanique des fluides :

(12.326)

I6. Le produit scalaire du rotationnel d'un vecteur est la différence des opérateurs commutés tel que :

(12.327)

Nous réutiliserons cette dernière relation lors de notre étude en électromagnétisme de la pression de
radiation (entre autres).

RÉSUMÉ

Dans le cadre de ce site Internet, nous faisons usage des différentes notations présentées et résumées dans le
tableau ci-dessous. Leur usage permet dans le cadre de différentes théories d'éviter des confusions avec
d'autres êtres mathématiques. C'est embêtant certes mais il faudra faire avec.
ÊTRE MATHEMATIQUE NOTATIONS

Gradient d'un champ scalaire

Gradient d'un champ vectoriel

Divergence d'un champ de vecteurs

Rotationnel d'un champ de vecteurs rot( )

Laplacien d'un champ scalaire

Laplacien d'un champ vectoriel


Tableau: 12.1 - Résumé des opérateur différentiels vectoriels

Et pour les pragmatiques voici un résumé des explications des opérateurs les plus importants en physique :

- Le gradient signifie "la pente" (exemple : le champ électrique est la pente du potentiel électrostatique).

Les différentes expressions du gradient (mises sous la forme de l'opérateur nabla) en coordonnées
cartésiennes, polaires, cylindriques et sphériques sont les suivantes :

(12.328)

(12.329)

(12.330)

(12.331)

- La divergence caractérise un flux de quelque chose qui vient de quelque part, d'une source, ou qui y va. Si
la divergence n'est pas nulle, c'est qu'il y a concentration autour d'un point, donc la densité augmente (ou
diminue, c'est selon le signe). Ca peut être la densité de charges électriques ou bien la masse volumique.
D'où le fameux théorème qui dit que le flux (ce qui passe dans une surface) est égal à l'intégrale de la
divergence (ce qui reste).

Les différentes expressions de la divergence (mises sous la forme de l'opérateur nabla) en coordonnées
cartésiennes, polaires, cylindriques et sphériques sont les suivantes :

(12.332)

(12.333)
(12.334)

(12.335)

- Le rotationnel caractérise l'existence d'un tourbillon (très utilisé en mécanique des fluides). S'il y a un
tourbillon, on peut suivre une ligne de courant sur une courbe fermée sans qu'elle change de sens : la
circulation ne sera pas nulle (elle vaut l'intégrale du rotationnel).

Les différentes expressions du rotationnel en coordonnées cartésiennes, cylindriques et sphériques sont les
suivantes :

- Le laplacien d'un champ scalaire est le champ scalaire qui mesure la différence entre la valeur de la
fonction en un point et sa moyenne autour de ce point. En d'autres termes, la dérivée partielle deuxième
mesure les variations de la pente au point étudiée dans un entourage immédiat et selon une dimension à la
fois. Si la dérivée partielle deuxième est nulle selon une direction, alors la pente est constante dans un
entourage immédiat et selon cette dimension, cela implique que la valeur de la fonction au point étudié est la
moyenne de son entourage (selon une dimension).

Les différentes expressions du laplacien (mises sous la forme de l'opérateur nabla) en coordonnées
cartésiennes, polaires et sphériques sont les suivantes :

(12.336)

(12.337)

(12.338)
13. ALGÈBRE LINÉAIRE

I l y a plusieurs manières d'aborder l'algèbre linéaire. D'abord une manière pragmatique (nous
commencerons par celle-ci car notre expérience nous a montré que c'est celle qui semblait le mieux marcher
chez les étudiants) et une manière plus formelle que nous présenterons aussi après la première.

Ainsi, rappelons que nous avions étudié dans le chapitre de calcul algébrique comment déterminer
l'intersection (si elle existe) de l'équation de deux droites (nous pouvons étendre le problème bien
évidemment à plus de deux droites) dans données par :

et (13.1)

où .

En cherchant donc la valeur de pour laquelle : (13.2)

Ainsi nous pouvions écrire : (13.3)

Cependant, il existe une autre manière de présenter le problème comme nous l'avons vu en méthodes
numériques (section d'informatique théorique). Effectivement, nous pouvons écrire le problème sous la
forme d'un bloc d'équations :

(13.4)

et comme nous cherchons , nous avons :

(13.5)

Cette écriture s'appelle comme nous l'avons présenté dans le chapitre de Méthodes Numériques (section
d'Informatique Théorique) un "système linéaire" que nous pouvons résoudre en soustrayant ou en
additionnant les lignes entre elles (l'ensemble des solutions étant toujours égal), ce qui nous donne :

(13.6)

et nous voyons que nous retombons sur la solution :

(13.7)
il y donc deux manière de présenter un problème d'intersection de droites :

1. Sous forme d'équation

2. Sous forme de système

Nous allons nous intéresser dans une partie ce chapitre à la deuxième méthode qui nous permettre à l'aide
des outils vus dans le chapitre de calcul vectoriel de résoudre les intersection non plus d'une ou plusieurs
droites mais d'une ou plusieurs droits, plans, hyperplans dans respectivement .

Il y a cependant une condition à remplir : comme nous l'avons vu dans l'exemple précédent, nous ne
pourrions pas résoudre un système d'équations à deux inconnues si nous n'avons qu'une seule équation. C'est
la raison pour laquelle il faut et il suffit pour un système d'équation à n inconnues avoir au moins
n équations. Ainsi, nous parlons de : "systèmes de n équations à n inconnues" et comme nous le verrons plus
loin, ceci implique trivialement d'avoir une matrice carrée (le concept de "matrice" sera défini un peu plus
loin). Nous démontrerons aussi que pour un tel système ait des solutions non toutes nulles, il faut que nous
ayons un déterminant de la matrice qui soit non nul (le concept de "déterminant" sera défini plus loin) et
donc que la matrice soit inversible.

SYSTÈMES LINÉAIRES

Définition: Nous appelons donc "système linéaire", ou simplement "système", toute famille d'équations de
la forme :

(13.8)

où chaque ligne représente l'équation d'une droite, plan ou hyperplan (cf. chapitre de Géométrie Analytique)
et les "coefficients du système", les "coefficients du second membre" et les les "inconnues du
système".

Si les coefficients du second membre sont tous nuls, nous disons alors que le système est un "système
homogène" et alors celui-ci admet au moins la solution triviale où les sont tous nuls.

Nous appelons "système homogène associé au système", le système d'équations que nous obtenons en
substituant des zéros aux coefficients du second membre.

Rappelons les élément suivants :

- L'équation d'une droite (cf. chapitre d'Analyse Fonctionnelle) est donnée par :

(13.9)

en posant .

- L'équation d'un plan (cf. chapitre de Géométrie Analytique) est donnée par :

(13.10)
en posant .

- L'équation d'un hyperplan est très facilement (si vous ne voyez pas comment faites le nous savoir nous le
préciseront) généralisable à partir de la démonstration de celle du plan et nous obtenons ainsi :

(13.11)

en posant

Nous écrivons souvent un système linéaire sous la forme condensée suivante :

(13.12)

Nous appelons "solution du système" tout n-uplet tel que :

(13.13)

Résoudre un système signifie trouver l'ensemble des solutions de ce système. Deux systèmes à n inconnues
sont dits "systèmes équivalents" si toute solution de l'un est solution de l'autre, autrement dit, s'ils admettent
le même ensemble de solutions. Nous disons parfois que les équations d'un système sont des "équations
compatibles" ou "équations incompatibles", suivant que ce système admet au moins une solution ou n'en
admet aucune.

Nous pouvons également donner bien sûr une interprétation géométrique à ces systèmes. Supposons que les
premiers membres des équations du système soient non nuls. Alors, nous savons que chacune de ces
équations représente un hyperplan d'un espace affine (voir le chapitre de calcul vectoriel) de dimension n.
Par conséquent, l'ensemble des solutions du système, regardé comme ensemble de n-uplets de coordonnées,
représente une intersection finie d'hyperplans.

Exemple:

Le système d'équations suivant: (13.14)

noté plus conventionellement dans les petites classes sous la forme:

(13.15)

Aurait comme solutions les points représentat l'intersection des trois plans définis par les trois équations.
Mais comme nous pouvons le voir visuellement avec Maple à l'aide des commandes suivantes:

>with(plots);
>implicitplot3d({x-3*z=-3,2*x-5*y-z=-2,x+2*y-5*z=1},x=-3..3,y=-3..3,z=-3..3);
(13.16)

ce système n'a aucune solution. Ce qui peut soit se vérifier à la main, soit avec Maple en écrivant:

>solve({x-3*z=-3,2*x-5*y-z=-2,x+2*y-5*z=1},{x,y,z});

Remarque: Pour la méthode de résolution "classique" de ces systèmes, nous renvoyons le lecteur au chapitre
traitant des méthodes numériques dans la section d'informatique.

C'était donc la manière pragmatique de voir les choses... passons maintenant à la seconde façon un peu plus
... mathématique (mais qui reste très simple) :

TRANSFORMATIONS LINÉAIRES

Définition: Une "transformation linéaire" ou "application linéaire" A est une application d'un espace
vectoriel E vers un espace vectoriel F telle que avec K étant ou :

(13.17)

plus fréquemment donné sous la forme (car l'application linéaire est souvent assimilée à une matrice):

(13.18)

ceci constitue, pour rappel, un endomorphisme (cf. chapitre de Théorie Des Ensembles).
La première propriété spécifie que la transformée d'une somme de vecteurs doit être égale à la somme des
transformées, pour qu'elle soit linéaire. La deuxième propriété précise que la transformée d'un vecteur
auquel nous avons appliqué un facteur d'échelle (homothétie) doit aussi être égale à ce facteur appliqué sur
la transformée du vecteur original. Si l'une ou l'autre de ces deux propriétés n'est pas respectée, la
transformation n'est alors pas linéaire.

Nous allons maintenant montrer que toute transformation linéaire peut être représentée par une matrice:

Soient les vecteurs de base pour E et ceux de F. Avec ces bases, nous pouvons
représenter n'importe quels vecteurs avec les combinaisons linéaires suivantes (cf. chapitre de
Calcul Vectoriel) :

(13.19)

Soit la transformation linéaire A qui applique E sur F ( ). Donc que nous pouvons
réécrire de la façon suivante :

(13.20)

mais puisque A est un opérateur linéaire par définition, nous pouvons aussi écrire :

(13.21)

En considérant maintenant que les vecteurs sont des éléments de F, nous pouvons les réécrire en tant
qu'une combinaison linéaire de ses vecteurs de base :

(13.22)

Ainsi, nous obtenons :

(13.23)

En inversant l'ordre des sommations, nous pouvons écrire :

(13.24)

et en réarrangeant cette dernière relation, nous produisons le résultat :

(13.25)
Finalement, en se rappelant que les vecteurs de base doivent être indépendants, nous pouvons conclure
que leurs coefficients doivent forcément être nuls, donc :

(13.26)

Ce qui correspond au produit de "matrice" :

(13.27)

que nous pouvons noter :

(13.28)

Autrement dit, toute transformation linéaire peut être décrite par une matrice A qu'il s'agit de multiplier avec
le vecteur que nous voulons transformer, pour obtenir le vecteur résultant de la transformation.

MATRICES

Nous appelons donc "matrice" à m et lignes et n colonnes, ou "matrice de type mn" (le premier terme
correspond toujours aux lignes et le second aux colonnes, pour s'en souvenir il existe un bon moyen
mnémotechnique : le président LinColn - abréviation de Ligne et Colonne...), tout tableau de nombres :

(13.29)

Nous désignons souvent une matrice de type plus brièvement par :

(13.30)

ou simplement par .

Le nombre est appelé "terme ou coefficients d'indices i, j". L'indice i étant appelé "indice de ligne" et
l'indice j "indice de colonne".

Nous notons l'ensemble des matrices dont les coefficients prennent leurs valeurs dans K
(pouvant être ou par exemple).

Lorsque , nous disons que est une "matrice carrée" d'ordre n. Dans ce cas, les termes
sont appelées "termes diagonaux".
Nous appelons également une matrice à une seule ligne "matrice-ligne" et une matrice à une seule colonne
"matrice-colonne". Il est claire qu'une matrice colonne n'est rient d'autre qu'un "vecteur-colonne". Par la
suite, les lignes d'une matrice seront assimilées à des matrices-lignes et les colonnes à des matrices-
colonnes.

L'intérêt de la notion de matrice apparaître tout au long des textes qui vont suivre mais la raison d'être
immédiate de cette notion est simplement de permettre à certaines familles finies de nombres d'être conçues
sous la forme d'un tableau rectangulaire.

Nous assignerons aux matrices des symboles propres, à savoir les lettre latines majuscules : A,B,... et aux
matrices-colonnes des symboles à savoir les lettres minuscules vectorielles ; nous les appellerons
d'ailleurs indifféremment matrices-colonnes ou vecteurs-colonnes.

Nous appelons "matrice nulle", et nous la notons O, toute matrice dont chaque terme est nul. Les matrices-
colonnes sont également désignées par le symbole vectoriel : .

Nous appelons "matrice unité d'ordre n" ou "matrice identité d'ordre n", et nous notons , ou simplement I,
la matrice carrée d'ordre n :

(13.31)

Nous verrons plus loin que la matrice nulle joue le rôle d'élément neutre de l'addition matricielle et la
matrice unité d'élément neutre de la multiplication matricielle.

Attention! Lorsque nous travaillons avec les matrices à coefficients complexes il faut toujours utiliser le
terme "matrice identité" plutôt que "matrice unitaire" car dans le domaine des nombres complexes la matrice
unitaire est un autre objet mathématique qu'il convient de ne pas confondre!

Nous allons maintenant revenir brièvement sur la définition de "rang d'une famille finie" que nous avons vu
en calcul vectoriel.

Rappel : Nous appelons "rang" d'une famille de vecteurs la dimension du sous-espace vectoriel de qu'elle
engendre.

Ainsi, soit les colonnes d'une matrice A, nous appelons "rang de A", et nous notons , le
rang de la famille .

Dans un langage un peu plus familier (...) le rang d'une matrice est donné par le nombre de matrice-colonnes
qui ne peuvent s'exprimer par la combinaison et la multiplication par un scalaire d'autres matrices-colonnes
de la même matrice.

Remarque: S'il a y des difficultés à déterminer le rang d'une matrice il existe un technique "d'échelonnage"
des matrices que nous allons voir plus tard qui permet d'effectuer ce travail très rapidement.

Définition: Nous appelons "matrice associée au système" :


(13.32)

l'objet mathématique défini par :

(13.33)

c'est-à-dire la matrice A dont les termes sont les coefficients du système. Nous appelons "matrice du second
membre du système linéaire", ou simplement "second membre du système", la matrice-colonne
dont les termes sont les coefficients du second membre de ce système. Nous appelons également
"matrice augmentée associée au système" la matrice obtenue de A en ajoutant comme (n + 1)-ème
colonne.

Si nous considérons maintenant un système de matrice associée A et de second membre . Désignons


toujours par les colonnes de A. Le système s'écrit alors de manière équivalente sous la forme
d'une équation vectorielle linéaire :

(13.34)

Maintenons rappelons un théorème que nous avons vu en calcul vectoriel : pour que le rang d'une famille de
vecteurs soit égal au rang de la famille augmentée , il faut et il suffit que le
vecteur soit combinaison linéaire des vecteurs .

Il s'ensuit que notre système linéaire sous forme vectorielle admet au moins une solution si le
rang de la famille est égal au rang de la famille augmentée et cette solution
est unique si et seulement si le rang de la famille est n.

Ainsi, pour qu'un système linéaire de matrice associée A et de second membre admette au moins une
solution, il faut et il suffit que le rang de A soit égal au rang de la matrice augmentée . Si cette
condition est remplie, le système admet une seule solution si et seulement le rand de A est égal au nombre
d'inconnues autrement dit, les colonnes de A sont linéairement indépendantes.

Nous disons qu'une matrice est "échelonnée" si ses lignes satisfont aux deux conditions suivantes :

C1. Toute ligne nulle n'est suivie que de lignes nulles

C2. L'indice de colonne du premier terme non nul de toute ligne non nulle est supérieur à l'indice de colonne
du premier terme non nul de la ligne qui la précède.

Une matrice échelonnée non nulle est donc de la forme :


(13.35)

où et sont des termes non nuls. Bien entendu, les lignes nulles terminales
peuvent manquer.

Remarque: Nous supposerons relativement évident que les matrices nulles et les matrices unités sont
échelonnées.

Les colonnes d'indice d'une matrice échelonnée sont clairement linéairement indépendantes.
Envisagées comme des vecteurs-colonnes de , elles forment donc une base de cet espace vectoriel. En
considérant les autres colonnes également comme des vecteurs-colonnes de , nous en déduisons qu'elles
sont nécessairement combinaison linéaire de celles d'indice et donc que le rang de la matrice
échelonnée est r.

Nous noterons que r est aussi le nombre de lignes non nulles la matrice échelonnée et également le rang de
la famille des lignes de cette matrice, puisque les lignes non nulles sont dès lors manifestement
indépendantes.

Nous pouvons dès lors nous autoriser un certain nombre d'opérations élémentaires (supplémentaires) sur les
lignes des matrices qui nous seront fort utiles et ce, sans changer son rang :

P1. Nous pouvons permuter les lignes.

Remarque: La matrice est juste une représentation graphique esthétique d'un système linéaire. Ainsi,
permuter deux lignes ne change aucunement le système.

P2. Multiplier une ligne par un scalaire non nul

Remarque: Cela ne changeant en rien l'indépendance linéaire des vecteurs-lignes.

P3. Additionner à une ligne, un multiple d'une autre

Remarque: La ligne additionnée disparaîtra au profit de la nouvelle qui est indépendante de toutes les
(anciennes) autres. Le système reste ainsi linéairement indépendant.

Toute matrice peut être transformée en matrice échelonnée par une suite finie d'opérations de type P1, P2,
P3. C'est cette technique que nous utilisons dans le chapitre traitant des algorithmes pour résoudre les
systèmes linéaires.

Il est donc évident que les opérations élémentaires sur les lignes d'une matrice ne modifient pas le rang de la
famille des lignes de cette matrice. Or, nous avons observé que le rang de la famille des lignes d'une matrice
échelonnée est égal au rang de la famille des colonnes, c'est-à-dire au rang de cette matrice. Nous en
concluons que le rang de n'importe quelle matrice de type est également le rang de la famille des
lignes de cette matrice.

Comme corollaire de cette conclusion, il apparaît que : (13.36)


Lors de la résolution de système linéaires de m équations à n inconnues il apparaît, comme nous l'avons déjà
fait remarquer tout au début de ce chapitre, qu'il doit y avoir au moins un nombre égal d'équations ou
d'inconnues ou plus rigoureusement : le nombre d'inconnues doit être inférieur ou égal aux nombre
d'équations tel que :

(13.37)

OPÉRATIONS SUR LES MATRICES

Rappelons que nous avons vu lors de notre étude du calcul vectoriel que les opérations de multiplication
d'un vecteur par un scalaire, d'addition ou soustraction de vecteurs entre eux et l'opération de produit scalaire
formait dans le sens ensembliste du terme un "espace vectoriel" (voir le chapitre de théorie des ensembles)
possédant ainsi aussi une "structure algébrique vectorielle". Ceci sous la condition que les vecteurs aient
bien sûr les mêmes dimensions (ce constat n'étant pas valable si au lieu du produit scalaire nous prenions le
produit vectoriel).

Au même titre que les vecteurs, nous pouvons multiplier une matrice par un scalaire et additionner celles-ci
entre elles (tant qu'elles ont les mêmes dimensions...) mais en plus, nous pouvons aussi multiplier deux
matrices entre elles sous certaines conditions que nous définirons ci-après. Cela fera également de
l'ensemble des matrices dans le sens ensembliste du terme, un espace vectoriel sur le corps K et possédant
ainsi aussi une "structure algébrique vectorielle".

Ainsi, un vecteur pourra aussi être vu comme une matrice particulière de dimension et s'opérer
dans l'espace vectoriel des matrices. En gros..., le calcul vectoriel n'est qu'un cas particulier de l'algèbre
linéaire.

Définitions:

D1. Soient . Nous appelons "somme de A et B" la matrice dont les coefficients
sont :

(13.38)

D2. Soient une matrice et un scalaire. Nous appelons "produit de A par " la matrice
dont les coefficients sont : (13.39)

De ses deux définitions nous pouvons donc effectivement conclure que l'espace/ensemble des matrices est
bien un espace vectoriel et possède ainsi une structure algébrique vectorielle.

D3. Soient E, F, G trois espaces vectoriels de bases respectives et deux


applications linéaires (voir théorie des ensembles aussi pour un rappel).

Notons A la matrice de f relativement aux bases et B la matrice de g relativement aux bases .


Alors la matrice C de (voir la définition d'une fonction composée dans le chapitre d'analyse
fonctionnelle) relativement aux bases est égale au produit de B par A noté BA.

et (13.40)

et (13.41)
Donc soient et , nous appelons "produit matriciel" ou "multiplication matricielle"
de B par A et nous notons BA, la matrice dont les coefficients sont :

(13.42)

Il est important de remarque que contrairement à l'addition, A et B peuvent avoir des dimensions différentes.
Toutefois! le nombre de lignes de A doit être égale au nombre de colonnes de B, comme l'indique des
l'indice n des deux matrices. Donc dans le produit BA, si B est une matrice , A doit être une matrice
, quel que soit p.

En notant par des lettres latines majuscules les matrices et par les lettres grecques minuscules les scalaires, le
lecteur vérifiera aisément (nous pouvons rajouter les démonstrations sur demande) les relations :

(13.43)

Il est surtout important de se rappeler de la dernière ligne comme quoi la multiplication matricielle n'est pas
commutative.

Remarque: L'ensemble des matrices carrées d'ordre n à coefficients dans muni de la somme et la
multiplication usuelles des matrices forme un anneau (voir chapitre de théorie des ensembles). C'est vrai
plus généralement si les coefficients des matrices sont pris dans un anneau quelconque : par exemple
l'ensemble des matrices à coefficients entiers est un anneau.

TYPE DE MATRICES

Afin de simplifier les notations et la longueur des calculs nous allons introduire ici les matrices types que le
lecteur pourra rencontrer tout au long de sa lecture du site (et pas que dans la partie de mathématiques
pures!).

Définitions:

D1. Soit A une matrice carrée (c'est-à-dire ). La matrice A est dite "matrice inversible" ou
"matrice régulière" si et seulement si est telle que :

(13.44)

où :

(13.45)
si tel n'est pas le cas, nous disons que A est une "matrice singulière".

Cette définition est fondamentale, elle a des conséquences extrêmement importantes dans tout l'algèbre
linéaire et aussi dans la physique (résolution de système linéaires, déterminant, vecteurs et valeurs propres,
etc.) il convient donc de s'en souvenir.

D2. Soit :

(13.46)

une matrice de . Nous appelons "matrice transposée" de A, la matricée notée (le T en exposant
est selon les ouvrages en majuscule ou en minuscule), de définie par (nous mettons les lignes en
colonnes et les colonnes en lignes) :

(13.47)

Voici quelques propriétés intéressantes (nous seront par ailleurs utiles plus tard lors d'un théorème fameux!)
de la transposée:

(13.48)

et aussi une propriété importante de la matrice transposée (la vérification se fait aussi par l'exemple) :

(13.49)

La matrice transposée est très important en physique et en mathématique dans le cadre de la théorie des
groupes et symétries! Il convient donc aussi de se souvenir de sa définition.

D3. Soit :

(13.50)

une matrice de . Nous appelons "matrice adjointe" de A, la matricée, de définie par :


(13.51)

qui est donc la complexe conjuguée de la matrice transposée ou si vous préférez... la transposée de la
matrice conjuguée A (dans le cas de coefficient réels... on se passera de la conjuguer!). Pour simplifier les
écritures nous la notons simplement (écriture fréquente en physique quantique et algèbre ensembliste).

Remarques: Relation triviale (qui sera souvent utilisée en physique quantique des champs) :

(13.52)

D4. Par définition, une matrice est dite "matrice hermitique" ou "matrice hermitienne" ou "matrice self-
adjointe" ou encore "matrice autoadjointe"... si elle est égale à son adjointe (matrice transposée conjuguée)
tel que :

(13.53)

D5. Soit A une matrice carrée de , la "trace" de A, notée est définie par :

(13.54)

Quelques relations utiles y relatives (dont nous pouvons rajouter les démonstrations détaillées sur demande)
:

(13.55)

D6. Une matrice A est dite "matrice nilpotent" si en la multipliant successivement par elle-même elle peut
donner zéro. En clair, s'il existe un entier tel que :

(13.56)

Remarque: Pour se souvenir de se mot, nous le décomposons en "nil" pour nulle et "potent" pour potentiel.
Ainsi, quelque chose de nilpotent est donc quelque chose qui est potentiellement nul.

D7. Une matrice A est dite "matrice orthogonale" si ses éléments sont réels et si elle obéit à :

(13.57)

ce qui se traduit par (où est le symbole de Kronecker) :

(13.58)
Les vecteurs colonnes de la matrice sont donc normés à l'unité et orthogonaux entre eux (ou de même avec
ses lignes!). Ainsi une matrice orthogonale représente une base orthonormée!

Remarques:

R1. C'est typiquement le cas de la matrice de la base canonique, ou de toute matrice diagonalisable.

R2. Si au lieu de prendre simplement une matrice avec des coefficients réels, nous prenons une matrice à
coefficients complexes avec sa transposée complexe (matrice adjointe). Alors, nous disons que A est une
"matrice unitaire" si elle satisfait à la relation ci-dessus!

Nous reviendrons plus tard, après avoir présenté les concepts de vecteurs et valeurs propres, sur un cas
particulier et très important de matrices orthogonales (appelées "matrices de translations").

Signalons encore une autre propriété importante en géométrie, physique et statistiques des matrices
orthogonales.

Soit , où A est une matrice orthogonale et . Alors f (respectivement A) est une


isométrie. C'est-à-dire que:

(13.59)

Démonstration:

(13.60)

et donc nous avons bien : (13.61)

Donc en d'autres termes : Les matrices orthogonales sont des applications linéaires qui conservent la norme
(les distances).

D8. Soit une matrice carrée. La matrice A est dite "matrice symétrique" si et seulement si :

(13.62)

Nous retrouverons cette définition en calcul tensoriel.

D9. Soit une matrice carrée. La matrice A est dite "matrice anti-symétrique" si et seulement si :

(13.63)

ce qui impose que : (13.64)

Nous retrouverons cette définition dans le chapitre de Calcul Tensoriel.

D10. Soit une matrice carrée. La matrice A est dite "matrice triangulaire supérieure" si et
seulement si :
(13.65)

D11. Soit Soit une matrice carrée. La matrice A est dite "matrice triangulaire inférieure" si et
seulement si :

(13.66)

D12. Soit , une matrice carrée. La matrice D est dite "matrice diagonale" si et seulement si :

(13.67)

La notation habituelle d'une matrice diagonale D étant :

(13.68)

D13. Soient E un espace vectoriel, de dimension n et deux bases de E :

(13.69)

Nous appelons "matrice de passage" de la base à la base , et nous noterons P la matrice de


dont les colonnes sont formées des composantes des vecteurs de sur la base (voir plus loin
traitement détaillé des changements de base pour plus d'infos).

Nous considérons le vecteur de E qui s'écrit dans les bases et


suivant les relations :

(13.70)

Soit :

(13.71)
le vecteur de formé des composantes de dans la base et respectivement le vecteur formé des
composantes de dans la base . Alors : (13.72)

relation pour laquelle la démonstration détaillée sera donnée plus loin lors de notre étude des changements
de base. Nous avons également: (13.73)

Remarques:

R1. Si lorsqu'un vecteur est donné et que sa base n'est pas spécifiée, c'est qu'il s'agit dès lors implicitement

de la base canonique: (13.74)

qui laisse invariant la multiplication par un vecteur quelconque et lorsque la base utilisée est notée et
n'est pas spécifiée, c'est qu'il s'agit également de la base canonique.

R2. Si un vecteur est donnée par rapport à la base canonique, ces composantes sont dites "covariantes", dans
le cas contraire, où si elles sont exprimées après suite dans une autre base non canonique, alors nous disons
que les composantes sont "contravariantes" (pour plus de précisions sur le sujet voir le chapitre de calcul
tensoriel).

DÉTERMINANTS

Nous allons nous intéresser aux déterminants dans le point de vue du physicien (celui de mathématicien
étant assez rébarbatif...). Fréquemment, en physique (que ce soit en mécanique ou physique quantique des
champs), en chimie ou en ingénierie, nous aurons fréquemment des systèmes linéaires à résoudre. Or, nous
avons vu maintenant qu'un système linéaire :

(13.75)

peut être écrit sous la forme :

(13.76)

et nous savons que les seuls systèmes linéaires résolubles sont ceux qui ont autant d'équations que
d'inconnues. Ainsi, la matrice A doit être une matrice carrée .

Si une solution existe, il existe alors une matrice-colonne (ou "vecteur") tel que ce qui implique
:

(13.77)
Qu'impose cette relation ? Eh bien c'est simple mais à la fois très important : pour qu'un système linéaire ait
une solution, il faut que le la matrice A soit inversible ! Quel rapport avec le déterminant alors ? C'est simple
: les mathématiciens ont cherché comment s'écrivaient les inverses des matrices de systèmes linéaires dont
ils savaient qu'il y avait une solution et ils sont arrivés après tâtonnements à déterminer une sorte de formule
qui permette de vérifier si la matrice est inversible ou non. Une fois cette formule trouvée, ils ont formalisé
(comme ils savent si bien le faire...), avec une très bonne rigueur, le concept entourant cette formule qu'ils
ont appelé "déterminant". Ils y sont tellement bien arrivés d'ailleurs qu'on oublie parfois qu'ils ont procédé
ainsi....

Remarque: Si une matrice d'un système linéaire n'est pas inversible, cela a pour conséquence qu'il existe soit
aucune solution, soit une infinité de solutions (comme à l'habitude quoi...)

Nous allons ci-dessous d'abord nous intéresser à la manière de construire le déterminant en définissant un
type d'application particulière. Ensuite, après avoir vu un exemple simple et interprétable du calcul d'un
déterminant, nous nous attacherons à déterminer la formule de celui-ci dans le cas général. Enfin, une fois
ceci fait, nous verrons quelle est la relation qui lie l'inverse d'une matrice et le déterminant.

Dans ce qui suit tous les espaces vectoriels considérés sont de dimension finie et sur le corps des nombres
complexes (ceux qui le préfèrent pourront prendre comme corps de base, de fait nous pourrions prendre
un corps quelconque).

D'abord nous allons faire un petit peu de mathématique (un peu rébarbative) avant de passer à du concret.

Soit V un espace vectoriel, nous écrirons au lieu de . désignera la base canonique de


. est l'ensemble des matrices carrées à coefficients dans .

Définitions:

D1. Une "application multilinéaire" sur un espace V est par définition une application qui est
linéaire en chacune de ces composantes. C'est-à-dire :

(13.78)

pour tout et où les sont des vecteurs.

Remarque: Une application multilinéaire non nulle n'est pas une application linéaire de l'espace dans .
Sauf si . Effectivement, cela se vérifie de par la définition de l'application linéaire versus celle de
l'application multilinéaire :

(13.79)

D2. Une "application multilinéaire alternée" sur V est par définition une application multilinéaire qui vérifie
la condition suivante:

(13.80)
pour tout . Ainsi la permutation de deux vecteurs qui se suivent change le signe de .

Ainsi, si est une application multilinéaire, alors est alternée si et seulement si . nous
avons :

(13.81)

Démonstration: étant définie comme alternée, nous avons donc :

(13.82)

et voilà ce qui nous intéresse :

D3. Un "déterminant" est par définition (par imposition) une application multilinéaire alternée

vérifiant de plus :

(13.83)

Remarque: Les colonnes d'une matrice carrée forment n vecteurs et nous voyons donc qu'un déterminant D
sur induit une application de (où est l'espace des matrices carrées à
coefficients dans ) définie par où est la i-ème colonne de M. Par la suite, nous
ferons l'abus d'écriture qui consiste à confondre D et .

Etudions le cas . Si D est un déterminant, pour tout vecteur :

(13.84)

nous avons : (13.85)

Comme D est multilinéaire, nous avons :

(13.86)

et comme elle est surtout multilinéaire alternée, nous avons donc :

(13.87)
En fait, nous venons de montrer que si un déterminant existe, il est unique et de la forme indiquée ci-dessus,
il faudrait encore vérifier que l'application ainsi définie satisfait les propriétés d'un déterminant, mais ce
dernier point est immédiat.

Ainsi, si est une matrice nous avons donc :

(13.88)

Nous retrouvons donc la forme du déterminant tel que nous en avons fait mention en calcul vectoriel.

Donnons une interprétation géométrique du déterminant. Soit deux vecteurs de .

(13.89)

Le vecteur est obtenu en projetant sur et nous avons donc :

et (13.90)

L'aire du parallélogramme ci-dessus est donc :

(13.91)

Si alors :

(13.92)

et donc : (13.93)

Ainsi le déterminant représente au signe près l'aire du parallélogramme défini par les vecteurs lorsque
ceux-ci sont linéairement indépendants. Nous pouvons généraliser ce résultat à une dimension n quelconque,
en particulier, pour , le déterminant de trois vecteurs linéairement indépendants représente le volume
du parallélépipède défini par ces derniers.

Le cas plus général de l'expression du déterminant est un peu plus délicat à établir. Il faut pour cela que nous
définissions une application bijective particulière mais simple que nous avions déjà rencontrée dans le
chapitre Statistique.

Définition: Soit nous appelons "permutation" de toute application bijective de


dans : (13.94)

Soit l'ensemble des permutations (applications bijectives) possibles de . contient bien


évidemment... (voir la combinatoire dans le chapitre de probabilités) n! éléments. La donnée d'un élément
de est définie par les données successives de :

(13.95)

Etant donnée une suite d'éléments ordonnées (croissants) d'éléments , nous appelons
"inversion", toute permutation d'éléments dans la suite ordonnée (donc la suite ne sera plus ordonnée du
tout...). Nous notons le nombre d'inversions.

Nous disons que la permutation est pair (impair) si est pair (impair). Nous appelons "signature" de

, le nombre noté défini par , c'est-à-dire :

(13.96)

Nous avons maintenant les outils en place nécessaire à définir de manière générale la formule du
déterminant :

Définition: Soit : (13.97)

Nous appelons "déterminant de A", et nous notons det(A), le scalaire K défini par (nous verrons un exemple

plus loin) : (13.98)

Exemples:

E1. Soit , considérons les permutations des seconds indices (des entiers 1,2)
pris dans leur ensemble :

(13.99)
Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons donc... qu'il y a
"inversion", si dans une permutation, un entier supérieur précède un entier inférieur) :

Nombre
0 1
d'inversions

Permutation Paire Impaire

+1 -1
Tableau: 13.1 - Inversions et permutations d'un déterminer d'ordre 2

Donc nous avons :

(13.100)

Ce qui correspond bien à ce que nous avions vu initialement.

E2. Soit , considérons les permutations des seconds indices (des entiers
1,2,3) pris dans leur ensemble :

(13.101)

Nous calculons les signatures de . Voici le schéma de cette règle (rappel : nous disons donc... qu'il y a
"inversion", si dans une permutation, un entier supérieur précède un entier inférieur) :

123 132 213 231 312 321

Nombre
0 1 1 2 2 3
d'inversions

Permutation Paire Impaire Impaire Paire Paire Impaire

+1 -1 -1 +1 +1 -1
Tableau: 13.2 - Inversions et permutations d'un déterminer d'ordre 3

Donc nous avons :

(13.102)
Remarque: Certaines personnes apprennent par coeur une méthode nommée "règle de Sarrus" pour calculer
les déterminants d'ordre trois comme le précédent. Nous lui préférerons sur ce site la formulation générale
du déterminant applicable à tous les ordres.

Voyons quelques propriétés et corollaires de cette formulation du déterminant :

P1. Soit une matrice carrée d'ordre n, nous ne changeons pas la valeur du déterminant de en :

1. Effectuant une opération élémentaire sur les colonnes de

2. Effectuant une opération élémentaire sur les lignes de

Démonstration: Si alors est composée de n vecteurs colonnes :

(13.103)

Effectuer une opération élémentaire sur les colonnes de revient à addition à une des
colonnes de . Soit la matrice obtenue en additionnant à la j-ème colonne de , nous avons :

(13.104)

Par multilinéarité (finalement la démonstration n'est vraiment pas bien dure) :

(13.105)

et comme le déterminant est alterné :

(13.106)

Pour ce qui est des opérations élémentaires sur les lignes il suffit de considérer la transposée (c'est à pleurer
tellement c'est simple mais il fallait y penser).

P2. Soit une matrice carrée d'ordre n et soit :

(13.107)

Démonstration: Comme précédemment, il suffit de remarquer que si sont les vecteurs colonnes
constituant la matrice alors sont ceux qui constituent et :

(13.108)

L'application étant n-linéaire, nous aboutissons à l'égalité : (13.109)


P3. Soit une matrice carrée d'ordre n. Nous changeons le signe du déterminant de si :

1. Nous permutons deux de ces colonnes

2. Nous permutons deux de ces lignes

Démonstration: est constituée des n vecteurs . Le déterminant de est égal au déterminant de


ces n. Permuter deux colonnes de revient à permuter les deux vecteurs correspondant. Supposons que les
vecteurs permutés soit le i-ème et le j-ème, l'application déterminant étant alternée, nous avons :

(13.110)

Pour ce qui est des lignes, il suffit de considérer les transposée de .

P4. Soit alors : (13.111)

La démonstration peut se faire de deux manières, la première est assez indigeste et abstraite nous la
laisserons aux mathématiciens (...) même si elle a l'avantage d'être générale, la seconde plus simple, consiste
à vérifier cette assertions pour différentes matrices carrées.

Démonstration:

(13.112)

Les calculs donnent donc des résultats qui sont bien identiques. Nous pouvons vérifier ainsi pour des
matrices carrées de dimensions supérieures.

P5. Une matrice carrée est inversible si et seulement si .

Démonstration:

Si A est inversible, nous avons :

(13.113)
Il s'agit de la propriété la plus importante des matrices dans le cadre de la physique théorique car si A est un
système linéaire, le calcul de son déterminant permet de savoir si celui-ci a des solutions uniques. Dans le
cas contraire, comme nous en avons déjà fait mention, soit le système n'a aucune solution, soit une infinité !

Il faut considérer aussi un cas particulier important. Soit le système suivant :

(13.114)

où et à déterminer. Il est clair..., que A soit inversible ou non, la solution triviale


est . Cependant..., imaginons un cas de physique théorique où nous avons mais pour lequel
nous savons que et pour lequel nous imposons . Dans ce cas, ils nous faut
éliminer la solution triviale . De plus, calculer l'inverse (s'il existe) de la matrice A ne nous ramènera à
rien de concret mis à part à ce qui bien évidemment ne nous satisfait pas. La seule solution est alors de
se débrouiller pour que les coefficients de la matrice A soient tels que sont déterminant soit nul et donc la
matrice non inversible ! L'intérêt ? Eh, bien d'avoir une infinité de solutions possibles (de B donc !) qui
satisfont . Nous aurons besoin de cette méthodologie en mécanique quantique ondulatoire, lorsque
nous déterminerons l'existence des anti-particules par l'intermédiaire de l'équation de Dirac linéarisée. Il
faudra donc s'en rappeler.

P6. Deux matrices "conjuguées" (attention, pas dans le sens complexe du terme) ont le même déterminant.

Démonstration:

Soit , et une matrice de passage d'une base à une autre (voir plus loin le traitement
des changements de bases), nous avons alors :

(13.115)

P7. Pour toute matrice : (13.116)

Démonstration: (13.117)

Or (trivial... simple multiplication de tous les coefficients) :

(13.118)

Puisque (trivial) et que (cf. chapitre sur les Nombres), nous pouvons
alors écrire :

(13.119)

P8. Pour toute matrice : (13.120)

Démonstration:
Ben... c'est la même chose que pour la propriété précédente mais sans les valeurs conjuguées... De fait, nous
montrons de la même manière, la même propriété pour .

P6. Soit une matrice , nous noterons la matrice obtenue à partir de A en effaçant la i-
ème ligne et la j-ème colonne. appartient donc à . Alors pour tout :

(13.121)

où le terme: (13.122)

est appelé le "cofacteur" .

Démonstration:

Définissons pour cela l'application :

(13.123)

Il est facile de voir que est multilinéaire (il suffit de considérer comme une simple constante et
ensuite par extension de la définition du déterminant... trop facile...).

Montrons cependant qu'elle est alternée (dans ce cas, c'est un déterminant qui a toutes les propriétés d'un
déterminant) :

Soit deux vecteurs colonne de A qui se suivent. Supposons que , il faut montrer que dans ce
cas (qui découle de la définition d'une application alternée).

Nous avons premièrement (c'est obligatoire de par la définition) si nous n'effaçons aucune des colonnes j
étant k ou k + 1: si (13.124)

et nous avons bien évidemment si nous enlevons l : (13.125)

Donc : (13.126)

C'est donc OK. Elle est alternée et multilinéaire, il s'agit donc bien d'un déterminant.

Nous venons donc de montrer que est un déterminant et par unicité nous a pour tout
.

Voyons un exemple de cette méthode en calculant le déterminant de :

(13.127)
Développons selon la deuxième ligne . Nous obtenons :

(13.128)

Développons selon la première colonne en guise de vérification (on ne sait jamais...) :

(13.129)

Le calcul déterminé ci-dessus est donc exponentiel car si par exemple nous devons calculer le déterminant
d'un matrice d'ordre 10 alors le déterminant sera développé la somme de 10 termes, dont chacun contient les
déterminant d'un matrice d'ordre 9, qui est un cofacteur de la matrice de départ. Si nous développons
n'importe lequel de ces déterminants, nous obtenons une somme de 9 déterminants dont chacun contient le
déterminant d'un matrice d'ordre 8. A ce stade, il y a donc 90 déterminants de matrices d'odre 8 à calculer.
Le processus pourrait se poursuivre jusqu'à ce qu'il ne reste que des déterminants d'ordre 2. Et alors là nous
devinons que le nombre de matrice d'ordre 2 est très conséquent!

Définition: Soit m, n deux entiers positifs quelconques et A une matrice à coefficients dans . Pour
tout entier un "mineur d'ordre k" de A est un déterminant du type:

avec (13.130)

Dans le cas particulier d'un matrice carée d'ordre la définition est plus simple: Le mineur de
l'élément est le déterminant de la matrice d'ordre n - 1 obtenue en suppirmant la ligne i et la colonne j.
Ainsi, pour calculer le mineur d'un élément, nous supprimons la ligne et la colonne auxquelles l'élément
appartient, puis nous calculons le déterminant de la matrice carrée restante.

Pour finir nous terminons en donnant une formule qui relie les coefficients de l'inverse d'une matrice
avec ces mineurs d'ordre .

DÉRIVÉE D'UN DÉTERMINANT

Voyons maintenant un résultat qui nous sera fort utile en relativité générale.

Soit une matrice carrée avec des fonctions dérivables. Posons . Nous
voulons calculer . Soit le i-ème vecteur colonne de la matrice G. Utilisons la formule :
(13.131)

Sachant que la dérivée de est (dérivée de n produits) :

(13.132)

nous avons donc :

(13.133)

Si nous regardons la première somme ci-dessus, nous remarquons que:

(13.134)

où est la dérivée du vecteur . De même pour les sommes suivantes. Ainsi,

(13.135)

Développons encore. Considérons le terme ci-dessus. Si nous le développons par rapport à

la première colonne, nous obtenons : (13.136)

De même, en développant le j-ème terme de la somme ci-dessus par rapport à la j-ème colonne nous avons :

(13.137)

Si nous posons : (13.138)

nous obtenons : (13.139)

ce qui en notation tensorielle (cf. chapitre de Calcul Tensoriel) s'écrit : (13.140)


Nous avons aussi : (13.141)

où est le coefficient se trouvant à la j-ème ligne, i-ème colonne de la matrice . Si nous notons le

coefficient i, j de la matrice alors : et (13.142)

L'expression de la dérivée devient finalement : (13.143)

qui s'écrit en notation tensorielle : (13.144)

Ce résultat, finalement assez simple, nous sera utile dans le chapitre de Calcul Tensoriel, pour construire les
outils nécessaires à l'étude de la relativité générale et à la détermination de l'équation d'Einstein des champs.
Il convient donc de s'en rappeler.

INVERSE D'UNE MATRICE

Terminons notre étude des déterminants avec la cerise sur le gâteau en donnant une relation très importante
dans de nombreus domaines de l'ingénierie, de la physique et de la mathématique qui relie les coefficients de
l'inverse d'une matrice avec ces mineurs d'ordre (nous allons utiliser cette relation plus loin).

Soit une matrice inversible. Notons et . Alors :

(13.145)

Démonstration:

Notons le k-ème vecteur colonne de la matrice A. Sachant que , nous avons (trivial) :

(13.146)

Calculons . D'une part en développant par rapport à la k-ème colonne nous


trouvons (puisque qu'un seul des coefficients de est non nul et que l'unique non nul est égal à l'unité) :

(13.147)

D'autre part (propriétés du déterminant) :

(13.148)
Ainsi : (13.149)

c'est-à-dire : (13.150)

CHANGEMENTS DE BASES

Supposons que nous passions d'une base d'un espace à une autre base
de ce même espace.

Décomposons les dans la base :

(13.151)

Définition: Nous appelons "matrice de transition" ou "matrice de passage", la matrice (l'application linéaire)
qui permet de passer de donnée par :

(13.152)

Maintenant, considérons le vecteur donné par . Alors nous nous proposons de démontrer que les
composantes de dans la base sont données par :

(13.153)

ou:

(13.154)

Remarque: La matrice P est inversible, car ses colonnes sont linéairement indépendantes (ce sont les
vecteurs décomposés dans la base et les sont linéairement indépendants car ils forment une base).
Démonstration:

Prenons pour simplifier le cas (la démonstration étant assez facilement généralisable...) avec
et .

Nous avons alors : (13.155)

Nous avons donc et nous cherchons à exprimer dans la base tel que . Nous allons
chercher l'application linéaire qui relie ces deux relations telles que:

(13.156)

Soit écrit de manière explicite:

(13.157)

d'où : (13.158)

c'est-à-dire : (13.159)

Donc P est bien la matrice qui permet d'exprimer les composantes d'un vecteur d'une base en celles d'une
autre base.

Considérons maintenant une application linéaire. Soit A sa matrice dans la base , et B sa


matrice dans la base . Alors nous avons : (13.160)

Démonstration:

Reprenons: (13.161)

et posons: (13.162)

nous avons donc une fonction qui nous amène à écrire: (13.163)

D'autre part, nous avons (ce que nous avons démontré tout à l'heure) : (13.164)

Dès lors : (13.165)

d'où : (13.166)
et comme nous l'avons vu dans notre étude du déterminant, les déterminants de A, B sont égaux et donc
invariants.

VALEURS ET VECTEURS PROPRES

Définition: Une "valeur propre" est par définition (nous retrouverons cette définition dans l'introduction à
l'algèbre quantique dans le cadre du chapitre de Physique Quantique Ondulatoire) une valeur appartenant à
un corps K tel que soit une matrice carrée nous avons :

(13.167)

et réciproquement qu'un vecteur est un "vecteur propre" si et seulement si :

(13.168)

L'avantage majeur de ces concepts sera la possibilité d'étudier une application linéaire, ou tout autre objet lié
à une représentation matricielle, dans une représentation simple grâce à un changement de base sur laquelle
la restriction de A est une simple homothétie.

En d'autres termes: lorsqu'une transformation (application d'une matrice) agit sur un vecteur, elle modifie la
direction de ce vecteur excepté pour certaines matrices particulières qui ont des valeurs propres!

Ainsi, l'ensemble des valeurs propres d'une matrice est appelé "spectre de A" et satisfait au
système homogène : (13.169)

ou (peu importe cela revient au même!) : (13.170)

où (aussi notée ) est une matrice diagonale unitaire (et donc aussi carrée) de dimension n . Ce système
nous le savons (démontré plus haut) admet des solutions non triviales, donc ou , si et
seulement si (nous verrons de nombreux exemples en physique) :

(13.171)

Le déterminant est donc un polynôme en de degré n et peut donc avoir aux maximum n
solutions/valeur propres comme nous l'avons démontré lors de notre étude des polynômes (cf. chapitre de
Calcul Algébrique) et est appelé "polynôme caractéristique" de A et l'équation "équation
caractéristique de A" ou "équations aux valeurs propres".

Pour la petite paranthèse, il est sympathique de remarquer que nous avons toujours dans le développement
du la trace de la matrice tr(A) et le déterminant det(A) qui apparaissent. Voyons deux exemples
de cela:
(13.172)

et: (13.173)

Si nous regardons comme une application linéaire f, puisque ce sont les solutions non triviales qui
nous intéressent, nous pouvons alors dire que les valeurs propres sont les éléments tel que :

(13.174)

et que le Kernel constitue l'espace propre de A de la valeur propre dont les éléments non nuls sont les
vecteurs propres!

En mathématiques, le concept de vecteur propre est une notion algébrique s'applique donc à une application
linéaire d'un espace dans lui-même. Il correspond à l'étude des axes privilégiés, selon lesquels l'application
se comporte comme une dilatation, multipliant les vecteurs par une même constante. Ce rapport de
dilatation/homothétie est donc la valeur propre, les vecteurs auxquels il s'applique vecteurs propres, réunis
en un "espace propre".

Une autre manière de voir la chose :

- Un vecteur est dit "vecteur propre" par une application linéaire s'il est non nul et si l'application ne fait que
modifier sa taille sans changer sa direction.

- Une "valeur propre" associée à un "vecteur propre" est le facteur de modification de taille, c'est à dire le
nombre par lequel il faut multiplier le vecteur pour obtenir son image. Ce facteur peut être négatif
(renversement du sens du vecteur) ou nul (vecteur transformé en un vecteur de longueur nulle).

- Un "espace propre" associé à une "valeur propre" est l'ensemble des vecteurs propres qui ont une même
valeur propre et le vecteur nul. Ils subissent tous la multiplication par le même facteur.

Remarque: En mécanique, nous étudions les fréquences propres et les modes propres des systèmes oscillants
(cf. chapitre de Mécanique Ondulatoire). En analyse fonctionnelle, une fonction propre est un vecteur propre
pour un opérateur linéaire, c'est-à-dire une application linéaire agissant sur un espace de fonctions cf.
chapitre d'Analyse Fonctionnelle). En géométrie ou en optique, nous parlons de directions propres pour
rendre compte de la courbure des surfaces (cf. chapitre de Géométrie Non- Euclidiennes). En théorie des
graphes, une valeur propre est simplement une valeur propre de la matrice d'adjacence du graphe (cf.
chapitre de Théorie Des Graphes).
MATRICES DE ROTATION

Maintenant que nous avons vu ce qu'était une valeur et un vecteur propre, revenons sur un type particulier de
matrices orthogonales qui nous seront particulièrement utiles dans notre étude des quaternions (cf. chapitre
sur les Nombres), des groupes et symétries (cf. chapitre d'Algèbre Ensembliste) et de la physique des
particules (cf. chapitre de Physique des Particules Elémentaires).

Nous notons, selon ce qui a été vu dans le chapitre d'Algèbre Ensembliste, O(n) l'ensemble des matrices
à coefficients dans orthogonales, c'est-à-dire vérifiant :

(13.175)

que nous notons aussi pour rappel : (13.176)

Les colonnes et les lignes d'une matrice orthogonale forment des bases orthonormées de pour le produit
scalaire habituel.

Le déterminant d'une matrice orthogonale vaut , en effet entraîne :

(13.177)

Nous notons SO(n) l'ensemble des matrices orthogonales de déterminant 1. Montrons en trois points que si
alors A est la matrice d'une rotation par rapport à un axe passant par l'origine.

1. Toute valeur propre d'une matrice de rotation A (réelle ou complexe) est de module 1. En d'autres termes,
la rotation conserve la norme :

En effet, si est une valeur propre de vecteur propre , nous avons :

(13.178)

ou en notant le produit scalaire avec la notation habituelle du site :

(13.179)

donc .

2. Il existe une droite dans l'espace qui sert d'axe de rotation et tout vecteur sur cette droite ne subit aucune
rotation :

Notons un vecteur propre normé de valeur propre 1 (c.à.d un vecteur tel que ). Comme le lecteur

l'aura peut-être compris (lire jusqu'au bout!), la droite engendrée par que l'on notera constitue notre
axe de rotation.

En effet, tout vecteur sur est envoyé sur lui-même par A. Dans ce cas l'espace orthogonal noté qui
est de dimension deux est le plan perpendiculaire à l'axe de rotation.
3. Tout vecteur perpendiculaire à l'axe de rotation reste, après une rotation, perpendiculaire à cet axe. En

d'autres termes, est invariant par A

En effet, si alors, et pour tout :

(13.180)

c'est-à-dire . Donc est invariant par A.

En fin de compte, la restriction de A à l'espace est une rotation.

Exemple :

Soit (voir le chapitre sur les nombres où la rotation par les complexes est démontré) une valeur propre
(dont le module est de 1 comme nous l'avons vu lors de notre étude des nombres complexes) de A restreinte

à .

Notons un vecteur propre avec de sorte que : (13.181)

avec (comme nous l'avons déjà montré dans notre étude des nombres complexes) :

(13.182)

où nous savons de par notre étude des nombres complexes, que les vecteurs forment une base

orthogonale (pas nécessairement normée!) de .

Remarque: Il est par ailleurs aisé de vérifier que cette matrice est orthogonale (si ce n'est pas le cas
contactez-nous et ce sera détaillé!).

THÉORÈME SPECTRAL

Voyons maintenant un théorème très important relativement aux valeurs et vecteurs propres qui se nomme le
"théorème spectral" qui nous sera très utile à nouveau en physique et en statistiques.

Pour résumer, les mathématiciens disent dans leur langage que le théorème spectral permet d'affirmer la
diagonalisabilité d'endomorphismes (de matrices) et justifie également la décomposition en valeurs propres.

Pour simplifier la démonstration, nous ne traitons ici que les matrices réelles en évitant un maximum le
langage des mathématiciens.

Nous noterons dans un premier temps l'ensemble des matrices à coefficients réels. Nous
confondrons la matrice avec l'application linéaire induite sur l'espace vectoriel par
( ).
Rappel : Nous avons vu lors de l'étude des changements de base que si une base de
et alors a matrice de l'application linéaire M dans la base est où S est la
matrice formée par les vecteurs colonnes .

D'abord, nous vérifions simplement que si A est une matrice symétrique alors :

(13.183)

Nous nous proposons maintenant d'étudier les propriétés suivantes d'une matrice M symétrique :

P1. Toutes les valeurs propres de M sont réelles.

Démonstration:

Soit : (13.184)

un vecteur propre à priori complexe de valeur propre . Notons : (13.185)

le vecteur conjugué de . Nous avons alors : (13.186)

D'autre part vu que nous avons : (13.187)

Etant donné que nous avons et par suite, .

P2. Deux espaces propres de M relatifs à des valeurs propres différentes sont orthogonaux (en d'autres
termes, les vecteurs propres sont indépendants).

Démonstration:

Soit deux valeurs propres distinctes de vecteurs propres correspondants . Nous avons (ne pas
oublier que M est symétrique!) :

(13.188)

ainsi : (13.189)

ce qui entraîne: (13.190)

Avant d'aller plus loin, il nous faut aussi démontrer que si est une matrice symétrique et V un
sous espace vectoriel de invariant par M (c'est-à-dire qui vérifie pour tout ) alors nous
avons les propriétés suivantes :
P1. L'orthogonal de V noté (obtenu par la méthode de Grahm-Schmidt vue dans le chapitre de calcul
vectoriel) est aussi invariant par M.

Démonstration:

Soit et alors : (13.191)

ce qui montre que .

P2. Si est une base orthonormale de alors la matrice de la restriction de M à dans la base
est aussi symétrique.

Démonstration:

Notons la matrice de la restriction de M à dans la base . Nous avons par


définition pour tout (puisque le vecteur résultant d'une application linéaire comme M peut

s'exprimer dans sa base) : (13.192)

Or : (13.193)

car si dans la base orthonormale.

D'un autre coté : (13.194)

Donc ce qui montre que .

Nous allons à présent pouvoir montrer que toute matrice symétrique est diagonalisable. C'est-
à-dire qu'il existe une matrice inversible S telle que soit diagonale.

Remarque: En fait nous verrons, pour être plus précis, qu'il existe S orthogonale telle que soit
diagonale.

Rappel : S orthogonale signifie que (où I est la matrice identité) ce qui équivaut à dire que les
colonnes de S forment une base orthonormale de .

Donc allons-y et pour cela considérons une matrice symétrique. Alors nous souhaitons
démontrér qu'il existe une matrice S orthogonale telle que soit diagonale (en d'autres termes, il existe
une base où M est diagonalisable).

Démonstration:
Nous prouvons l'affirmation par récurrence sur n. Si il n'y a rien à montrer. Supposons que
l'affirmation soit vérifiée pour et prouvons là pour . Soit donc une matrice
symétrique et une valeur propre de M.

Nous vérifions facilement que l'espace propre est invariant par M (il suffit de prendre
n'importe quelle application numérique) et que par la démonstration vue plus haut que est aussi
invariant par M. De plus, nous savons (cf. chapitre de calcul vectoriel), que se décompose en somme
directe .

Si , et il suffit de prendre un base orthonormale de W pour diagonaliser M. En effet si


est une telle base, la matrice formée par les vecteurs colonnes ( ) est
orthogonale et vérifie : (13.195)

est bien diagonale.

Supposons donc et soit avec une base orthonormale de . Notons A la


matrice de la restriction de M à dans la base . A est aussi symétrique (selon la démonstration
d'une des propriétés précédents).

Par hypothèse de récurrence il existe une matrice orthogonale telle que soit diagonale.

Notons par une base orthonormale de W et G la matrice formée par les vecteurs

colonnes . Alors, nous pouvons écrire que : (13.196)

et G est aussi orthogonale par construction.

Considérons la matrice par blocs (matrice composée de matrices) suivante :

(13.197)

et posons . Il est évident que S est orthogonale car G et L le sont. Effectivement, si et


alors (ne pas oublier que la multiplication matricielle est associative):

(13.198)

De plus S vérifie :

(13.199)
Et alors : (13.200)

est bien diagonale.

Pour finir voici donc le "théorème spectral" (cas réel): Si une matrice symétrique alors il existe
une base orthonormale formée de vecteurs propres de M.

Démonstration:

Nous avons donc vu dans les paragraphes précédents qu'il existe S orthogonale telle que soit
diagonale. Notons les colonnes de S. est une base orthonormale de car S est
orthogonale. Notant le i-ème vecteur de la base canonique de et le i-ème coefficient diagonal de
nous avons sans supposer directement que est une valeur propre pour l'instant :

(13.201)

en multipliant par S des deux côtés de l'égalité nous avons : (13.202)

et donc :

ce qui montre que sont des vecteurs propres et les valeurs propres.
14. CALCUL TENSORIEL

L e calcul vectoriel classique est une technique simple et efficace qui s'adapte parfaitement à l'étude des
propriétés mécaniques et physiques de la matière dans l'espace euclidien à trois dimensions. Cependant,
dans de nombreux domaines de la physique, il apparaît des grandeurs expérimentales qui ne peuvent plus
être facilement représentées par de simples vecteurs-colonnes d'espaces vectoriels euclidiens. C'est le cas par
exemple en mécanique des milieux continus, fluides ou solides, en électromagnétisme, relativité générale,
etc.

Ainsi, dès la fin du 19ème siècle, l'analyse des forces qui s'exercent à l'intérieur d'un milieu continu à
conduit à mettre en évidence des grandeurs physique caractérisées par neuf nombres représentant les forces
de pression ou de tension internes (cf. chapitre de Mécanique Des Milieux Continus). La représentation de
ces grandeurs nécessita l'introduction d'un nouvel être mathématique qui fut appelé "tenseur", par référence
à son origine physique. Par la suite, à partir de 1900, ce furent R. Ricci et T. Lévi-Civita qui développèrent
le calcul tensoriel puis l'étude des tenseurs permit un approfondissement de la théorie des espaces vectoriels
et contribua au développement de la géométrie différentielle (voir chapitre du même nom).

Le calcul tensoriel, appelé aussi parfois "géométrie différentielle absolue" a également pour avantage de se
libérer de tous les systèmes de coordonnées et leurs formes sont ainsi invariantes (énorme allégement des
calculs). Il n'y a plus alors à se préoccuper dans quel référentiel il convient de travailler et cela, est très
intéressant en relativité générale.

Nous conseillons par ailleurs vivement au lecteur de bien maîtriser les bases du calcul vectoriel et de
l'algèbre linéaire comme elles ont été présentées auparavant. Au besoin, nous avons choisi lors de la
rédaction de ce chapitre de revenir sur certains points vus en calcul vectoriel (composantes covariantes,
contravariantes,...).

Par ailleurs, si le lecteur a déjà parcouru l'étude des contraintes dans les solides (cf. chapitre de Mécanique
Des Milieux Continus) ou du tenseur de Faraday (cf. chapitre d'Electrodynamique) ou du tenseur d'énergie-
impulsion (cf. chapitre de Relativité) ceci constituera un avantage pratique certain avant de parcourir ce qui
va suivre. Par ailleurs, la lecture des objets susmentionés a été faite de telle manière que la notion de tenseur
y soit introduite intuitivement.

Nous ne ferons que très peu d'exemples pratiques dans cette section. Effectivement les exemples concrets,
vous l'aurez compris, viendront lorsque nous étudierons la mécanique des milieux continus, la relativité
générale, la physique quantique des champs, etc...

Un conseil peut-être : pensez matriciel, écrivez tensoriel ! (vous comprendrez mieux ce petit adage une fois
après avoir parcouru tout ce chapitre).

TENSEUR

Définition (simpliste): Un "tenseur" est un objet mathématique généralisant les notions de vecteur et de
matrice. Ils ont été introduits, en physique, pour représenter l'état de contrainte et de déformation d'un
volume soumis à des forces, d'où leur nom (tensions).

La définition rigoureuse nécessite (je pense personnellement) d'avoir d'abord lu le présent chapitre dans son
entier. Mais sachez qu'au fait un tenseur est grosse modo comme un déterminant... (cf. chapitre d'Algèbre
Linaire). Eh oui! C'est simplement une application multilinéaire sur un espace de dimension donnée
(correspondant au nombre de colonnes de la matrice/tenseurs) qui donne finalement un scalaire (d'un corps
donné).
Par exemple, nous avons démontré dans le chapitre de Mécanique Des Milieux Continus que les forces
normales dans un fluide étaient données par la relation :

(14.1)

soit sous forme condensée : (14.2)

Nous faisons ainsi apparaître une grandeur mathématique ayant 9 composantes, alors qu'un vecteur dans
le même espace en possède 3.

Cette notion est aussi beaucoup utilisée dans le chapitre de Relativité Générale où nous avons démontré que
le tenseur d'énergie-impulsion dans un cas particulièrement simple est donné par :

(14.3)

et satisfait à la relation non moins importante de conservation : (14.4)

Ou toujours dans le chapitre de Relativité Générale nous avons démontré que le tenseur de la métrique de
Schwarzschild est :

(14.5)

et donne donc l'équation de la métrique (cf. chapitre de Calcul Différentiel) :

(14.6)

Signalons également dans le chapitre de Relativité Restreinte que nous avons démontré que le tenseur de
transformation de Lorentz est donnée par :

(14.7)

qui sous forme condensée donne la transformation de composantes suivantes : (14.8)


En ce qui concerne la transformation du champ électromagnétique nous avons également démontré que le
tenseur de Faraday est donné par :

(14.9)

et permet donc de passer d'un référentiel à un autre à l'aide de la relation : (14.10)

Mais ce sont des tenseurs très simples qui peuvent être représentés sous formes de matrices. Il faut
également savoir que ce n'est pas parce qu'une lecture d'une variable avec des indices semble indiquer que
nous avons à faire à un tenseur que cela en est forcément un. Par exemple, la relation fameuse (très utilisée
dans le chapitre de Relativité Générale) :

(14.11)

pourrait faire croire que le premier membre tout à gauche est un tenseur mais au fait il n'est est rien... ce n'est
qu'un symbole... d'où son nom : symbole de Christoffel (et non pas : tenseur de Christoffel).

L'intérêt des tenseurs en physique est que leurs caractéristiques sont indépendantes des coordonnées
choisies. Ainsi, une relation entre tenseur dans une base sera vraie quelle que soit la base utilisée par la suite.
C'est une caractéristique fondamentale pour la relativité générale!

NOTATION INDICIELLE

Nous utilisons par la suite des symboles mathématiques: coordonnées, composantes de vecteurs et tenseurs,
éléments de matrice, etc., dont le nombre, dans chaque catégorie, est grand ou indéterminé. Pour distinguer
les divers symboles d'une catégorie nous employons des indices. Par exemple, au lieu des variables
traditionnelles x, y, z nous utiliserons éventuellement les grandeurs (comme nous l'avons déjà fait
en algèbre linéaire). Cette notation devient indispensable lorsque nous avons des variables en nombre
indéterminé.

Ainsi, si nous avons n variables, nous les noterons :

Nous utilisons également des indices supérieurs, selon les besoins; par exemple, . Afin d'éviter

toute confusion avec l'écriture des puissances, la quantité à la puissance p sera écrite . Lorsque le
contexte écarte tout risque d'ambiguïté, l'utilisation des parenthèses n'est cependant pas fondamentalement
nécessaire.

En calcul tensoriel il existe une convention de sommation qui consiste à utiliser le fait que l'indice répété, ici
l'indice i, va devenir lui-même l'indication de la sommation. Nous écrivons alors, avec cette convention :

(14.12)

ce qui permet de condenser relativement bien les écritures.

Ainsi, pour représenter le système linéaire :


(14.13)

Nous écrirons (remarquez bien comment s'écrivent les composants de la matrice associée) :

(14.14)

en spécifiant que c'est pour .

Nous voyons sur cet exemple, combien la convention de sommation permet une écriture condensée et donc
puissante.

La convention de sommation s'étend à tous les symboles mathématiques comportant des indices répétés.
Ainsi la décomposition d'un vecteur sur une base s'écrit pour dès lors :

(14.15)

En résumé, toute expression qui comporte un indice deux fois répété représente une somme sur toutes les
valeurs possibles de l'indice répété.

Remarque: Nous nommons, pour des raisons évidentes que nous détaillerons plus loin, la "composante
contravariante" du vecteur .

SOMMATION SUR PLUSIEURS INDICES

La convention de sommation (due à Einstein) s'étend au cas où figurent, en règle générale, plusieurs indices
répétés en positions supérieure et inférieure dits "indices muets" dans un même monôme (souvent les
physiciens omettent le règle de les mettre en position opposées comme ce sera aussi le cas souvent sur ce
site!). Soit par exemple, la quantité , celle-ci représente la somme suivante pour i et j prenant les
valeurs de 1 à 2:

(14.16)

Ainsi, nous voyons facilement qu'une expression avec deux indices de sommation qui prennent
respectivement les valeurs comportera termes; s'il y a trois indices, de sommation etc.

Il faut faire cependant attention aux substitutions avec ce genre de notation car si nous supposons que nous
avons la relation:

avec (14.17)

Pour obtenir l'expression de A uniquement en fonction des variables , nous ne pouvons pas écrire:

(14.18)
car cela ne revient pas à la même expression après développement puisque les indices muets sont
systématiquement sommés de manières identiques et rigides (nous laissons au lecteur le soin de faire ce petit
exercice de style).

SYMBOLE DE KRONECKER

Un symbole introduit par le mathématicien Kronecker, est le suivant (souvent utilisé en physique en général
dans de nombreux domaines):

(14.19)

Ce symbole est appelé "symbole de Kronecker". Il permet avantageusement d'écrire, par exemple, le produit
scalaire de deux vecteurs et , de norme unité et orthogonaux entre eux, sous la forme:

(14.20)

Lors d'une sommation portant sur deux indices muets, le symbole de Kronecker annule tous les termes où
les indices ont des valeurs différentes. Par exemple:

(14.21)

Nous retrouverons ce symbole dans de nombreux exemples de physique théorique (physique quantique
ondulatoire, physique quantique des champs, relativité générale, mécanique des fluides, etc..)

SYMBOLE D'ANTSYMÉTRIE

Un autre symbole fort utile est le "symbole d'antisymétrie" ou appelée aussi "tenseur d'antisymétrie" que
nous retrouverons en Électrodynamique, en Relativité Générale et en Physique Quantique Relativiste.

Dans le cas où i, j, k prennent l'une des valeurs {1,2,3} le symbole d'antisymétrie aura les valeurs
définies suivantes:

- , si deux quelconques des indices ou plus ont une valeur identique

- , si les indices sont dans l'ordre 1, 2, 3 ou proviennent d'un nombre pair de permutations des indices
par rapport à l'ordre initial des indices.

- , si les indices sont dans un ordre qui provient d'un nombre impair de permutations par rapport à
l'ordre initial des indices.

En utilisant ce symbole, un déterminant d'ordre deux (voir algèbre linéaire) s'écrit alors sous la forme
avantageuse :

(14.22)

et le produit vectoriel (et ça c'est très pratique en relativité générale) : (14.23)

où bien sûr, j et k sont sommés et où l'indice muet i est le numéro de la ligne du vecteur résultant (en cas de
demande nous ferons les développements). En particulier, le rotationnel d'un champ vectoriel est alors :
(14.24)

Comme exemple, calculons en notation indicielle le double produit vectoriel :

(14.25)

où à nouveau, l'indice muet i est le numéro de la ligne du vecteur résultant (en cas de demande nous ferons
les développements).

Démonstration:

Nous avons indirectement démontré dans le chapitre de Calcul Vectoriel la partie suivante:

(14.26)

que nous pouvons démonter en détails dans le chapitre précédemment mentionné sur demande.

Pour démontrer la relation: (14.27)

au changement d'indices près montrons d'abord que: (14.28)

ce qui nous donne: (14.29)

faisons le développement que pour la première ligne (c'est déjà suffisamment long...):

(14.30)

C'est ce qu'il fallait montrer.

Maintenant montrons que pour la première ligne nous avons bien:

(14.31)

en s'aidant d'un résultat obtenu dans le chapitre de Calcul Vectoriel (produit vectoriel de trois vecteurs
différents) nous avons le premier terme (la première ligne du vecteur résultant du calcul):
(14.32)

Il est alors immédiat que (pour i valant 1):

(14.33)

Montrons maintenant que pour i valant 1 nous avons aussi:

(14.34)

Effectivement:

(14.35)

Comme deuxième exemple, montrons comment la divergence d'un rotationnel s'annule :

(14.36)
Comme de par le théorème de Schwarz est symétrique dans les indices et que est antisymétrique
(par définition) dans les mêmes indices, la somme sur i et j doit nécessairement s'annuler. Par exemple, la
contribution à la somme du terme est l'opposée de celle de .

Remarques:

R1. Le symbole d'antisymétrie est très souvent appelé "tenseur de Levi-Civita" dans la littérature. Au fait,
bien que ce soit bien un tenseur sous la forme de ses notations, il s'agit plus d'un outil mathématique qu'un
"être" mathématique d'où la préférence de certains physiciens de le nommer "symbole" plutôt que "tenseur".
Mais c'est à vous de voir...

R2. Par abus d'écriture nous n'écrivons pas le vecteur de base mais en toute rigueur, et pour éviter de
l'oublier, rappelons qu'afin d'équilibrer les membres de l'égalité et dans le souci de préciser que les vecteurs
sont exprimés dans la même base, nous devrions écrire :

(14.37)

Voyons maintenant des applications concrètes de cette notation indicielle en reprenant l'exemple du
changement de base que nous avons déjà vu en calcul vectoriel :

Soient deux bases et d'un espace vectoriel euclidien . Chaque vecteur d'une
base peut être décomposé sur l'autre base sous la forme d'une application linéaire (matrice de changement de
base - voir chapitre d'Algèbre Linéaire) :

et (14.38)

où nous utilisons bien évidemment la convention de sommation pour

Rappelons que la matrice de changement de base (ou "matrice transformation") doit avoir autant de colonnes
que le vecteur de base a de lignes (dimensions). Petit exemple à trois dimensions:

(14.39)

et il est évident qu'il est bien plus sympathique d'écrire cela sous la forme:

(14.40)

où donc sur A, nous avons le k qui représente la colonne de la matrice et i la ligne.

Un vecteur quelconque de peut être décomposé (nous l'avons déjà vu) sur chaque base de sous la
forme:

(14.41)

Si nous cherchons les relations entre les composantes et il suffit de reprendre les relations de
changement de base et nous avons alors (cela revient à faire de l'algèbre linéaire):
(14.42)

De suite par l'unicité de la décomposition d'un vecteur sur une base, nous pouvons égaler les coefficients des
vecteurs de base et nous obtenons (il faut prendre garde a réarranger à nouveau l'ordre des termes car la
multiplication matricielle n'est pas commutative comme nous le savons déjà) :

et (14.43)

Il vient également la relation triviale (cf. chapitre d'Algèbre Linéaire) :

(14.44)

Effectivement faisons un exemple explicite simple avec une matrice de dimension 2:

(14.45)

Une autre manière élégante de montrer en toute généralité la relation antéprécédente est de se rappeler du
résultat démontré juste plus haut:

(14.46)

et en utilisant: (14.47)

Il vient alors: (14.48)

Les vecteurs de base étant linéairement indépendants, cette dernière relation implique que lorsque :

(14.49)

et lorsque : (14.50)

Ainsi il vient: (14.51)

Quant au produit scalaire, les résultats obtenus avec la notation indicielle sont forts intéressants et
extrêmement puissants. Nous avons déjà défini le produit scalaire dans le chapitre de Calcul Vectoriel mais
voyons comment nous manipulons ce dernier avec la notation indicielle:

Considérons un espace vectoriel euclidien rapporté à une base quelconque . Les vecteurs s'écrivent
sur cette base (nous le savons déjà): , (14.52)

Le produit scalaire relativement à ses propriétés et à la notation indicielle s'écrit alors:

(14.53)
Relation fonamentale pour la physique de pointe (relativité générale et théorie des cordes) qui fait apparaître
le "tenseur métrique covariant" : (14.54)

et pour satisfaire la propriété de commutativité du produit scalaire (cf. chapitre de Calcul Vectoriel) nous
devons évidemment avoir l'égalité: (14.55)

Remarque: Lorsque les vecteurs de base forment un espace vectoriel orthogonal (pas nécessairement
orthonormé) alors les quantités: (14.56)

sont nulles si . Le produit scalaire de deux vecteurs et se réduit alors à:

(14.57)

ou encore à : (14.58)

et donc lorsque les vecteurs de base forment un espace vectoriel orthonormal il est alors clair que est
alors égal au symbole de Kronecker seul!

MÉTRIQUE ET SIGNATURE

Comme nous l'avons vu en calcul vectoriel, le produit scalaire d'un vecteur peut permettre de définir la
notion de norme d'un vecteur (et le concept de distance).

Rappelons que nous avons par définition la norme d'un vecteur qui est donnée par (cf. chapitre de Calcul

Vectoriel) : (14.59)

où les nombres définissent en quelque sorte une "mesure" des vecteurs; nous disons alors dans le langage
du calcul tensoriel qu'ils constituent la "métrique" de l'espace vectoriel choisi.

Dans l'espace de la géométrie classique, la norme est un nombre qui est toujours strictement positif et qui ne
devient nul que si le vecteur mesuré est égal à zéro. Par contre, l'expression précédente de la norme d'un
vecteur, peut être éventuellement négative pour des nombres quelconques (espaces
complexes par exemple). Nous pouvons donc distinguer deux genres d'espaces vectoriels pré-euclidiens
(espace euclidien dans lequel nous avons défini le produit scalaire) selon que la norme est positive ou non.
Cependant lorsqu'en physique théorique nous souhaitons faire l'analogisme avec une structure d'espace
vectoriel il faut que la condition : (14.60)

soit satisfaite ( peut être écrit comme une matrice, rien ne nous l'empêche).

Explications : Nous savons que le produit scalaire doit satisfaire à la propriété de commutativité telle que:

(14.61)

D'autre part, si pour tout non nul nous avons : (14.62)


cela implique (c'est une des propriétés de la norme que nous avons vu en calcul vectoriel). Nous
pouvons alors écrire:

(14.63)

Nous nous retrouve ici simplement avec un système de n équations à n inconnues (ne devant admettre par
hypothèse que la solution ), il faut et il suffit pour cela que le déterminant du système, noté g, du
système soit différent de zéro (cf. chapitre d'Algèbre Linaire). Nous devons donc avoir:

(14.64)

C'est une des conditions pour qu'une expression assimilable à une norme sous une écriture tensorielle forme
dans le cadre d'une théorie physique un espace vectoriel des états du système !!

Remarques:

R1. Le nombre de signes + et - se trouvant dans l'expression du produit scalaire constitue une caractéristique
d'un espace vectoriel donné ; elle est appelée la "signature de l'espace vectoriel" .

R2. Une application pratique des calculs de la métrique est proposée dans le chapitre de Relativité Générale.

A partir des coefficients du tenseur métrique covariant définissant la métrique de l'espace , nous
pouvons introduire les coefficients du "tenseur métrique contravariant" définissant la métrique d'un
"espace dual" par la relation :

(14.65)

En d'autres termes, le tenseur métrique est son propre inverse. Nous le démontrerons explicitement plus loin
en montrant lors de notre étude du déterminant de Gram que les composantes contravariantes et covariantes
d'un espace euclidien sont égales.

Remarque: L'espace est aussi appelée "espace primal".

L'espace dual est sous-tendu par n vecteurs de base construite à partir des vecteurs tel que :

(14.66)

Il est dès lors facile de voir que le produit scalaire des vecteurs définit la métrique de l'espace dual :

(14.67)

tandis que les vecteurs (contravariants) et (covariants) sont bien orthogonaux :

(14.68)
Nous pouvons exprimer aussi un vecteur dans la base duale par l'écriture suivante en remarquant bien
évidemment que la position des indices muets est inversée :

(14.69)

Remarque: Les composantes sont nommées, pour des raisons que nous verrons plus loin, les
composantes covariantes.

Ce qui est important c'est que nous avons finalement la possibilité de passer aussi les vecteurs d'une base à
l'autre :

(14.70)

où ce qu'il est important de retirer est que : (14.71)

et inversement, de la même manière que : (14.72)

DÉTERMINANT DE GRAM

Voyons une autre approche pour obtenir les vecteurs de base de l'espace dual qui peut permettre par ailleurs
de mieux appréhender le concept et qui nous permettra par ailleurs d'obtenir un résultat intéressant que nous
utiliserons lors de certains calculs de la relativité générale (principalement son étude selon le formalisme
lagrangien) .

Nous avons donc pour : (14.73)

Ce produit scalaire peut être vu comme une condition de normalisation pour les deux bases et les deux
produits scalaires comme des conditions d'orthogonalisation. Ainsi, comme est

perpendiculaire à nous pouvons écrire : (14.74)

Où est une constante de proportionnalité. Maintenant jouons un peu avec la relation précédente :

(14.75)

Dès lors, nous obtenons : (14.76)

où nous voyons apparaître le produit mixte tel que nous l'avions défini dans le chapitre de Calcul Vectoriel.

Ainsi, nous obtenons très facilement : (14.77)

ou de manière plus générale (sans démonstration car peut-être trop évident) nous avons donc pour les
vecteurs covariants :
(14.78)

et de même pour les vecteurs contravariants (sans démonstration car peut-être trop évident) :

(14.79)

Remarque: Un petit calcul rapide de tête montre que les bases duales des systèmes cartésiens (comme les
systèmes à coordonnées cylindriques, polaires ou sphérique par exemple) sont les systèmes cartésiens eux-
mêmes. En d'autres termes, dans un système de coordonnées cartésiennes, il n'y a pas de différence entre les
composantes covariantes et contravariantes puisque

Revenons maintenant sur quelque chose qui va nous sembler bien ancien... Dans le chapitre de Calcul
Vectoriel, nous avons définis et étudiés ce qu'étaient le produit vectoriel et le produit mixte. Nous allons voir
maintenant une autre manière de représenter ceux-ci et voir que cette représentation permet d'obtenir un
résultat pour le moins pertinent!

Nous avons vu dans le chapitre de Calcul Vectoriel que le produit vectoriel était donné par :

(14.80)

Or, ce que nous n'avions pas vu et que nous pouvons constater maintenant de manière triviale c'est que cette
expression n'est que le déterminant des matrices suivantes :

(14.81)

Mais comme nous faisons du calcul tensoriel, il nous faut maintenant proprement distinguer composantes
covariantes et contravariantes. Nous allons donc récrire cela correctement avec les composantes
contravariantes :

(14.82)

De même, le produit mixte peut être écrit à l'aide de cette relation et notation :

(14.83)
Or, en regardant l'expression du déterminant nous voyons assez facilement, sans même avoir à faire les
développements (si vous ne le voyez pas n'hésitez pas à nous le dire nous détaillerons!) que :

(14.84)

Ce qui est fréquemment noté :

(14.85)

avec :

(14.86)

appelé "volume euclidien" (effectivement rappelons que le produit mixte est un volume!)

Remarque: Rappelons encore une fois que si les vecteurs de base sont orthonormés, qu'ils soient exprimés
en coordonnées cartésiennes, cylindriques ou sphériques alors :

(14.87)

Par ailleurs, nous avons aussi la relation non moins importante :

(14.88)

En utilisant la relation vue dans le chapitre de Calcul Vectoriel :

(14.89)

Or, nous avons vu plus haut que donc :

(14.90)

et finalement :

(14.91)

Ceci ayant été fait revenons à la relation du produit vectoriel :


(14.92)

et exprimons les composantes du déterminant dans leur base duale (en coordonnées covariantes) :

(14.93)

Bien évidemment, si le produit vectoriel est exprimé en composantes covariantes alors nous avons :

(14.94)

Maintenant appliquons le produit mixte :

(14.95)

en connaissant l'expression du déterminant d'une matrice carrée (cf. chapitre d'Algèbre Linéaire) il
vient immédiatement :

(14.96)

Inversement, il vient immédiatement :


(14.97)

Or, nous avons vu que dans le chapitre de Calcul Vectoriel que . Il vient alors :

(14.98)

et donc :

(14.99)

Cette dernière relation étant souvent appelée "déterminant de Gram". Un cas particulier très intéressant nous
donne :

(14.100)

écrit autrement :

(14.101)

Ainsi, le volume euclidien est donné par ce que nous appellerons le "déterminant fonctionnel" du système
(expression que nous retrouverons en relativité générale et théorie des cordes):

(14.102)

Si nous notons autrement le déterminant :

(14.103)

COMPOSANTES CONTRAVARIANTES ET COVARIANTES

Jusqu'à maintenant nous avons écrit les indices muets arbitrairement en exposant ou en indice selon notre
bon vouloir. Cependant, cela n'est pas toujours autorisé et parfois le fait qu'un indice muet soit en exposant
ou en indice à une signification bien particulière. Ceci constitue souvent la difficulté lors de l'étude de
certains théorèmes, car si nous n'étudions pas ceux-là depuis le début, nous ne savons pas vraiment comme
interpréter la position des indices muets. Il faut donc être extrêmement prudent à ce niveau.

Pour un espace vectoriel euclidien rapporté à une base quelconque , le produit scalaire d'un vecteur
par un vecteur de sa base s'écrit:

(14.104)

Donc :

(14.105)

Cette relation est de première importance en physique théorique et en calcul tensoriel. Il est important de
s'en souvenir pour lorsque nous étudierons la contraction des indices plus tard (vous pouvez observer dans la
relation précédente que nous avons "abaissé" l'indice des composantes du membre droit de l'égalité).

Ces produits scalaires notés , s'appellent les "composantes covariantes", dans la base , du vecteur .
Ces composantes sont donc définies par:

(14.106)

Remarque: Cela constitue donc une projection d'un vecteur sur un des vecteurs de sa propre base

Elles seront notées au moyen d'indices inférieurs !!! Nous verrons par la suite que ces composantes
s'introduisent naturellement pour certains vecteurs de la physique, par exemple le vecteur gradient. D'autre
part, la notion de composante covariante est essentielle pour les tenseurs.

Remarque: Les vecteurs de base ont toujours les indices notés en bas car ils sont leurs propres composantes
covariantes (ils se projettent sur eux-mêmes par produit scalaire).

Inversement, les "composantes contravariantes" (autrement dit les composantes non projetées) peuvent être
calculées en résolvant, par rapport aux n inconnues , le système de n équations de :

(14.107)

Les relations précédentes montrent que les composantes covariantes sont liées aux composantes
classiques et composantes contravariantes sont donc des nombres tels que:

(14.108)

Elles seront indiquées au moyen d'indices supérieurs !! L'étude des changements de base permettra de
justifier encore plus l'appellation des différentes composantes.

Dans une base orthonormée canonique (cas très particulier), les composantes covariantes et contravariantes
sont identiques comme nous le savons déjà suite à l'étude du déterminant de Gram. Effectivement :

(14.109)
Remarque: Nous voyons ci-dessus, que l'écriture incessante d'indices muets en exposants ou en indice peut
parfois amener à certaines confusions et à des maux de tête sérieux...

OPÉRATIONS DANS LES BASES

L'intérêt du physicien pour le calcul tensoriel, est le passage de paramètres d'une base à une autre pour des
raisons données (souvent dans le but soit de simplifier l'étude de problèmes ou simplement parce que les
états étudiés dépendant - ou peuvent dépendre - de la géométrie de l'espace dont il est question). Il convient
donc d'introduire les principaux outils qui y sont relatifs. Nous en profiterons aussi pour présenter des
développements que nous aurions pu déjà aborder dans le chapitre de Calcul Vectoriel.

MÉTHODE D'ORTHOGONALISATION DE SCHMIDT

La "méthode d'orthogonalisation de Schmidt" (dite également de "Grahm-Schmidt") permet le calcul effectif


d'une base orthogonale pour tout espace vectoriel pré-euclidien (nous aurions pu présenter cette méthode
dans le chapitre de Calcul Vectoriel mais il nous semblait plus intéressant de la présenter dans le cas général
et esthétique du calcul tensoriel).

Pour cela, considérons un ensemble de n vecteurs linéairement indépendants de et


supposons que nous ayons pour chaque vecteur le produit scalaire (la norme) :

(14.110)

Cherchons n vecteurs orthogonaux entre eux. Partons pour cela de et cherchons orthogonal à
sous la forme: (14.111)

Le coefficient se calcule en écrivant la relation d'orthogonalité:

(14.112)

Nous en déduisons sans trop de peine: (14.113)

La paramètre étant déterminé, nous obtenons le vecteur qui est orthogonal à et non nul puisque le
système est linéairement indépendant.

Le vecteur est cherché sous la forme:

(14.114)

Les deux relations d'orthogonalité: et , permettent le calcul des coefficients et .


Nous obtenons:

; (14.115)
ce qui détermine le vecteur , orthogonal à et , et non nul puisque le système est
indépendant. En continuant le même type de calcul, nous obtenons de proche en proche un système de
vecteurs orthogonaux entre eux et dont aucun n'est nul.

Dans le cas où certains vecteurs seraient tels que (leur norme est nulle), nous remplaçons par
, en choisissant un vecteur de telle sorte que nous obtenions .

Nous en déduisons donc que tout espace vectoriel pré-euclidien admet des bases orthogonales!

Ce système de calcul des bases est de première importance, il permet par exemple d'étudier des systèmes
physiques à partir d'un référentiel pré-euclidien dont les propriétés changent dans le temps. Ce qui est par
exemple typique de la relativité générale.

CHANGEMENTS DE BASES

Soient deux bases et d'un espace vectoriel . Chaque vecteur d'une base peut
être décomposé sur l'autre base sous la forme suivante (nous l'avons déjà démontré):

et (14.116)

Un vecteur de peut être décomposé sur chaque base sous la forme:

(14.117)

et nous avons aussi déjà démontré que:

et (14.118)

Nous remarquons que les relations de transformation des composantes contravariantes sont le contraire des
vecteurs de base, les grandeurs A et A' s'échangeant, d'où l'origine de l'appellation "contra"-"variantes" de
ces composantes!

Soient et les composantes contravariantes du vecteur respectivement sur les bases et .


Remplaçons les vecteurs de base, exprimés par les relations:

et (14.119)

dans l'expression de définition des composantes covariantes, il vient:

(14.120)

d'où la relation entre les composantes covariantes dans chaque base:

(14.121)

Nous obtenons de même: (14.122)


Nous remarquons que les composantes covariantes se transforment comme les vecteurs de bases, d'où
l'appellation de ces composantes.

BASES RÉCIPROQUES

Revenons maintenant sur le concept d'espace dual mais tel qu'il est vu dan le cadre du calcul vectoriel. Cette
deuxième approche peut peut-être aider certains à mieux comprendre le concept.

Soit une base quelconque d'un espace vectoriel euclidien . Par définition, n vecteurs qui vérifient
les relations suivantes:

(14.123)

sont appelés les "vecteurs réciproques" des vecteurs . Ils seront notés avec des indices supérieurs. Par
définition, chaque vecteur réciproque se doit donc d'être orthogonal à tous les vecteurs , sauf pour
.

Montrons que les vecteurs réciproques d'une base donnée sont linéairement indépendants. Pour cela, il
faut montrer qu'une combinaison linéaire donne un vecteur nul, si et seulement si chaque coefficient
est nul.

Soit un vecteur quelconque de . Multiplions scalairement par la combinaison linéaire


précédente , on obtient:

(14.124)

Cette dernière égalité devant être vérifiée quels que soient les , il est nécessaire que chaque soit nul et
ainsi les vecteurs sont donc linéairement indépendants (fallait déjà avoir l'idée de procéder ainsi n'est-ce
pas?).

Le système de n vecteurs réciproques forme donc une base appelée la "base réciproque" (qui n'est d'autre
que la base duale) de l'espace vectoriel .

Exemple:

Soit trois vecteurs formant une base (non nécessairement orthonormée) d'un espace vectoriel
euclidien. Nous décidons de noter :

(14.125)

où, rappelons-le, le symbole représente le produit vectoriel (au cas où il y aurait un petit oubli...). Les
vecteurs suivants:

(14.126)
vérifient la relation et constituent le système réciproque des vecteurs . En
cristallographie, ces vecteurs constituent ce que nous appelons "l'espace de Fourier associé".

Remarque: Nous reconnaissons ici les relations que nous avions déjà obtenues lors de notre étude du
déterminant de Gram.

TENSEURS EUCLIDIENS

La généralisation de la notion de vecteur nous a conduits à l'étude des espaces vectoriels à dimensions. Les
tenseurs sont également des vecteurs de dimension quelconque mais qui possèdent des propriétés
supplémentaires par rapport aux vecteurs.

Pour le physicien théoricien, le calcul tensoriel s'intéresse en premier lieu à la manière dont les composantes
des tenseurs se transforment lors d'un changement de base des espaces vectoriels dont ils sont issus. Nous
commencerons donc à étudier ces propriétés vis-à-vis des changements de base (car c'est le cas le plus
intéressant).

Un tenseur est, en pratique, souvent uniquement défini et utilisé sous la forme de ses composantes. Ces
dernières peuvent être exprimées sous forme covariante ou contravariante comme pour tout vecteur. Mais un
nouveau type de composantes va apparaître pour les tenseurs, ce sont les "composantes mixtes". Ces trois
types de composantes constituent des décompositions des tenseurs euclidiens sur des bases différentes.

TENSEUR FONDAMENTAL

Au cours de la théorie vu précédemment, nous avons utilisé les quantités , définies à partir du produit
scalaire des vecteurs de base d'un espace vectoriel pré-euclidien à n dimensions, par:

(14.127)

Ces quantités constituent les composantes covariantes d'un tenseur appelé le "tenseur fondamental" ou
"tenseur métrique".

Etudions comment varient les quantités lorsque nous effectuons un changement de base :

Soit une autre base liée à la précédente par les relations connues:

et (14.128)

Substituant la relation dans l'expression de , il vient (nous changeons les indices comme il se
doit lors d'une substitution):

(14.129)

Dans la nouvelle base , les produits scalaires des vecteurs de base sont donc des quantités telles que:

(14.130)
Nous avons donc finalement pour l'expression des composantes covariantes lors d'un changement de
base:

(14.131)

Identiquement nous avons :

(14.132)

De manière générale, une suite de quantités qui se transforment, lors d'un changement de base de ,
selon les deux relations précédentes, à savoir:

et (14.133)

constituent, par définition, les "composantes covariantes d'un tenseur d'ordre deux" (à deux indices) sur .

Nous pouvons ainsi manipuler des quantités exprimant les propriétés intrinsèques des bases comme des
tenseurs normaux !

PRODUIT TENSORIEL DE DEUX VECTEURS

Considérons un espace vectoriel euclidien de base et soient deux vecteurs de :

et (14.134)

Formons les produits deux à deux des composantes contravariantes et , soit:

(14.135)

Nous obtenons ainsi quantités, si les deux vecteurs ont le même nombre de composantes, qui constituent
également les composantes contravariantes d'un tenseur d'ordre deux appelé le "produit tensoriel" du vecteur
par le vecteur .

Par exemple pour de dimension 2 et de dimension 3 nous avons:

(14.136)

Nous pouvons bien évidemment construire des produits tensoriels d'ordre trois (donc avec termes) tels
que : (14.137) etc...
Etudions les propriétés de changement de base de ces composantes. Utilisons pour cela les relations de
changement de base des composantes contravariantes d'un vecteur, à savoir:

et (14.138)

Remplaçons dans la relation les composantes et par leur expression de changement de base,
il vient:

(14.139)

Les quantités sont les nouvelles composantes:

(14.140)

La formule de transformation des quantités lors d'un changement de base de est donc finalement
(très similaire au tenseur métrique):

(14.141)

Une telle relation de changement de base caractérise les composantes contravariantes d'un tenseur d'ordre
deux. Inversement, nous obtenons :

(14.142)

Les quantités constituent donc les "composantes contravariantes d'un tenseur d'ordre deux".

Nous pouvons former de même les produits deux à deux des composantes covariantes et des vecteurs
et soit:

(14.143)

Les formules de changement de base des composantes covariantes des vecteurs sont données par les
relations suivantes que nous avons déjà démontrées précédemment:

et (14.144)

Substituant la première relation dans le produit , il vient:

(14.145)

C'est la relation de changement de base des composantes covariantes d'un tenseur d'ordre deux. On vérifie
que l'on a:

(14.146)

Identiquement nous avons bien évidemment: puisque .


Les quantités constituent donc les "composantes covariantes d'un tenseur d'ordre deux".

Formons à présent quantités en multipliant deux à deux les composantes covariantes du vecteur par les
composantes contravariantes de , nous obtenons :

(14.147)

Effectuons un changement de base dans cette dernière relation en tenant compte des expressions
et , on obtient:

(14.148)

Cette relation de changement de base caractérise les "composantes mixtes" d'un tenseur d'ordre deux.
Inversement, on peut vérifier que l'on a:

(14.149)

Ces composantes mixtes constituent également des composantes du produit tensoriel de par , selon une
certaines base.

De manière générale, une suite de quantités qui se transforment, lors d'un changement de base de ,
selon les relations établies juste précédemment constituent donc, par définition, les "composantes mixtes
d'un tenseur d'ordre deux".

ESPACES TENSORIELS

Au cours de l'étude précédente, nous avons utilisé des systèmes de nombres, crées à partir d'un espace
vectoriel . Lorsque ces nombres vérifient certaines relations de changement de base, nous avons appelé
ces grandeurs, par définition, les "composantes d'un tenseur".

Nous avons vu que toute combinaison linéaire de ces composantes constitue les composantes d'autres
tenseurs. Nous pouvons donc additionner entre elles les composantes des tenseurs ainsi que les multiplier
par des scalaires, pour obtenir d'autres composantes de tenseurs. Ces propriétés d'addition et de
multiplication font que nous allons pouvoir utiliser ces grandeurs tensorielles comme composantes de
vecteurs.

D'un point de vue pratique, nous pourrions nous contenter de définir les tenseurs à partir des relations de
transformation de leurs composantes lors d'un changement de base. C'est ce qui est souvent fait en physique.
Cependant, la définition des tenseurs sous forme de vecteurs conduit à une meilleure compréhension de leurs
propriétés et les rattache à la théorie générale des vecteurs.

Pour préciser comment nous définissons un tenseur sur une base, étudions le cas particulier d'un produit
tensoriel de deux vecteurs constitués par des triplets de nombres. Considérons l'espace vectoriel euclidien
dont les vecteurs sont des triplets de nombre de la forme: . La base orthonormée
canonique de est formée de trois vecteurs :

(14.150)
avec (jolie façon d'écrire la chose n'est-il pas...).

Des vecteurs de permettent de former les neuf quantités que nous avons appelées les "composantes
du produit tensoriel" des vecteurs et .

Si nous effectuons tous les produits tensoriels possibles entre vecteurs de , nous obtenons des suites de
neuf nombres qui peuvent servir à définir le vecteur suivant :

(14.151)

Remarque: Nous voyons de suite avec la relation précédente que le produit tensoriel n'est dès lors pas
commutatif.

Nous nous retrouvons alors avec des éléments d'un espace vectoriel à neuf dimensions, ayant pour
éléments tous les multiplets formés de neuf nombres.

Ces vecteurs peuvent être décomposés, par exemple, sur une base canonique orthonormée :

(14.152)

avec .

Si nous renumérotons les quantités selon la place qu'elle occupent dans l'expression de , soit:

(14.153)

avec et , les vecteurs s'écrivent alors:

(14.154)

et constituent un exemple de tenseur d'ordre deux (évidemment on peut généraliser la démarche).

En quoi ces tenseurs diffèrent-ils des vecteurs ordinaires ? Ils sont certes identiques à certains vecteurs de
mais ils ont été formés à partir des vecteurs de et de . Pour rappeler ce fait, nous les notons :

(14.155)

et ils sont appelés "produits tensoriels d'ordre deux" des vecteurs et . Le symbole est donc défini de
la manière dont nous avons formé les quantités et l'ordre dans lequel nous les avons classées pour
former le vecteur .

Pour rappeler la dépendance entre une quantité et le vecteur de base auquel il est affecté,
renumérotons ces vecteurs en mettant à la place de l'indice k les deux indices i et j, relatifs aux composantes,
soit:

(14.156)
Ce dernier peut très bien être noté sous la forme:

(14.157)

Les vecteurs constituent donc une base de qui est appelée la "base associée".

Nous rappelons également que le produit tensoriel est non-commutatif (il est vraiment important de s'en
rappeler)! Autrement dit :

(14.158)

Les relations précédentes nous permettent finalement d'écrire le produit tensoriel des vecteurs et sous
la forme:

(14.159)

L'espace vectoriel est doté d'une structure plus précise que celle de simple espace vectoriel de dimension
neuf lorsque nous définissons les produits tensoriels comme constituant la base de . Nous disons
que est doté d'une "structure de produit tensoriel" ce qui nous amène à noter cet espace ou
encore .

En tant qu'élément d'un espace , un tenseur est un vecteur de la forme générale:

(14.160)

Etudions ses propriétés vis-à-vis d'un changement de base de tel que:

et (14.161)

Lors d'un tel changement, la base associée à devient une autre base associée à ,à
savoir:

(14.162)

Par suite, le produit tensoriel a pour composantes dans la nouvelle base:

(14.163)

Soit donc :

(14.164)

Nous avons les propriétés suivantes pour le produit tensoriel:

P1. Distributivité, à gauche et à droite, par rapport à l'addition des vecteurs :


(14.165)

La démonstration de ces propriétés découle simplement de la définition du produit tensoriel. Nous avons par
exemple :

(14.166)

P2. Associativité avec la multiplication par une grandeur scalaire :

(14.167)

Nous avons en effet :

(14.168)

P3. Lorsque nous choisissons une base dans chacun des espaces vectoriels pour , pour , les
éléments de que nous notons forment également une base de .

Démonstration:

Déjà faite dans l'exemple particulier que nous avons utilisé au début.

Remarque: En pratique, nous avons souvent à utiliser des tenseurs formés à partir de vecteurs appartenant à
des espaces vectoriels identiques .

Nous pouvons bien évidemment généraliser le produit tensoriel à un nombre quelconque de vecteurs. De
proche en proche, compte tenu de la propriété P1, nous pouvons considérer vecteurs
appartenant chacun à des espaces vectoriels différents . Si nous avons :

(14.169)

nous pouvons former le produit tensoriel :

(14.170)

avec .

Nous construisons ainsi des produits tensoriels d'ordre p appartenant à l'espace vectoriel
, espace qui est muni d'une structure de produit tensoriel. Les éléments de cet espace
constituent par définition des tenseurs d'ordre p.

Afin d'unifier la classification, les espace vectoriels élémentaires, qui ne peuvent êtres munis d'une structure
de produit tensoriel, peuvent êtres considérés comme ayant pour éléments des tenseurs d'ordre un. En
général, nous appelons ces éléments des "vecteurs", réservant le nom de "tenseurs" à des éléments d'espaces
tensoriels d'ordre égal ou supérieur à deux !
Remarque: Il est commode d'appeler "tenseurs d'ordre zéro" les grandeurs scalaires. Il est également rare de
rencontrer des tenseurs d'ordre supérieur à 2.

Il est assez évident et nous ne ferons pas la démonstration (excepté s'il y a une demande) que nous pouvons
redéfinir absolument tous les concepts (base, décomposition sur une base, base réciproque, produit scalaire,
produit tensoriel) que nous avons vu jusqu'à maintenant en considérant les tenseurs d'ordre deux comme des
vecteurs (il faudrait donc que nous réécrivions tout ce qui est déjà écrit ci-dessus... ce qui est inutile).

Il est aussi tout à fait possible de réitérer toutes ces définitions pour des tenseurs d'ordre supérieurs et ainsi
généraliser le concept d'espace tensoriel pour toutes les dimensions.

De ces considérations, nous pouvons énoncer le "critère de tensorialité":

Pour qu'une suite de quantités, rapportées à une base d'un espace vectoriel , puisse être considérée
comme les composantes d'un tenseur, il faut et il suffit que ces quantités soit liées entre elles, dans deux
bases différentes de , par les relations de transformation des composantes.

Exemple:

Un vecteur peut se représenter dans un base quelconque par une suite de n composantes. Cependant, nous ne
pouvons pas conclure que n'importe quelle suite de n chiffres constitue un vecteur. En effet, lorsque nous
nous plaçons dans une autre base de l'espace, les composantes doivent changer également, pour représenter
le même objet: nous disons alors que le vecteur est un objet intrinsèque (dont l'existence ne dépend pas du
choix du repère). Il reste alors à savoir qu'un vecteur est un tenseur d'ordre 1.

COMBINAISONS LINÉAIRES DE TENSEURS

Nous pouvons former d'autres tenseurs en combinant entre elles les composantes de différents produits
tensoriels définis à l'aide des vecteurs d'un même espace vectoriel. Considérons par exemple les
composantes contravariantes des produits tensoriels des vecteurs et :

(14.171)

Formons les quantités suivantes:

(14.172)

Les quantités vérifient également les formules générales de changement de base. Nous avons en effet,
en substituant les relations de transformation des composantes contravariantes d'un produit tensoriel dans
l'expression précédente :

(14.173)

Les quantités de , vérifiant la relation de changement de base, constituent donc également des
composantes contravariantes d'un tenseur d'ordre deux.

CONTRACTION DES INDICES

Considérons le produit tensoriel mixte de deux vecteurs et de composantes respectives contravariantes


et covariantes . Les composantes mixtes du produit tensoriel de ces deux vecteurs, sont:
(14.174)

Effectuons l'addition des différentes composantes du tenseur telle que , soit:

(14.175)

Nous obtenons ainsi l'expression du produit scalaire des vecteurs et ; la quantité est un scalaire ou
tenseur d'ordre zéro. Une telle addition sur des indices de variance différente constitue, par définition,
l'opération de "contraction des indices" du tenseur . Cette opération a permis de passer d'un tenseur
d'ordre deux à un tenseur d'ordre zéro; le tenseur a été amputé d'une covariance et d'une contravariance.

Prenons également l'exemple d'un tenseur dont les composantes mixtes sont (attention... il ne s'agit
pas d'une matrice tridimensionnelle mais simplement de l'indication que les composantes de ce tenseurs
s'expriment à partir de trois autres variables). Considérons certaines de ses composantes telles que ,à
savoir les quantités et effectuons l'addition de ces dernières; nous obtenons:

(14.176)

Ces nouvelles quantités forment les composantes d'un tenseur d'ordre un (donc un vecteur). Les
quantités constituent des "composantes contractées" du tenseur et satisfont bien évidemment aux
relations de changement de base (sur demande nous pouvons faire la démonstration mais sachez qu'elle est
similaire à celle que nous avions faite pour les vecteurs). Nous sommes ainsi passé d'un tenseur d'ordre trois
à un tenseur d'ordre un.

Si nous partons de l'expression des composantes contravariantes ou covariantes d'un tenseur, nous pouvons
abaisser l'un des indices par multiplication de ou (métrique diagonale unitaire et à signature positive :
de type canonique) et sommation, afin d'obtenir des composantes mixtes sur lesquelles nous pouvons ensuite
effectuer les opérations de contraction.

Considérons un tenseur euclidien de composantes contravariantes . Ecrivons les composantes


mixtes de en abaissant à la position covariante l'indice (cela revient donc à exprimer les composantes
d'un des vecteurs implicites en composantes covariantes). Alors:

(14.177)

Effectivement, rappelons que :

(14.178)

Maintenant que nous avons un tenseur à composantes, mixtes, nous pouvons très bien contracter les indices.
Choisissons par exemple l'indice et effectuons la contraction avec l'indice , posons (nous
nous intéressons alors plus qu'à certains termes particuliers), il vient:

(14.179)

Nous obtenons donc après abaissement de l'indice et contraction, un tenseur d'ordre .


Remarque: Par suite de la symétrie des quantités (produit scalaire est commutatif) ce dernier tenseur est
identique à celui que nous obtiendrons en abaissant à la position covariante l'indice puis en effectuant la
contraction avec l'indice :

(14.180)

De manière générale, la contraction d'un tenseur permet donc de former un tenseur d'ordre à partir
d'un tenseur d'ordre p. Nous pouvons naturellement répéter l'opération de contraction. Ainsi, un tenseur pair,
2p, deviendra un scalaire après p contractions et un tenseur d'ordre impair, , deviendra un vecteur.

Nous pouvons étendre après cette définition de la contraction des indices, le critère de tensorialité. Nous
avons vu jusqu'à maintenant, deux manières de reconnaître le caractère tensoriel d'une suite de quantités :

- la première consiste à démontrer que ces quantités sont formées par le produit tensoriel de composantes de
vecteurs ou par une somme de produits tensoriel

- le deuxième consiste à étudier la manière dont ces quantités se transforment lors d'un changement de base
et à vérifier la conformité des relations de transformation.

- la troisième et nouvelle amène à poser que pour qu'un ensemble de quantités, comportant p indices
supérieurs et q indices inférieurs soit tensoriel, il faut et il suffit que leur produit complètement contracté par
les composantes contravariantes de p vecteurs quelconques et les composantes covariantes de q vecteurs
quelconques, soit une quantité (la norme au fait...) qui demeure invariante par changement de base.

TENSEURS PARTICULIERS

Nous pouvons être confrontés en physique théorique à des tenseurs qui ont des propriétés intéressantes. Afin
d'éviter de faire un travail redondant au cas par cas, nous allons énumérer et démontrer les différentes
propriétés existantes et parler de leurs possibles implications.

TENSEUR SYMÉTRIQUE

Considérons un tenseur d'ordre deux contravariantes . Supposons que, suivant une base , toutes
ces composantes satisfassent aux relations:

(14.181)

Sur une autre base , liée à la précédente par les relations de transformation connues, les nouvelles
composantes de vérifient la relation:

(14.182)

Nous voyons que la propriété est donc une caractéristique intrinsèque du tenseur , indépendante
de la base ! Nous disons alors que le tenseur est un "tenseur symétrique".

La propriété de symétrie se vérifie également pour les composantes covariantes d'un tenseur symétrique
puisque nous avons:
(14.183)

Réciproquement, la symétrie des composantes covariantes entraîne celle des composantes contravariantes.

Pour des tenseurs d'ordre plus élevé, la symétrie peut être partielle, portant sur deux indices covariants ou
deux indices contravariants. Ainsi, un tenseur d'ordre quatre, de composantes mixtes peut être
également symétrique en i et j, par exemple, soit:

(14.184)

Nous vérifions, de même que ci-dessus, qu'une telle propriété est intrinsèque.

Un tenseur est dit "tenseur complètement symétrique" si toute transposition de deux indices de même
variance, change la composante correspondante en elle-même. Par exemple, pour un tenseur d'ordre trois
, complètement symétrique, nous avons les composantes suivantes qui sont égales entre elles:

(14.185)

Des exemples de tenseurs compléments symétriques sont le tenseur des contraintes que nous verrons lors
de notre étude des équations de Navier-Stokes en mécanique des fluides et les tenseurs des transformations
relativistes de Lorentz que nous verrons en mécanique relativiste. Ces tenseurs sont alors dits aussi "tenseurs
totalement invariants" (sous-entendu par changement de base).

Nous pouvons également (curiosité intéressante) obtenir une représentation géométrique des valeurs des
composantes d'un tenseur symétrique d'ordre deux. Pour cela, considérons dans l'espace géométrique
ordinaire des coordonnées , l'équation suivante:

(14.186)

où, rappelons-le, peut-être vu comme un produit tensoriel avec et où les sont des
coefficients réels donnés. Supposons que ces coefficients soient tels que:

(14.187)

L'équation précédente s'écrit alors:

(14.188)

Nous retrouvons ici l'équation d'une surface de second degré ou quadrique similaire à celle du plan que nous
avons vue en géométrie plane. Nous savons que par extension à la troisième dimension que ces surfaces sont
des ellipsoïdes ou hyperboloïdes, selon les valeurs des quantités .

Etudions comment se transforment les quantités lorsque nous effectuons un changement de coordonnées
tel que :

et (14.189)
L'équation de la quadrique s'écrit dans ce nouveau système de coordonnées:

(14.190)

d'où l'expression des coefficients dans le nouveau système d'axes:

(14.191)

Les coefficients se transforment donc comme les composantes covariantes d'un tenseur d'ordre deux.
Réciproquement, si les quantités sont les composantes d'un tenseur symétrique, ces composantes
définissent les coefficients d'une quadrique. Il existe donc une certaine équivalence entre un tenseur
symétrique et les coefficients d'une quadrique. Nous dirons que l'équation de la quadrique est la "quadrique
représentative" du tenseur symétrique.

Nous savons de par notre étude des quadriques en géométrie plane (en étendant cela au cas tridimensionnel)
que nous pouvons toujours trouver un système de coordonnées par rapport auquel l'équation d'une quadrique
prend une forme plus simple:

(14.192)

Dans ce cas, les vecteurs de base sont portés par les axes principaux de la quadrique. Dans ce système de
coordonnées, les composantes du tenseur se réduisent à:

(14.193)

et pour les autres composantes. Les quantités sont appelées les "composantes principales" du
tenseur .

Si les quantités sont positives, la surface est une ellipsoïde, si deux quantités sont strictement
positives et la troisième strictement négative, nous avons un hyperboloïde à une nappe, si deux quantités
sont strictement négatives et la troisième positive, nous avons un hyperboloïde à deux nappes (pour plus
d'information voir le chapitre de Géométrie Analytique).

La comparaison de l'expression de la quadrique obtenue précédemment avec l'équation classique:

(14.194)

où a,b,c sont les demi-axes d'un ellipsoïde montre que nous avons :

(14.195)

TENSEUR ANTISYMÉTRIQUE

Lorsque les composantes contravariantes d'un tenseur d'ordre deux, vérifient les relations:
(14.196)

nous disons que le tenseur est un "tenseur antisymétrique". C'est une propriété intrinsèque du tenseur qui se
démontre comme pour les tenseurs symétriques, au signe "-" près. Un tenseur antisymétrique doit bien
évidemment satisfaire au fait que ces composantes diagonales soient nulles tel que:

(14.197)

Si les composantes contravariantes d'un tenseur sont antisymétriques, ses composantes covariantes le sont
également.

Un tenseur sera partiellement antisymétrique si nous avons par exemple:

(14.198)

Il sera complètement antisymétrique si toute transposition d'indice de même variance change la composante
correspondante en son opposée.

Tout tenseur peut être mis sous la forme d'une somme d'un tenseur symétrique et d'un tenseur
antisymétrique. Nous avons en effet:

(14.199)

Le premier terme de la somme ci-dessus est un tenseur symétrique et le second, un tenseur antisymétrique.

Considérons maintenant deux vecteurs et d'un espace vectoriel . Formons les quantités
antisymétriques suivantes (nous y trouvons deux produits tensoriels):

(14.200)

où nous voyons immédiatement que les composantes sont celles d'un tenseur antisymétrique .

La décomposition du vecteur dans la base s'écrit:

(14.201)

Le tenseur (noté ainsi en analogie avec le produit vectoriel pour ) est appelé le "produit
extérieur" des vecteurs et . Nous disons encore que ce tenseur est un "bi-vecteur".

Le produit extérieur est donc un tenseur antisymétrique qui vérifie les propriétés suivantes:

P1. Anticommutativité: , il en résulte:

(14.202)

P2. Distributivité à gauche et à droite pour l'addition vectorielle:


(14.203)

P3. Associativité pour la multiplication par un scalaire:

(14.204)

P4. Les produits extérieurs:

(14.205)

constituent une base de l'ensemble des bi-vecteurs.

Démonstration:

Un tenseur antisymétrique d'ordre deux, élément de , peut s'écrire sous la forme:

(14.206)

Echangeant, dans la dernière somme de la relation ci-dessus, le nom des indices et en tenant compte que
, nous obtenons :

(14.207)

Les éléments:

(14.208)

sont linéairement indépendants puisque les vecteurs le sont également. Ces éléments constituent
donc une base sur laquelle les tenseurs antisymétriques peuvent êtres décomposés.

Le nombre de vecteurs distinguables est égal au nombre de combinaisons de vecteurs pris


deux à deux et distinguables parmi n tel que:

(14.209)

Effectivement parmi les composantes, n composantes sont nulles et les autres composantes ont
des valeurs opposées deux à deux. Nous pouvons donc considérer que la moitié de ces dernières suffit à
caractériser le tenseur.

Dans le cadre du produit tensoriel où nous avons:

(14.210)

le nombre de composantes distinguables est également de et elles sont appelées "composantes


strictes".
Nous remarquons que pour , le nombre de composantes strictes du produit extérieur de deux vecteurs
est aussi égal à trois. Ceci permet de former avec les composantes du bivecteur, les composantes d'un
produit vectoriel .

Ainsi, un produit vectoriel n'existe donc que pour un sous-espace de bi-vecteurs dont le nombre de
dimension est égal à 3 et dont les pré-images sont des tenseurs antisymétriques.

Si toutes ces conditions sont satisfaites, nous disons que le vecteur constitue le "tenseur adjoint" du
tenseur .

TENSEUR FONDAMENTAL

Nous avons vu au début de notre étude du calcul tensoriel la définition des composantes covariantes du
tenseur fondamental, à savoir :

(14.211)

Ces quantités interviennent, nous le savons, dans l'expression du produit scalaire de deux vecteur et , de
composantes contravariantes et , donné par la relation:

(14.212)

Utilisons le critère général de tensorialité pour mettre en évidence le caractère tensoriel des . L'expression
précédente est un produit complètement contracté des quantités avec les composantes contravariantes
d'un tenseur arbitraire. Comme le produit scalaire est une quantité invariante (en l'occurrence un
scalaire) par rapport aux changements de base, il en résulte que les quantités sont les composantes
covariantes d'un tenseur.

Ce tenseur est de plus symétrique par suite de la propriété symétrie du produit scalaire des vecteurs de base
tel que:

(14.213)

Nous avons de même pour les composantes contravariantes du tenseur fondamental :

(14.214)

Si nous notons les composantes mixtes du tenseur fondamental à lui même:

(14.215)

avec évidemment dans la base canonique :

(14.216)
COORDONNÉES CURVILIGNES

Les notions classiques de système de coordonnées peuvent être généralisées à des espaces ponctuels (voir le
chapitre traitant des Principes) à n dimensions. Nous appelons "système de coordonnées" dans (espace
ponctuel à n dimensions donc), tout mode de définition d'un point M dans le système considéré.

Pour un système donné de coordonnées (cartésiennes, sphériques, cylindriques, polaires...), nous appelons
"ligne coordonnée" le "lieu" des points M lorsqu'une seule coordonnée varie, les autres étant égales à des
constantes.

Etudions tout d'abord la généralisation d'un système de coordonnées relatives à un repère fixe (nous
conseillons vivement au lecteur d'avoir lu au préalable la partie traitant des systèmes de coordonnées dans le
chapitre de Calcul Vectoriel et la partie traitant du formalisme lagrangien dans le chapitre Principes).

Considérons un espace ponctuel et un repère de cet espace. Soit les coordonnées rectilignes d'un
point M de par rapport à ce repère. Un système de coordonnées quelconque , , est obtenu
en se donnant n fonctions arbitraires des paramètres , telles que:

(14.217)

Nous supposerons par la suite que les n fonctions satisfont aux trois propriétés suivantes:

P1. Elles sont de classe supérieur ou égal à (dérivables au moins deux fois pour les besoins de la
physique). Cette hypothèse implique, en tout point où elle est satisfaite, que nous avons la permutabilité des
dérivations (par rapport aux deux dérivations):

(14.218)

P2. Ces fonctions sont telles que nous pouvons résoudre le système des n équations de changement de
système de coordonnées par rapport aux variables et les exprimer en fonction des , soit:

(14.219)

toujours avec .

P3. Lorsque les variables varient dans un domaine , les variables varient dans un domaine . Le
jacobien des fonctions , défini par:

(14.220)

sera supposé différent de zéro dans le domaine ainsi que le jacobien des fonctions
qui est l'inverse du jacobien . Si les jacobiens existent, ils sont
non nuls comme conséquence en première lieu de la deuxième propriété ci-dessus et implicitement de la
première.
Si nous fixons paramètres en faisant varier un seul paramètre, par exemple, nous obtenons les
coordonnées d'un ensemble de points M de qui constituent une "ligne coordonnée".

En général, les lignes coordonnées ne sont pas des droites mais des courbes; ces coordonnées sont
appelées pour cette raison des "coordonnées curvilignes". En un point M de se croisent d'ailleurs n lignes
coordonnées.

Nous démontrons en mécanique analytique, lors de l'étude des espaces ponctuels, que les dérivées et les
différentielles d'un vecteur de sont indépendantes du point O d'un repère donné. Si est rapporté à
un système de coordonnées curvilignes , nous écrivons :

(14.221)

Exemple:

Un exemple de coordonnées curvilignes , où chaque est une fonction uniforme des coordonnées
rectilignes et de plus des fonctions continues du point courant M, est celui des coordonnées sphériques
où nous avons (cf. chapitre de Calcul Vectoriel) :

(14.222)

Rappelons aussi que lors de notre étude du système de coordonnées sphériques en calcul vectoriel nous
avions obtenu :

(14.223)

Ainsi, nous voyons bien cette dépendance sous l'expression des relations suivantes :

(14.224)

Dans un espace non euclidien, nous ne pouvons définir une base valable dans tout l'espace. Ainsi, nous
construisons une base en chaque point séparément et pour cela, nous utilisons bien les coordonnées
curvilignes telles qu'en chaque point M, les vecteurs de base sont tangents à la ligne de coordonnées
correspondante via la relation donnée plus haut :

(14.225)

Soient maintenant les coordonnées curvilignes du point M par rapport à une repère cartésien
. Dans ce repère, nous avons bien évidemment :
(14.226)

où les coordonnées cartésiennes sont des fonctions .

Le vecteur a donc pour expression:

(14.227)

A partir des composantes du vecteur , nous pouvons former un déterminant qui est
précisément le jacobien des fonctions que nous avions défini précédemment. Puisque ce déterminant est
différent de zéro (du moins imposé tel quel), il en résulte que les n vecteurs sont linéairement
indépendants.

Ces n vecteurs, définis par la relation :

(14.228)

sont appelées la "base naturelle" au point M de l'espace vectoriel . Il sont colinéaires aux tangentes des
n lignes coordonnées qui se coupent au point M où ils sont définis.

Nous n'insisterons pas sur le fait évident qu'à tout système de coordonnées curvilignes sont associées des
repères naturels dont les bases sont exprimées par ses mêmes coordonnées (cf. chapitre de Calcul Vectoriel).

Exemple:

En coordonnées sphériques, les vecteurs de la base naturelle sont ceux que nous avons obtenus lors de notre
étude du système de coordonnées sphériques dans le chapitre de Calcul Vectoriel et qui sont orthogonaux
mais non orthonormés.

Associons au point M de un repère formé par le point M et par les vecteurs de la base naturelle. Ce
repère est appelé le "repère naturel" en M du système de coordonnées . Il sera noté:

ou (14.229)

La différentielle du vecteur s'exprime alors sous la forme:

(14.230)

Les quantités constituent les composantes contravariantes du vecteur dans le repère naturel
du système de coordonnées .

Considérons maintenant deux systèmes quelconques de coordonnées curvilignes et , liées entre elles
par les relations:

(14.231)
où les fonctions sont supposées plusieurs fois continument dérivables par rapport aux
et de même pour les fonctions par rapport aux coordonnées . Lorsque nous
passons d'un système de coordonnées à un autre, nous disons que nous effectuons un "changement de
coordonnées curvilignes".

Nous avons vu en relativité générale que le carré de la distance entre deux points M et M' infiniment
proches est donné par la relation:

(14.232)

où les sont les composantes du vecteur , rapportées à un repère fixe d'un espace ponctuel
. Lorsque cet espace est rapporté à un système de coordonnées curvilignes , nous avons vu que la
relation:

(14.233)

montre que le vecteur a pour composantes contravariantes les quantités par rapport au repère
naturel . Le carré de la distance s'écrit alors dans le repère naturel:

(14.234)

où les quantités sont les composantes du tenseur fondamental ou du tenseur métrique définies à
l'aide d'une base naturelle. L'expression précédente s'appelle "l'élément linéaire de l'espace ponctuel" ou
encore la "métrique" de cet espace.

Les vecteurs du repère naturel varient en général d'un point un autre. C'est le cas, par exemple, des
coordonnées sphériques dont les quantités (nous le démontrerons de suite après) sont variables !!

Une courbe de peut être définie par la donnée des coordonnées curvilignes du lieu des points
en fonction d'un paramètre . La distance élémentaire ds sur cette courbe s'écrit alors:

(14.235)

REPÈRE NATUREL EN COORDONNÉES SPHÉRIQUES

Déterminons la base naturelle de l'espace vectoriel associé à l'espace ponctuel de la géométrie


ordinaire, en coordonnées sphériques. Ecrivons l'expression des vecteurs dans un repère cartésien fixe
qui sont par définition (voir le chapitre de Calcul Vectoriel pour plus de détails) :

(14.236)

Les vecteurs des la base naturelle étant donnés par:


(14.237)

Nous avons ainsi :

(14.238)

La dérivée de par rapport à donne le vecteur :

(14.239)

La dérivée par rapport à donne le vecteur :

(14.240)

Ces trois vecteurs sont orthogonaux entre eux ainsi que nous le vérifions aisément en effectuant les produits
scalaires . Lorsqu'il en est ainsi, nous disons que les coordonnées sont des "coordonnées curvilignes
orthogonales".

Ces vecteurs ne sont cependant pas tous normés, puisque nous avons:

(14.241)

Le repère naturel, en coordonnées sphériques, est donc formé par des vecteurs variables en direction en en
module en chaque point de M. Les quantités constituent un exemple de tenseur métrique attaché à
chacun des points M de l'espace .

L'élément linéaire du plan est donné par (les détails des calculs peuvent êtres trouvés dans le chapitre de
Relativité Générale):

(14.242)

REPÈRE NATUREL EN COORDONNÉES POLAIRES

Déterminons la base naturelle de l'espace vectoriel associé à l'espace ponctuel de la géométrie


ordinaire, en coordonnées polaires. Ecrivons l'expression des vecteurs dans un repère fixe cartésien
qui sont par définition (voir le chapitre de Calcul Vectoriel pour plus de détails):

(14.243)

Les vecteurs des la base naturelle étant donnés par:

(14.244)
Nous avons:

(14.245)

La dérivée de par rapport à donne le vecteur :

(14.246)

Ces deux vecteurs sont orthogonaux entre eux ainsi que nous le vérifions aisément en effectuant les produits
scalaires .

Nous avons:

(14.247)

L'élément linéaire du plan est alors donné par (cf. chapitre de Relativité Restreinte):

(14.248)

REPÈRE NATUREL EN COORDONNÉES CYLINDRIQUES

Déterminons la base naturelle de l'espace vectoriel associé à l'espace ponctuel de la géométrie


ordinaire, en coordonnées cylindriques. Ecrivons l'expression des vecteurs dans un repère fixe
cartésien qui sont par définition (voir le chapitre de Calcul Vectoriel pour plus de détails):

(14.249)

Les vecteurs des la base naturelle étant donnés par:

(14.250)

Nous avons:

(14.251)

La dérivée de par rapport à donne le vecteur :

(14.252)

et enfin:

(14.253)

Ces trois vecteurs sont orthogonaux entre eux ainsi qu'on le vérifie aisément en effectuant les produits
scalaires .
Nous avons:

(14.254)

L'élément linéaire du plan est alors donné par (cf. chapitre de Relativité Restreinte):

(14.255)

SYMBOLES DE CHRISTOFFEL

L'étude des champs de tenseurs constitue, pour le physicien, l'essentiel de l'analyse tensorielle. Le tenseur
générique de ce champ est une fonction du point M et nous le notons:

(14.256)

Si le tenseur est une fonction seulement de M, le champ considéré est appelé un "champ fixe". Si est,
en outre, une fonction d'un ou plusieurs paramètres autres que les coordonnées de M, nous disons alors
que ce champ est variable et nous le notons :

(14.257)

Les différentes opérations algébriques sur les tenseurs associés à un même point M ne soulèvent pas
de difficulté particulière. La dérivée de par rapport à un paramètre conduit à utiliser les résultats
classiques relatifs à la dérivation des vecteurs.

Cependant, une difficulté apparaît lorsque nous cherchons à calculer la dérivée d'un tenseur par
rapport aux coordonnées curvilignes. En effet, les composantes du tenseur sont définies en chaque point
M par rapport à un repère naturel qui varie d'un point à un autre.

Par suite, le calcul de la variation élémentaire, appelé "transport élémentaire" :

(14.258)

lorsque nous passons d'un point M à un point infiniment voisin M ' ne peut se faire que si nous avons recours
à une même base. Pour pouvoir comparer l'un à l'autre les tenseur et , nous sommes amenés à
étudier comment varie un repère naturel, pour un système de coordonnées donné, lorsque nous passons d'un
point M au point infiniment voisin M '.

Pour un système de coordonnée curvilignes donné d'un espace ponctuel un problème fondamental de
l'analyse tensorielle consiste donc à déterminer, par rapport au repère naturel au point M, le repère
naturel au point infiniment voisin M '. Nous disons alors que nous recherchons une "connexion
affine".

D'une part, le point M' sera parfaitement défini par rapport à M si nous déterminons le vecteur tel que
. Pour des coordonnées curvilignes , la décomposition d'un vecteur élémentaire est
donnée par la relation que nous avons démontré précédemment:
(14.259)

Les quantités étant les composantes contravariantes du vecteur sur la base naturelle .

D'autre part, les vecteurs vont pouvoir être déterminés en calculant les variations élémentaires des
vecteurs , par rapport au repère naturel , lorsque nous passons de M en M '; nous avons alors:

(14.260)

Le calcul des vecteurs reste alors le problème essentiel à résoudre. Nous allons tout d'abord étudier un
exemple de ce type de calcul en coordonnées sphériques.

Pour cela, reprenons l'expression des vecteurs de la base naturelle en coordonnées sphériques, soit:

(14.261)

Les vecteurs de base du repère fixe cartésien étant constants en module et en direction, la
différentielle du vecteur s'écrit:

(14.262)

Nous remarquons que les termes entre parenthèses représentent respectivement les vecteurs et ,
d'où:

(14.263)

Nous calculons de même, en différentiant les vecteurs :

(14.264)

Avec: (14.265)
nous avons:

(14.266)

Donc finalement:

(14.267)

Et:

(14.268)

Après quelques opérations algébriques élémentaires et très pertinentes (...), nous arrivons à:

(14.269)

Les différentielles sont ainsi décomposées sur la base naturelle . Si nous notons , les
composantes contravariantes du vecteur , celui-ci s'écrit (nous changeons les lettres d'indices):

(14.270)

Les composantes des vecteurs sont des formes différentielles (combinaisons linéaires de
différentielles). Nous avons, par exemple:

(14.271)

Si nous notons de manière générale les coordonnées sphériques, nous avons:

(14.272)

Les différentielles des coordonnées sont alors notées:

(14.273)

et les composantes s'écrivent alors de manière générale:

(14.274)
où les quantités sont des fonctions de qui vont être explicitement obtenues en identifiant chaque
composante . Par exemple, la composante s'écrit avec la notation de la relation précédente:

(14.275)

Identifiant les coefficients des différentielles, il vient:

(14.276)

En procédant de même avec les neuf composantes , nous obtenons les vingt sept (...) termes . Pour un
système de coordonnées curvilignes quelconques, ces quantités sont appelées les "symboles de
Christoffel de deuxième espèce" ou encore "fonctions euclidiennes de connexion affine".

Ainsi, pour un espace ponctuel et un système de coordonnées curvilignes quelconque, la différentielle


des vecteurs de la base naturelle s'écrit sur cette base:

(14.277)

Nous venons de voir, sur l'exemple des coordonnées sphériques, qu'un calcul direct permet, par
identification, d'obtenir explicitement les quantités . Nous allons voir que nous pouvons également
obtenir l'expression de ces quantités en fonction des composantes .

Le calcul des quantités en fonction des va nous amener à introduire d'autres symboles de Christoffel.
Pour cela, écrivons les composantes covariantes, notées , des différentielles , soit:

(14.278)

Les composantes covariantes sont également des combinaisons linéaires des différentielles que nous
pouvons écrire sous la forme:

(14.279)

Les quantités sont appelées les "symboles de Christoffel de première espèce".

Nous voyons très bien en parcourant à nouveau la définition du symbole de Christoffel que celui-ci est
symétrique:

(14.280)

et donc que :

(14.281)
Effectivement (suite à la demande d'un lecteur), puisque nous avons :

(14.282)

Il vient alors :

(14.283)

et en permutant les indices :

(14.284)

L'identification terme à terme du développement sur un cas concret des deux dernières relations donnera
(forcément) l'égalité :

(14.285)

que nous voulions prouver.

Puisque les composantes covariantes sont liées aux composantes contravariantes par les relations
(contraction des indices) :

(14.286)

nous obtenons l'expression liant les symboles de Christoffel de chaque espèce:

(14.287)

Inversement:

(14.288)

Remarque: Diverses notations sont utilisées pour représenter les symboles de Christoffel. Les plus usuelles
sont les suivantes:

- Symboles de première espèce:

(14.289)

- Symboles de deuxième espèce:

(14.290)

Considérons maintenant un espace ponctuel et soit un élément linéaire donné de cet espace:

(14.291)
Partant de:

(14.292)

nous obtenons par différentiation:

(14.293)

L'expression des différentielles nous donne:

(14.294)

L'expression représente la composante covariante du vecteur soit compte tenu des


composantes contravariantes en fonction des symboles de Christoffel:

(14.295)

substituant la relation dans l'expression précédente, nous obtenons alors :

(14.296)

La différentielle s'écrit alors :

(14.297)

D'autre part, la différentielle de la fonction s'écrit également :

(14.298)

d'où en identifient les coefficients des différentielles dans ces deux dernières expressions :

(14.299)

Comme nous avons :

(14.300)

Nous pouvons écrire l'avant dernière relation :

(14.301)

puis en effectuant une permutation circulaire sur les indices, nous obtenons :
(14.302)

En effectuant la somme :

(14.303)

et en retranchant :

(14.304)

En simplifiant il vient :

(14.305)

d'où :

(14.306)

C'est l'expression des symboles de Christoffel de première espèce en fonction des dérivées partielles des
composantes du tenseur fondamental.

Nous obtenons ceux de deuxième espèce à partir de la relation (par définition):

(14.307)

Les deux dernières expressions encadrées permettent le calcul effectif des symboles de Christoffel pour une
métrique donnée (d'où un énorme gain en calculs). Lorsque les quantités sont données à priori, nous
pouvons ainsi étudier les propriétés de l'espace ponctuel défini par la donne de cette métrique, ce qui est le
cas des espaces de Riemann que nous verrons plus loin.

Exemple:

Proposons-nous de calculer les correspondant au système de coordonnées polaires (ce sera déjà
suffisamment long...) dans le plan que nous noterons cette fois ci (contrairement au chapitre de Calcul
Vectoriel) en notation indicielle :
avec (14.308)

Nous allons calculer les symboles de Christoffel à partir de notre dernière relation :

(14.309)

Occupons nous de déterminer les composants de la métrique. Au fait, elles sont les mêmes que celles que
nous avions calculé pour les coordonnées cylindriques plus haut à la différence normalement évidente que
n'existe pas. Dès lors, nous avons :

(14.310)

Calculons alors les . Dans cet exemple c'est assez trivial, il suffit d'appliquer la relation démontrée au
début de ce chapitre :

(14.311)

Nous avons alors immédiatement :

(14.312)

Maintenant développons l'écriture de symboles de Christoffel pour ces coordonnées :


(14.313)

d'où en raison des propriétés de symétrie :

(14.314)

De même :

(14.315)
En résumé :

(14.316)

Et pour information dans le cas des coordonnées sphériques (le développement est primaire, ennuyant et
long donc j'ai pas trop envie de le faire...) :

(14.317)

tous les autres sont nuls.

THÉORÈME DE RICCI

Nous avons vu dans le chapitre de Relativité Restreinte que les géodésique sont les distances les plus courtes
entre deux points dans n'importe quel type d'espace. Ce qui va nous intéresser maintenant, c'est d'étudier les
variations d'un vecteur au cours d'un tel déplacement. Rappelons d'abord que l'équation des géodésique pour
un système de coordonnées curvilignes quelconque de l'espace ponctuel (cf. chapitre des Principes) est
donnée par (cf. chapitre de Relativité Générale) :

(14.318)

Considérons maintenant un vecteur de composantes covariantes et formons le produit scalaires des


vecteurs et (ce dernier vecteur, noté directement ici de manière abusive avec les indices, donne
les composantes tangentes à la géodésique sur laquelle circule le premier vecteur), nous avons alors la
quantité suivante :

(14.319)

Lors d'un déplacement le long de la géodésique, d'un point M à un point infiniment voisin M', le scalaire
subit la variation :

(14.320)

et comme :
(14.321)

d'où :

(14.322)

Remplaçons dans cette dernière expression, d'une part la différentielle de par sa différentielle totale
exacte :

(14.323)

et d'autre part, la dérivée seconde par son expression tirée de l'équation des géodésiques. Nous
obtenons :

(14.324)

qui peut encore s'écrire :

(14.325)

où nous avons posé :

(14.326)

qui sont par définition les différentielles absolues des composantes covariantes du vecteur . Nous
définissons également la "dérivée covariante" (appelée également "connexion") par la relation :

(14.327)

Remarque: Dans les ouvrages anciens ou américains ceci est souvent noté sous la forme (que nous
n'utiliserons aucunement sur ce site) :

(14.328)

faisant donc usage du ";" pour noter la dérivée covariante et de la "," pour différentielle partielle.

Puisque la dérivée du produit de deux fonctions est la somme des dérivées partielles, nous avons alors aussi :
(14.329)

Si nous posons alors nous avons (résultat que nous utiliserons après avoir démontré le théorème
de Ricci pour déterminer le tenseur d'Einstein nécessaire à la relativité générale) :

(14.330)

En coordonnées curvilignes, pour que la différentielle d'un vecteur soit un vecteur, il faut que les deux
vecteurs dont nous prenons la différence se trouvent en un même point de l'espace. En d'autres termes, il faut
transporter, d'une manière ou d'une autre, l'un des deux vecteurs infiniment voisins au point où se trouve le
second et , seulement après faire la différence des deux vecteurs qui se trouvent maintenant en un seul et
même point de l'espace. L'opération de transport parallèle doit être définie de telle sorte qu'en coordonnées
cartésiennes (pour le petit exemple), la différence des composantes coïncide avec la différence ordinaire
.

Ainsi, nous avons bien en coordonnées cartésiennes :

(14.331)

puisque dans ce système : .

Ainsi, en coordonnées curvilignes la différence des composantes des deux vecteurs après le transport de l'un
d'entre eux au point où se trouve l'autre est noté tel que nous ayons :

(14.332)

Ceci nous amène à :

(14.333)

Mais aussi à écrire le principe de moindre action (principe variationnel) sous la forme tensorielle :

(14.334)

Considérons maintenant un tenseur d'ordre deux, produit de deux tenseurs d'ordre un tel que (nous l'avons
vu lors de notre étude des compositions de tenseurs) :

(14.335)

Donc : (14.336)
d'où (nous sortons les deux dernières égalités juste pour l'esthétique!):

(14.337)

Ce qui nous amène à pouvoir écrire la métrique sous sa forme variationnelle appelée "identité de Ricci" :

(14.338)

Mais nous avons aussi puisque :

(14.339)

d'où l'identité :

(14.340)

Avec les deux relations :

et (14.341)

et la différentielle absolue (qui se généralise simplement pour un tenseur d'ordre deux) :

(14.342)

Nous avons :

(14.343)

Or, rappelons que nous avons par définition :

et (14.344)

Donc finalement :

(14.345)

La différentielle absolue sur une géodésique dans l'approximation d'un transport infinitésimal du tenseur
fondamental est donc (comme nous pouvions nous y attendre) nulle. C'est le "théorème de Ricci". Certains
physiciens théoriciens disent dès lors que "la dérivée covariante tue la métrique" dans le sens où la métrique
ne change pas sur un différentiel d'espace.

Finalement, nous voyons aussi que pour un tenseur d'ordre deux (la métrique en particulier) nous avons :

(14.346)

Nous pouvons donc écrire la différentielle absolue qui dans ce cas particulier est nul :
(14.347)

et donc :

(14.348)

Remarque: Il faudra se rappeler lors de la définition du tenseur d'Einstein que :

et (14.349)

et qu'il s'agit d'une autre manière d'exprimer qu'une variation infinitésimale sur une géodésique selon le
principe de moindre action tue la métrique. Nous allons donc travailler à partir de maintenant (comme avant
déjà) avec des équations différentielles non nécessairement linéaires qu'il faudra intégrer pour trouver le
comportement de la matière dans un espace donné.

Déterminons maintenant une expression qui nous sera très utile en relativité générale lorsque nous
déterminerons l'équation d'Einstein des champs (une autre manière d'exprimer que la dérivée covariante de
la métrique est nulle):

Effectuons la multiplication contractée de l'avant dernière expression par , il vient en utilisant la relation
(que nous avions démontrée beaucoup plus haut que) :

(14.350)

d'où la relation :

(14.351)

Les quantités et représentant les mêmes sommes, nous avons alors :

(14.352)

Soit g le déterminant des quantités . La dérivation du déterminant nous donne :

(14.353)

Démonstration:

Soit une variable quelconque que nous choisissons ici être le temps t uniquement pour simplifier les
notations des calculs qui vont suivre. Lorsque la partie principale du développement sera achevée, le résultat
peut être adapté à tout autre variable et soit les colonnes d'éléments de .

Pour les développements qui vont suivre, nous définissons les notations :

(14.354)
La règle de dérivation d'un déterminant fonctionnel est (cf. chapitre d'Algèbre Linéaire) :

(14.355)

En considérant le premier déterminant, en faisant appel aux mineurs pour le développement de sa première
colonne :

(14.356)

Pour le terme j, il vient :

(14.357)

Soit :

ou (14.358)

Or, nous avons démontré bien plus haut que le tenseur métrique est son propre inverse. Donc

(14.359)

Ce qui nous permet d'écrire :

(14.360)

et donc :

(14.361)

Ce qui s'écrit également :

(14.362)

Nous pouvons adopter une autre variable. Soit h cette autre variable :

(14.363)

Soit :

(14.364)

En combinant :

et (14.365)

il vient :
(14.366)

Nous avons donc :

(14.367)

Donc finalement (selon les règles des dérivées intérieures) l'expression suivante qui contient implicitement
la dérivée covariant de la métrique :

(14.368)

Effectivement:

(14.369)

Cette relation ne veut pas dire grand chose tant que nous n'en ferons pas un usage plus explicite lors de notre
travail sur la relativité générale (cf. chapitre de Relativité Générale).

Soit maintenant à déterminer la dérivée covariante seconde du tenseur métrique. Rappelons-nous avant
d'aller plus loin (car c'est important) que nous avions obtenu :

(14.370)

TENSEUR DE RIEMANN-CHRISTOFFEL

Rappelons que nous avons démontré plus haut que :

(14.371)

Cette relation exprime sauf erreur de la part du rédacteur de ces lignes.... la dérivée covariante d'un tenseur
d'ordre deux - tel que la métrique - sur un chemin géodésique dans deux directions parallèles (la deuxième
dérivée covariantes permettant de créer la "perpendiculaires géodésique" entre les deux géodésique
infiniment proches de la première dérivée covariante). Nous appelons un tel déplacement : un "transport
parallèle".

En y substituant :

(14.372)

Nous avons alors facilement :

(14.373)
Permutons maintenant les indices j et k dans l'expression précédente pour avoir une différentielle par rapport
à un autre chemin :

(14.374)

En admettant que les composantes vérifient les propriétés classiques , nous obtenons par
soustraction des deux expressions précédentes :

(14.375)

et puisque nous avons démontré que:

(14.376)

Nous avons:

(14.377)

Il reste alors:

(14.378)

Comme le transport parallèle se fait sur des chemins de géodésiques infiniment proches, nous prenons la
limite :

(14.379)

Ce qui soutend que le champ de vitesse est quasi égal en deux points parallèles infiniment proches.

Il reste alors:

(14.380)

Cette relation exprime le fait que, comme la gravité, la courbure de l'espace-temps cause une accélération
mutuelle entre les géodésiques. De plus, il est facile de constater, que l'accélération mutuelle entre les
géodésiques est nulle si les tenseurs de Riemann-Christoffel sont nuls (typiquement en coordonnées
cartésiennes, in extenso cela signifie pour un espace-temps plat). C'est exactement ce que nous attendons de
la gravité : si nous observons aucune accélération, la courbure (nous allons de suite définir ce que c'est) est
nulle et si la courbure est nulle, nous n'observons aucune accélération. Morale de l'histoire : la gravité est
courbure et la courbure est gravité !!

Nous voyons que la quantité entre parenthèses est un tenseur d'ordre quatre que nous noterons sur ce site
(car il y a plus traditions dans la manière de le noter...):

(14.381)

et qui résume à lui seul le transport parallèle et le fait que gravité et géométrie de l'espace sont liés.

Le tenseur est appelé "tenseur de Riemann-Christoffel" ou "tenseur de l'espace Riemannien". La


courbure d'un espace Riemannien peut aussi être caractérisée à l'aide de ce tenseur.

Si nous multiplions le tenseur par , nous avons alors les données covariantes de ce tenseur tel que :

(14.382)

et soit les relations suivantes que nous avions démontrées :

(14.383)

Dès lors, il vient :

(14.384)

et remplaçons les quantités par . Nous obtenons alors :

(14.385)

Nous avions aussi démontré que :

(14.386)

D'où :

(14.387)

et comme :

(14.388)
Nous avons :

(14.389)

et nous avions aussi démontré que :

(14.390)

et en les reportant dans l'avant dernière relation, nous obtenons :

(14.391)

Nous avons donc finalement pour l'expression covariante du tenseur de Riemann-Christoffel :

(14.392)

Il convient de remarquer que (c'est trivial par vérification sur la relation précédente) le tenseur de Riemann-
Christoffel est donc antisymétrique :

(14.393)

Enfin, la permutation en bloc des indices ij et rs nous donne, par suite de la symétrie des et en
invertissant leur ordre de dérivation (trivial) :

(14.394)

Effectuons maintenant une permutation circulaire sur les indices j, r, s dans l'expression :

(14.395)

il vient :

(14.396)

et nous avons alors (c'est très simple à contrôler... une simple addition) :

(14.397)
L'identité précédente est appelée "première identité de Bianchi". Par extension, il est trivial que nous avons
aussi (nous changeons les notations des indices afin d'être plus conforme aux écritures habituelles en
relativité générale) :

(14.398)

et par extension :

(14.399)

Rappelons qu'implicitement, cette relation exprime toujours simplement (si l'on peut dire...) le fait que
gravité et géométrie de l'espace sont liées ensembles..

TENSEUR DE RICCI

Avant de voir les conséquences de l'identité de Bianchi, nous avons besoin de définir le "tenseur de Ricci" :

(14.400)

qui est donc la contraction des premier et troisième indices. D'autres contractions d'autres indices pourraient
aussi être possible mais parce que est antisymétrique sur et alors la contraction sur ces
indices reviennent à avoir .

De manière similaire, nous définissons le "scalaire de Ricci" par la relation :

(14.401)

TENSEUR D'EINSTEIN

Appliquons une contraction à l'identité de Bianchi :

(14.402)

Rappelons que et de même par extension que . Donc finalement ceci nous amène à
écrire de par la propriété des dérivées (produit en somme) :

(14.403)

et donc à obtenir :

(14.404)

En utilisant la propriété d'antisymétrie du tenseur de Riemann-Christoffel, nous écrivons :

(14.405)

Ce qui revient finalement à écrire de par la définition du tenseur de Ricci :


(14.406)

Cette relation est appelée "identité de Bianchi contractée".

Contractons cette relation encore une fois :

(14.407)

Ce qui revient identiquement à écrire en utilisant les propriétés de la sommation d'Einstein (qui permet
librement de changer les indices):

(14.408)

Ce qui équivaut à :

(14.409)

Comme , nous avons :

(14.410)

En montant l'indice par multiplication avec , nous obtenons "l'identité d'Einstein":

(14.411)

Le "tenseur d'Einstein" qui est donc une constante dans un espace Riemannien donné est dès lors défini par :

(14.412)

et exprime de la façon la plus courte qui soit, le transport parallèle.

Identiquement, nous pouvons obtenir la forme covariante :

(14.413)

Le tenseur est donc construit pour une métrique uniquement Riemannienne (ce qui fait cependant quand
même pas mal d'espaces possibles...), et est automatiquement non divergent :

(14.414)

Nous retrouverons ce tenseur naturellement en relativité générale lorsqu'en faisant usage du principe
variationnel nous décomposerons l'action en deux termes :
1. l'action de la masse dans le champ gravitationnel

2. l'action du champ gravitationnel en l'absence de masse

En exprimant le tout dans un espace Riemannien nous obtiendrons alors la non moins fameuse équation
d'Einstein des champs (sans plus d'explications dans ce chapitre) :

(14.415)

Remarque: Comme nous le voyons, nous pouvons très bien rajouter un terme constant à l'expression du
tenseur d'Einstein, sans que cela ne change la nullité de sa divergence. Ce fait, utilisé en astrophysique,
permet de construire des modèles d'Univers particuliers que nous traitons dans le chapitre d'Astrophysique.
15. CALCUL SPINORIEL

C omme nous le verrons en premier en physique quantique relativiste, les spineurs jouent un rôle majeur
dans la théorique quantique et en conséquence dans toute la physique contemporaine (théorique quantique
des champs, modèle standard, théorie des cordes,...).

Ce fut à partir de 1927 que les physiciens Pauli, puis Dirac introduisirent les spineurs pour la représentation
des fonctions d'onde (cf. chapitre de Physique Quantique Relativiste). Cependant, sous leur forme
mathématique, les spineurs avaient été découverts par Élie Cartan dès 1913 lors de ses recherches sur les
représentations des groupes en faisant suite à la théorie générale des espaces de Clifford (introduits par le
mathématicien W.K. Clifford en 1876). Il montra, comme nous le verrons, que les spineurs fournissent au
fait une représentation linéaire du groupe des rotations d'un espace à un nombre quelconque de dimensions.
Ainsi, les spineurs sont donc étroitement liés à la géométrie mais leur présentation est souvent faite de
manière abstraite sans signification géométrique intuitive. Ainsi, nous allons nous efforcer (comme toujours
sur ce site) dans ce chapitre d'introduire de la manière la plus simple et intuitive possible les théories des
spineurs.

Le formalisme spinoriel n'intéresse pas seulement la physique quantique et ses travaux, entre autres, de
Roger Penrose ont montré que la théorie spinorielle était une approche extrêmement féconde de la théorie de
la relativité générale. Bien que le plus couramment utilisée pour le traitement de la relativité générale soit le
calcul tensoriel, Penrose a montré que dans le cas spécifique de l'espace à quatre dimensions et la métrique
de Lorentz, le formalisme des spineurs à deux composantes est plus approprié.

La théorie des spineurs ou "géométrie spinorielle" est extrêmement vaste mais ce site ayant plus pour
objectif de s'adresser aux physiciens, nous nous limiterons aux spineurs utiles en physique quantique ainsi
que leurs propriétés y relatives.

Remarque: Nous conseillons vivement au lecteur d'avoir lu au préalable le sous-chapitre sur les quaternions
(cf. chapitre Nombres), le sous-chapitre sur les rotations dans l'espace (cf. chapitre Géométrie Euclidienne)
et enfin, si possible pour avoir un exemple pratique physique, le chapitre de physique quantique relativiste.

SPINEUR UNITAIRE

Nous allons donner ici une première définition (ou exemple) particulière simplifiée des spineurs. Ainsi, nous
allons montrer qu'il est possible à partir d'un tel outil de représenter un vecteur d'un espace à trois
composantes à l'aide d'un spineur à deux composantes. La méthode est extrêmement simple et celui qui a
déjà lu la partie du chapitre de Physique Quantique Ondulatoire traitant de l'équation de Dirac ainsi que le
chapitre d'Informatique Quantique y verra une analogie assez grandiose.

Considérons pour commencer la sphère suivante d'équation (cf. chapitre de Géométrique Analytique)

(15.1)

Et considérons le schéma suivant:


(15.2)

Considérons-y les coordonnées (x, y, z) d'un point P de la sphère centrée en O et de rayon unité et notons N
et S les points d'intersection de l'axe Oz avec la sphère.

Le point S aura par convention pour coordonnées: (15.3)

Nous obtenons une projection dite "projection stéréographique" P' du point P en traçant la droite SP qui
traverse un plan équatorial xOy complexe au point P' de coordonnées (x', y', z').

Les triangles semblables SP'O et SPQ (avec Q étant la projection orthogonale sur l'axe Oz du point P) nous
donnent les relations suivantes en appliquant simplement le théorème de Thalès:

(15.4)

Remarque: Les deux dernières relations s'obtiennent par application du théorème de Thalès (cf. chapitre de
Géométrie) dans le plan équatorial complexe.

Posons maintenant: (15.5)

Il vient, compte tenu de la relation précédente que : (15.6)

en prenant le module au carré (voir l'étude des nombres complexes dans le chapitres des Nombres) :

(15.7)

et comme de l'équation de la sphère il découle: (15.8)

nous avons finalement : (15.9)

Mettons maintenant le nombre complexe sous la forme où sont deux nombres complexes
auxquels nous pouvons toujours imposer de vérifier la condition d'unitarité (rien ne nous l'interdit mais en
physique cela nous arrange bien): (15.10)
Remarque: Les nombres complexes suivants satisfont donc la relation précédente :

(15.11)

Rappelons avant de continuer que nous avons démontré lors de notre étude des nombres complexes que :

(15.12)

Dès lors il vient en injectant ces deux dernières relations dans l'équation déterminée plus haut:

(15.13)

d'où finalement la coordonnée verticale du point P: (15.14)

Comme nous avons : (15.15)

alors : (15.16)

tenant compte des derniers développements nous avons finalement : (15.17)

Ainsi, à tout point P situé sur la sphère de rayon unité, nous pouvons faire correspondre un couple de
nombre complexes vérifiant la relation d'unitarité imposée.

Soit sous forme complète et explicite nous avons finalement:


(15.18)

Cette dernière relation nous indique donc que est l'angle entre Oz et (puisque l'hypoténuse de
l'angle du vecteur à une norme unitaire) et donc par déduction représente l'angle entre Ox et le plan
(Oz,OP):

(15.19)
Le couple de nombres complexes de la relation antéprécédente constitue par définition un "spineur unitaire".
Ainsi, comme nous l'avons vu, un spineur unitaire peut se mettre sous la forme :

(15.20)

de même un spineur quelconque peut se mettre sous la forme un peu plus générale:

(15.21)

Le spin ainsi mesuré l'est essentiellement à partir d'un axe orienté OZ comme nous venons de le voir avec la
figure précédente.

La projection stéréographique conduit donc à représenter certains vecteurs de l'espace euclidien avec des
éléments d'un espace vectoriel complexe de dimension deux qui est l'espace des spineurs.

Remarque: Cette représentation n'est pas unique car les arguments de nombres complexes sont (sous forme
trigonométrique) déterminés qu'à une constante près.

Le lecteur qui aura déjà étudié un peu la physique quantique ondulatoire (voir chapitre du même nom) aura
certainement remarqué l'étrange similarité non innocente de la condition et des relations :

(15.22)

par rapport à la condition de normalisation de Broglie (l'intégrale sur tout l'espace de la somme des produits
des fonctions d'ondes complexes conjuguées sont égales à l'unité) et des développements déterminant
l'équation de continuité en physique quantique ondulatoire.

Voyons maintenant pour les besoins ultérieurs, que nous pouvons trouver deux nouveaux vecteurs de
l'espace euclidien , associés à un spineur unitaire déterminé sur la sphère unité. Ces vecteurs seront
cherchés orthogonaux entre eux et de norme unité, chacun étant orthogonal au vecteur .

Notons et , les composantes respectives des vecteurs sont bien sûr liées
par le produit vectoriel :

(15.23)

d'où tenant compte de l'expression des composantes en fonction de celles du spineur associé, ainsi que
du fait , nous obtenons :

(15.24)
Ecrivant l'orthogonalité des vecteurs entre eux nous obtenons bien évidemment six équations
supplémentaires. Cependant l'orientation des vecteurs n'étant pas fixée, il existe une certaine
indéterminée sur les valeurs de leurs composantes. Choisissons des valeurs telles que :

(15.25)

Prenant les quantités complexes conjuguées des relations précédentes, nous obtenons par addition les
composantes de :

(15.26)

Par soustraction, nous obtenons de même les composantes du vecteur :

(15.27)

Nous vérifions aisément que ces valeurs redonnent bien les relations du produit vectoriel. A tout spineur
unitaire nous pouvons donc associer trois vecteurs . Nous pouvons vérifier directement que
les vecteurs ainsi calculés sont bien orthogonaux entre eux et de norme unité.

PROPRIÉTÉS GÉOMÉTRIQUES

Nous allons étudier les transformations des vecteurs de associés à un spineur afin d'en déduire les
propriétés correspondantes de transformation du spineur. Les rotations dans l'espace pouvant toujours
s'exprimer sous forme du produit de deux symétries planes (faire dans la tête l'expérience imaginaire), nous
commençons par l'étude de ces dernières.

SYMÉTRIES PLANES

Considérons dans un premier temps la symétrie plane d'un vecteur :

Lors d'une symétrie par rapport à un plan P, un vecteur quelconque se transforme en un vecteur .
Déterminons une matrice S qui représente cette symétrie par rapport à ce plan. Soit un vecteur unitaire
normal au plan P et soit H le pied de la perpendiculaire abaissée d'un point M de l'espace sur le plan P.

(15.28)
Soit M' le point symétrique de M par rapport à P, nous avons :

(15.29)

Soient les composantes cartésiennes de et les composantes respectives des


vecteurs , la relation précédente nous donne les relations linéaires :

(15.30)

La matrice S qui fait passer du vecteur au vecteur a donc pour expression :

(15.31)

Gardons en mémoire ce résultat et considérons à présent deux vecteurs , orthogonaux entre eux et
unitaires, définissant comme nous l'avons vu un spineur unitaire . Une symétrie par rapport à un plan
P transforme les vecteurs en vecteurs auxquels sont associés le spineur . Nous allons
maintenant montrer que la transformation suivante du spineur en spineur est :

(15.32)

et transforme précisément les vecteurs en vecteurs , ces vecteurs se déduisant


respectivement - comme nous allons le montrer - les uns des autres par une simple symétrie plane et que la
matrice représente bien la transformation cherchée.

La relation précédente nous donne donc : (15.33)

En tout nous avons : (15.34)

Nous en déduisons :

(15.35)
Par suite du fait que , nous obtenons :

(15.36)

Nous retombons donc bien sur la matrice de symétrie :

(15.37)

Ainsi, la matrice que nous retrouverons dans le chapitre de Physique Quantique Relativiste:

(15.38)

engendre donc la transformation d'un spineur en un spineur telle que les vecteurs associées

se déduisent respectivement de par une symétrie plane.

ROTATIONS

Comme nous l'avons vu dans le chapitre de géométrie euclidienne, il est possible faire une rotation d'un
vecteur dans le plan ou dans l'espace à l'aide de matrices. De même, par extension, il est évident que la
multiplication de deux rotations est une rotation (c'est de l'algèbre linéaire élémentaire - du moins nous le
considérons tel quel).

Considérons dès lors, deux plans P, Q dont l'intersection engendre une droite (ligne) L et notons
et des vecteurs unitaires portés par les normales respectives à ces deux plans
sécantes en L :

(15.39)

Notons l'angle des vecteurs entre eux (la raison de cette notation provient de notre étude des
quaternions (cf. chapitre Nombres). Soit le vecteur unitaire porté par la droite L résultant de l'intersection
des plans P, Q et tel que :
(15.40)

Explications : sont unitaires mais pas nécessairement perpendiculaires et nous devons quand même
nous assurer que soit un vecteur unitaire (sa norme soit égale à l'unité donc). Dès lors, la relation ci-dessus
nous assure que :

(15.41)

Le produit vectoriel précédent nous donne pour les composantes de :

(15.42)

D'autre part, le produit scalaire s'écrit :

(15.43)

Remarque: Nous allons nous servir des ces deux plans comme plans de symétrie pour nos rotations

Comme nous l'avons fait remarquer précédemment, une rotation dans peut toujours se faire avec au plus
deux symétries planes. Ainsi, une rotation peut se noter par l'application (multiplication) de deux matrices de
symétrie selon les résultats obtenus plus haut :

(15.44)

Développant le produit de ces deux matrices et tenant compte de relations découlant du produit vectoriel et
scalaire nous obtenons :

(15.45)

Ainsi, nous pouvons écrire la transformation d'un spineur et un spineur à l'aide d'une matrice
de la forme :

(15.46)
dont les paramètres sont appelés sont appelés "paramètres de Cayley-Klein".

La matrice peut être écrite sous une autre forme si nous faisons un développement limité pour des
rotations infiniment petites (eh voilà la physique qui revient....). Ainsi, les développements de
MacLaurin nous donnent :

(15.47)

En utilisant seuls les termes du premier ordre, la matrice de rotation s'écrit finalement :

(15.48)

Cette matrice constitue le développement limité de la matrice de rotation au voisinage de la matrice identité,
cette dernière correspondant évidemment à la rotation nulle. Nous notons cette dernière également sous la
forme :

(15.49)

où la matrice est la matrice unité d'ordre deux et s'appelle la "matrice infinitésimale de rotation".
Maintenant, si nous posons dans nous obtenons :

(15.50)

Comment interpréter ce résultat ? Eh bien c'est assez simple, choisir , nous donne un
vecteur colinéaire à l'axe de . Dès lors, nous pouvons très bien nous imaginer les plans générant
l'axe qui porte . Comme (in extenso ) est généré par les vecteurs perpendiculaires à et
donc à , alors l'angle (ou sa variation) représente une variation de la direction des plans normaux à
qui par symétrie servent à construire la rotation (rappelons que ne sont pas nécessairement
orthogonaux entre eux). Donc par extension, avoir ne permet plus que de faire des
rotations (symétries) autour de .

De même, une rotation autour de l'axe correspond à , ce qui donne :

(15.51)

et de même avec nous avons enfin :


(15.52)

Les trois matrices :

(15.53)

sont donc les matrices de rotation dans l'espace des spineurs à deux composantes. Les physiciens et
mathématiciens disent que ces matrices constituent une représentation irréductible de dimension deux du
groupe "SU(2)" ou encore appelé "groupe spécial des rotations spatiales SU(2)" (cf. chapitre d'Algèbre
Ensembliste).

Les matrices infinitésimales précédentes font donc apparaître de manière habile les matrices suivantes:

(15.54)

Ces matrices sont appelées "matrices de Pauli" et nous les retrouverons en physique quantique ondulatoire
(cf. chapitre de Physique Quantique Ondulatoire) dans le cadre de notre étude de l'équation de Dirac et de la
détermination de ses solutions explicites (utilisant les spineurs).

En utilisant ces matrices de Pauli, la matrice de rotation infinitésimale peut finalement s'écrire :

(15.55)

Définissons un vecteur ayant pour composantes les matrices de Pauli : (15.56)

L'expression peut alors s'écrire sous forme d'une sorte de produit scalaire qui représente
une somme de matrices (la flèche au-dessus du sigma est parfois omise si aucune confusion n'est possible):

(15.57)

Le développement limité s'écrit alors : (15.58)

La matrice de rotation : (15.59)


peut à l'aide des matrices de Pauli s'écrire sous la forme remarquable :

(15.60)

forme que nous utiliserons dans le chapitre d'Informatique Quantique pour exprimer les matrices R de
manière explicite ainsi que dans le chapitre d'Algèbre Ensembliste.

Ce qui s'écrit parfois:

(15.61)

Ce qui peut s'écrire aussi :

(15.62)

qui a donc la forme d'un quaternion de rotation d'angle et d'axe . D'où la raison d'avoir depuis le début
choisi la notation de .

Il est clair, pour que l'analogie avec les quaternions soit plus forte, que les matrices de Pauli forment un
ensemble de quatre matrices linéairement indépendantes ! Tel que la base canonique pour les quaternions !

Si nous notons alors le "produit spinoriel" est défini finalement par:

(15.63)

Cette matrice constitue comme nous en avons déjà fait mention, au développement limité de la matrice de
rotation au voisinage de la matrice identité, les composantes de étant associées à un spineur dont la
rotation se fait par la double symétrie définie par deux plans dont l'intersection est définie par le vecteur .

Nous pouvons par ailleurs remarquer la conséquence intéressante qu'une rotation de 360° ne restore par
l'objet dans sa position initiale.

Effectivement:

(15.64)

Il faut donc une rotation de 720° pour faire un tour complet! Cela correspond au spin de ½. Il faut faire deux
tours pour retrouver pour que l'objet réapparaisse de manière équivalente. Nous disons alors que la
représentation des rotations est "bivaluée".
PROPRIÉTÉS DES MATRICES DE PAULI

Le lecteur vérifiera aisément (si ce n'est pas le cas il pourra toujours nous contacter pour que nous en
rédigions les détails) les propriétés suivantes des matrices de Pauli dont certaines seront utilisées dans le
chapitre de physique quantique relativiste:

P1. Unitarité: (15.65)

P2. Anticommutativité: (15.66)

pour et

Les deux dernières propriétés nous donnent : (15.67)

avec

P3. Cyclicité: (15.68)

P4. Commutation: (15.69)

P4. Produit vectoriel:

Soit le carré des composantes de en notant abusivement par "1" la matrice unitaire (nous changeons les
indices afin de vous habituer aux autres notations courantes):

(15.70)

Ce qui conduit à écrire que :

(15.71)

Considérons maintenant les produits suivants :


(15.72)

Toutes ces relations peuvent se résumer sous la forme:

(15.73)

où pour rappel (cf. chapitre de Calcul Tensoriel) le symbole de Kronecker est défini par:

(15.74)

et le tenseur d'antisymétrie par:

Nous avons aussi :

(15.75)

Nous retrouvons donc ici les composantes du produit vectoriel:

(15.76)
Maintenant voyons une identité spinorielle qui nous sera utile dans le chapitre de Physique Quantique
Relativiste:

(15.77)

Or:

(15.78)

Donc finalement: (15.79)

P5. Nous noterons que ces matrices sont aussi hermitiennes (rappelons qu'une matrice hermitienne est une
matrice transposée suivie de sa conjuguée complexe selon ce que nous avons vus dans le chapitre d'Algèbre
Linéaire) tel que :

(15.80)
Il s'agit donc dans le langage de la physique quantique, d'opérateur hermitiques!

Voyons maintenant quelles sont les vecteurs et valeurs propres des matrices de Pauli car ce résultat est très
utile en physique quantique ainsi qu'en informatique quantique!

Rappelons que lorsqu'une transformation (application d'une matrice) agit sur un vecteur, elle modifie la
direction de ce vecteur excepté pour certaines matrices particulières qui ont des valeurs propres. Dans ce cas,
la direction est conservée mais pas leur longueur. Cette propriété est exploitée en mécanique quantique.

Déterminons dans un premier temps, les vecteurs et valeurs propres (cf. chapitre d'Algèbre Linéaire)
associées à en utilisant la méthode la plus courante :

L'équation aux valeurs propres (cf. chapitre d'Algèbre Linéaire) s'écrit donc:

(15.81)

Ce qui nous donne comme équation de caractéristique :

(15.82)

d'où les valeurs propres . Ce qui nous permet de déterminer les vecteurs propres comme suit :

(15.83)

Donc pour : (15.84)

Ce qui impose que . Le vecteur propre est donc : (15.85)

quelle que soit la valeur de x.

Conclusion : La direction propre du vecteur est conservée mais pas sa longueur car elle dépend de la valeur
de x.

Pour : (15.86)

Ce qui impose que et donc que le vecteur propre est : (15.87)

Les vecteurs propres précédents écrits avec le formalisme de Dirac (cf. chapitre de Physique Quantique
Ondulatoire) donnent pour :

(15.88)
avec une norme de (1 puisque nous normalisons à l'unité):

(15.89)

Remarque: Dans le formalisme de Dirac, est la Bra et est le Ket.

Ceci n'étant valable que pour des composantes qui sont des nombres réels. Le vecteur propre normé a donc
pour expression :

(15.90)

et pour :

(15.91)

et:

(15.92)

et le vecteur propre normé a donc pour expression:

(15.93)

Déterminons maintenant, les vecteurs et valeurs propres associées à en procédant de même :

Nous avons donc pour les valeurs propres :

(15.94)

Les vecteurs propres se déterminant comme suit :

(15.95)

et donc pour :

(15.96)

Le vecteur propre est dès lors :


(15.97)

La norme associée :

(15.98)

Le vecteur propre normé a donc pour expression:

(15.99)

Pour :

(15.100)

Le vecteur propre est dès lors :

(15.101)

la norme associée :

(15.102) .

Le vecteur normé a donc pour expression:

(15.103)

Déterminons maintenant, les vecteurs et valeurs propres associées à en procédant de même.

Nous avons alors :

(15.104)

Les vecteurs propres sont alors pour :

(15.105)
ce qui nous pose légèrement problème pour dire quoi que ce soit... la seule possibilité est de choisir et
ainsi :

(15.106)

et la norme associée :

(15.107)

Le vecteur propre normé a alors pour expression:

(15.108)

et pour nous aurons le même choix à faire en posant cette fois-ci donc :

(15.109)

d'où la norme associée :

(15.110)

Le vecteur propre normé a donc finalement pour expression:

(15.111)

Donc les vecteurs propres normés de se trouvent sur les directions des axes de coordonnées cartésiennes.
C'est pour cette raison particulière que les vecteurs propres de sont notés en informatique quantique:

(15.112)

et il faut savoir que l'on note alors aussi:

(15.113)
16. ANALYSE FONCTIONNELLE

L 'analyse fonctionnelle est la branche des mathématiques et plus particulièrement de l'analyse qui est en
rapport avec l'étude des espaces de fonctions. Elle prend ses racines historiques dans l'étude des
transformations telles que la transformation de Fourier et dans l'étude des équations différentielles et des
intégrales. A ce titre elle englobe tellement de domaines qu'il est difficile de justifier qu'elle fasse l'objet d'un
chapitre car il s'agit plutôt d'un domaine d'études. Par ailleurs, c'est à cause de cette difficulté de cerner
exactement le domaine qu'elle touche que le lecteur trouvera le théorème fondamental de l'analyse dans le
chapitre de calcul différentiel et intégral plutôt qu'ici.

Pourquoi ceci dit utilisons-nous le terme "analyse" dans le cas particulier des fonctions. La raison vient pour
des raisons historiques à l'étude des divers phénomènes de la nature et la résolution de divers problèmes
techniques et par conséquent de mathématiques, qui nous amènent souvent à considérer la variation d'une
grandeur en corrélation avec la variation d'une autre ou de plusieurs autres grandeurs. Pour étudier ces
variations, de nombreux outils sont à la disposition de tout à chacun :

- L'ingénieur a par exemple fréquemment recours à la représentation graphique (système d'axes cartésien,
polaire, logarithmique... concepts sur lesquels nous reviendrons plus en détail) pour déterminer la relation
(ou "loi") mathématique qui lient les différentes grandeurs entre elles. Certes ce genre de méthode est
(parfois...) esthétique mais les étudiants savent bien combien il est parfois pénible en laboratoire de devoir
porter des points sur une feuille de papier ou à l'ordinateur. C'est malheureusement une étape nécessaire
(mais dont il faudrait éviter de faire une utilisation abusive) pour comprendre comment nos prédécesseurs
travaillaient et ont obtenu les résultats qui nous aident aujourd'hui dans nos avancées en physique théorique.

- Le mathématicien et le physicien théoricien ont habituellement horreur d'avoir recours aux méthodes
papier-crayon-gribouillage. Quoiqu'il en soit, le rôle du mathématicien ou du physicien est de développer de
nouvelles théories à l'aide d'axiomes ou de principes mathématiques ce qui ne devrait nécessiter aucunement
le recours à la représentation graphique et à l'accès aux mesures expérimentales qui y sont souvent
rattachées.

Remarque: Avant de commencer la lecture de ce qui va suivre, il peut être utile de rappeler au lecteur que la
définition du concept de "fonction" (et les propriétés élémentaires y relatives) sont données dans le chapitre
de Théorie Des Ensembles.

REPRÉSENTATIONS

Nous allons voir dans ce qui va suivre, dans un premier temps, comment représenter différentes grandeurs
liées de façon tabulaire et graphique (eh oui! il faut bien car cela aide à comprendre) et ensuite comment
analyser mathématiquement les propriétés de ces représentations uniquement à l'aide d'outils mathématiques
abstraits.

Définition: Une fonction est dite "fonction univalente", si le nombre de ses arguments (paramètres ou
variables) est égal à un. Dans le cas d'une fonction à deux arguments, nous parlons de "fonction bivalente",
etc.

REPRÉSENTATION TABULAIRE

Parmi le mode de représentation visuel des fonctions, la plus intuitive et la plus ancienne est celle où nous
disposons dans la colonne ou la ligne d'un tableau de façon ordonnée les valeurs de la variable indépendante
et les valeurs correspondantes, dites "variables transformées" de la fonction dans une
autre colonne ou ligne alignée.
Telles sont par exemple, les tables des fonctions trigonométriques, les tables logarithmiques, etc. et au cours
de l'étude expérimentale de certains phénomènes des tables qui expriment la dépendance fonctionnelle
existant entre des grandeurs physiques mesurées tel que les relevés de la température de l'air enregistrés dans
une station météorologique durant une journée.

Bien évidemment, ce concept est généralisable à toute fonction multivalente quelque soit son ensemble de
définition.

Cependant, cette méthode est laborieuse et ne permet pas de voir directement le comportement de la
fonction et donc une analyse visuelle simple et intéressante de ses propriétés. Elle a pour avantage quand
même de ne pas nécessiter d'outils spéciaux ou de connaissances mathématiques poussées.

REPRÉSENTATIONS GRAPHIQUES

Les nombres naturels, relatifs, réels ou purement complexes (cf. chapitre sur les Nombres) peuvent tous
êtres représenté le plus simplement du monde par des points sur un axe numérique (ligne droite) infini.

Pour ce faire, nous choisissons sur cet axe:

1. Un point O appelé "origine"

2. Un sens positif, que nous indiquons par une flèche horizontale

3. Une unité de mesure (représenté habituellement par un petit trait vertical : la "graduation")

Tel que :

(16.1)

Le plus souvent nous disposons (par tradition) l'axe horizontalement et choisissons la direction de gauche à
droite.

Remarque: Le point (lettre) O, représente très fréquemment le nombre zéro en mathématique mais nous
pourrions très bien choisir de mettre l'origine ailleurs. Par exemple, en physique le point O est souvent
positionné à l'emplacement du barycentre d'un système.

Il est évident que le fait que les ensembles de nombres dont nous avons parlé soient ordonnés implique que
tout nombre est représenté par un seul point de l'axe numérique. Ainsi, deux nombres réels distincts
correspondent deux points différents de l'axe numérique.

Ainsi, il existe une correspondance biunivoque entre tous les nombres et tous les points de l'axe numérique
(dans le cas des nombres réels ou complexes, il correspond non pas un nombre à chaque graduation mais un
nombre à chaque point de l'axe). Ainsi, à chaque nombre correspond un point ou une graduation unique et
inversement à chaque point ou graduation correspond un seul nombre dont il est l'image.

REPRÉSENTATIONS PLANES

Il existe outre les représentations unidimensionnelles d'autres de dimensions supérieures (ouf!) qui nous
permettent de tracer non plus que des simples points sur une droite unidimensionnelle mais des fonctions
d'une variable. Voyons de quoi il s'agit :
Nous pouvons à chaque valeur d'une variable x reportée sur un axe horizontal, appelé "axe des abscisses" ou
"axe des x", faire correspondre une valeur y au travers d'une fonction f :

(16.2)

reportée sur un axe vertical, appelé "axe des ordonnées" ou "axe des y" qui passe par le croisement défini par
l'origine O tel que (exemple arbitraire) :

(16.3)

L'ensemble des points du plan noté sous les variantes XOY, XY ou encore xOy, Oxy, xy, dont les abscisses
représentent par tradition les valeurs de la variable indépendante et les ordonnées les valeurs
correspondantes de la fonction, est appelé "graphique plan" de cette fonction. S'il n'y a pas de confusion
possible nous dirons simplement "graphique".

Dans le cas d'une représentation par un système de coordonnées rectangulaires (cartésien, polaire ou
logarithmique) comme la figure ci-dessus, nous pouvons observer que l'ensemble du plan des coordonnées
est séparé en quatre surfaces que nous avons pour habitude d'appeler "quadrants".

Remarque: Lorsque nous souhaitons mettre en évidence un point particulier de la fonction représentée, nous
y dessinons un petit rond tel que présenté ci-dessus.

Un autre cas classique de représentation graphique plane connu par un grand nombre d'étudiants est le tracé
des polynômes (cf. chapitre de Calcul Algébrique) à coefficients réels.

Effectivement, pour résoudre les équations polynomiales du second degré (cf. chapitre de Calcul
Algébrique), il est fréquent dans les petites classes que le professeur demande en plus à ses élèves de donner
une expression algébrique des racines de :

(16.4)

données par, rappelons-le :

(16.5)
une résolution graphique où les deux racines (dans le cas où il y en a deux distinctes réelles) sont données
par l'intersection de la parabole avec l'axe des abscisses (bien évidemment, si l'équation n'a pas de solutions,
il n'y a pas d'intersections...) :

(16.6)

La représentation graphique étant généralisable aux équations polynomiales du 3ème, 4ème et 5ème degré
(nous démontrerons bien plus loin, à l'aide de la théorie de Galois qu'il n'est pas possible d'obtenir une
expression algébrique générale des racines d'une équation polynômiale du 5ème degré et supérieur).

De même, les graphiques sont un outil qualitatif puissant dans le domaine des statistiques (cf. chapitre de
Statistiques) comme point de départ de l'analyse de données (histogrammes, fromages, boîtes à moustaches,
radars, nuages de points,...). Les hypothèses et idées qui sont générées par l'analyse graphique peuvent être
investiguées avec des outils statistiques avancés.

Voici par exemple un graphique (histogramme) pris du chapitre de Génie Industriel très courant dans le
domaine des statistiques et de la gestion de projets dans l'industrie mondiale:

(16.7)

Les histogrammes permettent d'observer les distributions et de décider de manière qualitative si elle s'ajuste
à un modèle théorique particulier.
Les graphique peuvent permettre également d'observer les changements au cours du temps de (séries
temporelles, cartes de contrôle):

(16.8)

et encore à bien d'autres choses... que nous verrons tout au long des pages de ce site Internet.

REPRÉSENTATIONS 3D

Bien évidemment, dans le cas d'une fonction trivalente (tridimensionnelle), c'est-à-dire dont un paramètre
dépend de deux autres, le principe reste le même à la différence que le nombre de quadrants double.

Cette méthode de représentation et d'analyse d'une fonction trivalente était longue à mettre en place il y a
une dizaine d'années mais avec l'aide des ordinateurs en ce 21ème siècle ce problème (de temps) est assez
bien résolu...

Ce type de représentation est suffisamment important en physique appliquée pour que nous y arrêtions un
instant en faisant des exemples typiques sur plusieurs pages des commandes les plus importantes avec
Maple (même s'il existe de nombreux ouvrages sur le sujet c'est trop important pour que nous omettions ces
exemples).

> restart;
> with(plots):

Nous prenons une fonction 3D quelconque:

> f:=(x,y)->12*x/(1+x^2+y^2);

Nous définissons le domaine d'analyse:

> xrange:=-10..10;yrange:=-5..5;

et nous faisons un plot simple:

> plot3d(f,xrange,yrange);
(16.9)

Améliorons un peu l'aspect:

> plot3d(f,xrange,yrange, style=patchnogrid, grid=[80,50], shading=ZHUE, axes=FRAME,


tickmarks=[3,3,3], labels=[`x`,`y`,`f(x,y)`], labelfont=[TIMES,BOLD,12], title=`Graphique rempli`,
titlefont=[TIMES,BOLD,12], scaling=unconstrained, orientation=[-107,68]);

(16.10)

Traçons les courbes de niveau (cf. chapitre de Géométrie différentielle):

> plot3d(f,xrange,yrange,style=patchcontour);
(16.11)

C'est pas très beau donc améliorons cela:

> plot3d(f,xrange,yrange,style=patchcontour,contours=[seq(-
7+k/4,k=0..60)],grid=[80,50],shading=ZHUE,axes=FRAME, tickmarks=[3,3,3],
scaling=unconstrained,orientation=[-107,68]);

(16.12)

Avec une petite rotation pour voir du dessus:

> plot3d(f,xrange,yrange, style=patchcontour, contours=[seq(-7+k/4,k=0..60)], grid=[80,50],


shading=ZHUE, axes=FRAME, tickmarks=[3,3,3], scaling=unconstrained, orientation=[-90,0]);
(16.13)

Et en coupe:

> plot(f(x,2),x=xrange);
(16.14)

Ou avec des coupes multiples:

>display([seq(plot(f(x,y),x=xrange),y=yrange) ]);
(16.15)

Le lecteur pourra aussi animer le précédent graphique avec la commande suivante:

> display([seq(display([plot(f(x,k/5),x=xrange),
textplot([6,5,cat(`y=`,convert(evalf(k/5,2),string))],font=[TIMES,BOLD,16])]),k=-25..25)],insequence=true,
title=`Animation`,titlefont=[TIMES,BOLD,18]);

voilà pour un exemple typiquement simple des manipulations standards d'un ingénieur dans l'entreprise
utilisant des graphiques.

REPRÉSENTATIONS VECTORIELLES

Il est aussi fréquemment fait usage des représentations graphiques dans le cadre de la géométrie analytique
pour simplifier les analyses ou faire des démonstrations de théorèmes connus sous forme visuelles (il faut
cependant ne pas en abuser!).

Ainsi, nous pouvons introduire par exemple le concept de norme (cf. chapitre de Calcul Vectoriel) de
manière simpliste en représentant graphiquement la distance entre deux points et en appliquant le théorème
de Pythagore (cf. chapitre de Géométrie Euclidienne) qui sera supposé connu.

Ainsi, représentons trois points sur un graphique plan dans lequel a été défini un repère tel que
présenté dans le graphique ci-dessous :
(16.16)

Si et (comme sur la figure ci-dessus), les points sont les sommets d'un triangle
rectangle. Par application du théorème de Pythagore (cf. chapitre de Géométrie Euclidienne) :

(16.17)

Sur la figure, nous voyons que :

et (16.18)

Puisque , nous pouvons écrire :

(16.19)

Si , nous nous retrouvons avec une relation appelée "norme", "module" ou encore "distance" que
nous avions déjà défini dans le cadre de note étude de l'analyse vectorielle (cf. chapitre de Calcul Vectoriel).

Bien évidemment, si nous considérons deux points , nous pouvons déterminer si un


troisième point est sur la médiatrice (cf. chapitre de Géométrie Euclidienne) des deux premiers et
qu'il suffit pour cela que bien évidemment (par définition même de la médiatrice) :

(16.20)

Comme sont connus, nous pouvons facilement exprimer une "expression analytique" de la
médiatrice du type :
(16.21)

où a, b sont des constantes et où tout point qui satisfait cette relation, qui est en l'occurrence l'équation d'une
droite, se trouve sur la médiatrice.

Par ailleurs, il est aisé de visualiser que le point milieu du segment de droite est donné par :

(16.22)

Donc nous voyons qu'avec une simple représentation graphique, nous pouvons obtenir des résultats qui sont
parfois (...) plus évident pour les étudiants.

Profitons de cet exemple pour définir quelques concepts sur lesquels nous reviendrons et faire quelques
rappels.

Définition: Toute fonction de la forme d'un polynôme (cf. chapitre de Calcul Algébrique) de degré 1 à
coefficients réels constants :

(16.23)

est l'expression analytique de ce que nous appelons une "droite" de "pente" a et "d'ordonnée à l'origine" b
(quand ).

Bien évidemment, si :

(16.24)

la droite est horizontale si nous la représentons graphiquement puisque y est constant pour tout x et vaut
alors b. Inversement, si :

(16.25)

la droite est une verticale.

PROPRIÉTÉS DES REPRÉSENTATIONS GRAPHIQUES

Selon le type de graphique que nous visualisons (en particulier les graphiques plans) il est possible d'extraire
certaines propriétés de base. Voyons les plus importantes à connaître pour les graphiques plans d'une
fonction à une variable :
(16.26)

P1. Le graphique d'une fonction est symétrique par rapport à l'axe des ordonnées si le changement de x en -
x ne modifie pas la valeur de l'équation tel que :

(16.27)

P2. Le graphique d'une fonction est symétrique par rapport à l'axe des abscisses si le changement de y en -
y ne modifie pas la valeur de l'équation tel que :

(16.28)

P3. Le graphique d'une fonction est symétrique par rapport à l'origine si le changement simultané de y en -
y et de x en -x ne modifie pas la valeur de l'équation tel que :

(16.29)
P4. Soit une fonction , si nous ajoutons une constante à cette fonction tel que nous écrivions
:

(16.30)

alors le graphique de f est déplacé (ou "translaté") verticalement vers le haut d'une distance tel que
présenté sur la figure suivante:

(16.31)

Et inversement si mais que :

(16.32)

alors le graphique est bien évidemment translaté verticalement vers le bas:

(16.33)

Nous pouvons aussi envisager des translations horizontales de graphiques. Précisément, si , alors
est translaté horizontalement vers la droite si nous écrivons :

(16.34)

ce qui graphiquement est représenté par:


(16.35)

et inversement, translaté horizontalement vers la gauche, si nous écrivons :

(16.36)

comme le montre le graphique ci-dessous:

(16.37)

Pour étirer ou comprimer verticalement un graphique, il suffit de multiplier la fonction par une
constante et respectivement tel que :

(16.38)

ce que nous pouvons représenter graphique par:


(16.39)

et:

(16.40)

Pour étirer ou comprimer horizontalement un graphique, il suffit de même, de multiplier la fonction


par une constante et respectivement ou tel que :

(16.41)

ce que nous pouvons représenter sous forme graphique:

(16.42)
et:

(16.43)

Remarque: Translater, étirer, comprimer un graphique ou lui faire subit une symétrie c'est le transformer. Le
graphique résultant de ces transformations est appelé le "transformé" du graphique de départ.

Définitions: Nous disons qu'une fonction f est :

- Une "fonction croissante" ou "fonction croissante au sens large" sur I si pour tout couple ,
d'éléments de I tels que , nous avons . Ce que nous notons de manière condensée:

(16.44)

- Une "fonction décroissante" ou "fonction décroissante au sens large" sur I si pour tout couple ,
d'éléments de I tels que , nous avons . Ce que nous notons de manière condensée:

(16.45)

Remarque: Une "fonction monotone" ou "fonction monotone au sens large" sur I si elle est croissante sur I
ou décroissante.

-Une "fonction strictement croissante" sur I si pour tout couple , d'éléments de I tels que ,
nous avons . Ce que nous notons de manière condensée:

(16.46)

- Une "fonction strictement décroissante" sur I si pour tout couple , d'éléments de I tels que ,
nous avons . Ce que nous notons de manière condensée:

(16.47)
Remarque: Nous disons qu'une "fonction strictement monotone" sur I si elle est strictement croissante sur I
ou strictement décroissante sur I.

REPRÉSENTATIONS ANALYTIQUES

Le mode de représentation analytique est de loin le plus utilisé et consiste à représenter toute fonction en une
"expression analytique" qui est la notation mathématique symbolique et abstraite de l'ensemble des
opérations mathématiques connues que l'on doit appliquer dans un certain ordre à des nombres et des lettres
exprimant des grandeurs constantes ou variables que nous cherchons à analyser.

Remarquons que par ensemble des opérations mathématiques connues, nous envisageons non seulement les
opérations mathématiques vues dans la section arithmétique (addition, soustraction, extraction de la racine,
etc.) mais également toutes les opérations qui seront définies au fur et à mesure dans le présent site internet.

Si la dépendance fonctionnelle est telle que f est une expression analytique, nous disons alors que
la "fonction y de x" est "donnée analytiquement". Voici quelques exemples d'expressions analytiques
simples :

, , (16.48)

Lorsque nous avons déterminé l'équation de la médiatrice, nous avons obtenu une expression analytique de
la droite visuelle qui l'a caractérise sous la forme d'une fonction du type :

(16.49)

qui rappelons-le, est donc l'expression analytique l'équation d'une droite, appelée également "équation
linéaire" ou "fonction affine", sur un plan dont si deux points sont connus, la pente est
donnée par le rapport de l'accroissement vertical sur l'accroissement horizontal tel que :

(16.50)

Une application sympathique et triviale consiste à démontrer analytiquement que deux droites non verticales
sont parallèles si et seulement si elles ont la même pente. Ainsi, soit deux droites données par les équations :

(16.51)

Les droites se coupent en un point (x, y) si et seulement si les valeurs de y sont égales pour un certain x,
c'est-à-dire :

(16.52)

La dernière équation peut être résolue par rapport à x si et seulement si . Nous avons donc montré
que les droites se coupent si et seulement si . Donc, elles ne se coupent pas (elles sont
parallèles) si et seulement si .

De façon assez simple en appliquant le théorème de Pythagore, il n'est pas compliqué de déterminer que
l'équation d'un cercle de centre C(h, k) à pour équation (nous avons pour habitude en mathématique de ne
pas expliciter y pour l'équation du cercle ainsi, l'équation de ce dernier est visuellement beaucoup plus
esthétique et parlante)

(16.53)

Dans ces exemples les fonctions sont exprimées analytiquement par une seule formule (égalité entre deux
expressions analytiques) qui définit dans un même temps le "domaine naturel de définition" des fonctions.

Définition: Le "domaine naturel de définition" d'une fonction donnée par une expression analytique est
l'ensemble des valeurs x pour lesquelles l'expression du membre droit a une valeur bien déterminée.

Par exemple, la fonction :

(16.54)

est définie pour toutes les valeurs de x, excepté la valeur où nous avons une singularité (division par
zéro).

Remarque: Il existe une infinité de fonction et nous ne pouvons toutes les exposer ici, cependant nous en
rencontrerons plus d'un millier sur l'ensemble du site et cela devrait amplement suffire à se faire une idée de
leur étude.

FONCTIONS

Définitions:

D1. Nous disons que y est une fonction de x et nous écrirons , etc., si à chaque valeur de
la variable x appartenant à un certain domaine de définition (ensemble) D, correspond une valeur de la
variable y dans un autre domaine de définition (ensemble) E. Ce que nous notons :

(16.55)

La variable x est appelée "variable indépendante" ou "variable d'entrée" et y "variable dépendante".

La dépendance entre les variables x et y s'appelle une "dépendance fonctionnelle". La lettre f, qui entre dans
la notation symbolique de la dépendance fonctionnelle, indique qu'il faut appliquer certaines opérations à x
pour obtenir la valeur correspondant y.

Nous écrivons parfois :

(16.56)

au lieu de :

(16.57)

Dans ce dernier cas la lettre y exprime en même temps la valeur de la fonction et le symbole des opérations
appliquées à x.
Remarque: Comme nous l'avons vu lors de notre étude du chapitre de Théorie Des Ensembles, une
application (ou fonction) peut-être injective, bijective ou surjective. Il convient donc que le lecteur dont ces
notions ne sont pas connues aille en priorité lire ces définitions.

D2. L'ensemble des valeurs x pour lesquelles la valeur de la fonction y est donnée par la fonction f(x) est
appelé "domaine d'existence" de la fonction (ou domaine de définition de la fonction).

D3. La fonction est dite "fonctions croissante" si à une plus grande valeur de la variable
indépendante correspond une plus grande valeur de la fonction (de l'image). Nous définissons de manière
analogue mais inverse la "fonction décroissante".

D4. Une "fonction constante" est une fonction pour laquelle à toute valeur de la variable indépendante
correspond toujours une même image constante.

D5. La fonction est dit "fonction périodique" s'il existe un nombre constant tel que la valeur de
la fonction ne change pas quand nous ajoutons (ou que retranchons) le nombre à la variable indépendante
tel que:

(16.58)

Ce qui correspondant à une translation selon x. La plus petite constante satisfaisant à cette condition est
appelée "période" de la fonction. Elle est fréquemment notée T en physique.

D6. En calcul différentiel et intégral, l'expression :

(16.59)

avec est d'un intérêt particulier. Nous l'appelons un "quotient d'accroissement" (nous reviendrons
beaucoup plus en détail sur ce sujet lors de notre étude du calcul différentiel et intégral).

D7. Nous utilisons certaines propriétés des fonctions pour faciliter leur représentation graphique et leur
analyse. En particulier, une fonction f(x) est dite "fonction paire" si :

(16.60)

pour tout x dans son domaine de définition. Une fonction est dite "fonction impaire" si :

(16.61)

pour tout x dans son domaine de définition.

Ainsi, pour résumer une fonction paire est une fonction qui ne dépend pas du signe de la variable et une
fonction impaire change de signe quand nous changeons le signe de la variable (la spirale de Cornus dans le
chapitre de Génie Civil est un bon exemple pratique de fonction impaire). Ce concept nous sera très utile
pour simplifier certaines expressions très utiles en physique (comme les transformées de Fourier des
fonctions paires ou impaires par exemple!).

Montrons maintenant que toute fonction f(x) est la somme d'une fonction paire g(x) et d'une fonction impaire
h(x).
Remarque: Ce type de théorème qui consiste à relier un concept général par un cas particulier et son opposé
se retrouve souvent en mathématiques. Nous retrouverons de tels exemples en calcul tensoriel avec les
tenseurs symétriques et antisymétriques (cf. chapitre de Calcul Tensoriel) ou encore en physique quantique
avec les opérateurs hermitiques et anti-hermitiques (cf. chapitre de Physique Quantique Ondulatoire).

Démonstration:

Posons :

(16.62)

alors :

(16.63)

Si nous sommons, nous avons dès lors :

(16.64)

et en soustrayant :

(16.65)

Il existe donc bien une décomposition paire et impaire de toute fonction.

C.Q.F.D.

D8. De façon générale, si f(x) et g(x) sont des fonctions quelconques, nous utilisons la terminologie et les
notations données dans le tableau suivant :

Terminologie Valeur de la fonction


Somme
Différence
Produit

Quotient
Tableau: 11.1 - Terminologie concernant les fonctions

Les domaines de définition de , , sont l'intersection I des domaines de définition de f(x) et


de g(x), c'est-à-dire les nombres qui sont communs aux deux domaines de définition. Le domaine de
définition de est quant à lui le sous-ensemble de I comprenant tous les x de I tels que .

D9. Soit y une fonction de u et u une fonction de la variable x, alors y dépend alors de x et nous avons ce que
nous appelle une "fonction composée" et que nous notons:

ou (16.66)
Pour la dernière notation, il faut lire "f rond g" et ne pas confondre le "rond" avec la notation du produit
scalaire que nous verrons lors de notre étude du calcul vectoriel (cf. chapitre de Calcul Vectoriel).

Le domaine de définition de la fonction composée est soit identique au domaine tout entier de définition de
la fonction , soit à la partie de ce domaine dans laquelle les valeurs de u sont telles que les valeurs
correspondantes f(u) appartiennent au domaine de définition de cette fonction.

Le principe de fonction composée peut être appliqué non seulement une fois, mais un nombre arbitraire de
fois.

Si x ne dépend pas d'une autre variable (ou qu'elle n'est pas elle même une fonction composée), nous disons
alors que est une "fonction élémentaire".

Les principales fonctions élémentaires sont des fonctions dont l'expression est l'une des suivantes:

1. La "fonction puissance" :

(16.67)

où m est un nombre positif différent de 1 (sinon il s'agit d'une fonction linéaire).

(16.68)

2. La "fonction exponentielle" :

(16.69)

où a est un nombre positif différent de 1.

3. La "fonction logarithmique" :

(16.70)

où la base du logarithme est un nombre positif a différent de l'unité (cette fonction sera définie
rigoureusement un peu plus loin).
Remarque: Les fonctions exponentielles et logarithmiques sont appelées parfois des "fonctions
transcendantes".

4. Les "fonctions trigonométriques" (cf. chapitre de Trigonométrie) :

... (16.71)

5. Les "fonctions polynomiales" :

(16.72)

où sont des nombres constants appelés coefficients et n est un entier positif que nous appelons
"degré du polynôme" (cf. chapitre de Calcul Algébrique). Il est évident que cette fonction est définie pour
toutes les valeurs de x, c'est-à-dire qu'elle est définie dans un intervalle infini.

6. Les "fractions rationnelles" qui sont des divisions de polynômes (cf. chapitre de Calcul Algébrique):

(16.73)

Remarque: Deux fractions rationnelles sont égales, si l'une s'obtient de l'autre en multipliant le numérateur et
le dénominateur par un même polynôme.

7. Les "fonctions algébriques" sont définies par le fait que la fonction est le résultat d'opérations
d'addition, de soustraction, de multiplication, de division, de variables élevées à une puissance rationnelle
non entière.

Remarque: Il existe cependant un très grand nombre de fonctions que nous rencontrerons dans les différents
chapitres du site. Citons par exemple les "fonctions de Bessel" (cf. chapitre des Suites Et Séries), les
"fonctions lipschitziennes" (cf. chapitre de Topologie), les "fonctions de Dirac" (cf. chapitre de Calcul
Différentiel et Intégral), les "fonctions de répartition et de distribution" (cf. chapitre de Statistiques), la
"fonction gamma d'Euler" (cf. chapitre de Calcul Différentiel Et Intégral), etc.

8. Une application est dite "fonction en escalier" si et seulement si il existe une subdivision
de [a, b] tel que et et tels que:
(16.74)

LIMITE ET CONTINUITÉ DES FONCTIONS

Nous allons considérer maintenant des variables ordonnées d'un type spécial, que nous définissons par la
relation "la variable tend vers une limite". Dans la suite de ce cours, la notion de limite d'une variable va
jouer un rôle fondamental, étant intimement liée aux notions de base de l'analyse mathématique, la dérivée,
l'intégrale, etc.

Définition: Le nombre a est appelé la "limite" de la grandeur variable x, si, pour tout nombre arbitrairement
petit avons :

(16.75)

Si le nombre a est la limite de la variable x, nous disons que "x tend vers la limite a".

Nous pouvons définir également la notion de limite en partant de considérations géométriques (cela peut
aider à mieux comprendre... quoique pas toujours...) :

Le nombre constant a est la limite de la variable x, si pour tout voisinage donné, aussi petit qu'il soit, de
centre a et de rayon , nous pouvons trouver une valeur x telle que tous les points correspondant aux
valeurs suivantes de la variable appartiennent à ce voisinage (notions que nous avons défini précédemment).
Géométriquement nous représentons cela ainsi:

(16.76)

Remarque: Il devrait être trivial que la limite d'une grandeur constante est égale à cette constante, puisque
l'inégalité est toujours satisfaite pour arbitraire.

Il découle également de la définition de la limite qu'une grandeur variable ne peut pas avoir n'importe
comment deux limites. En effet, si :
et (16.77)

avec , x doit satisfaire simultanément aux deux inégalités suivantes :

et (16.78)

pour arbitrairement choisi. Mais si nous faisons une représentation géométrique identique à la précédente,
nous voyons assez aisément que cela est impossible si :

(16.79)

Il ne faut également pas s'imaginer que chaque variable doit nécessairement avoir une limite.

Définition: La variable x tend vers l'infini, si pour chaque nombre positif donné M nous indiquons une
valeur de x à partir de laquelle toutes les valeurs conséquentes de la variable (valeurs de la variable
appartenant dans le voisinage défini à partir de valeur indiquée précédemment) x vérifient l'inégalité
.

Nous pouvons vérifier ce genre de cas dans les suites arithmétiques, géométriques, ou harmoniques où
chaque terme de la progression est une valeur que prend la variable x.

La variable x "tend vers plus l'infini", ou si pour arbitraire, à partir d'une certaine valeur,
toutes les valeurs conséquentes de la variable vérifient l'inégalité . C'est typiquement le genre de
considération que nous avons pour des progressions divergentes vers l'infini ou à partir d'un certain terme de
valeur égale à M tous les termes suivant sont supérieurs à M.

La variable x "tend vers moins l'infini" ou si pour arbitraire, à partir d'une certaine valeur,
toutes les valeurs suivantes de la variable vérifient l'inégalité .

Définition: Soit une fonction définie dans un voisinage du point a ou en certains points de ce
voisinage. La fonction tend vers la limite b lorsque x tendant vers a , si pour
chaque nombre positif , aussi petit qu'il soit, nous pouvons indiquer un nombre positif tel que tous les x
différents de a et vérifiant l'inégalité satisfont également :

(16.80)

L'inégalité permet d'exprimer le côté (ou le sens) depuis lequel nous venons avec notre x. Car sur
le système d'axe représentant des valeurs ordonnées, nous pouvons, pour une valeur donnée, venir de sa
gauche ou de sa droite pour se rapprocher d'elle (imaginez-vous au besoin, un bus qui peut venir depuis un
côté ou un autre de la route tant que la distance qui le sépare à l'arrêt qui nous intéresse est inférieur à ).

Si b est la limite de la fonction f(x) quand , nous écrivons alors sur ce site en tout les cas:

(16.81)

Pour définir le côté depuis lequel nous venons en appliquant la limite, nous utilisons une notation
particulière (rappelons que cela permet de connaître de quel côté de la route vient notre bus).
Ainsi, si f(x) tend vers la limite quand x tend vers un nombre a en ne prenant que des valeurs plus petites
que a, nous écrirons alors:

(16.82)

(remarquez le petit – en indice) et nous appellerons la "limite à gauche" de la fonction f(x) au point a (car
rappelez vous que l'axe des ordonnées va de à , donc les petites valeurs par rapport à une valeur
donnée, se trouvent à gauche). Si x prend des valeurs plus grande que a, nous écrirons alors:

(16.83)

(remarquez le petit + en indice) et nous appellerons la "limite à droite" de la fonction au point a.

Définition: La fonction f(x) tend vers la limite b quand si pour chaque nombre positif aussi petit
qu'il soit nous pouvons indiquer un nombre positif N tel que pour toutes les valeurs de x vérifiant l'inégalité
, l'inégalité

Exemple:

Montrons que (nous supposons le résultat connu pour l'instant):

(16.84)

Il faut démontrer que, quel que soit , l'inégalité sera satisfaite dès que , où N est

défini par le choix de . L'inégalité précédente est évidemment équivalente à , qui est satisfait si
nous avons x:

(16.85)

Nous admettons que l'exemple et la méthode sont discutables mais nous verrons plus tard les outils
mathématiques adéquats pour arriver rigoureusement, sans magouilles et hypothèses de départ, au résultat
obtenu précédemment.

La signification des symboles et , rend évidente celle des expressions :

f(x) tend vers b quand

et :

f(x) tend vers b quand

que nous notons symboliquement par:

et (16.86)
Nous avons étudié le cas où la fonction f(x) tend vers une certaine limite b quand ou .
Considérons maintenant le cas où la fonction tend vers l'infini quand la variable x varie d'une
certaine manière.

Définition: La fonction f(x) tend vers l'infini quand , autrement dit f(x) est infiniment grande quand
, si pour chaque nombre positif M, aussi grand qu'il soit, nous pouvons trouver un nombre tel
que pour toutes les valeurs de x différentes de a et vérifiant la condition , l'inégalité
est satisfaite.

Si f(x) tend vers l'infini quand , nous écrivons:

(16.87)

Si f(x) tend vers l'infini quand , en ne prenant que des valeur positives ou que des valeurs négatives,
nous écrivons respectivement :

et (16.88)

Si la fonction f(x) tend vers l'infini quand on écrit:

(16.89)

et en particulier, nous pouvons avoir:

, , , (16.90)

Il peut arriver que la fonction f(x) ne tende ni vers une limite finie, ni vers l'infini quand (par
exemple ), la fonction est alors bornée (cf. chapitre de Théorie des Ensembles).
Maintenant que nous avons grosso modo eu un aperçu du concept de limite, nous allons donner une
définition extrêmement importante qui est un des piliers de beaucoup de domaines de la mathématique et de
la physique.

Définition: Soit f une fonction définie sur . Soit , nous disons que nous avons une "fonction
continue" en si et seulement si:

(16.91)

c'est-à-dire si (il faut pouvoir arriver à y lire le fait qu'on s'approche de manière infiniment petite d'une limite
ce qui permet d'assurer le continuité) que tel que alors:

(16.92)

Remarque: f est "continue à droite" (resp. à gauche) si nous rajoutons la condition (resp. ).

Nous avons les corollaires triviaux suivants:

C1. f est continue en si et seulement si f est continue à droite et à gauche en

C2. f est continue sur I si et seulement si f est continue en tout point de I.

ASYMPTOTES

Le terme d'asymptote est utilisé en mathématiques pour préciser des propriétés éventuelles d'une branche
infinie de courbe à accroissement tendant vers l'infinitésimal.

L'étude du comportement asymptotique est particulièrement développée dans les études de fonctions. Dans
le domaine scientifique, il arrive fréquemment d'étudier des fonctions dépendant du temps (évolution de
populations, réaction chimique ou nucléaire, graphique de température, oscillation d'un amortisseur). Un des
objectifs du chercheur est alors de connaitre l'état à la fin de l'expérience, c'est à dire lorsqu'un grand
intervalle de temps s'est écoulé. L'objectif n'est alors pas de connaitre les variations intermédiaires mais de
déterminer le comportement stable, à l'infini du phénomène mesuré. Le chercheur étudie donc le
comportement asymptotique de sa fonction avec les outils que les mathématiques lui offrent.

Définitions :

D1. Lorsque la limite d'une fonction f(x) tends vers une constante quand , alors la représentation
graphique de cette fonction nous amène à dessiner une droite horizontale que nous appelons "asymptote
horizontale" et dont l'équation est :

(16.93)

D2. Lorsque la limite d'une fonction f(x) tends vers quand , alors la représentation graphique de
cette fonction nous amène à dessiner une droite verticale que nous appelons "asymptote verticale" et dont
l'équation est :

(16.94)
Exemple:

La courbe représentative de la fonction f(x)=1/(x-1) admet la droite d'équation comme asymptote


verticale et comme asymptote horizontale:

(16.95)

D3. La droite d'équation est une "asymptote oblique" à la courbe de la fonction f(x) si :

(16.96)

les valeurs de a et de b peuvent se retrouver facilement à l'aide des relations suivantes :

(16.97)

Remarque: Attention une courbe peut admettre deux asymptotes obliques distinctes en + et en -

Pour rechercher une asymptote oblique éventuelle, il faut déjà être sur que la fonction f admet une limite
infinie en + ou en - ensuite nous cherchons la limite en + ou en de f(x)/x .

Trois cas sont à considérer :

C1. La courbe représentative de f a pour direction asymptotique la droite d'équation :

(16.98)
Exemple:

La fonction possède entre autre une asymptote d'équation :

(16.99)

C2. La courbe représentative de f admet une branche infinie (cette branche infinie n'admet pas d'asymptote)
et l'axe des abscisses en est la direction asymptotique (fonction racine carrée par exemple)

(16.100)

Exemple:

La fonction (en rouge) ou ln(x) (en vert) ont une limite f(x)/x nulle et possèdent donc toutes deux
une "branche parabolique" de direction Ox.
(16.101)

C3. La courbe représentative de f admet une branche infinie (cette branche infinie n'admet pas d'asymptote)
et l'axe des ordonnées en est la direction asymptotique. (nous parlons aussi de "branche parabolique" voir de
"fonction carrée")

(16.102)

Exemple:

La fonction à une limite f(x)/x infinie et possède donc une "branche parabolique" de direction Oy.
(16.103)

LOGARITHMES

Nous avons longuement hésité à mettre la définition des logarithmes dans le chapitre traitant du calcul
algébrique. Après un moment de réflexion, nous avons décidé qu'il valait mieux la mettre ici car pour bien la
comprendre, il faut avoir connaissance des concepts de limite, domaine de définition et fonction
exponentielle. Nous espérons que notre choix vous conviendra au mieux.

Soit la fonction exponentielle (bijective) de base quelconque a, où notée :

(16.104)

pour laquelle il correspond à chaque nombre réel x, exactement un nombre positif (l'ensemble image de
la fonction est dans ) tel que les règles de calcul des puissances soient applicables (cf. chapitre de Calcul
Algébrique).

Nous savons que pour une telle fonction, que si , alors f(x) est croissante et positive dans , et si
, alors f(x) est décroissante et positive dans .

Remarques:

R1. Si , lorsque x décroît vers des valeurs négatives, le graphique de f(x) tend vers l'axe des x. Ainsi,
l'axe des x est une asymptote horizontale. Lorsque x croît par valeurs positives, le graphique monte
rapidement. Ce type de variation est caractéristique de la "loi de croissance exponentielle" et f(x) est quelque
fois appelée "fonction de croissance". Si , lorsque x croît, le graphique tend asymptotiquement vers
l'axe des x. Ce type de variation est connue sous le nom de "décroissance exponentielle".
R2. En étudiant , nous excluons le cas et . Notons que si , alors n'est pas un nombre
réel pour de nombreuses valeurs de x (nous rappelons que l'ensemble image est contraint à ). Si ,
n'est pas défini. Enfin, si , alors pour tout x et le graphique de f(x) est une droite
horizontale.

Puisque la fonction exponentielle f(x) est bijective alors il existe une fonction réciproque et appelée
"fonction logarithme" de base a notée :

(16.105)

Et donc :

(16.106)

si et seulement si .

En considérant comme un exposant, nous avons les propriétés suivantes :

Propriétés Justification

Tableau: 16.2 - Propriétés du logarithme en base a

Remarque:

R1. Le mot "logarithme" signifie "nombre du logos", "logos" signifiant "raison" ou "rapport".

R2. Les fonctions logarithme et exponentielle sont définies par leur base (le nombre a). Lorsqu'on utilise un
base de puissance de 10 (10, 100, 1000,…) nous parlons alors de "système vulgaire" car ils ont pour
logarithme des nombres entiers successifs.

R3. La partie entière du logarithme s'appelle la "caractéristique".

Il existe deux types de logarithmes que nous retrouvons presque exclusivement en mathématique et en
physique : le logarithme en base dix et le logarithme en base e (ce dernier étant fréquemment appelé
"logarithme naturel" ou plus exactement pour des raisons historiques justifiées "logarithme népérien").

D'abord celui en base 10:

(16.107)

abusivement noté :

(16.108)

et celui en base (eulérienne) e:


(16.109)

historiquement noté:

(16.110)

le "n" signifiant "népérien".

Remarque: Historiquement, c'est à John Napier (1550-1617) dont le nom latinisé est "Neper" que l'on doit
l'étude des logarithmes et le nom aux "logarithmes népérien".

En français pour la fonction logarithmique en base 10 il faut pour calculer:

(16.111)

se poser la question suivante : à quelle puissance devons nous élever 10 pour obtenir x ?

Formellement, cela consiste à résoudre l'équation:

(16.112)

ou autrement écrit:

(16.113)

avec x étant connu et donc en base 10:

(16.114)

Pour la fonction logarithmique en base eulérienne e (ou dite "base nepérienne") il faut pour calculer:

(16.115)

se poser aussi la question suivante : à quelle puissance devons nous élever le nombre e pour obtenir x
?

Formellement, cela consiste à résoudre l'équation :

(16.116)

ou autrement écrit:

(16.117)

avec x étant connu et donc:

(16.118)

Techniquement, nous disons alors que la fonction exponentielle (voir plus bas les détails):
(16.119)

est la bijection réciproque de la fonction ln(x).

(16.120)

Mais quel est donc ce nombre "eulérien" appelé également "nombre d'Euler" ? Pourquoi le retrouve-t-on si
souvent en physique et en mathématique? D'abord déterminons l'origine de sa valeur :

Pour cela, il nous faut déterminer la limite (dont l'origine historique semblerait être l'étude de problèmes
financiers par Euler) de :

(16.121)

avec et quand .

Remarque: Le deuxième terme de l'égalité est donc typiquement le type d'expression que nous retrouvons
dans les intérêts composés en finance (cf. chapitre d'Économie) ou dans tout autre type d'accroissement à
facteur égal. Et ce qui nous intéresse dans le cas présent c'est quand ce type de d'accroissement tend vers
l'infini.

L'intérêt que nous avons à poser le problème ainsi c'est que si nous faisons tendre la fonction écrite
précédemment tend vers e et cette fonction a pour propriété particulière de pouvoir se calculer plus ou moins
facilement pour des raisons historiques à l'aide du binôme de Newton.

Donc d'après le développement du binôme de Newton (cf. chapitre de Calcul Algébrique) nous pouvons
écrire :

(16.122)

Ce développement, est similaire au développement de Taylor de certaines fonctions pour des cas particuliers
de valeurs de développement (d'où la raison pour laquelle nous retrouvons ce nombre eulérien dans
beaucoup d'endroits que nous découvrirons au fur et à mesure).
En effectuant certaines transformations algébriques évidentes, nous trouvons:

(16.123)

Nous voyons de cette dernière égalité que la fonction est croissante quand croît. En effet, quand
nous passons de la valeur à la valeur chaque terme de cette somme augmente:

, etc. (16.124)

Montrons que la grandeur variable est bornée. En remarquant que :

, , etc. (16.125)

Nous obtenons donc par anologie avec l'expression étendue en binôme de Newton déterminée plus haut la
relation d'ordre suivante:

(16.126)

D'autre part:

(16.127)

Nous pouvons donc écrire l'inégalité :

(16.128)

Les termes soulignés constituent une progression géométrique de raison (cf. chapitre de Suites et
Séries) et dont le premier terme est 1. Par suite en utilisant les résultant obtenus dans le chapitre de Suites et
Séries, nous pouvons écrire:

(16.129)

Par conséquent nous avons :


(16.130)

Nous avons donc prouvé que la fonction est bornée.

La limite:

(16.131)

tend donc vers cette valeur bornée qui le nombre e dont la valeur est :

(16.132)

Remarque: Comme nous l'avons démontré dans le chapitre traitant des Nombres ce nombre est irrationnel.

Nous pouvons alors définir la "fonction exponentielle naturelle" (réciproque de la fonction logarithme
népérien) par :

(16.133)

ou également parfois notée:

(16.134)

Le nombre e et la fonction qui permet de le déterminer sont très utiles. Nous les retrouvons dans tous les
domaines de la mathématique et de la physique et donc dans la quasi totalité des chapitres de ce site.

Les logarithmes ont plusieurs propriétés. Les voici (nous nous référons à une base X donnée):

(16.135)

Si nous posons et nous avons donc :

(16.136)

Si nous avons le cas particulier alors:

(16.137)

Cherchons à exprimer:

(16.138)

sous une forme différente. Posons ce qui nous amène au développement:


(16.139)

Cherchons à exprimer maintenant avec sous un forme différente. Posons :

(16.140)

ce qui nous amène à:

(16.141)

Il y a une relation assez utilisée en physique relativement aux changements de bases logarithmiques. La
première relation est triviale et découle des propriétés algébriques des logarithmes:

(16.142)

La seconde relation:

(16.143)

est un peu moins triviale et nécessite peut-être une démonstration (nous en aurons besoin lors de notre étude
des fractions continues dans le chapitre de Théorie des nombres).

Démonstration:

Nous avons d'abord les équations équivalentes (de la première relation ci-dessus):

et (16.144)

et nous procédons comme suit:

(16.145)

Ce qui nous amène finalement à:

(16.146)

C.Q.F.D.

PRODUIT SCALAIRE FONCTIONNEL


Le produit scalaire fonctionnel (analogie très forte avec le produit scalaire vectoriel vu dans le chapitre de
calcul vectoriel) peut paraître inutile lorsqu'il est étudié pour la première fois hors d'un contexte appliqué
mais il connaît au fait de nombreuses applications pratiques. Nous en ferons par exemple directement usage
dans le chapitre de physique quantique ondulatoire et de chimie quantique ou encore dans le cadre plus
important encore des polynômes trigonométriques via les séries et transformées de Fourier (cf. chapitre sur
les Suites Et Séries) que nous retrouvons partout dans la physique contemporaine.

Cependant, si le lecteur n'a pas encore parcouru le chapitre de calcul vectoriel et la partie y traitant du
produit scalaire vectoriel, nous ne serions que trop recommander sa lecteur sans quoi de ce qui va suivre
risque d'être un peu incompréhensible.

Nous nous plaçons dans l'espace des fonctions continues de l'intervalle [a,b] dans muni du
produit scalaire définit par (nous retrouvons la notation spécifique du produit scalaire à sa version
fonctionnelle comme nous en avions fait mention lors de notre définition du produit scalaire vectoriel):

(16.147)

Une famille de polynômes orthogonale, comme nous pouvons en faire l'analogie avec le produit scalaire vu
dans le chapitre de Calcul Vectoriel, est donc une famille de polynômes tels que :

si (16.148)

Nous rappelons qu'une famille orthogonale est libre (cf. chapitre de Calcul Vectoriel).

Le développement suivant va nous rappeler le procédé de Gram-Schmidt (cf. chapitre de Calcul Tensoriel)
pour construire une famille orthogonale :

Soit une famille de polynômes linéairement indépendants définis sur [a,b] et V l'espace
vectoriel engendré par cette famille. La famille définie par récurrence de la manière suivante :

(16.149)

et est orthogonale et engendre V.

Démonstration:

Montrons par récurrence sur n que est une famille orthogonale qui engendre le même espace
que . L'assertion est vérifiée pour . Supposons l'assertion vérifiée pour , pour
nous avons :
(16.150)

est donc orthogonale. Pour finir, l'égalité :

(16.151)

montre que et engendrent le même espace. est donc bien une famille
orthogonale qui engendre V.

C.Q.F.D.

Exemple:

Considérons l'exemple très important en physique moderne qui est l'ensemble des fonctions continues
-périodiques qui forme un espace vectoriel (cf. chapitre de Calcul Vectoriel).

Nous définissons donc le produit scalaire de deux fonctions de cet ensemble par :

(16.152)

Le but de cette étude est de construire une base de sur laquelle nous pouvons décomposer tout fonction
-périodique.

L'idée la plus simple est alors de se servir des fonctions trigonométriques sinus et cosinus :

(16.153)

Les relations ci-dessous montrent que les bases choisies ci-dessus sont orthogonaux et forment donc une
famille libre, de plus c'est une famille génératrice de l'espace vectoriel car comme nous le démontrerons
lors de notre étude des séries de Fourier (cf. chapitre sur les Suites Et Séries), nous avons les valeurs
suivantes :
(16.154)

où est le symbole de Kronecker (cf. chapitre de Calcul Tensoriel).


17. ANALYSE COMPLEXE

A vant de commencer ce chapitre de l'étude du calcul différentiel et intégral dans le cas


généralisé de l'ensemble des nombres complexes, je tiens à signaler que je me suis beaucoup
inspiré du PDF de E. Hairer (avec son autorisation) au niveau des illustrations. Le présent
texte contient également de nombreuses phrases et développements repris, homogénéisés et
simplifiés (au risque d'en faire grimper certains aux rideaux...) conformément aux notations et
objectifs pédagogiques du reste de ce site internet.

Le sujet de l'analyse complexe est donc l'étude des fonctions et de leur


différentiabilité (qui est différente de celle dans ). Les "fonctions holomorphes" (c'est-à-
dire différentiable dans un sous-ensemble de ) nous le verrons possèdent des propriétés
surprenantes, élégantes et qui peuvent être réutilisées dans le cas des fonctions de et qui
ont des applications importantes en physique.

Avant de commencer expliquons l'intérêt de ce domaine de manière simplifiée!

Nous avons étudié dans la section d'Algèbre une partie du calcul différentiel et intégral avec
quelques théorèmes utiles et importants pour la physique et l'ingénierie. Cependant, en restant
dans ou la liste des théorèmes s'épuise en quelque sorte et on finit par ne plus trouver
grand-chose de pertinent dans la pratique qui permette de simplifier le calcul d'intégrales que
l'on retrouve souvent dans l'industrie. Alors, quand on sait que (donc l'ensemble des
complexes généralise celui des réels) et qu'on peut construire aussi une correspondance
comme nous allons le voir, de nouveaux théorèmes apparaissent avec des résultats
très intéressants que l'on peut exploiter pour les intégrales dans ou !! C'est cette raison
qui fait que l'ingénieur à besoin de connaître l'analyse complexe!

APPLICATIONS LINÉAIRES

Une bonne introduction à l'analyse complexe et à sa représentation, consiste à étudier dans un


premier temps (à titre pédagogique principalement) le cas particulier des applications linéaires
complexes. Voyons cela:

Soit , un ensemble et un autre ensemble. Une fonction qui associe à chaque


un :

(17.1)

est une "fonction complexe" :

(17.2)

Ce qui est important c'est de comprendre et remarquer que nous pouvons identifier:
(17.3)

et:

(17.4)

Nous arrivons alors à deux fonctions de deux variables réelles x, y:

(17.5)

qui sont les coordonnées du point w.

Définition: Une application est dite -linéaire si par exemple pour une fonction du type:

(17.6)

où c est un nombre complexe fixé et z un nombre complexe quelconque, elle satisfait:

(17.7)

Nous avons vu et démontré dans le chapitre Nombres lors de notre étude des nombres
complexes, que la multiplication de deux nombre complexes pouvait être équivalente à une
rotation orthogonale suivie d'une homothétie et que cette même multiplication pouvait être
représentée sous forme matricielle! Or la transcription sous forme matricielle implique
comme nous l'avons vu dans le chapitre d'Algèbre linéaire automatiquement la linéarité!

Donc la matrice de rotation/homothétie est un exemple d'une application -linéaire que nous
écrirons dorénavant:

(17.8)

Ce qui se représente typiquement de la manière suivante (on y observe bien une rotation et
une homothétie qui conserve les angles et les proportions):
(17.9)

C'est le fait que les proportions et que les angles soient conservés qui fait d'une fonction
complexe qu'elle est -linéaire. Dans le cas contraire, nous dirions que la fonction est -
linéaire.

Donc une matrice représente une application -linéaire seulement si elle est de la
forme:

(17.10)

Voyons des exemples de fonctions -linéaire assez remarquables.

Exemples:

E1.

(17.11)

En coordonnées réelles cela donne:

(17.12)

Ainsi, regardons ce que fait cette fonction avec les points du plan complexes confondus avec
les lignes verticales du plan complexe (ce qui vient alors à poser ). Nous avons alors:

(17.13)
et en éliminant y, nous trouvons l'équation d'une parabole ou plutôt d'une famille de paraboles
(pour plusieurs valeurs de a) qui sont ouvertes à gauche du plan complexe image:

(17.14)

Si nous faisons la même analyse pour les points du plan complexes confondus avec lignes
horizontales du plan complexe nous trouvons également, en posant , une famille de
paraboles (pour plusieurs valeurs de b) qui partent sont ouvertes à droite du plan complexe
image.

Voici une représentation du plan complexe image sur lequel nous avons dessiné un chat:

(17.15)

et si nous regardons le plan complexe pré-image correspondant nous avons alors deux têtes de
chats qui apparaissent:
(17.16)

L'apparition de ces deux têtes de chats vient du fait que cette fonction possède 2 pré-images
possibles pour chaque point image (c'est donc une fonction surjective).

E2. Une autre fonction intéressante est la "transformation de Cayley" utilisée dans certains
domaines de la physique et définie par:

(17.17)

ayant comme domaine de définition: .

On remarquera qu'il s'agit d'une fonction involutive puisque:

(17.18)

et comme nous avons démontré dans le chapitre de Théorie de la démonstration que toute
fonction involutive est à la fois injective et surjective, alors la transformation de Cayley est
une fonction bijective.

Cette fonction transforme l'axe des imaginaires en cercle unité (et inversement puisqu'elle est
involutive):
(17.19)

où:

(17.20)

satisfont:

(17.21)

Soit:

(17.22)

Il s'agit donc bien de l'équation d'un cercle.

E3. Comme dernière fonction d'exemple, prenons la "transformation de Joukovski" définie


par:

(17.23)

Si le domaine de définition donné est construit en coordonnées polaires regardons comment


un cercle ou une ellipse se transforme :
(17.24)

Alors le plan image sera:

(17.25)

Elle transforme donc respectivement les cercles centrés en 0 et les rayons passant par 0 en une
famille d'ellipses et d'hyperboles cofocales. Pour démontrer ce fait, nous utilisons donc les
coordonnées polaires complexes (formule d'Euler) vues dans le chapitre sur les Nombres:

(17.26)

et:
(17.27)

Nous avons alors:

(17.28)

d'où:

(17.29)

et nous voyons immédiatement que:

(17.30)

qui a la forme de l'équation d'une ellipse (cf. chapitre de Géométrie Analytique) et nous avons
de même:

(17.3
1)

qui est l'équation d'une hyperbole (cf. chapitre de Géométrie Analytique).

Cette fonction trouve son utilité dans le cas où si nous plaçons astucieusement un cercle
(comme dans le cas de la première figure représentant le plan en coordonnées polaires en trait
discontinu) passant par le point pourrait ressembler à une aile d'avion. Ce qui permet en
aérodynamique de transposer l'étude d'un champ de vecteurs du profil d'une aile d'avion à
l'étude du profil d'un cercle et de faire par la suite la transformation de Joukovski.

Effectivement, voyons un partie de cela avec Maple:

> assume(x,real,y,real);
> z:=x+I*y;
> F:=1/2*(z+1/z);

> u:=Re(F);
> u:=evalc(u);
> v:=Im(F);
> v:=evalc(v);

> with(plots):with(plottools):
> p1:=disk([0,0],1,color=black):
> p2:=implicitplot({seq(v=b/8,b=-10..10)},x=-4..4,y=-2..2,color=black):
> display([p2,p1],scaling=constrained);

Nous obtenons alors...:

(17.32)

E3. Faisons un dernier exemple avec la fonction 1/z mais et encore avec Maple. Si vous y
saisissez les commandes suivantes (suffisamment explicites de par leur nom pour comprendre
ce qu'elles font):

> assume(x,real,y,real);
> z:=x+I*y;
> F:=1/z;

> u:=Re(F);
> u:=evalc(u);

> v:=Im(F);
> v:=evalc(v);

> with(plots):
> p1:=implicitplot({seq(u=a,a=-5..5)},x=-1..1,y=-1..1,numpoints=1000):
> p2:=implicitplot({seq(v=b,b=-5..5)},x=-1..1,y=-1..1,numpoints=1000,color=green):
> display([p1,p2],scaling=constrained);

Nous obtenons!:
(17.33)

voilà pour ceux qui souhaiteraient faire eux-mêmes des figures de fonctions complexes!

FONCTIONS HOLOMORPHES

La définition de la dérivation par rapport à une variable complexe est naturellement


formellement identique à la dérivation par rapport à une variable réelle.

Nous avons alors, si la fonction est dérivable en :

(17.34)

et nous disons (abusivement dans le cadre de ce site) que la fonction est "holomorphe" (alors
que dans on dit "dérivable") ou "analytique" dans son domaine de définition ou dans un
sous-ensemble de celui-ci si elle y est dérivable en chaque point.

Remarque:
R1. Une fonction complexe se dérive comme une fonction réelle, il suffit de poser z comme
étant x... à condition que ce que nous allons voir dans ce qui va suivre soit respecté!

R2. Au fait si la fonction est holomorphe dans un sous-ensemble du plan complexe, nous
verrons un peu plus loin lors de notre étude la converge des séries de puissance qu'il s'agit
toujours d'un sous-ensemble ouvert.

D'une manière équivalente, nous disons que la fonction f est -différentiable en si la


limite suivante existe dans :

(17.35)

Présentons maintenant un théorème central pour l'analyse complexe appelée "théorème de


Cauchy-Riemann"!

Si la fonction:

(17.36)

est -différentiable, en , alors nous avons:

(17.37)

qui est un peu l'équivalent du théorème de Schwarz dans vu dans le chapitre de Calcul
Différentiel et Intégral. Ces deux dernières relations sont appelées "conditions de Cauchy".

Démonstration:

Puisque:

(17.38)

En choisissant:

(17.39)

avec , nous obtenons:

(17.40)
et quand x tend vers une petite valeur dx nous avons (cf. chapitre de Calcul Différentiel et
Intégral):

(17.41)

et en choisissant:

(17.42)

avec , nous obtenons :

(17.43)

et quand y tend vers une petite valeur dy nous avons (cf. chapitre de Calcul Différentiel et
Intégral):

(17.44)

Nous avons donc maintenant:

(17.45)

Or nous avons démontré dans le chapitre de Calcul Différentiel et Intégral que:

(17.46)

Dès lors:
(17.47)

Soit:

(17.48)

Ce qui peut s'écrire:

(17.49)

Une solution triviale est d'avoir:

(17.50)

Soit la possibilité d'écrire:

(17.51)

En identifiant parties réelles et imaginaires, nous terminons la démonstration!

C.Q.F.D.

Donc pour que f soit dérivable au sens complexe (holomorphe) en un point, il suffit qu'elle y
soit différentiable comme fonction de deux variables réelles ( -différentiable en ) et
que ses dérivées premières partielles en ce point vérifient les équations de Cauchy-Riemann.

Par contre, pour qu'elle soit -différentiable, il faut que les équations de Cauchy-Riemann
soient valables en tous les points du plan complexe (on parle alors parfois de "fonctions
entières") et non pas seulement dans un sous-domaine de celui-ci!

Remarque: Géométriquement, nous montrerons plus tard qu'une fonction holomorphe a une
interprétation possible dans le sens qu'elle est conforme (conserve les angles).

Signalons donc que si f(z) est -différentiable alors elle peut donc être développée en série de
Taylor aussi (cf. chapitre de Suites et Séries):
(17.52)

Remarquons une chose importante aussi. Si nous récrivons:

(17.53)

Sous la forme suivante:

(17.54)

Nous disons alors que la fonction f est irrotationnelle (cf. chapitre de Calcul Vectoriel)
puisque la première relation peut être vue comme:

(17.55)

ce qui est une analogie non anodine! Enfin, la deuxième relation:

(17.56)

permet également de dire par analogie (mais cela s'arrête à une simple analogie!) que la
fonction f est non divergente (cf. chapitre de Calcul Vectoriel) ce qui est bon moyen
mnémotechnique de s'en souvenir.

Mettons également autre chose en évidence. Si nous reprenons les deux équations de Cauchy-
Riemann:

(17.57)

et que nous les dérivons encore une fois ainsi:

(17.58)
et que nous sommons ces deux relations nous avons alors:

(17.59)

Il en est de même avec v. Nous avons alors:

(17.60)

Et nous connaissons très bien cette forme d'équations (équation de Maxwell-Poisson dans le
chapitre d'Électrodynamique et de Newton-Poisson dans celui d'Astronomie...). Il s'agit d'une
équation d'onde appelée aussi "équation de Laplace" (rien à voir avec celle vue lors de notre
étude de l'hydrostatique!) parfois et donnée par le Laplacien scalaire (cf. chapitre de Calcul
Vectoriel):

(17.61)

Il est alors de tradition de dire que u est harmonique et nous pouvons arriver bien évidemment
au même résultat avec v! Bon évidemment... nous le savions déjà puisque nous avons déjà
étudié que dans le chapitre sur les Nombres que la partie réelle et imaginaire d'un nombre
complexe pouvait être mises sous forme trigonométrique.

Grâce à cette découverte, Riemann a ouvert l'application des fonctions holomorphes à de


nombreux problèmes de la physique, puisque ces dernières équations sont satisfaites par le
potentiel gravitationnel (équation de Newton-Poisson dans le chapitre d'Astronomie), par les
champs électriques et magnétiques (équation de Maxwell-Poisson dans le chapitre
d'Électrodynamique) et par la chaleur en équilibre (par encore d'exemples sur le site) et aux
mouvements sans rotationnel de certains liquides ( par encore d'exemples non plus sur le site).

Exemple:

Le potentiel d'un dipôle peut être décrit par la fonction holomorphe:

(17.62)

La figure ci-dessous:
(17.63)

montre les courbes de niveau des fonctions harmoniques u(x, y) et v(x, y) données comme
parties réelle et complexe de la f(z) donnée précédemment.

ORTHOGONALITÉ DES ISO-COURBES RÉELLES ET IMAGINAIRES

Nous allons maintenant démontrer une propriété sympathique que les fonctions qui satisfont
les conditions de Cauchy (donc les fonctions analytiques!) ont. Effectivement, rappelez-vous
que nous avons vu plus haut la fonction:

(17.64)

qui donnait donc le diagramme suivant:


(17.65)

Eh bien les fonctions satisfaisant les conditions de Cauchy ont la propriété géométrique
simple suivante: les lignes dont la partie réelle de la fonction est constante et
les lignes dont la partie imaginaire sont sont orthogonales les unes aux autres.

En d'autres termes, les fonctions complexes analytiques sont des fonctions de transformation
d'un domaine du plan dans un plan où les angles sont conservés. Nous disons alors que la
fonction est une "transformation conforme".

Pour la démonstration rappelons que nous avons démontré lors dans le chapitre de Calcul
Vectoriel que le gradient d'une fonction f de est donné par:

(17.66)

et dans le cadre de notre étude des isoclines dans le chapitre de Géométrie Différentielle que
la vecteur tangent aux isoclines de la fonction f sera toujours parallèle au vecteur du plan:

(17.67)

et que ces deux derniers vecteurs sont perpendiculaires tels que:

(17.68)

Nous avons alors le vecteur (parallèle) tangent aux lignes:


(17.69)

donné par:

(17.70)

La normale aux lignes:

(17.71)

est le gradient de v de composantes:

(17.72)

Mais en utilisant les conditions de Cauchy démontrées plus haut, nous avons aussi:

(17.73)

En comparant:

et (17.74)

nous voyons donc que et sont parallèles (colinéaires). Et puisque est colinéaires
aux isolignes réelles et que est perpendiculaire aux isolignes imaginaires nous avons
terminé notre démonstration.

Le lecteur pourra donc prendre comme exemple la fonction :

(17.75)

détaillé mathématiquement et schématiquement plus haut! Mais pour changer un peu, prenons
un exemple qui nous accompagnera tout au long du reste de ce chapitre et qui est la fonction
holomorphe suivante:

(17.76)

>assume(x,real,y,real);
> z:=1/(1+(x+I*y)^2);
> F:=1/z;
> u:=Re(F);
> u:=evalc(u);
> v:=Im(F);
> v:=evalc(v);
> with(plots):
> p1:=implicitplot({seq(u=a,a=-5..5)},x=-5..5,y=-5..5,numpoints=1000):
> p2:=implicitplot({seq(v=b,b=-5..5)},x=-5..5,y=-5..5,numpoints=1000,color=green):
> display([p1,p2]);

(17.77)

LOGARITHME COMPLEXE

Nous devons trouver pour toutes les fonctions construites dans leur équivalent dans tout
en sachant que si nous réduisons le cas de à nous devons retomber sur nos pattes!

Pour cela, commençons par la fonction la plus classique et scolaire qui est donc le logarithme.

De la même manière que nous avions construit le logarithme comme étant par définition (!) la
fonction réciproque de l'exponentielle naturelle dans le chapitre d'Analyse Fonctionnelle
nous partons d'abord de:

(17.78)

où z est donc un nombre complexe et nous allons définir le logarithme complexe qui doit se
réduire au logarithme naturel si z n'a pas de partie imaginaire!
Donc par définition le logarithme complexe sera:

(17.79)

et sur l'ensemble de ce site, le logarithme complexe sera différencie du logarithme réel par un
L majuscule!

Ecrivons z et w sous la forme d'Euler vue dans le chapitre sur les Nombres:

(17.80)

Nous avons alors:

(17.81)

Par correspondance nous trouvons immédiatement:

et (17.82)

avec . Il vient alors:

(17.83)

Donc:

(17.84)

ou autrement écrit:

(17.85)

Donc si w n'a pas de partie imaginaire nous retombons bien sur nos pattes puisque arg(w)
devient nul.

Une grosse différence est mise en avant donc entre le logarithme des nombres complexes et
réels: ces premiers peuvent prendre plusieurs valeurs à cause de l'argument.

Nous vérifions bien par ailleurs maintenant que:

(17.86)

INTÉGRATION DE FONCTIONS COMPLEXES


Nous venons de voir précédemment comment vérifier si une fonction complexe f(z) était
dérivable (elle doit au moins respecter les équations de Cauchy-Riemann) en tout point et
comment calculer celle-ci avec quelques exemples simples.

Maintenant voyons le cas contraire qui est... l'intégration (cas numérique de la recherche de
primitive pour rappel).

Nous avons bien évidemment en reprenant les notations vue dans le chapitre de Calcul
Différentiel et Intégral:

(17.87)

soit sous forme explicite:

(17.88)

Bon cette expression établie faisons une petite explication quand à sa lecture:

1. Nous savons que u et v dépendent les deux dans le cas général de x et y.

2. Nous savons que u et v représentent (voir exemples au début du chapitre) des courbes
fermées ou ouvertes ainsi que des droites lorsque x ou respectivement y sont fixés et que
l'autre variable associée elle varie!

Donc chacun des termes comportant une intégrale dans l'expression écrite précédemment est
une intégrale curviligne sur une famille de courbes ouvertes ou fermées (donc un cas
particulier sont les droites...)!

Cette intégrale peut être évaluée en utilisant le théorème de Green dans le plan (cf. chapitre de
Calcul Vectoriel) si nous considérons le cas particulier d'un chemin curviligne fermé tel que:

(17.89)

Nous avions effectivement démontré (il est très fortement conseillé de relire ce théorème de
Green) dans le chapitre de Calcul Vectoriel que:

(17.90)

Ce qui s'écrit dans notre situation:


(17.91)

Or, si la fonction est holomorphe et satisfait donc aux équations de Cauchy-Riemann nous
avons immédiatement:

(17.92)

Ainsi notre intégrale se réduit dans le cas particulier d'un chemin fermé:

(17.93)

Et.... réutilisons le théorème de Green:

(17.94)

Or, si la fonction est holomorphe (donc pour dérivable en tout point du plan complexe ou d'un
sous-ensemble ouvert de celui-ci) et satisfait donc aux équations de Cauchy-Riemann nous
avons immédiatement:

(17.95)

et nous obtenons ainsi le "théorème de Cauchy" qui dit que si une fonction est holomorphe
(satisfait donc les équations de Cauchy-Riemann) et intégrée sur un contour fermé alors:

(17.96)

Comme corollaire (sans démonstration), toute fonction qui satisfait à la relation précédente est
holomorphe (dans tout le plan complexe ou un sous-ensemble ouvert de celui-ci).

A l'aide de ce résultat, faisons un exemple important qui nous sera utile par la suite.

Calculons:

(17.97)

Pour cela, nous allons utiliser la simplification qui consiste à se rappeler (cf. chapitre
Nombres) que:
(17.98)

Donc:

(17.99)

Nous pouvons alors écrire l'intégrale curviligne comme:

(17.100)

Or comme sur un chemin fermé dérivable en tout point (donc sans sommets) l'angle à
parcourir pour faire un tour complet ira nécessaire de 0 à . Il vient alors:

(17.101)

Avant de continuer remarquons un fait intéressant et important: Une intégrale (on ne parle pas
de la primitive mais de l'intégrale!) d'une fonction du type 1/x dans ne serait pas
calculable. Or si nous généralisons le concept à , nous voyons que nous contournons... (le
jeu de mot...) la singularité via une intégrale de chemin qui entoure la singularité. Et... et...
dans notre calcul précédent z pourrait tout à fait avoir que la valeur réelle et pas l'imaginaire.
Donc l'intégrale de 1/x devient alors calculable et a un résultat dans les complexes ce qui est
remarquable!

Certains mathématiciens interprètent cela en figurant que 1/x est une projection plane d'un
espace tridimensionnel dont l'axe imaginaire est perpendiculaire au plan . D'où le fait que
1/x soit intégrable dans .... mais bon c'est une interprétation...

Enfin, indiquons que 1/z est holomorphe sur tout le plan complexe excepté en 0 (la dérivée
étant la même que pour 1/x).

Ceci étant fait, faisons un calcul similaire:

(17.102)

où est un nombre complexe constant. Posons:

(17.103)

Nous pouvons alors écrire:


(17.104)

qui n'est valable à nouveau que si notre chemin d'intégration évite sinon quoi il y a une
singularité. Cette dernière intégrale est donc une petite généralisation simpliste de la
précédente.

Maintenant montrons le théorème important qui nous intéresse au fait depuis le début de ce
chapitre en utilisant les nombreux résultats démontrés jusqu'ici!

Nous savons que si une fonction f(z) satisfait aux équations de Cauchy-Riemann, alors si nous
évitons soigneusement la valeur (comme dans les calculs précédents), l'expression:

(17.105)

est aussi dérivable en tout point excepté en (donc l'expression n'est plus holomorphe)
appelé qui est donc une singularité.

Effectivement, prendre une fonction holomorphe f(z) satisfaisant Cauchy-Riemann et y


soustraire une constante ne change en rien le fait que l'expression (le numérateur dans la
relation précédente) restera holomorphe. Enfin, multiplier celle ci par une fraction
(dénominateur de la relation précédente) qui est elle aussi holomorphe donne une fonction
holomorphe. Mais des singularités peuvent alors apparaître, nous parlons alors de "fonctions
méromorphes" (il s'agit du rapport de deux fonctions holomorphes).

Dès lors, si nous en prenons l'intégrale curviligne sur un chemin fermé évitant de passer par
, le théorème de Cauchy nous donne immédiatement (voir la démonstration plus haut):

(17.106)

Or, ceci s'écrit aussi après réarrangement des termes:

(17.107)

Soit:

(17.108)

Or, nous avons démontré plus haut que:


(17.109)

Il vient alors le résultat appelé "théorème intégral de Cauchy", ou plus rarement "formule de
Cauchy", dont il existe une forme généralisée:

(17.110)

Au fait, dans la pratique toute la subtilité est de pouvoir ramener une fonction g(z)
holomorphe (qui satisfait donc les équations de Cauchy-Riemann) en la manipulant à une
forme du type:

(17.111)

quand c'est possible.... alors le calcul de son intégrale (de chemin fermé) devient extrêmement
simple puisqu'elle sera égale à:

(17.112)

de par le théorème intégral de Cauchy.

Remarque: Nous savons donc calculer la valeur d'une intégrale curviligne d'une expression
non holomorphe mais dont le numérateur lui l'est.

Il a une relation équivalente pour la dérivée à celle donnée par le théorème intégral de
Cauchy. Voyons cela:
(17.113)

Donc:

(17.114)

en continuant ainsi, nous avons:

(17.115)

bref nous remarquons donc que:

(17.116)

qui n'est d'autre que le "théorème intégral de Cauchy généralisé".

Ce résultat est très puissant car il montre que les fonctions holomorphes sont infiniment
dérivables (à cause du dénominateur), soit analytiques, et il est beaucoup plus difficile de
trouver un théorème équivalent avec des conditions aussi simples pour les fonctions réelles.

Si nous revenons maintenant à notre développement de Taylor d'une fonction complexe:


(17.117)

humm... et que voyons-nous ici? Eh bien ceci! :

(17.118)

Il en découle la relation suivante appelée "série de Laurent à puissances positives" (il en existe
une version plus généralisée que nous allons démontrer plus tard):

(17.119)

qui donne donc l'expression formelle d'une fonction complexe sous forme de série infinie de
puissances entières à proximité d'un point du plan complexe avec donc:

(17.120)

Nous constatons que l'ensemble des deux relations précédentes nous redonne le
développement en série de Taylor que nous avions obtenue en analyse réelle (cf. chapitre de
Suites et Séries) et qui était:

(17.121)

Ainsi, les séries de Taylor ne sont qu'un cas particulier des séries de Laurent.

Ceci est assez remarquable comme résultat car cela montre aussi que nous pouvons utiliser
l'intégrale curviligne sur le plan complexe pour calculer les coefficients de la série de
Taylor au lieu de calculer les dérivées d'ordre n de la fonction f si ces dernières s'avéreraient
trop compliquées à déterminer. Ou inversement.... calculer une simple dérivée au lieu de
calculer une intégrale curviligne casse-tête (typiquement le cas en physique) en utilisant le fait
que:

(17.122)
Le seul point malheureux étant que cette dernière relation n'est calculable que si nous arrivons
à mettre la fonction dans l'intégrale curviligne sous la forme:

(17.123)

où n est un entier positif ou nul. Ceci est franchement loin d'être aisé dans la grande majorité
des cas! L'idée serait alors de trouver un chemin général pour l'intégrale curviligne, valable
pour toute fonction f(z) tel que ce dénominateur (qui contient en plus un singularité en )
disparaisse. Ce serait l'idéal... mais il nous faut une piste... et celle-ci va venir de l'étude de la
convergence des séries de puissance complexes. Voyons de quoi il s'agit avec une approche
qualitative!

CONVERGENCE D'UNE SÉRIE

Nous avons vu dans le chapitre de Suites et Séries que nombre de fonctions réelles pouvaient
être exprimées en série de MacLaurin (cas particulier des séries de Taylor en ) sous la
forme:

(17.124)

Nous y avions également montré, uniquement par l'exemple, que ce développement en série
de puissance infinie n'était valable pour certaines fonctions réelles que dans un certain
domaine de définition appelé "rayon de convergence".

Même si ce rayon de convergence peut être déterminé plus ou moins facilement au cas par
cas, il y a certains exemples déroutants qui ne pouvaient pas au début de 19ème siècle être
compris sans l'analyse complexe.

Voyons un exemple simple pour comprendre de quel type de problème il s'agit. Considérons
pour cela les deux fonctions:

et (17.125)

et vant de continuer notre exemple, rappelons que nous avons démontré dans le chapitre de
Suites et Séries la relation:

(17.126)

concernant les séries géométriques. C'est-à-dire les séries dont les termes sont du type :

(17.127)
Il vient dès lors immédiatement si et nous avons:

(17.128)

Si , nous avons:

(17.129)

Donc si nous changeons la notation, nous avons:

(17.130)

Il vient alors immédiatement:

et (17.131)

Donc les deux fonctions g(x) et f(x) précédentes sont définies pour un développement en série
infinie de puissance uniquement dans un rayon de convergence .

Nous obtiendrions donc le même résultant en faisant un développement en série de


MacLaurin!

Nous voyons trivialement qu'il y a pour g(x) deux singularités qui sont par
contre, basiquement nous n'en voyons pas trivialement pour h(x) si nous raisonnons
uniquement dans donc il peut être difficile pour cette dernière fonction de comprendre le
rayon de convergence.

Effectivement, si nous traçons ces deux fonctions dans avec Maple nous obtenons
respectivement:
et
(17.132)

d'où le problème de savoir pourquoi il y a quand même implicitement un rayon de


convergence pour h(x)???

Une manière encore plus flagrante de mettre en évidence le problème c'est de montrer
l'approche de ces deux fonctions par un développement en série de MacLaurin avec dix
termes:

Pour g(x) nous avons:

with(plots):
> xplot := plot(1/(1-x^2),x=-5..5,thickness=2,color=red):
> tays:= plots[display](xplot):
> for i from 1 by 2 to 10 do
> tpl := convert(taylor(1/(1-x^2), x=0,i),polynom):
> tays := tays,plots[display]([xplot,plot(tpl,x=-5..5,y=-2..2,
> color=black,title=convert(tpl,string))]) od:
> plots[display]([tays],view=[-5..5,-2..2]);
(17.133)

où nous voyons bien que la série de MacLaurin (ou l'expression en série de puissance) ne
converge pas en dehors de ce qui peut est intuitif à cause des deux singularités.

Pour h(x) nous avons par contre:

>with(plots):
> xplot := plot(1/(1+x^2),x=-5..5,thickness=2,color=red):
> tays:= plots[display](xplot):
> for i from 1 by 2 to 10 do
> tpl := convert(taylor(1/(1+x^2), x=0,i),polynom):
> tays := tays,plots[display]([xplot,plot(tpl,x=-5..5,y=-2..2,
> color=black,title=convert(tpl,string))]) od:
> plots[display]([tays],view=[-5..5,-2..2]);
(17.134)

où nous voyons bien que la série de MacLaurin (ou l'expression en série de puissance) ne
converge pas en dehors de ce qui était déstabilisant et contre intuitif au début de
l'histoire de l'analyse réelle.

Aujourd'hui même un élève du secondaire sait qu'il est possible de raisonner aussi dans et
que . Donc l'analyse réelle n'est qu'un cas particulier et restreint de l'analyse complexe.

La singularité pour h(x) dans vient alors dû fait que celle-ci s'écrit alors:

(17.135)

et qu'il y a donc deux singularités pour ce que nous voyons bien si nous
représentons:

(17.136)

avec Maple (heureusement que nous avec maintenant l'équivalent d'un microscope dans la
mathématique...):

>plot3d(abs(1/(1+(re+I*im)^2)),re=-3..3,im=-3..3,view=[-2..2,-2..2,-2..2],orientation=[-
130,70],contours=50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=1000
0);
(17.137)

où nous voyons bien les deux singularités sur l'axe imaginaire et la fonction h(x) sur l'axe
réelle (entre les deux pics). Donc lorsque nous développons une fonction en série, nous
concluons que son rayons de convergence est défini par tout le plan complexe et non par l'axe
traditionnel de l'analyse réelle.

Il est ainsi plus naturel de comprendre pourquoi nous parlions dans le chapitre de Suites et
Séries de "rayon" car vu du dessus nous avons dans le plan complexe:
(17.138)

d'où le fait que nous parlons tantôt de disque de convergence (ouvert) et de rayon de
convergence (ouvert). Par ailleurs nous remarquons sur le graphique que le domaine de
convergence est connexe (tout couple de points du domaine de convergence peut être relié par
une droite qui est dans le domaine de convergence).

Remarque: Rappelons qu'un sous-ensemble, intervalle ou disque "ouvert" signifie que nous
n'en prenons pas les bords.

Nous comprenons alors mieux pourquoi la série de Taylor ne convergait pas trivialement pour
h(x): elle doit converger sur toute le disque de convergence du plan complexe et pas
seulement converger sur l'axe réel!

De tout ceci il en découle que notre série de Laurent à puissances positives démontrée plus
haut:

(17.139)

ne converge pas forcément, sans surprise..., sur tout le plan complexe (au même titre que les
séries de Taylor sur la droite réelle puisque il s'agit de l'équivalent!) mais parfois uniquement
dans un sous-domaine (connexe?) ouvert de ce plan autour de (qui dans l'exemple
particulier pris ici valait donc: 0).
Avec notre fonction h(x) exprimée en utilisant un développement de MacLaurin sur 6 termes,
nous voyons immédiatement avec Maple que sur les bords du carré inscrit au disque de
convergence, la série ne converge plus et nous y devinons le début des deux singularités:

>plot3d(abs(1-(re+I*im)^2+(re+I*im)^4-(re+I*im)^6+(re+I*im)^8),re=-0.7..0.7,im=-
0.7..0.7,view=[-1.5..1.5,-1.5..1.5,0..1.5],orientation=[-
130,70],contours=50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=1000
0);

(17.140)

un peu en dehors du disque de convergence nous avons évidemment un peu n'importe quoi:

>plot3d(abs(1-(re+I*im)^2+(re+I*im)^4-(re+I*im)^6+(re+I*im)^8),re=-3..3,im=-3..3,view=[-
1.5..1.5,-1.5..1.5,0..1.5],orientation=[-
130,70],contours=50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=1000
0);
(17.141)

Il y quand même quelques chose d'intéressant à essayer... puisque nous sommes maintenant
sur un plan, et non plus sur une droite, il nous est possible de faire le développement de
Taylor autour d'une singularité en déformant la disque convexe en un couronne simplement
connexe telle que présentée ci-dessous (la couronne étant aussi la géométrie simplement
connexe la plus simple découlant de la déformation d'un disque):
(17.142)

L'intérêt de ceci est de pouvoir déformer le domaine de convergence sur tout le plan complexe
en évitant (contournant) toutes les singularités. Ainsi, contrairement aux séries de Taylor qui
ne sont valables que sur un intervalle de l'axe des abscisses, nous aurions un nouveau type de
série décrivant une fonction absolument partout, c'est-à-dire avant ET après (donc autour...)
les singularités!

Donc évidemment nous allons imposer que dans la couronne déformée ci-dessus la fonction
soit toujours holomorphe et analytique (comme dans le disque convexe initial). Avant de
déterminer ce sur quoi nous allons tomber (série de Laurent généralisée), il nous d'abord faire
un étude de la décomposition d'une intégrale en chemins:

DÉCOMPOSITIONS EN CHEMINS

Les intégrales curvilignes comme celles données précédemment peuvent aussi être écrites
sous une autre forme assez classique et souvent utilisée dans la pratique.

Voyons cela. D'abord, nous venons de démontrer dans le cas particulier d'une fonction
holomorphe que:

(17.143)
mais un chemin fermé peut être vu comme un chemin ayant un aller et un retour:

(17.144)

Nous avons alors:

(17.145)

Et maintenant viens ce qui nous intéresse.... pour cela concentrons-nous sur une des intégrales
curviligne du type:

(17.146)

Nous savons que tout nombre complexe z du type:

(17.147)

peut être écrit sous la forme:

(17.148)

et pour intégrer sur un chemin, rien ne nous empêche d'en choisir un où r serait fixe (le
module) et variable (nous n'aurions pas pu faire cela avec la première forme d'expression
car en faisant varier que la partie imaginaire ou réelle nous ne pouvons pas obtenir de courbe
alors que cela est possible avec la forme d'Euler d'un nombre complexe)!

Nous avons alors:

(17.149)

Nous pouvons dès lors écrire:


(17.150)

et comme:

(17.151)

d'où:

(17.152)

ce que nous retrouvons souvent sous la forme suivante dans la littérature:

(17.153)

Cette relation va nous être maintenant utile à démontrer un résultat nécessaire pour notre
étude de la couronne.

CHEMIN INVERSE

Si C est une courbe allant d'un point P à un point Q, nous notons alors la même courbe
mais parcourue de Q à P.

Paramétrisons :

Si C(t) est la courbe définie sur [a, b] nous définissons la courbe définie sur [a, b] par:

(17.154)

En effet, nous avons alors bien avec cette paramétrisation:

et (17.155)

et lorsque t croit de a à b, a + b - t décroît de b à a. n'est donc que C mais parcourue dans


le sens inverse.

Nous avons alors en utilisant la dernière démonstration:


(17.156)

Posons:

(17.157)

d'où:

(17.158)

Nous avons alors:

(17.159)

Donc si et C sont les chemins d'une même fonction mais parcourues dans le sens inverse,
nous avons en reprenant notre notation conventionnelle (attention dans le deuxième terme il
est implicite que la paramétrisation est différente du premier!):

(17.160)

Soit:

(17.161)

SÉRIES DE LAURENT

Cette dernière relation obtenue, nous pouvons revenir à notre déformation du disque de
convergence en une couronne. Nous rappelons que l'idée étant initialement d'avoir
l'expression analytique d'une fonction sous forme d'une série de puissance infinie dans un
domaine restreint autour d'un point singulier et tout ceci... afin de pouvoir calculer pour les
physiciens des intégrales curvilignes complexes en passant par une méthode utilisant les
propriétés des séries complexes!

Commençons dont par le point (2), qui nous mènera plus facilement au point (1), en faisant un
zoom sur notre couronne:
(17.162)

Nous avons donc si la fonction f est analytique et holomorphe dans la couronne de rayon
extérieur R et rayon intérieur r, l'intégrale de chemin suivante dans toute la couronne:

(17.163)

où nous notons z le point où nous souhaitons connaître la fonction et z' la variable dont
dépend f. Ce changement de notation se justifiera par la suite pour une raison purement
pratique.

La couronne peut être donc décomposée en 4 chemins:

(17.164)

Si les deux segments et sont infiniment proches, ils correspondent alors à un même
chemin parcouru une fois dans un sens positif et une fois dans le sens négatif. Or, nous avons
démontré plus haut que:

(17.165)

Il en découle donc que:

(17.166)

Ce qui nous amène à écrire:


(17.167)

Pour les deux intégrales , nous savons que la fraction peut s'écrire sous la forme d'une
série géométrique déjà vue plus haut. Effectivement:

(17.168)

en assimilant:

(17.169)

où comme nous l'avons vu, la convergence impose que:

(17.170)

afin que x soit en valeur absolue inférieur à 1.

Nous voyons alors apparaître la série géométrique infinie:

(17.171)

Soit:

(17.172)

Pour revenir à:

(17.173)

nous avons en tout point z à l'intérieur du cercle de rayon R dont le bord est décrit par la
variable z' et de centre la convergence qui est assurée car:
(17.174)

Nous pouvons alors écrire:

(17.175)

Intégrant terme à terme, nous mettons en évidence le développement (déjà connu):

(17.176)

avec la définition des coefficients , où n est un entier positif ou nul:

(17.177)

Ce développement peut faire penser au développement de Taylor au sens où seules des


puissances positives (ou nulles) de apparaissent, mais il n'en est pas un dans la cas de
la couronne! En effet, ne peut pas être écrit cette fois-ci comme:

(17.178)

puisque, par hypothèse, f(z) est supposée analytique dans la couronne seulement, et peut donc
fort bien ne pas l'être à l'intérieur du petit cercle de rayon r, en particulier en , auquel cas
peut tout simplement ne pas exister (répétons que z est strictement contrait à se
trouver dans la couronne, soit ). Nous verrons plus loin ce qui ce passe quand f(z)
est holomorphe dans ce disque et que, notamment, n'est pas un point singulier.

Il nous faut encore traiter . Nous faisons alors le même type de développement que pour
, avec la différence que maintenant :

(17.179)

lorsque z' parcoure le petit cercle de rayon r. Pour faire apparaître une série géométrique, il
faut écrire cette fois-ci:
(17.180)

d'où:

(17.181)

Soit:

(17.182)

Intégrant terme à terme, nous mettons en évidence le développement (nouveau):

(17.183)

avec:

(17.184)

En changeant n et -n dans la sommation pour , nous avons pour la somme :

(17.185)

avec pour l'instant deux distincts:

et (17.186)

Nous allons voir maintenant que des deux relations peuvent être réunies en une seule!

Si nous observons bien ces deux dernières relations, nous constatons qu'elles ne dépendent
nullement de z (!) et c'est bien normal puisque les sont les coefficients du développement
en série de f(z) et ceux-ci sont les mêmes en n'importe quel point du domaine de définition de
la fonction où celle-ci est analytique!
Donc les deux contours (cercles) peuvent être fusionnés en un seul cercle tant que celui-ci est
situé dans la couronne et a pour centre :

(17.187)

Par ailleurs, le lecteur attentif aura remarqué que ce contour n'a même pas besoin d'être un
cercle finalement. Il peut être quelconque tant qu'il est ferme et qu'il se trouve dans un
domaine analytique!

Ainsi les deux relations:

(17.188)

Les deux relations précédentes définissent la "série de Laurent" généralisée. Il est


remarquable et se distingue d'une série de Taylor au sens où il contient toutes les puissances
entières positives et négatives et les coefficients ne sont pas a priori exprimables avec les
dérivées de f.

La série de puissances est appelée "partie régulière", celle des puissances négatives
porte le nom de "partie principale".

La série des puissances négatives converge uniformément partout à l'extérieur de , celle des
puissances positives à l'intérieur de . Au total le développement de Laurent converge
uniformément dans le domaine commun, qui est la couronne et donc aussi sur le chemin
unique .

Montrons maintenant un point que nous avions mentionné plus haut. Si le cercle ne contient
pas de singularité, alors tous les coefficients:

(17.189)

sont nuls. Notons d'abord que est un nombre entier positif ou nul que nous noterons p
tel que:

(17.190)

Nous avons alors l'intégrand suivant dans un chemin fermé:


(17.191)

Or, si nous enlevons la singularité cela impose que est holomorphe (et de toute façon
c'est imposé par tous les développements initiaux sur les séries de Laurent).

est un polynôme à puissance positive et non nulle et comme nous le savons, tout
polynôme satisfaisant ces conditions est dérivable au moins une fois sans faire apparaître de
singularité. Ainsi ce terme est aussi holomorphe.

En admettant que le produit de deux fonctions holomorphe est une fonction holomorphe et
que le contour est fermé, nous avons alors en utilisant le résultat suivant démontré plus haut
(pour une fonction holomorphe):

(17.192)

la conséquence immédiate suivante:

(17.193)

s'il n'y pas de singularité dans le petit cercle de la couronne. Nous retrouvons alors dans ce cas
un développement avec les seules puissances positives, les étant cette fois équivalents à:

(17.194)

conformément au théorème intégral de Cauchy généralisé démontré plus haut. A contrario,


nous voyons bien que c'est la partie principale (quand elle existe) qui contient l'information
sur le fait que f n'est pas à priori holomorphe dans le petit disque. L'existence de puissances
négatives montre que f n'est visiblement pas bornée en .

La classification des singularités d'une fonction sera précisément sur la considération des
caractéristiques de la partie principale du développement de Laurent centré sur un point
singulier de cette fonction.

Exemple:

Voyons donc à quoi ressemble la série de Laurent de notre fonction:

(17.195)
sur un domaine simplement connexe qui serait donc la couronne entourant la singularité i par
exemple (nous aurions pu choisir la deuxième singularité -i mais il fallait bien en prendre
une...). Ce qui équivaut donc à chercher le développement en série de puissance de z - i.

Nous allons procéder de la manière suivante:

(17.196)

Nous allons utiliser pour la suite:

(17.197)

La deuxième fraction peut être exprimée en série géométrique si comme nous l'avons déjà vu:

(17.198)

Il vient alors:

(17.199)

Multiplions cette série par -i/2 et divisons ensuite par z - i (le deuxième terme du
dénominateur de la fraction initiale) pour obtenir pour le terme de gauche:

(17.200)

et pour le terme de droite nous avons:

(17.201)

Nous avons alors au final pour notre série géométrique:

(17.202)
Nous voyons donc sur cette série de Laurent autour de i de la fonction holomorphe f(z) dans la
couronne, les coefficients :

(17.203)

et nous avons avec Maple:

>plot3d(abs(-I/2*1/((re+I*im)-I)-(I/2)^2-(I/2)^3*(re-I*im)-(I/2)^4*(re-I*im)^2-(I/2)^5*(re-
I*im)^3),re=-1.5..1.5,im=-1.5..1.5,view=[-2..2,-2..2,-1..2],orientation=[-
130,70],contours=50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=1000
0);

(17.204)

où nous voyons que la série de Laurent nous permet d'exprimer f(z) dans un voisinage proche
de la singularité i en prenant 5 termes.

Idem si nous faisons la somme des deux séries de Laurent pour les deux singularités avec 5
termes:

>plot3d(abs(-I/2*1/((re+I*im)-I)-(I/2)^2-(I/2)^3*(re-I*im)-(I/2)^4*(re-I*im)^2-(I/2)^5*(re-
I*im)^3 -(I/2)^6*(re-I*im)^4-(I/2)^7*(re-I*im)^5+I/2*1/((re+I*im)+I)+(I/2)^2+
(I/2)^3*(re+I*im)+(I/2)^4*(re+I*im)^2+(I/2)^5*(re+I*im)^3+(I/2)^6*(re+I*im)^5
+(I/2)^7*(re+I*im)^6),re=-1.5..1.5, im=-1.5..1.5, view=[-2..2,-2..2,-
1..2],orientation=[130,70], contours=50, style=PATCHCONTOUR,
axes=frame,grid=[100,100],numpoints=10000);
(17.205)

et nous voyons que très vite en dehors des deux singularités tout diverge puisque les séries ne
convergent que dans une couronne ou la fonction y est holomorphe. Mais cela donne déjà une
bonne idée visuelle des choses.

SINGULARITÉS

Nous avons donc vu juste précédemment qu'il était donc possible de calculer l'intégrale
curviligne d'une fonction, sous condition d'analycité, sur le contour d'une singularité. Notre
objectif va maintenant être d'améliorer cette approche.

Nous avons déjà mentionné et mis en évidence dans nos démonstrations que l'intégrant dans
le "théorème intégral de Cauchy" était de la forme:

(17.206)

où f(z) est bien définie en .

Le point est bien évidemment une singularité de g(z) et celle-ci n'y est donc pas
définie.

Comme nous l'avons vu lors de notre démonstration de séries de Laurent, g(z) peut être
exprimé sous forme de série de Laurent positive dans un disque de convergence (ou ce qui
revient au même: en série de Laurent dans une couronne non centrée sur une singularité...)
sous la forme:
(17.207)

Avant de continuer, il est d'usage en mathématique de définir un petit vocabulaire


conventionnel en ce qui concerne cette fois-ci les éventuelles singularités de f(z)!

Rappelons au préalable que nous savons, et nous avons démontré, que toutes les informations
sur les singularités de f(z) sont contenues la partie principale de la série de Laurent (les
puissances négatives) définie sur la couronne entourant :

(17.208)

La classification ci-après porte donc sur les "singularités isolées", c'est-à-dire un point
singulier où f(z) est analytique partout dans le voisinage de excepté en .

Définitions:

D1. Lorsque la limite de la fonction existe en , nous disons que la singularité est un
"point singulier éliminable" ou une "singularité apparente".

Par exemple:

(17.209)

ne semble pas être définie en mais nous avons un numérateur ayant une série de
Laurent sans puissances négatives (donc un simple série de Taylor). Il vient alors en faisant la
série de MacLaurin (donc la série de Taylor en en d'autres termes...) :

(17.210)

Donc nous voyons que f(z) n'a finalement aucun terme en puissance négative et donc que nous
avons éliminé la singularité (ou qu'elle n'en contient au fait pas... ce qui est facilement
vérifiable avec Maple).

Donc une autre manière équivalente de définir une singularité éliminable, est de dire que le
développement de Laurent de la fonction ne contient aucun terme en puissance négative.

D2. Lorsque en la limite de n'existe pas, nous parlons de "singularité essentielle".


Par exemple, est une singularité essentielle pour la fonction:

(17.211)

En effet, si z tend vers zéro en venant de l'axe réel positif, la fonction diverge, plus
précisément, elle tend vers . Si z vient du côté , la fonction tend vers zéro comment le
montre bien le tracé Maple suivant:

>plot3d(abs(exp(1/(re+I*im))),re=-5..5,im=-5..5,view=[-3..3,-3..3,-0.5..3],orientation=[-
130,70],contours=50,style=PATCHCONTOUR,axes=frame,grid=[100,100],numpoints=1000
0);

(17.212)

Effectivement:

(17.213)

Donc une autre manière équivalente de définir une singularité essentielle, est de dire qu'il y a
un nombre infini de termes à puissances négatives dans la partie principale de la série de
Laurent.

D3. Lorsque en la limite de est , nous parlons de "pôle".


Il s'agit de la dernière catégorie dans laquelle nous pouvons ranger une fonction qui n'est
classable ni dans la première, ni dans la deuxième définition précédentes.

Donc une autre manière équivalente de définir un "pôle", est de dire qu'il y a un nombre fini
de termes à puissances négatives dans la partie principale de la série de Laurent. Si ce nombre
de termes est k, alors nous parlons de "pôle d'ordre k".

Nous pouvons également trouver encore une autre définition équivalente courante d'un pôle
(pour ceux qui aiment les définitions à relire...):

f(z) a un pôle d'ordre k à si et seulement si a une singularité éliminable en


, mais avec n'en a pas.

Remarque: Nous disons parfois qu'une "singularité essentielle" est un pôle d'ordre infini.

Si nous prenons comme exemple:

(17.214)

Nous avons démontré plus haut que la série de Laurent était de cette fonction en était:

(17.215)

Donc la fonction précédente a un pôle d'ordre 1 en (et in extenso, nous devinons qu'elle
en a un aussi en ).

THÉORÈME DES RÉSIDUS

Considérons une fonction:

(17.216)

qui est analytique (c'est-à-dire que nous avons pris une fonction f(z) que nous avons rendue
analytique après élimination de ses pôles supposés en un nombre fini k...). Cette fonction
a alors un développement en série de Taylor dans un disque centré sur .

Comme nous l'avons vu plus haut, nous pouvons alors en utilisant la relation ci-dessous:

(17.217)

écrire:
(17.218)

En explicitant dans l'intégrale, il vient:

(17.219)

Il faut bien analyser cette relation et comprendre qu'elle relie l'intégrale d'une fonction ayant
des singularités avec la valeur en un point d'une fonction analytique n'ayant plus de
singularités!

La dernière relation peut se récrire en réarrangeant les termes:

(17.220)

Et en exprimant en utilisant (autorisé car cette dernière fonction est analytique) le


fait que:

(17.221)

Nous avons:

(17.222)

Soit en explicitant à nouveau :

(17.223)

Cette dernière relation est pour rappel valable que pour UNE singularité isolée (au cas où
vous auriez oublié les concepts introduits lors de notre présentation des singularités) et où k
vaut au minimum 1!

Les mathématiciens définissent alors:

(17.224)
comme étant le résidu de la fonction f(z) au point étant une singularité isolée et ayant
un pôle d'ordre k. Ou respectivement:

(17.225)

où l'intégrale curviligne est donc centrée en .

Remarquons que le terme à droite de l'égalité dans la relation précédente correspond au


coefficient de la série de Laurent. Effectivement:

(17.226)

D'où:

(17.227)

Remarque: Il vient donc qu'en une singularité isolée éliminable, le résidu est nul puisque
comme nous l'avons vu plus haut, l'intégrale curviligne entourant un domaine sans singularité
est nulle!

Bref, la relation:

(17.228)

est très intéressante pour le physicien... car il y a donc une manière élégante lui permettant de
calculer l'intégrale curviligne d'une fonction f(z) non analytique ayant une unique singularité
isolée et ce juste en connaissant ses pôles!

Par exemple si une fonction f(z) n'a qu'un pôle d'ordre 1, il vient alors:

(17.229)

et nous remplaçons donc par la valeur voulue dans la parenthèse et ensuite nous
calculons la limite du terme entre crochets!

Maintenant pour aller plus loin, rappelons que le contour de l'intégrale curviligne:

(17.230)

et le même que le chemin curviligne de l'intégrale:


(17.231)

sont au fait confondus et que les coefficients ne dépendant pas de z! La seule contrainte du
chemin est qu'il soit fermé et dans un domaine analytique centré sur un point.

Donc si nous avons plusieurs singularités isolées, entourées par des chemins curvilignes reliés
tels que présenté ci-dessous sur le plan complexe d'une fonction ayant un pôle d'ordre 3 (donc
trois singularités non éliminables):

(17.232)

nous avons alors toujours qu'un seul chemin curviligne fermé mais dont les différentes
singularités isolées sont reliées par des traverses où comme nous le savons, les chemins qui
s'opposent, s'annulent! Et rappelons que les coefficients sont les mêmes partout sur tout le
chemin puisque celui-ci est dans un domaine analytique.

Nous avons alors la version généralisée du théorème des résidus pour une fonction f ayant n
singularités isolées:

(17.233)

avec une rigueur approche rigueur digne de l'ingénieur... qui notent cette dernière relation
parfois:

(17.234)
où r est donc un résidu.

Exemple:

Prenons la fonction:

(17.235)

Nous savons qu'elle a un pôle d'ordre 1 en et un pôle d'ordre 1 . Donc si nous


prenons cette fois la série de Laurent dans un chemin qui entoure les deux singularités (et non
plus qu'une seule) nous avons alors une fonction avec un pôle d'ordre 2.

Il vient alors pour ce cas particulier:

(17.236)

avec donc n valant 2.

Nous avons alors:

(17.237)

et:

(17.238)

Nous pouvons vérifier cela avec Maple:

>readlib(singular)
> singular(1/(1+z^2),z)
> readlib(residue):
>residue(1/(1+z^2),z=-I);
>residue(1/(1+z^2),z=I);

et dès lors:

(17.239)

Au fait dans le cas présent, le théorème des résidus est nul car la fonction n'a pas de pôles à
l'infini ce qui se vérifie puisque dans notre exemple:

(17.240)

Les physiciens quant à eux diraient que la force ne travaille pas sur le chemin...!

PÔLE À L'INFINI

Nous avons parlé juste précédemment que toute fonction qui n'avait pas de pôle à l'infini avait
donc la somme des résidus de tous ces pôles qui était nulle. Ce résultat est très important en
physique et mérite d'être approfondi!

Il est assez facile de reconnaître nombre de pôles... mais pour reconnaître les pôles à l'infini
on risque de se faire prendre au piège.

Considérons l'expression f(z)dz. Si z est au voisinage de l'infini alors 1/z se trouve au


voisinage de 0. Posons:

(17.241)

Nous avons alors:

(17.242)

Donc le résidu à l'infini est tel que:

(17.243)

avec:

(17.244)

Avec donc:
(17.245)

Cette dernière relation nous sera indispensable dans le chapitre de Physique Quantique
Corpusculaire pour construire le modèle relativiste de l'atome d'hydrogène de Sommerfeld car
nous aurons à y calculer une intégrale de chemin ayant un pôle à l'infini.

Voyons un exemple avec la fonction qui nous accompagne depuis le début de ce chapitre.
C'est-à-dire:

(17.246)

Il vient alors :

(17.247)

Or nous reconnaissons immédiatement la fonction initiale au signe près et qui n'a donc pas de
pôle en 0. Donc f(z) n'a pas de pôles à l'infini.
18. TOPOLOGIE

L a topologie (du grec : discours du lieu) est un domaine extrêmement vaste des mathématiques dont il est
difficile de définir avec exactitude l'objet dont elle fait l'étude tellement les les domaines où elle existe sont
variés (topologie de la droite réelle, topologie des graphes, topologie différentielle, topologie complexe,
topologie symplectique,...).

Ce que nous pouvons dire dans un premier temps, c'est que dans ces fondements la topologie est très
intimement liée à la théorie des ensembles, à l'étude de convergence des suites et séries, à l'analyse
fonctionnelle, à l'analyse complexe, au calcul intégral et différentiel, au calcul vectoriel et à la géométrie
pour ne citer que les cas les plus importants se trouvant sur le présent site web.

L'origine de la topologie provient des problèmes qu'ont posés les progrès de l'analyse fonctionnelle dans
l'étude rigoureuse des fonctions continues, de leur dérivabilité, de leurs limites en un point (fini ou non), de
l'existence d'extremums, etc... dans des espaces de dimensions supérieures (au fait, implicitement la
topologie a pour objectif de créer des outils qui permettent facilement d'étudier les propriétés des fonctions
dans toutes les dimensions). Tout ces concepts, demandaient pour le mathématicien une définition
rigoureuse de l'idée intuitive de proximité, tout particulièrement lors d'opérations sur ces fonctions.

Nous allons essayer de dégager les structures qui permettent de parler de limite et de continuité. L'exemple
fondamental que nous prendons est le cas de (la droite de pour être rigoureux...).

ESPACE TOPOLOGIQUE

Les espaces topologiques forment le socle conceptuel dans lequel les notions de limite, de continuité ou
d'équivalance sont définies.

Le cadre est suffisamment général pour s'appliquer à un grand nombre de situations différentes: ensembles
finis, discrets, espaces de la géométrie, espaces numériques à n dimensions, espaces fonctionnels les plus
complexes. Ces concepts apparaissent dans presque toutes les branches des mathématiques, ils sont donc
centraux dans la vision moderne des mathématiques.

Si nous pensons à la droite achevée, afin d'étudier les concepts susmentionnés, il va falloir que nous
mesurions (imaginons...) des morceaux de celle-ci à la règle. Or, les mesures prises de certains intervalles ou
de l'ensemble de la droite doivent pouvoir présenter certaines propriétés minimales que nous allons énoncer
maintenant de suite.

Définition: Soit un ensemble non vide X (la longueur d'une règle de plastique par exemple). Une "topologie
F" ou "espace topologique (X, F)" sur X est une famille F de parties de X (de notre règle...) appelées
"ouverts" V (comme les intervalles ouverts vus dans le chapitre d'Analyse Fonctionnelle) tel que les axiomes
suivants soient vérifiés :

A1. L'ensemble vide et X sont considérés comme des ouverts et appartiennent obligatoirement à la famille
de la topologie F (ces deux ouverts seuls constituent par ailleurs la "topologie grossière" la plus minimale
satisfaisant à tous les axiomes):

et (18.1)

En d'autres termes, si nous imaginons notre règle en plastique, la mesure nulle doit appartenir à celle-ci ainsi
que tout point de la règle elle-même (ou un sous-ensemble de celle-ci) ou les deux.

A2. Toute intersection finie d'ouverts de F est un ouvert de F:


implique (18.2)

A3. Toute réunion d'ouverts F est un ouvert de F:

implique (18.3)

Remarques:

R1. Les mathématiciens notent fréquemment par la lettre O la famille des ouverts et F la famille des fermés.
Convention que nous ne suivrons donc pas ici.

R2. Les "fermés" d'une topologie sont les complémentaires des ouverts. Par conséquent, la famille des
fermés contient entre autres X et l'ensemble vide...

R3. La réunions d'ouverts en toute rigueur dans l'axiome

Le couple (X,F) forme un "espace de Hausdorff" ou "espace séparé" si de plus la propriété suivante dit
"axiome d'Hausdorff" est vérifiée :

A4. avec , tels que et


Remarques:

R1. Un exemple bien connu d'espace topologique est muni de l'ensemble F engendré par les intervalles
ouverts (par la loi d'union), c'est-à-dire les intervalles ]a,b[.

R2. Nous verrons une application très concrète des espaces de Hausdorff lors de notre études des fractales en
informatique théorique.

Définition: Si nous notons (X,F) un espace topologique, F désignant les ouverts de X, une "base", au sens
topologique, de (X,F) est une partie B de F telle que tout ouvert de F soit réunion d'ouverts de B (c'est la
même idée que les espace vectoriels au fait mais appliqué à des ensembles... rien de bien méchant).

ESPACE MÉTRIQUE ET DISTANCE

Définition: Un "espace métrique" noté (X,d) ou encore est par définition un ensemble X muni d'une
application , appelée "distance" ou "métrique", qui satisfait les axiomes suivants:

A1. (positivité)

A2. (axiome de séparation)

A3. (inégalité triangulaire)

A4. (axiome de symétrie)


Remarques:

R1. Certains lecteurs verront de suite que certaines de ces propriétés ont déjà été vues dans d'autres chapitres
du site lors de l'étude des distances entre points fonctionnels et lors de l'étude des normes (inégalité
triangulaire démontrée dans le chapitre de Calcul Vectoriel - la symétrie, la nullité, la positivité, la
séparation dans le chapitre d'Analyse Fonctionelle).

R2. Certains auteurs omettent l'axiome A1 ce qui est rigoureusement juste car découle trivialement de A3.

R3. Un espace métrique sera en général noté (X,d) ou bien encore . Nous pouvons également le noter
simplement X si la distance d ne peut être confondue.

La "fonction distance" de est donc notée habituellement dans le plus général qui soit en
mathématique :

(18.4)

Remarques:

R1. Si nous n'imposons pas l'axiome A2, nous disons que d est une "semi-distance" sur X.

R2. Si nous autorisons une semi-distance d à prendre la valeur , nous préférons dire que d est un "écart"

R3. Si une distance d vérifie la propriété :

(18.5)

propriété plus contraignante que l'inégalité triangulaire dans certains espaces, nous disons que d est "ultra-
métrique".

Un exemple de distance ultra-métrique est l'arbre généalogique:

(18.6)

Nous avons les distances suivantes:

(18.7)

Nous remarquons que les distances ne s'ajoutent pas mais que nous avons par contre:
(18.8)

Ainsi:

(18.9)

R4. Soit (E,d) un espace métrique et soit une partie de l'ensemble E. L'espace métrique où
désigne la restriction de d à est appelé "sous-espace métrique" de (E,d) (il convient
de vérifier que la distance d est équivalente à la distance ). Dans ce cas, nous disons aussi que F est muni
de la distance induite par celle de E. Nous notons simplement d la distance induite.

Exemples:

E1. Si nous prenons pour X le plan, ou bien l'espace à trois dimensions de la géométrie euclidienne et une
unité de longueur, la "distance" au sens usuel du terme est bien une distance au sens des 5 axiomes
précédemment cités. Dans ces espaces, les trois points A, B, C satisfont comme nous l'avons démontré en
Calcul Vectoriel et comme il l'est intuitivement que :

(18.10)

avec les autres inégalités obtenues par permutation circulaire de A, B, C. Ces inégalités sont bien connues
par exemple entre les longueurs des côtés d'un triangle.

E2. Si nous prenons , et que nous dotons d'une structure d'espace vectoriel
euclidienne (et non pas non-euclidienne) et que nous prenons deux points :

(18.11)

dans .

La distance est donnée nous le savons par (nous avons déjà démontré cela en Analyse Fonctionnelle et
Calcul Vectoriel) :

(18.12)

qui satisfait aux 5 axiomes de la distance et que nous appelons la "distance euclidienne". Nous pouvons
prendre (c'est une propriété intéressante pour la culture générale), que toute relation de la forme :

(18.13)

est aussi une distance dans (sans démonstration). Les mathématiciens font encore plus fort en
généralisant encore plus (la démonstration à peu d'intérêt pour l'instant) cette dernière relation (en prenant en
compte la définition même de la distance) sous la forme :
(18.14)

qui est appelée "distance hölderienne".

Remarque: Suite à l'intervention d'un internaute nous précisons qu'en toute rigueur l'inclusion ci-dessus
devrait être notée où est la droite achevée (précision également valable pour l'inégalité de
Minkowski ci-dessous).

Au même titre pour l'inégalité triangulaire, donnée alors par (cf. chapitre de Calcul Vectoriel) :

(18.15)

La généralisation, de par la vérification de l'existence de la distance de hölderienne, nous donne la vraie


"inégalité de Minkowski" :

(18.16)

Dans le cas particulier avec , nous avons bien évidemment :

(18.17)

qui est la distance usuelle sur .

E3. Si nous prenons , nous considérerons la distance :

(18.18)

Ainsi, si et nous avons le module qui de même manière que la


norme dans , forme une distance :

(18.19)

E4. Considérons aussi un ensemble arbitraire. Posons :

si et si (18.20)

Il est très facile de vérifier que cette distance vérifie les 5 axiomes et qu'elle est de plus ultra-métrique. Cette
distance est appelée "distance discrète" et le lecteur remarquera que nous avons par analogie opté pour cette
distance le symbole de la fonction Dirac (ce n'est pas innocent !!) plutôt que la traditionnel d.

DISTANCES ÉQUIVALENTES

Parfois, deux distances différentes d et sur un même ensemble E sont assez ressemblantes pour que les
espaces métriques liés possèdent les mêmes propriétés pour certains objets mathématiques
définis par d d'une part, par . Il existe plusieurs notions de ressemblances dont voici une première (avant
les autres qui nécessitent des outils mathématiques que nous n'avons pas encore définis) :

Définition: Soient d et deux distances sur un même ensemble E, d et sont dites "distances
équivalentes" s'il existe deux constantes réelles telles que

(18.21)

soit :

(18.22)

avec . Nous noterons par ailleurs cette équivalence .

L'intérêt de cette définition est le suivant : si nous avons convergence pour l'une des métriques, alors nous
aurons la convergence pour l'autre aussi. Plus clairement :

(18.23)

in extenso:

(18.24)

FONCTIONS LIPSCHITZIENNES

Relativement aux définitions précédentes, nous pouvons maintenant définir quelques propriétés
supplémentaires aux fonctions telles que nous les avions énoncées dans le chapitre de Théorie Des
Ensembles :

Soient (E,d) et des espaces métriques, et soit une fonction. Nous définissons les propriétés
suivantes :

P1. Nous disons que f est une "isométrie" si (c'est plutôt intuitif...!):

(18.25)

Si nous prenons la distance usuelle, la fonction k-lipschitzienne s'écrit alors:

(18.26)

ou ce que nous pouvons écrire également:

(18.27)

Ou ce qui revient au même: toutes les cordes tracées entre 2 points quelconques du graphe ont un coefficient
directeur (dérivée) compris entre -k et k.
Par exemple, la fonction sin(x) est 1-lipschitzienne (car la dérivée du cosinus est en valeur absolue compris
entre 0 et 1).

P2. Nous disons que deux espaces métriques sont "isométriques" s'il existe une isométrie surjective de l'un
sur l'autre (ce qui est assez rassurant en géométrie...).

P3. f est dite "L-lipschitzienne" de constante (ou "de rapport") L s'il existe tel que :

(18.28)

Si , nous disons que f est "contractante" (ou une "contraction"), et si , nous disons que f est
strictement contractante.

P4. Toute fonction f lipchitzienne est uniformément continue (voir plus loin voir plus loin le concept
"d'uniforme continue") si elle vérifie :

(18.29)

avec et (la réciproque n'est pas vraie : toute fonction uniformément continue n'est pas
nécessairement continue). En d'autres termes, si nous pouvons rapprocher deux points aussi près que nous
voulons dans un espace, nous le pouvons aussi dans l'autre (ce qui assure en quelque sorte la dérivation).

Remarques:

R1. Une isométrie est toujours injective car:

(18.30)

mais elle n'est pas en général surjective.

R2. Si (E,d) et sont isométriques, du point de vue de la théorie des espaces métriques ils sont
indiscernables, puisque toutes leurs propriétés sont les mêmes, mais leurs éléments peuvent être de nature
très différente (suites dans l'un et fonctions dans l'autre par exemple).

ENSEMBLES OUVERTS ET FERMÉS

Définition: Considérons un ensemble E muni d'une distance d. Un sous-ensemble U de E est dit "sous-
ensemble ouvert" si, pour chaque élément de U, il existe une distance r non nulle pour laquelle tous les
éléments de E dont la distance à cet élément est inférieure ou égale à r, appartiennent à U, ce qui ce traduit
en langage mathématique :

U ouvert de (18.31)

Remarque: Le symbole / signifie dans ce contexte "satisfait le propriété"

Cette définition peut sembler complexe mais en fait, sa signification concrète est plus simple qu'il n'y paraît.
En fait, selon cette définition, un ensemble ouvert dans un espace topologique n'est rien d'autre qu'un
ensemble de points contiguës et sans bords.

L'absence de bord découle de la condition . En effet, en raisonnant par l'absurde, si un ensemble ouvert
U avait un bord, alors pour chaque point situé sur celui-ci (le bord) il serait toujours possible de trouver un
point n'appartenant pas à U aussi proche que l'on veut de lui. Il s'ensuit que la distance r nécessaire devient
donc nulle.

Définitions:

D1. Un "sous-ensemble fermé" est un "ouvert avec bord".

D2. Un "voisinage" d'un point de E est une partie de E contenant un ouvert contenant ce point.

La définition d'un ensemble ouvert peut être simplifiée en introduisant une notion supplémentaire, celle de
"boule ouverte" :

BOULES

Soit x un élément de E:

Définition: Une "boule ouverte de centre x et de rayon r>0" ou "boule métrique de rayon r centrée en x" est
le sous-ensemble de tous les points de E dont la distance à x est inférieure à r, ce que nous écrivons :

(18.32)

Un ensemble ouvert peut également être défini comme un ensemble pour lequel il est possible de définir une
boule ouverte en chaque point.

Remarque:

R1. Les ouverts ainsi définis, forment ce que nous appelons une "topologie induite" par la distance d ou
aussi "topologie métrique".

R2. Nous appelons une "couverture ouverte" U de E, un ensemble d'ouverts de E dont la réunion est E.

Définition: Une "boule fermée" est similaire à une boule ouverte mais diffère dans le sens que nous y
incluons les éléments situés à la distance r du centre :

(18.33)

Remarque: Pour les inclusions sont des conséquences directes de la


définition de boule ouvert et fermée.

Exemple:

La distance usuelle dans est donnée par . Les boules sont des intervalles. Pour et
, nous avons:

et (18.34)

Définition: Une "sphère" est donnée par :

(18.35)
Remarque: Puisque par définition, , les boules ouvertes et fermées ne sont pas vides car elle
contiennent au moins leur centre. Par contre, une sphère peut être vide.

Exemple:

Avec nous avons vu dans les exemples précédents que nous pouvions définir différentes distances.
Pour les distinguer, nous les notons :

(18.36)

Alors, dans les boules fermées de centre O et de rayon unité équivalentes aux trois formulations
précédentes, ont la forme suivante (rappel : dans cet exemple) :

(18.37)

PARTIES

Maintenant que nous avons défini les concepts de boules, nous pouvons enfin définir rigoureusement les
concepts d'intervalles ouverts et fermées (qui dans un espace à plus d'une dimension sont nommées
"parties") dont nous avons fait si souvent usage en Analyse Fonctionnelle et Calcul Intégral Et Différentiel.

Définition: Soit (X,d) un espace métrique. Nous disons qu'une partie A de X est "bornée" s'il existe une
boule fermée telle que :

(18.38)

Compte tenu de la remarque précédente sur les inclusions des boules, il est clair que nous pouvons
remplacer l'adjectif "fermée" par "ouverte". De plus l'inégalité triangulaire entraîne que le caractère borné de
A ne dépend pas du choix de (avec un il suffit de remplacer r par ).

Définitions:

D1. Soit X un ensemble et (Y,d) un espace métrique. Si X est un ensemble, nous disons qu'une fonction
est "bornée" si son image f(X) est bornée (cas de la fonction sinus ou cosinus par exemple).

D2. Soit (E,d) un espace métrique, et soit A une partie non vide de E. Pour tout nous notons d(u,A) et
nous appelons "distance de u à A", le nombre réel positif non nul :
(18.39)

Nous prolongeons la notion en posant :

(18.40)

Si A et B sont deux parties de E nous avons respectivement (c'est peut-être plus compréhensible ainsi...):

(18.41)

Exemple:

Si nous prenons et nous avons quand tandis que


. Ainsi, la distance entre les parties ne définit pas vraiment une distance sur dans cet exemple.
Il s'agit donc d'un abus de notation et il faut bien interpréter comme l'infinimum de la distance entre
A et B

Remarques:

R1. Si le lecteur à bien compris la définition du concept de "parties" il remarquera qu'il n'existe pas
nécessairement toujours un tel que . En conséquence, nous écrivons trivialement :

(18.42)

De plus, si un tel existe, il n'est bien évidemment pas nécessairement unique.

R2. Il convient peut être de rappeler que cette distance satisfait également les 5 axiomes des distances.

D3. Soit (E,d) un espace métrique, et soit A une partie de E. Nous appelons "adhérence" de A et notons
adh(A) le sous-ensemble de E défini par :

(18.43)

En particulier, puisque , nous avons , et puisque ,


nous avons .

Remarques:

R1. Tout élément de l'ensemble adh(A) est dit "point adhérent" à A

R2. Nous disons qu'une partie A de E est une "partie fermée" si elle est égale à son adhérence

R3. Nous disons qu'une partie A de E est une "partie ouverte" si elle est son complémentaire par rapport à E :

(18.44)

est fermé.
Il s'ensuit que (de par les définitions) :

(18.45)

A est ouverte (18.46)

avec quelques propriétés :

P1. (triviale) Si et vérifient , nous avons :

P2. (triviale) Pour tout , tout :

Dernière propriété qui a pour corroloaire (trivial) :

Si pour tout nous avons , , nous avons :

BOULES GÉNÉRALISÉES

La notion de distance d'un point à un ensemble permet d'étendre les notions de boule et de sphère.

Définitions:

D1. Soit et soit un . Nous appelons "boule ouverte généralisée" de centre A et de rayon r,
l'ensemble suivant :

(18.47)

Respectivement "boule fermée généralisée":

(18.48)

Respectivement "sphère généralisée" :

(18.49)

D2. Soit (E,d) un espace métrique et soient A, B deux parties non vides de E. Nous notons g(A,B) et
appelons "gap" (qui signifie "écartement" ou "espacement" en français) de A à B, le nombre réel supérieur
ou égal à zéro :

(18.50)

Remarque: L'inégalité triangulaire n'est pas valide dans le cadre des gap (ceci
étant également valable). Il suffit pour le démontrer, d'un seul et unique exemple qui contredirait l'inégalité.

Exemple:

Dans prenons nous avons alors :


(18.51)

Il y a donc bien contradiction.

DIAMÈTRE

Définition: Soit (E,d) un espace métrique et soit A une partie non vide de E. Nous notons diam(A) et nous
appelons "diamètre" de A, le nombre réel positif non nul :

(18.52)

Tout partie non vide A d'un espace métrique vérifiant sera aussi dite "bornée".

Remarque: Nous considérons la partie vide comme un borné de diamètre A

Si l'espace métrique (E,d) tout entier est borné, nous disons que la distance d est bornée. Par exemple, la
distance discrète est bornée, la distance usuelle sur ne l'est pas.

Nous avons aussi les propriétés suivantes :

P1. (triviale) ou

P2. (triviale)

P3. De par la définition du diamètre :

Exemple:

Pour il suffit pour se convaincre de prendre la distance discrète. Ainsi, dans un espace
métrique où nous prenons avec , nous avons (c'est un cas intéressant car
complètement contre-intuitif).

P4. Nous avons

Exemple:

Dans prenons , nous avons alors (infériorité stricte triviale):

(18.53)

P5. A est borné si et seulement si

Définition: Nous appelons "excès de Hausdorff" de A sur B :

(18.54)

Remarque: Nous avons en général et ces quantités peuvent ne pas être finies.
VARIÉTÉS

Nous introduisons maintenant les "variétés". Ce sont des espaces topologiques qui sont "localement comme
" (notre espace par exemple..).

Définitions:

D1. Une "variété topologique de dimension n" est un espace de Hausdorff M tel que pour tout il
existe un voisinage ouvert avec , un voisinage ouvert et un homéomorphisme :

(18.55)

D2. Un "homéomorphisme" entre deux espaces est une bijection continue dont l'inverse est également
continu.

D3. Les couples sont appelés des "cartes", U étant le "domaine de la carte" et "l'application de
coordonnées". Au lieu de "carte nous disons parfois aussi "système de coordonnées".

Remarque: Nous noterons par dim M la dimension d'une variété topologique. Ainsi :

(18.56)

D4. Soit M une variété topologique de dimension n. Une famille A de cartes de M est appelée un "atlas" si
pour tout , il existe une carte telle que .

Remarque: Notons que si sont deux cartes de M telles que (ne vérifiant pas l'axiome de
Hausdorff) , alors l'application de changement de cartes :

(18.57)

(18.58)

est un homéomorphisme.

VARIÉTÉS DIFFÉRENTIABLES

Définitions :
D1. Une "variété différentiable" est un espace topologique M où les applications sont des fonctions
de classe .

D2. Un "difféomorphisme" est une application où sont des domaines ouverts de et si


f est un homéomorphisme et en plus si sont différentiables.

Remarque: "différentiable" dans ce contexte signifiera toujours différentiable de classe

D3. Soit une variété topologique (pour simplifier l'écriture), deux cartes de M
sont des "cartes compatibles" (plus précisément, compatibles de classe ), si l'une des deux propriétés
suivantes est vérifiée :

P1. et l'application de changement de cartes est un difféomorphisme

P2.

Un atlas A de M est différentiable si toutes les cartes de A sont compatibles entre elles.

D4. Une "variété différentiable" est un couple (M , A) où M est une variété topologique et A un atlas
différentiable de M.

Remarque: Etant donné un atlas différentiable, il est parfois nécessaire de le compléter : nous disons qu'une
carte de M est compatible avec un atlas différentiable si elle est compatible avec chaque carte de A. Un atlas
de A est une "atlas maximal" si toute carte compatible avec A appartient déjà à A. Un atlas maximal est
appelé une "structure différentiable".
19. THÉORIE DE LA MESURE (ET DE L'INTÉGRATION)

L a mesure, au sens topologique, va nous permettre de généraliser la notion élémentaire de mesure d'un
segment, ou d'une aire (au sens de Riemann, par exemple) et est indissociable de la nouvelle théorie de
l'intégration que Lebesgue mettra en place de 1901 à 1902 et que nous allons aborder ici afin de construire
des outils mathématiques beaucoup plus puissant que l'intégrale simple de Riemann (cf. chapitre de Calcul
Différentiel Et Intégral).

La théorie de la mesure va également nous permettre de définir avec rigueur le concept de mesure (peu
importe la mesure de quoi) et ainsi de revenir sur des résultats importants de l'étude des probabilités (cf.
chapitre de Probabilités). Effectivement, nous allons voir (nous définirons le vocabulaire qui suit plus loin)
pourquoi (U, A, P) est un "espace de probabilités" où A est au fait une tribu sur U et P une mesure sur
l'espace mesurable (U, A).

Avertissement : Le niveau d'abtraction et de volonté requis pour la lecture et la compréhension de ce


chapitre est assez élevé. Il faut être à l'aise avec les notions vues en théorie des ensembles ainsi qu'en
topologie.

ESPACES MESURABLES

Quand en mathématiques nous dérivons, intégrons ou comptons, nous effectuons de manière implicite une
mesure d'un objet ou ensemble d'objet. Rigoureusement, les mathématiciens souhaitent définir comment
peut être structuré la chose mesurée, comment faire une mesure de celle-ci et les propriétés en découlant!

Définitions:

D1. Soit E un ensemble, une "tribu" (ou ""σ-algèbre" ") sur E est une famille de parties de E vérifiant les
axiomes suivants :

A1. (voir exemples plus bas - E étant considéré comme élément)

A2. Si A est un élément d'une tribu alors . Ce qui signifie que est "stable par passage au
complémentaire". Cet axiome implique que l'ensemble vide est toujours un élément d'une tribu!

A3. Pour toute suite d'éléments de nous avons . Nous disons alors que est "stable par
union dénombrable".

Par exemple, la graduation d'une simple règle de mesure... satisfait ces trois axiomes.

Remarques:

R1. Nous écrivons car nous considérons avec cette notation E non plus comme un sous-ensemble de
mais comme un élément de !

R2. Les cas non-dénombrables sont typiques de la topologie, de la statistique ou du calcul intégral!

D2. Le couple est appelé "espace mesurable" et nous disons que les éléments de sont des
"ensembles mesurables".
D3. Si dans le troisième axiome nous imposons que soit stable par union finie (non-dénombrable) nous
imposons alors la notion plus générale "d'algèbre". Ainsi, une tribu est nécessairement contenue dans une
algèbre (mais le contraire n'est pas vrai car justement l'axiome est plus fort).

Remarque:Dans le domaine des probabilités, E est assimilé à l'Univers des événements et à une famille
d'événements et nous parlons "d'espace probabilisable" ou... "d'espace mesurable".

Exemples:

E1. Soit un ensemble de cardinal 2. Les deux seules tribus qui satisfont les trois axiomes sont :

(19.1)

Il n'y a pas d'autres tribus pour l'ensemble E donné que ces deux (la grossière, et la maximale), car il ne faut
pas oublier que l'union de chacun des éléments de la tribu doit aussi être dans la tribu (axiome A3), ainsi que
le complémentaire d'un élément (axiome A2).

Nous voyons par ailleurs de cet exemple que si E est un ensemble est bien une tribu!

E2. L'ensemble des parties de E, noté est aussi une tribu (dixit l'exemple 1).

Une tribu est aussi "stable par union des complémentaires dénombrables". En effet si est une suite
d'éléments de nous avons (trivial en prenant comme référence l'exemple E1) :

et (19.2)

Une tribu est aussi "stable par intersections dénombrables" (trivial en prenant comme référence l'exemple
E1) :

(19.3)

ce qui amène à ce qu'une tribu est stable par unions et intersections dénombrables. En particulier, si nous
prenons deux éléments d'une tribu alors . Avec pour rappel (cf. chapitre de Théorie Des
Ensembles) :

(19.4)

Remarque: Nous voyons aisément avec l'exemple E1 que si est une famille de tribus sur E alors

est une tribu (la vérification des trois axiomes est immédiate)

Bon c'est bien joli de jouer avec des patates et sous-patates... et leur complémentaires mais passons à la
suite.

Définition: Soit E un ensemble et une famille de sous-ensembles de tel que . Soit la


famille de toutes les tribus contenant (entre autres) . n'est évidemment pas vide car . Nous
notons par définition :
(19.5)

la "tribu engendrée" par . est donc par définition la plus petite tribu contenant (et par extension la
plus petite tribu de E).

Voici deux exemples qui permettent de vérifier si ce qui précède à été compris et qui permettent de mettre
en évidence des résultats importants pour la suite.

Exemples:

E1. Soit E un ensemble, et alors (lorsque A est vu comme un sous-ensemble de E


comme le précise l'énoncé et non comme une famille de sous-ensembles!) :

(19.6)

E2. Si est une tribu sur E alors :

(19.7)

E3. Soit et nous avons dès lors (prenez bien garde car maintenant A est une
famille de sous-ensemble et non simplement un unique sous-ensemble!) la tribu engendrée suivante :

(19.8)

Plutôt que de déterminer cette tribu en cherchant la plus petite tribu de contenant A (ce qui serait
laborieux) nous jouons avec les axiomes définissant une tribu pour facilement trouver celle-ci.

Ainsi, nous trouvons donc bien dans au moins l'ensemble vide obligatoire ainsi que:

(19.9)

selon l'axiome A1 et:

(19.10)

lui-même par définition de et les complémentaires de:

(19.11)

selon l'axiome A2 ainsi que les unions:

(19.12)

selon l'axiome A3.


Définition: Soit E un espace topologique (cf. chapitre de Topologie). Nous notons la tribu engendrée
par les ouverts de E. est appelée la "tribu borélienne" sur E. Les éléments de sont appelés les
"boréliens" de E.

Remarque:

R1. La notion de borélien est surtout intéressante car elle est nécessaire à la définition de la "tribu de
Lebesgue" et par suite à "la mesure de Lebesgue" qui nous aménera à définir "l'intégrale de Lebesgue".

R2. La tribu étant stable par passage au complémentaire, elle contient aussi tous les fermés!

R3. Si E est un espace topologique à base dénombrable, est engendrée par les ouverts de la base.

Exemple:

Si désigne l'espace des réels muni de la topologie euclidienne (cf. chapitre de Topologie), la famille des
intervalles ouverts à extrémités rationnelles est une "base dénombrable" (étant donné les extremités...) de
et donc engendre . Même remarque pour , , avec comme base dénombrable la famille des
pavés ouverts à extrémités rationnelles.

Considérons maintenant un ensemble dense (cf. chapitre de Topologie) dans . Les familles suivantes
engendrent :

; ; ; (19.13)

Démonstration:

Soit (la famille des ouverts) :

(19.14)

Nous avons évidement :

(19.15)

De plus :

(19.16)

Donc les intervalles du type [a,b[ avec a et b dans appartiennent aussi à . Donc, si nous
généralisons, avec , il existe une suite d'éléments de décroissant vers x et une suite
d'éléments de croissant vers y tel que :

(19.17)

ce qui entraîne au même titre (que ) que . Les autres cas se traitent de manière
analogue.
C.Q.F.D.

Soit un espace mesurable et (et ) (où A est donc considéré comme un sous-ensemble et
non comme un élément !). La famille est une tribu sur A appelée "tribu trace" de sur A,
nous la noterons . De plus, si , la tribu trace est formée par les ensembles mesurables contenus
dans A.

Démonstration: Nous allons faire une démonstration par l'exemple (...). Nous vérifions les trois points de la
définition d'une tribu :

1.

2. Soit et donc

Exemple:

Soit alors (une tribu parmi d'autres - ne pas oublier la stabilité par union !) :

(19.18)

Choisissons (il est évident que est une tribu sur A).

Dès lors :

(19.19)

et nous avons bien ainsi que .

3. Soit une suite d'éléments de alors :

(19.20)

La dernière assertion de la proposition sera supposée évidente.

C.Q.F.D.

Soit maintenant E un ensemble, une famille de parties de E et non vide. Nous notons la trace
de sur A et la tribu engendrée par sur A. Alors :

(19.21)

Exemple:
Soit l'ensemble , , alors :

(19.22)

Et vérifions :

(19.23)

Donc l'égalité est vérifiée.

Un corollaire trivial de cette égalité est que si nous considérons un espace topologique E et muni de
la topologie induite. Alors:

(19.24)

Rappelons (cf. chapitre de Théorie Des Ensembles) que si nous avonsE qui est un ensemble, alors pour tout
nous définissons la différence symétrique entre A et B par :

(19.25)

Les propriétés triviales sont les suivantes :

P1. Une algèbre est stable par différence symétrique ( nous avons )

P2.

P3.

P3.

Si est une algèbre sur E, alors est un "anneau de Boole" (ou algèbre de Boole mais attention avec
le terme "algèbre" qui peut prêter à confusion avec la théorie des ensembles) avec et E comme élément
neutre "additif" ( ) respectivement "multiplicatif" ( ).

Pour des rappels sur les éléments cités dans le paragraphe précédent, le lecteur pourra se reporter au chapitre
de Théorie Des Ensembles et le chapitre d'Algèbre De Boole (cf. chapitre de Systèmes Logiques Formels)

Démonstration: ("addition") est associative car en développant nous obtenons (cela se vérifie en faisant
un diagramme saggital au besoin - les "patates") :

(19.26)

et cette dernière expression est stable par permutation (commutation) de A et C (même méthode de
vérification) . Donc :

(19.27)
Nous vérifions que est bien neutre par rapport à la différence symétrique (la démonstration que E est
neutre par rapport à l'inclusion est évidente). Il est trivial que :

et que (19.28)

est donc bien un groupe abélien par rapport à la loi (différence symétrique).

C.Q.F.D.

Pour finir est distributif par rapport à . En effet:

(19.29)

Ce qui fait bien de un anneau (qui de plus est un anneau commutatif).

THÉORÈME DE LA CLASSE MONOTONE

Définition: Soit E un ensemble. Une "classe monotone" sur E est une famille de parties de E vérifiant :

A1.

A2. et

A3. Si est une suite croissante (attention au terme "croissant") d'éléments de alors (stable
par union dénombrable croissant)

Remarque:

R1. Une suite croissante d'ensembles c'est :

R2. Les deux premiers points impliquent que est stable par passage au complémentaire.

R3. Les axiomes (2) et (3) (plus le (1)) amènent que la classe monotone est stable par intersection
décroissante. Une manière de vérifier c'est de prendre le complémentaire de chaque élément de la suite
croissante pour tomber sur la suite décroissante et inversement.

R4. L'axiome 3 des classes monotones étant un peu plus restrictif (plus "fort") que l'axiome 3 des tribus
(puisque nous y imposons une suite croissante). Cela implique que toute tribu est une classe monotone (tout
union dénombrable de la tribu étant dans la tribu ce qui est une condition plus forte que la suite croissante) !

De la même manière que pour les tribus, si nous considérons une famille de classes monotones sur E.

Alors est une classe monotone (la démonstration se vérifie immédiament par les trois axiomes
précédemment cités).

Exemple:
Si E est un ensemble, est une classe monotone sur E. Plus généralement, une tribu est une classe
monotone.

De manière équivalente aux tribus, considérons un ensemble E et . Soit la famille de toutes les
classes monotones contenant . n'est pas vide car . Nous notons :

(19.30)

la classe monotone engendrée par . est la plus petite classe monotone contenant (et satisfaisant
bien évidemment aux axiomes).

Remarque: Si E est un ensemble et alors , car est une classe monotone (et
aussi une tribu) contenant et donc elle contient aussi (voir les exemples avec les tribus).

Le théorème (de la classe monotone) s'énonce ainsi : soit E un ensemble. Si est une famille de parties de E
que nous imposons stable par intersections finies alors (nous devons donc prouver que la tribu
minimale de est égale à la classe monotone minimale de ). Si nous n'imposons pas que soit stable par
intersections finies nous n'aurions pas nécessairement l'égalité.

Démonstration:

comme déjà dit (c'est quasiment trivial). Nous allons montrer dans un premier temps que
est donc aussi une tribu sur E. Pour ceci il suffit de montrer que est (aussi) stable par union
dénombrable (et non nécessairement par une suite croissante d'éléments!).

Considérons les familles suivantes pour la démonstration :

(19.31)

(19.32)

Par les définitions précédentes mais étant (imposé) stable par intersections finies entraîne
et donc (c'est le même raisonnement que pour les tribus) :

(19.33)

est une classe monotone en effet , si et que (axiome 2) alors :

(19.34)

et donc (ce qui appuie que les autre éléments satisfont la relation précédente) :
Si est une suite croissante d'éléments de alors :

(19.35)

car est une suite croissante.

Ainsi est bien une classe monotone et par , nous avons donc :

(19.36)

Cette dernière égalité implique . Comme pour , nous montrons que est une classe monotone
et donc , ce qui veut dire par extension que est est donc stable par intersections finies.

étant stable par passage au complémentaire ceci entraîne que est, nous venons de le montrer,
stable par unions finies (alors que nous voulons démontrer que c'est stable par union dénombrable).

Soit à présent une suite d'éléments de . Nous considèrons la suite :

(19.37)

est une suite croissante d'éléments de , donc :

mais (19.38)

Donc :

(19.39)

Ainsi est stable par union dénombrable et enfin est une tribu. Or comme
cela nous amène donc à .

C.Q.F.D.

Nous verrons plus tard quelques applications importantes de ce théorème.


20. TRIGONOMÉTRIE

L a trigonométrie fait partie intégrante de la science de la géométrie. Cette première ayant pour racine
"mesure de la terre" la trigonométrie a pour racine "mesure des corps à trois angles (trigone)".

Remarques:

R1. Il existe actuellement trois trigonométries connues (définies) couramment utilisées en mathématique : la
trigonométrie du cercle (assimilée à l'étude des "fonctions circulaires"), la trigonométrie hyperbolique et la
trigonométrie sphérique. Nous proposons dans le présent texte une tentative d'approche relativement
rigoureuse de toutes les relations les plus connues dans ces trois domaines.

R2. Nous ne traiterons par contre pas ici des trigonométries quadratique et rhombique qui sont utilisées par
les électroniciens et qui n'ont peu voir pas d'intérêt en physique théorique. La même remarque est valable
pour la trigonométrie lemniscatique qui est en relation avec les mathématiques pures et en particulier la
fonction zêta de Riemann.

R3. Le lecteur qui chercherait la démonstration des dérivées et intégrales des fonctions trigonométriques
définies ci-après devra se reporter au chapitre de Calcul Différentiel Et Intégral (cf. section d'Algèbre) où les
dérivées et intégrales des fonctions usuelles que nous pouvons trouver dans les formulaires sont toutes
démontrées.

RADIAN

Quand nous parlons de trigonométrie, la première chose qui devrait venir à l'esprit et s'imposer comme tel
comme standard de mesures d'angles plans (voir le chapitre de géométrie plane pour la définition du concept
d'angle) est la notion de "radians".

Définition: 1 "radian" (noté [rad]) est l'angle plan décrit par une sécante à un cercle, passant par son centre,
tel que l'arc de cercle ainsi défini par l'axe horizontal passant par le centre du cercle et la sécante soit d'égale
longueur au rayon de ce cercle.

Par exemple, pour un cercle de rayon donc de circonférence (ou périmètre P) la longueur de
l'arc de cercle définit par une sécante ayant une angle de 1 radian par rapport à l'horizontale passant par le
centre du cercle sera égale à 1.

Dès lors il vient que l'angle pour "un tour" du cercle sera de :

(20.1)

L'exemple précédent se généralise à un cercle de rayon R quelconque car l'angle pour un tour complet sera
toujours et pour un demi-tour de pour un quart de ...

Malheureusement dans les écoles, les professeurs du primaire apprennent encore aux enfants à mesurer les
angles en degrés. Heureusement la conversion à faire n'est pas trop difficile... (c'est une simple règle de
trois).

Soit r la mesure d'un angle en radians, d la mesure du même angle en degrés et g la mesure du même angle
en grades (vieille unité) nous avons par définition :
(20.2)

Les astronomes et astrophysiciens aiment bien parler en minutes ou secondes d'arc tel que :

(minutes d'arc) (secondes d'arc) (20.3)

TRIGONOMÉTRIE DU CERCLE

Soit la figure ci-dessous représentant un cercle quelconque centré à l'origine dans une base directe :

(20.4)

De par l'application du théorème de Pythagore (cf. chapitre de Géométrie Euclidienne), nous y avons:

(20.5)

avec R étant le rayon du cercle.

A partir de cette représentation, nous pouvons définir des êtres mathématiques nommés "fonctions
trigonométriques du cercle" appelées aussi parfois par les anciens (...) "fonctions cyclométriques" telles que
(pour les plus importantes):

(20.6)

Remarques:

R1. Lisez "cosinus" pour "cos", "sinus" pour "sin", "tangente" pour "tan", "cotangente" pour "ctg", "sécante"
pour "sec", "cosécante" pour "csc".

R2. Lorsque le contexte le permet et qu'il ne peut y avoir d'ambiguïté, les parenthèses après le nom de la
fonction trigonométriques peuvent être omises (c'est souvent le cas en physique).

R3. Les fonctions arc... sont donc les fonctions réciproques des fonctions trigonométriques (fonctions
bijectives) correspondantes!
A partir des ces fonctions, nous pouvons faire des combinaisons et tirer des relations remarquables très
simples mais dont l'utilité profonde est discutable (et qui sont très peu utilisées) telles que :

(20.7)

Dont voici un superbe schéma... qui résume le tout :

(20.8)

Propriétés :

P1. Si nous nous plaçons dans l'étude du cercle dit "cercle trigonométrique", il faut poser pour les définitions
ci-dessus . Ainsi, apparaît plus nettement le sens physique de ces définitions et il en découlera un
nombre de propriétés et d'applications directement exploitables dans la physique théorique et la
mathématique pure.

Effectivement, si nous avons trivialement:

(20.9)

et en appliquant le théorème de Pythagore (cf. chapitre de Géométrie Euclidienne):

(20.10)

d'où:

(20.11)

P2. Si est un réel, et , les réels et sont associés au même point M de par la
périodicité du cercle trigonométrique. En effet, et sont deux mesures du même angle orienté.
Ainsi :
(20.12)

Idem pour toutes les fonctions trigonométriques qui découlent de la définition des fonctions sinus et cosinus.

Remarque: Dans la mesure des "angles orientés", nous disons que deux mesures sont congrues modulo
si et seulement si leur différence est un multiple de . Cela caractérise deux mesures d'un
même angle.

Par définition, sinus et le cosinus de tout nombre réel font partie de l'intervalle . Plus précisément, la
position de M nous permet d'en savoir plus sur le cosinus et le sinus de . Ainsi :

(20.13)

Il existe également une autre représentation des fonctions trigonométriques du cercle, un peu plus technique
au sens visuel mais assez important pour bien comprendre, plus tard, la mécanique ondulatoire :
(20.14)

Le lecteur devrait à ce point, remarquer sans trop de peine les propriétés suivantes (très souvent utilisées en
physique!) :

(20.15)

et reconnaître facilement que le sinus est une fonction impaire et la fonction cosinus une fonction paire
(constat qui nous sera souvent utile dans divers développements mathématiques sur les séries
trigonométriques).

Nous avons vu au début de ce chapitre, que de par la définition des fonctions trigonométriques nous avons :

(20.16)

et également:

(20.17)

De façon exactement identique nous démontrons que:

(20.18)

A partir de ces dernières relations nous tirons sans trop de peine que:

(20.19)

identiquement nous aurons :


(20.20)

par le raisonnement inverse nous tirons tout aussi facilement que:

et (20.21)

Il vient également sans difficultés en observant le cercle trigonométrique que:

(20.22)

Voici les schémas qui résument la manière d'analyse de quelques de ces propriétés (pour les autres relations,
la méthode est identique):

(20.23)

Introduisons maintenant une dernière relation que nous retrouvons en optique ondulatoire ou encore dans le
cadre des transformées de Fourier qui est le "sinus cardinal":
(20.24)

représenté par:

(20.25)

C'est surtout sa forme 3D qui est connue car souvent utilisée pour des raisons marketing faisant penser à une
goutte d'eau tombant dans un récipient d'eau (avec Maple) et c'est toujours joli à regarder...:

plot3d(sin(sqrt(x^2+y^2))/(sqrt(x^2+y^2)),x=-20..20,y=-20..20);

(20.26)

RELATIONS REMARQUABLES

Le dessin ci-dessous va nous permettre d'établir des relations qui permettront de résoudre des équations
impliquant des fonctions trigonométriques (toutes ces relations sont de première importance en physique
pour la simplification de la résolution de problèmes).
(20.27)

Nous noterons sur le schéma la relation suivante:

Donc:

(20.28)

En résumé:

(20.29)

Ce qui implique trivialement si :

(20.30)

et :

(20.31)

d'où:

(20.32)

Nous avons également:

(20.33)

d'où:

(20.34)

Ce qui implique trivialement si :

(20.35)
Avec la relation déjà démontrée nous obtenons également les relations très
importantes:

(20.36)

Relations avec lesquelles nous obtenons très facilement:

(20.37)

et :

(20.38)

d'où:

(20.39)

Nous avons aussi:

(20.40)

Ceci, pour en arriver à la relation:

(20.41)

qui implique:

(20.42)

et évidemment:

(20.43)

d'où:

(20.44)

Nous obtenons également de manière triviale des relations précédentes (nous faisons un petit mélange et
nous secouons...):
et (20.45)

Nous avons aussi :

(20.46)

avec :

(20.47)

d'où :

(20.48)

de manière similaire nous obtenons :

(20.49)

avec :

(20.50)

d'où :

(20.51)

Déterminons maintenant les formules trigonométriques complémentaires appelées "formules de Simpson"


ou "formules d'addition" qui permettent d'exprimer la somme de sinus et/ou de cosinus en produit de sinus
et/ou cosinus.

Soit les relations déjà démontrées précédemment:

(1)

(20.52)

(2)

Posons et d'où :
et (20.53)

Nous obtenons par sommation de (1) et (2):

(20.54)

et par différence:

(20.55)

De la même manière nous obtenons :

(20.56)

et par différence:

(20.57)

et inversement nous retombons très facilement sur les relations:

(20.58)

Toutes ces relations nous seront utiles lors de notre étude de la physique générale et particulièrement dans le
cas de calcul d'intégrales.

THÉORÈME DU COSINUS

Démontrons encore le théorème du cosinus, utile en géométrie:

Dans un triangle quelconque, le carré d'un des deux côtés est égal à la somme des autres diminués du double
produit de ces deux côtés par le cosinus de l'angle compris entre eux :
(20.59)

Démonstration:

(20.60)

mais dans le triangle ABH, rectangle en H, nous avons la relation d'où:

(20.61)

Nous obtenons donc une des relations du "théorème du cosinus":

(20.62)

Par permutation circulaire, nous obtenons les deux autres relations connues.

Remarque: Le théorème du cosinus est parfois appelé "formule d'Al-Kashi", par ailleurs si a est l'hypoténuse
son angle opposé un angle droit tel que est nul et nous retrouvons donc le théorème de Pythagore.
Voici pourquoi nous appelons parfois la formule d'Al-Kashi "formule de Pythagore généralisée".

THÉORÈME DU SINUS

Soit le triangle quelconque dont nous traçons deux hauteurs :

(20.63)

Dans le triangle ci-dessus nous avons les relations :


(20.64)

ce qui nous conduit à l'expression :

(20.65)

d'où :

(20.66)

Par un raisonnement similaire nous avons :

(20.67)

Ce qui donne :

(20.68)

Le tout combiné nous fournit le "théorème des sinus" dont le plus exemple d'application sur ce site est
certainement la détermination des points de Lagrange L4 et L5 dans le chapitre d'astronomie :

(20.69)

Evidemment, il n'y a pas ici toutes les relations trigonométriques (du cercle) existantes comme nous l'avons
déjà dit, mais au moins les plus importantes qu'il faut savoir retrouver lors de l'étude de systèmes physiques.

TRIGONOMÉTRIE HYPERBOLIQUE
Nous avons démontré en analyse fonctionnelle que toute fonction f(x) peut se décomposer en un fonction
paire et impaire tel que :

(20.70)

Ainsi, pour la fonction , nous obtenons :

(20.71)

Rappelons lors de notre étude des nombres complexes que nous avions démontré que :

(20.72)

Nous définissons alors par analogie le sinus et le cosinus hyperbolique (nous démontrerons la provenance de
ce terme plus loin) par :

(20.73)

et nous pouvons donc écrire :

(20.74)

Relation que nous pouvons à nouveau mettre en analogie avec :

(20.75)

Chose intéressante, nous pouvons travailler en trigonométrie avec des angles complexes. Effectivement, si
nous posons , nous avons alors :

(20.76)

Or :

(20.77)

Donc :

(20.78)

Donc la fonction hyperbolique d'un angle complexe existe et l'image en est un nombre complexe aussi. Nous
pouvons ainsi voir abusivement la géométrie hyperbolique comme une sorte de généralisation de la
trigonométrie du cercle aux angles réels et complexes.

Par opposition à la trigonométrie du cercle, le lecteur remarquera et vérifiera facilement que nous avons :
(20.79)

Démonstration:

Nous avons donc:

C.Q.F.D.

Recherchons maintenant les fonctions réciproques des fonctions sinus et cosinus hyperboliques (que nous
utiliserons parfois en physique ou en mécanique). Pour cela rappelons que:

(20.80)

et que la recherche de la fonction réciproque consiste toujours à isoler x.

Donc:

(20.81)

c'est-à-dire:

(20.82)

en résolvant ce polynôme du deuxième degré en puis en prenant le logarithme nous obtenons:

(20.83)

Or comme nous devons rejets la solution avec le signe "-". Il vient alors:

(20.84)

d'où:

(20.85)
En procédant de même pour:

(20.86)

Donc:

(20.87)

c'est-à-dire:

(20.88)

en résolvant ce polynôme du deuxième degré en puis en prenant le logarithme nous obtenons:

(20.89)

Or comme nous devons rejets la solution avec le signe "-". Il vient alors:

(20.90)

d'où:

(20.91)

Ainsi:

(20.92)

Pour étudier une représentation géométrique simple posons maintenant :

(20.93)

avec une restriction à et donc :

(20.94)

Donc nous pouvons écrire :

(20.95)

Or, comme nous le verrons lors de notre étude des coniques dans le chapitre de Géométrie Analytique :
1. La première de ces deux relations, constitue pour l'ensemble de définition donné, un cercle de rayon unité
centré à l'origine. Le lecteur remarquera qu'il est assez curieux pour la trigonométrie du cercle d'obtenir un
cercle...

2. La deuxième de ces deux relations, constitue pour l'ensemble de définition donné, une hyperbole
équilatérale orientée selon l'axe X dont le sommet est S(1,0) à et de foyer . Le lecteur remarquera à
nouveau qu'il est assez curieux pour la trigonométrie hyperbolique d'obtenir une hyperbole...

Ces deux dernières constations devraient permettre, nous l'espérons, au lecteur de comprendre l'origine du
nom de la trigonométrie hyperbolique et de constater que l'étude la trigonométrie hyperbolique sur
l'hyperbole est l'analogue de l'étude de la trigonométrie du cercle sur le cercle.

Si nous représentons le cercle trigonométrie et l'hyperbole trigonométrique et rajoutons quelques


information complémentaire, voici ce que nous obtenons :

(20.96)

Explications :

Pour tracer à la règle et au compas le point P(x,y) de l'hyperbole, nous nous donnons x, donc le point A(x,0).
Nous traçons la tangent au cercle (C) qui relie A(x,0) ce qui nous donne le point de tangence T. Nous traçons
le cercle (G) de centre A(x,0) et passant par T. Ce cercle coupe P(x,y) à la perpendiculaire en A(x,0) à Ox.

Nous voyons apparaître sur la figure plusieurs valeurs des fonctions hyperboliques correspondant à
mais aussi etc. Entre autres, le cercle (G) coupe l'axe Ox en deux
points dont les abscisses sont et .

Si le lecteur veut s'assure de cette constat de faits que donne la figure, il pourra contrôler qu'en tout point de
l'hyperbole, nous avons toujours les relations (entre autres) :

(20.97)
qui sont toujours vérifiées.

Si nous traçons maintenant sur un graphique :

(20.98)

Nous obtenons (ça c'est juste pour avoir vu une fois à quoi ressemble ces fonctions) :

(20.99)

Nous retrouverons la fonction cosh(x) dans le chapitre de Génie Civil par exemple dans le cadre des câbles
suspendus.

RELATIONS REMARQUABLES

Soit par définition :

(20.100)

et :

(20.101)

A partir de ces définitions et à l'aide des opérations élémentaires d'algèbre nous pouvons déterminer les
relations remarquables suivantes (c'est beaucoup plus facile que la détermination de relations remarquables
de la trigonométrie du cercle, donc sauf demande nous donnons ces relations sans démonstration) :

(20.102)

Egalement :

(20.103)

Et nous avons les relations d'addition :


(20.104)

Suite à la demande d'un étudiant, démontrons la première et troisième relation ci-dessus :

Pour la première :

(20.105)

et la troisième :

(20.106)

Signalons encore d'autres relations remarquables :

(20.107)

et encore :

(20.108)
TRIGONOMÉTRIE SPHÉRIQUE

L'objectif de la trigonométrie sphérique est de déterminer les relations remarquables existants entre les
angles et les côtés de formes projetées (dites également "formes géodésiques" car suivant la courbure de
l'espace) sur la surface d'une sphère. Pour déterminer ces relations, nous allons nous intéresser au cas
particulier d'une sphère de rayon unité et des relations entre les côtés d'un triangle (élément de surface plane
élémentaire) et les différents angles existants. Nous verrons que les résultats sont au fait indépendants du
rayon de la sphère et de la forme considérée initialement.

Soit la figure sur laquelle se trouve un triangle géodésique de sommets A, B, C d'angles d'ouverture
respectifs et de côtés opposés a, b, c et trois vecteurs unitaires tels que et que
l'extrémité de est confondu avec le sommet A:

(20.109)

L'angle entre les points B et C, noté , n'a pas pu être représenté sur le schéma ci-dessus faute de place.

Rappelons que le périmètre d'un cercle de rayon unité sur la sphère de rayon unité vaut bien évidemment
. Le périmètre du cercle en fonction de l'angle d'ouverture de ce dernier étant donné par (relation
très très souvent utilisée en physique!!!):

(20.110)

Si le cercle à rayon (comme c'est le cas pour notre sphère), le calcul de la longueur d'arc se simplifie
et devient:

(20.111)

Conséquence relativement aux points sur notre sphère; les côtés du triangle sont donnés par:
(20.112)

Considérons maintenant le produit scalaire (cf. chapitre de Calcul Vectoriel) :

(20.113)

et comme nous avons:

(20.114)

Si nous décomposons les deux vecteurs et sur les vecteurs tangents unités nous avons:

(20.115)

Ce qui nous donne:

(20.116)

ce qui donne (distributivité du produit scalaire):

(20.117)

Comme et , la relation précédente se réduit à:

(20.118)

et comme:

(20.119)

Nous avons:

(20.120)

relation dit "relation fondamentale" que nous pouvons tout aussi bien écrire:

(20.121)

Cette dernière relation est invariante par permutation circulaire des variables .

Il est que les sinus de tous les angles sont positifs (puisque inférieurs à ), ainsi nous pouvons écrire:
(20.122)

Cette dernière relation est bien évidemment également invariante par permutation circulaire des variables
. Donc nous obtenons une relation remarquable du triangle sphérique, appelée "relation des sinus":

(20.123)

Comme la trigonométrie sphérique est souvent utilisée pour des repérages terrestres, avec souvent 2 cercles
très particuliers et orthogonaux : l'équateur terrestre et un méridien ou un parallèle quelconque, ce cas revêt
un intérêt particulier. Le lecteur pourra s'exercer à retrouver les relations ci-dessous. Dans le cas d'un
triangle rectangle en A nous avons bien évidemment:

(20.124)

Toutes les relations que nous avons déterminées jusqu'à maintenant nous permettent dans le cas où
de tirer des relations très intéressantes pour la géophysique:

(20.125)

Evidemment, nous n'avons pas présenté ici toutes les relations de trigonométrie sphérique existantes, mais
au moins les plus importantes qu'il faut savoir retrouver.

Remarque: Nous définissons "l'excédent" ou "excès sphérique" par le nombre:

(20.126)

Pendant que nous y somme, profitons-en pour calculer un problème classique qui est celui de la surface d'un
triangle sur une sphère. Soit la figure:
(20.127)

Si nous prolongeons les arcs de géodésique AC et AB jusqu'à , nous obtenons une tranche de sphère dont
la surface est proportionnelle à l'angle ,en A. Si cet angle valait , nous aurions toute la sphère et la
surface vaudrait . Comme l'angle vaut , la proportionnalité nous dit que vaut:

(20.128)

De la même manière, si nous prolongeons les arcs BC et BA jusqu'à et si nous prolongeons les arcs CA et
CB jusqu'à , nous obtenons deux autres tranches dont les surfaces et valent:

(20.129)

Supposons maintenant que nous additionnons ces trois surfaces:

(20.130)

nous obtenons alors la moitié de la sphère (regarder la figure pour vous le représenter mentalement) plus
additionné 2 fois en trop le triangle géodésiques de surface S en bleu sur la figure (soit 2 fois en trop).

Il faut enlever deux fois la surface de ce triangle bleu pour obtenir la surface de la demi-sphère:

(20.131)

Donc:

(20.132)

comme , nous avons:

(20.133)
Après simplification nous en déduisons que la surface S du triangle ABC vaut::

(20.134)

où est un angle solide.

Il est assez simple de généraliser ce concept à d'autres formes du même acabit (en particulier celles
composées de triangles...).

ANGLE SOLIDE

Il se pose le problème dans la géométrie spatiale le concept d'angle d'ouverture d'une portion de l'espace (en
extension à l'angle dit "angle plan"). Nous définissons alors "l'angle solide" par la mesure de la portion
d'espace limitée par une surface conique de sommet O et nous l'exprimons en stéradian, défini par le rapport
:

(20.135)

S étant l'aire de la calotte découpée par le cône sur une sphère de rayon r.

(20.136)

Si est le demi-angle du cône, nous obtenons pour ce rapport (pour le calcul de la calotte d'une surface
sphérique voir le chapitre traitant des formes géométriques) :

(20.137)

D'où l'on conclut que l'angle solide total vaut par définition :

(20.138)

Nous pouvons également calculer "l'angle solide élémentaire" tel que représenté ci-dessous :
(20.139)

Soit un angle solide élémentaire et OM l'axe du cône. Nous posons :

(20.140)

Nous considérons une surface quelconque passant par le point M. découpe sur cette surface une
portion .

Si nous traçons la sphère S de centre O et de rayon r, cet angle solide découpe sur cette sphère une calotte
d'aire dS :

(20.141)

Soit MN la normale à qui fait un angle avec OM. Nous avons, en assimilant dS et à des portions de
plan :

(20.142)

d'où :

(20.143)

Ce concept d'angle solide nous sera très utile en partie dans le domaine de la physique théorique qui traite du
rayonnement thermique (cf. chapitres d'Optique et de Thermodynamique).

Nous pouvons encore calculer à partir des concepts précédents, l'angle solide élémentaire de révolution tel
que présenté sur la figure ci-dessous :
(20.144)

Il est compris entre deux angles solides de révolution dont les demi-angles au sommet diffèrent de .

(20.145)

où :

(20.146)

Démonstration:

Dans le chapitre traitant des Formes Géométriques (cf. section de Géométrie) nous avons démontré les
différentes manières de calculer la surface d'une sphère. De ces calculs il avait été déduit que la surface
élémentaire à R constant était:

(20.147)

et puisque :

(20.148)

l'angle solide élémentaire s'écrit alors :

(20.149)

Ainsi, l'angle solide délimité par un cône de révolution, d'angle au somment vaut :

(20.150)

C.Q.F.D.
21. GÉOMÉTRIE EUCLIDIENNE

L 'objet de la "géométrie euclidienne" (appelée plus communément "géométrie plane") est, en principe,
l'étude des formes et des propriétés des corps naturels. La géométrie n'est cependant pas une science
expérimentale, puisque son objet est, non pas d'étudier certains aspects de la nature, mais une reproduction
nécessairement arbitraire de celle-ci.

Nous allons dans ce chapitre présenter implicitement, dans un premier temps, les cinq postulats de la
géométrie euclidienne (dont les quatre premiers sont considérés aujourd'hui comme des axiomes) et ensuite
développer autour de ceux-ci la géométrie de base que le lecteur aura besoin pour l'étude du reste du site.
Une fois ceci fait, nous résumerons notre étude en présentant de manière explicite les cinq postulats
d'Euclide et ensuite les axiomes de Hilbert.

Remarque: Nous avons tenté de préserver au mieux les notations propres à Euclide en ayant toutefois une
approche plus moderne de certains concepts et de présenter uniquement ceux qui sont utiles à l'ingénieur sur
le marché du travail.

OBJETS DE LA GÉOMÉTRIE EUCLIDIENNE

Avant d'énoncer les cinq postulats, il nous semble bon de définir quelque concepts intuitifs au préalable :

D1. La notion expérimentale la plus simple est celle de "volume". Nous disons qu'un corps occupe un
certain volume lorsqu'il occupe dans l'espace à trois dimensions une certaine place (pour des espaces à des
dimensions supérieures, nous parlons d'hyper-volumes).

D2. Nous admettrons comme une chose évidente qu'un volume est limité par une "surface"; mais si
l'existence du volume est physiquement contrôlable et mesurable, la surface est une création de l'esprit; c'est
quelque chose d'analogue à une baudruche, par exemple, enveloppant un volume quelconque, mais
d'analogue seulement. C'est un être géométrique à deux dimensions sans épaisseur.

D3. Lorsqu'une surface est limitée, cette limite est une "ligne". Ici encore, la ligne est une création de
l'esprit, une ligne n'a pas d'existence expérimentale; c'est quelque chose d'analogue à la figure formée par un
fil de fer. Etre géométrique encore mais d'une dimension sans hauteur ni largeur.

D4. Une "droite" est définie comme la ligne de plus court chemin joignant deux points sur une surface.

D5. Quand une ligne est limitée, sa limite est un "point": le point est quelque chose d'analogue à
l'intersection de deux fils tendus. C'est encore une création de l'esprit, un être géométrique.

Remarque: Il est d'usage, en géométrie, de représenter un point par une lettre A, B,...; une ligne, ou une
surface par une lettre entre parenthèses (mais cela est rarement respecté car nous supposons souvent que le
lecteur sait de quoi nous parlons). Nous disons alors, par exemple: la ligne (L), la surface (S).

D6. L'expression le "segment" AB désigne en général une ligne limitée par les points A et B. Nous dirons
qu'un point M est sur le segment AB, pour traduire le fait suivant: tout segment AB peut être séparé d'une
infinité de façons en deux morceaux limités par A et M d'une part, par M et B d'autre part - fait inspiré au
géomètre par la possibilité de couper expérimentalement un bout de fil de fer en deux, et cela d'une infinité
de façons (nous y reviendrons lors plus loin)

Remarque: L'expression: "la ligne (L) est tracée sur une surface (S)" signifie que la surface (S) pourrait être
divisée en plusieurs morceaux, de manière que la ligne (L) soit la frontière ou une partie de frontière d'un de
ces morceaux. Cette définition est inspirée du fait qu'il est possible de découper une étoffe, par exemple, en
suivant avec des ciseaux un trait quelconque tracé sur cette étoffe.

Lorsqu'une ligne (L) est tracée sur une surface (S), tout point M qui est situé sur la ligne (L) est aussi, par
définition, situé sur la surface (S). Nous disons alors que c'est un "point de cette surface".

D7. Nous appelons "angle" (ou "angle plan") ou plus rigoureusement "angle rectiligne" la portion de plan
limitée par deux demi-droites (voir plus loin la définition d'une demi-droite)

DIMENSIONS

Nous avons parlé de volume, surface et de ligne auxquelles nous pouvons associer des dimensions. Mais
qu'est-ce une dimension au fait ? Nous allons tâcher d'essayer de définir au mieux cette dernière mais
d''abord, il faut savoir qu'il existe en géométrie plusieurs types de dimensions. La plus connue et commune
est celle que nous appelons la "dimension topologique".

Par exemple, le point (abstraction mathématique et géométrique) à une dimension topologique de 0, la


courbe (trait continu d'épaisseur nulle) une dimension de 1, la surface une dimension de 2, un volume une
dimension de 3 et un hyper-volume une dimension 4 (pour représenter un hyper-volume, prenez un volume
dessiné sur papier (...) et faites en une translation et reliez les sommets) Ce sont toutes des valeurs entières
par définition :

Tableau: 21.1 - Objets, représentations et dimensions types

Pour calculer la dimension de certains objets, nous allons utiliser la méthode de la géométrie métrique plane
qui consiste à un étalon de cet objet, c'est à dire cet objet lui même mais en plus petit, et nous allons le
reporter sur notre objet un certain nombre de fois :

(21.1)

Soit L la longueur totale du segment. Nous allons prendre un étalon de longueur n que nous allons reporter
sur le segment. Cet étalon sera reporté L/n fois. Nous remarquons que:

(21.2)

Nous pouvons appliquer le même raisonnement à une surface:


(21.3)

Soit la surface totale du carré. Cette fois, nous prenons un autre carré, plus petit, de côté n et de surface
. Nous reportons le petit carré sur le grand fois pour obtenir la surface du grand carré. Nous
remarquons que:

(21.4)

Dans ces deux exemples, nous avons fait apparaître le nombre 1 pour le segment, et le nombre 2 pour le
carré. Ces nombres sont la "dimension" de l'objet.

Généralisons: soit N le nombre de fois que nous reportons l'étalon de longueur n sur notre objet de longueur
L, et soit d la dimension de l'objet, nous avons:

(21.5)

Dans le cas des fractales (cf. chapitre sur les Fractales) les dimensions sont variables et fractionnaires.
Considérons la courbe de Von Koch (par exemple) après une itération de la suite la définissant:

(21.6)

Soit L sa taille tel que . Pour calculer sa dimension nous prenons l'élément fondamental de la courbe
(ci-dessous en rouge):

(21.7)

Soit n la taille de cet étalon tel que . Nous voyons très bien que nous pouvons le reporter 4 fois sur la
courbe. Donc:
(21.8)

Le dimension de Van Koch à donc une valeur fractionnaire.

Nous pouvons donc calculer la dimension de n'importe quels objets fractals à la condition de connaitre leurs
mesures.

Ne nous hasardons pas à aller chercher des objets complexes dans quelques galaxies alors que la fractale la
plus connue se trouve dans votre assiette. Eh oui ! Le chou-fleur est bien un fractal ! Vous avez sûrement
déjà remarqué que quand nous découpons le chou-fleur, nous le cassons au lieu de le couper, et ça donne
plein de petits choux-fleurs, qui eux même peuvent donner d'autres plus petits choux-fleurs. Cette
particularité d'autosimilarité à différentes échelles fait du chou-fleur un fractal.

Calculons à présent la dimension fractale du chou-fleur. Quand nous cassons le chou-fleur, nous obtenons
entre 12 et 14 branches qui ressemblent au chou-fleur entier à une dilatation près. Cette dilatation est, si nous
la calculons, de facteur 3. Donc, selon la formule ci-dessus, la dimension du chou-fleur est d'environ:

(21.9)

Il existe également d'autres dimensions. Prenons pour exemple, les "dimensions d'homothétie" dont voici
quelques exemples simples (voir plus loin la définition rigoureuse de "l'homothétie") :

(21.10)

Le segment (tout à gauche), de dimension 1 a par homothétie, vu sa longueur, doublé et nous remarquons
que:

(21.11)

Le carré (au milieu), de dimension 2 a par homothétie, vu sa surface, doublé et nous remarquons que:

(21.12)

Le cube (tout à droite), de dimension 3 a par homothétie vu son volume doublé et nous remarquons que:

(21.13)

Le facteur de duplication d'échelle (homothétie) est donc égal à:

(21.14)
Comme vous pouvez le voir, il s'agit toujours d'une valeur entière mais d'un autre type de dimension.

Le concept de dimensions ayant été introduit intéressons nous maintenant aux postulats d'Euclide qui
pourront paraître vagues dans un premier temps mais qui seront détaillés au fur et à mesure de notre lecture.

CONSTRUCTIONS D'EUCLIDE

La construction de la géométrie plane d'Euclide se fonde sur cinq postulats (dont les quatre premiers sont
considérés aujourd'hui comme des axiomes comme nous en avons déjà fait mention) :

P1. Conduire une droite d'un point quelconque à un point quelconque.

Sous forme moderne nous dirions que par deux points distincts A et B, il passe une droite et il n'en passe
qu'une seule.

Autrement dit : Deux droites (D) et (D') qui ont deux points communs sont confondues, tout point de l'une
est un point de l'autre et réciproquement.

Il résulte de ce postulat que deux droites (D) et (D'), ou bien n'ont aucun point commun, ou bien ont un seul
point commun qui s'appelle "point d'intersection" et sont alors "sécantes" et "distinctes", ou bien ont plus
d'un point commun et sont alors "confondues".

P2. Prolonger indéfiniment, selon sa direction, une droite finie.

Sous forme moderne nous dirions que tout segment AB est prolongeable en une droite passant par A et B
(compte tenu du premier axiome, elle est unique dans une géométrie Euclidienne)

P3. D'un point quelconque, et avec un intervalle quelconque, décrire une circonférence de cercle.

Sous forme moderne nous dirions pour tout point A et tout point B distinct de A, nous pouvons décrire un
cercle de centre A passant par B

P4. Tous les angles droits sont égaux entre eux.

Sous forme moderne nous dirions qu'à chaque angle du plan correspond sa mesure , effectuée avec
une unité choisie une fois pour toutes où est un nombre positif, inférieur à . Réciproquement, soit
un nombre positif quelconque compris entre 0 et , nous admettrons qu'il existe une infinité d'angles
égaux entre eux dont la mesure avec l'unité d'angle choisie soit .

P5. Si une droite, tombant sur deux droites, fait les angles intérieurs du même côté plus petits que deux
droits, ces droites, prolongées à l'infini, se rencontreront du côté où les angles sont plus petits que deux
droits.

Sous forme moderne nous dirions que: étant donnés une droite et un point, il existe une unique droite
passant par ce point et ne coupant pas la droite initiale.

La construction d'Euclide permet donc le développement de la notion de mesure de longueur, d'aire, de


volume, d'angle comme nous allons le voir plus loin.

Les deux théorèmes fondamentaux de la géométrie euclidienne sont le théorème de Pythagore et celui de
Thalès comme nous en verrons la démonstration plus loin. Un peu d'analyse permet d'aller plus loin avec la
trigonométrie que nous avons déjà développée dans le chapitre précédant.

DROITE ET SEGMENTS
Dans un premier temps, la figure géométrique la plus simple (mis à part le point...) en géométrie euclidienne
est la "ligne droite" et celle-ci est directement concernée par deux premiers postulats d'Euclide.

Définitions:

D1. La "ligne droite" est l'image donnée par un fil tendu d'épaisseur nulle et de longueur infinie.

Remarque: Nous pouvons également définir la "ligne droite" comme une infinité de points mis à côté les uns
des autres dans une même direction sur un plan.

D2. Nous appelons "demi-droite" la portion de droite limitée à un point O appelé "origine".

Remarque: L'expression "la demi-droite OA" désigne la demi-droite d'origine O, point nommé le "premier",
qui contient le point A.

D3. Nous disons que deux demi-droites OA, OB sont des "demi-droites opposées" lorsqu'elles constituent la
droite AB toute entière.

D4. Nous appelons "segment" AB une portion de droite limitée par deux points A et B. Ces points sont
appelés les "extrémités" du segment.

GRANDEURS DE MÊME ESPÈCE

Nous disons que des figures géométriques (sous entendus des droites) sont des "grandeurs de même espèce"
lorsqu'il est possible de définir:

1. Dans quel cas une figure (A) sera dite égale à une figure (B) et, si elles sont inégales, laquelle est la plus
petite

2. Ce que nous devons entendre par somme d'une figure (A) et d'une figure (B)

Les définitions choisies doivent être telles que si (A) est déclaré plus petit que (B) et (B) plus petit que (C),
(A) soit déclaré aussi plus petit que (C).

Il faut, en outre, que la figure appelée "somme de (A) et de (B)" soit égale à celle qui est appelée somme de
(B) et de (A).

Enfin, la substitution dans une comparaison, une égalité ou une somme, d'une figure par une figure égale ne
doit pas modifier le résultat des opérations.

Pour faire comprendre ce que sont des grandeurs de même espèce, prenons l'exemple des segments de
droite:

- Nous admettrons qu'il est possible de décider de l'égalité de deux segments AB et A'B' lorsque nous
pouvons les faire coïncider.

- Nous admettrons aussi qu'il est possible de remplacer le segment A'B' par un segment égal AD et porté sur
la demi-droite AB.

- Enfin, nous admettrons qu'il est possible de distinguer entre trois points A, B, C, pris au hasard sur une
droite, lequel est entre les deux autres.

Nous convenons alors de dire que le segment A'B' est plus petit que le segment AB, ce qui s'écrit en abrégé:

(21.15)
lorsque le point C, obtenu en portant sur la demi-droite AB un segment AC égal à A'B', tombe entre A et B.

Si le point C était en B, les segments AB et A'B' seraient égaux et nous écririons alors :

A'B'=AB (21.16)

Nous convenons d'appeler la "somme de deux segments" AB, A'B', le segment AC obtenu en portant sur la
demi-droite opposée à la demi-droite BA un segment BC égal à A'B'. Nous traduisons cette opération en
écrivant:

AC=AB+A'B' (21.17)

Considérons toujours des grandeurs de même espèce... Ajouter entre elles plusieurs de ces grandeurs, c'est
ajouter l'une d'elles à une autre, la somme obtenue à une troisième, etc. Par exemple, ajouter les segments
AB, BC, CD, c'est ajouter AC et CD ce qui donne AD. Nous résumons l'opération en écrivant:

AD=AB+BC+CD (21.18)

Multiplier une grandeur par un nombre entier n, c'est ajouter n grandeurs égales à celle-là. Par exemple, si
nous avons AB=BC=CD, la relation précédente s'écrirait:

(21.19)

Nous allons définir ce que nous appelons "comparer deux grandeurs (A) et (B) de même espèce" :

Choisissons arbitrairement une grandeur (C) de même espèce que (A) et que (B) et plus petite que chacune
d'elles. Formons une suite de grandeurs telles que:

(21.20)

Nous constatons que la grandeur (A) s'intercale entre deux grandeurs et et que (B) se trouve
entre deux autres et par construction.

Nous disons alors par définition que le rapport des grandeurs (A) et (B) est un nombre (A)/(B) positif
compris entre :

et (21.21)

Prenons alors, par exemple, deux segments quelconques AB, A'B' mais différents (par exemple 1.2 [cm] et
3.5 [cm]):

Pour réaliser l'opération précédente, utilisons une règle graduée dont l'unité sera la grandeur C, un segment
arbitrairement choisi (par exemple de 1 [cm]).

Nous appliquons le zéro de la règle en A, et B s'intercalera par construction entre deux graduations de la
règle numérotée p et p+1 à moins que la grandeur C soit égale à AB... (soit avec le choix pris comme
exemple, B s'intercalera entre la 1ère et la 2ème).

Pour A'B', nous appliquons le zéro de la règle aussi en A', et B' s'intercalera aussi entre deux grandeurs de la
règle numérotée q et q+1 à moins que la grandeur C soit égale à A'B'... (soit avec le choix pris comme
exemple, B' s'intercalera entre la 3ème et la 4ème).

Nous exprimerons le résultat de ces mesures et leur rapport en écrivant:


(21.22)

où le terme tout à gauche s'appelle une "mesure par défaut" et celui à l'opposé une "mesure par excès".

Par exemple avec les mesures prises comme exemple nous avons donc:

(21.23)

Définition: Nous appelons "mesure d'une grandeur" (A) le nombre positif qui mesure le rapport de cette
grandeur et d'une grandeur (U) arbitrairement choisie et que nous appelons "l'unité", la mesure de l'unité
étant "1", par définition.

Nous pouvons démontrer que si a est la mesure de (A), b celle de (B) évaluées toutes deux avec une même
unité (U), le nombre (A)/(B) est égal au rapport a/b. Ce rapport étant indépendant de l'unité choisie.

Remarque: Nous disons que (B) est une "partie aliquote" de (A) si le rapport (A)/(B) est un nombre entier.

Nous conviendrons une fois pour toute, qu'en géométrie toutes les grandeurs de même espèce qui
interviennent dans une figure donnée sont mesurées avec la même unité.

Soit (A), (B), (C), ..., (S) des grandeurs de même espèce et (A'), (B'), (C'), ..., (S'), des grandeurs de même
espèce, mais qui ne sont pas nécessairement de même espèce que les précédentes. Nous disons que ces
grandeurs sont "homologues", si nous pouvons les grouper deux à deux, (A') homologue de (A), (B')
homologue de (B), ..., etc., de manière que les conditions suivantes soient réalisées:

- Si (A) est égal à (B), (A') est égal à (B')

- Si (A) est plus petit que (B), (A') est plus petit que (B')

- Si (S) est la somme de (A) et de (B), (S') est la somme de (A') et de (B')

Pour calculer le rapport (A)/(B), formons la suite et pour calculer le rapport (A')/(B'),
formons la suite , obtenue comme la précédente, mais à partir de la grandeur (C')
homologue de (C).

Il est évident que si (A) s'intercale entre et , (A') s'intercalera entre et ; de même,
si (B) s'intercale entre et . Les rapports (A)/(B) et (A')/(B') seront encadrés par les mêmes
nombres :

et (21.24)

Par conséquent: Le rapport de deux grandeurs (A) et (B) est égal au rapport des grandeurs homologues (A')
et (B').

Si, en particulier, les grandeurs (A),(B)... sont mesurées avec une unité (U), et si les grandeurs (A'),(B'),...
sont mesurées avec une unité (U'), homologue de (U), les rapports égaux :
(A)/(U) et (A')/(U') (21.25)

ne sont autres que les mesures de (A) et de (A'). Par conséquent:

Les mesures de deux grandeurs homologues (A) et (A') sont égales, à condition que les unités choisies pour
les mesurer soient des grandeurs homologues.

Considérons maintenant sur une demi-droite Ox un point M. Soit x la mesure (selon la définition précédente)
de OM. A chaque point M de la demi-droite correspond un nombre positif x et un seul; nous admettrons qu'à
un nombre positif x arbitrairement choisi correspond réciproquement un point M de la demi-droite et un
seul.

Une conséquence de cette hypothèse est qu'il existe un point, et un seul, C qui divise le segment OM en
parties égales. Ce point est le point de la demi-droite OM, tel que:

(21.26)

Nous l'appelons "milieu du segment" OM.

Théorème: Il existe un point M et un seul, situé sur le segment AB tel que la mesure du rapport MA/MB soit
égal à un nombre positif donné .

Remarque: Si , ce point est le milieu du segment.

Démontrons cette unicité : Soit M un point quelconque du segment AB; soit x, la mesure de AM, et a la
mesure de AB: la mesure de MB sera a-x puisque M est placé entre A et B. Nous aurons alors:

(21.27)

Pour que ce rapport soit égal à , il faut, et il suffit, que x soit solution de l'équation:

(21.28)

Or, cette équation admet la seule solution:

(21.29)

A cette valeur positive et inférieure à a de x correspond un point M et un seul de la demi-droite AB tel que
MA=x. Ce point M satisfait, et satisfait seul, aux conditions imposées.

Théorème: Il existe un point M et un seul de la droite AB, situé en dehors du segment AB, tel que le rapport
MA/MB soit égal à un nombre donné et défini différent de 1.

Démontrons aussi cette unicité :

1. Supposons . Soit M un point quelconque de la droite AB situé en dehors du segment AB: ou bien A
est sur le segment MB, ou bien B est sur le segment MA. Si A est sur le segment MB, nous avons
nécessairement , donc :
(21.30)

Le point M ne répond donc pas à la question de l'unicité.

Si B est sur le segment MA, MA=x, AB=a, MB=x-a. Nous aurons donc:

(21.31)

Pour que ce rapport soit égal à , il faut, et il suffit que x soit solution de l'équation:

(21.32)

Cette équation admet, nous l'avons vu, comme seule solution:

(21.33)

qui est bien positive et supérieure à . A cette valeur positive et supérieure à 1de x correspond un point M et
un seul de la demi-droite AB. Ce point M satisfait, et satisfait seul aux conditions imposées d'unicité.

2. Supposons maintenant . Nous chercherons le point M pour lequel (nous avons simplement inversé le
rapport) :

(21.34)

nombre supérieur à 1. Il y en a un et un seul d'après (1.) . Il satisfait seul aux conditions imposées.

Remarque: Il n'existe aucun point M situé en dehors du AB pour lequel MA/MB=1. En effet, si A est sur le
segment MB, nous avons, quel que soit M, , et si B est sur le segment MA, .

PLAN

Passons maintenant à l'étude d'un objet géométrique de dimension supérieure à celle de la droite qu'est le
plan et la surface.

Considérons une surface finie (S) et deux points A et B de cette surface. Deux cas peuvent se présenter:

1. Il y a des points de la droite AB qui ne sont pas sur la surface (S). Nous dirons dans ce cas: la droite AB
coupe la surface; les points communs à la droite AB et à la surface (S) sont les points d'intersection de la
surface (S) et de la droite AB. Parmi ces points communs se trouvent, en particulier les points A et B.

2. Tous les points de la droite AB sont des points de la surface (S). Nous disons alors que la droite AB est sur
la surface (S).

Définition: Nous appelons "plan" la surface telle que toute droite AB qui joint deux points arbitrairement
choisis sur la surface, soit sur la surface.
Nous admettrons qu'une pareille surface existe et que par trois points ABC, non alignés, il passe un plan et
un seul. L'étude des plans sera faite ultérieurement: nous nous proposons actuellement l'étude des figures
géométriques tracées dans un plan donné, figures dites "figures planes". Leur étude constitue la "géométrie
plane".

Remarque: Dans la pratique, les figures sont tracées soit sur une feuille de papier, soit sur la surface du
tableau noir.

Le plan étant défini, nous pouvons déjà nous intéresser à opération de base concernant les figures du plan
que nous détaillerons plus tard rigoureusement.

DÉPLACEMENTS ET RETOURNEMENTS

Soit (F) un dessin effectué sur un tableau plan: effectuons sur un papier transparent, dont le recto est
appliqué sur le plan du tableau, un calque du dessin (F). Effectuons, en appliquant ce calque en un
autre point du tableau, un nouveau dessin (F') identique à (F).

Deux cas sont à considérer :

1. Si le recto du papier transparent est demeuré appliqué sur le tableau, le dessin (F') se déduit de (F) par une
opération appelée "déplacement" ou "translation".

2. Si, au contraire, le papier a été retourné, et si c'est le verso qui est appliqué sur le tableau, l'opération
s'appelle "retournement" ou "symétrie"

A chaque point A du dessin (F), l'une quelconque de ces deux opérations fait correspondre un point A' du
dessin (F'), que nous appelons "l'homologue" de A. Un segment AB de (F) vient en coïncidence avec un
segment A'B' homologue de (F'); ces deux segments sont par définition égaux et cela quels que soient A et B.

Définition: Nous disons communément que le dessin (F) est "superposable" au dessin (F') et que ces dessins
représentent des figures égales.

ANGLES

Nous avons déjà brièvement défini le concept "d'angle" dans le chapitre précédent traitant de la
trigonométrie. Nous avons maintenant en plus le quatrième postulat d'Euclide à notre disposition concernant
ce concept.

Nous allons maintenant revenir plus en détail et en voir les concepts sous-jacents qui vont nous permettre
d'aborder plus loin un objet particulièrement utile qu'est la bissectrice:

Définitions:

D1. Nous appelons "angle" (ou "angle plan") ou plus rigoureusement "angle rectiligne" la portion de plan
limitée par deux demi-droites OA,OB, par exemple. Le point 0 s'appelle "sommet" de l'angle, les demi-
droites OA,OB, s'appellent les "côtés" de l'angle.

D2. Nous appelons "angle formé par deux segment AB,AC", l'angle de sommet A dont les côtés sont les
demi-droites AB,AC.

D3. Les demi-droites OA,OB divisent le plan en deux régions: elles définissent donc deux angles:

1. L'un constitué par la région couverte de hachures (voir la figure à l'extrémité gauche ci-dessous) s'appelle
"angle saillant"
2. L'autre, constitué par la région couverte de hachures (voir la figure au centre ci-dessous) s'appelle "angle
rentrant".

(21.35)

La notation ou désigne un de ces deux angles: la lettre qui indique le sommet doit être
(normalement) écrite au milieu (souvent on ne mentionne pas le sommet si le contexte est évidente).
Lorsqu'aucune précision n'accompagne cette notation, elle représente par définition l'angle saillant !!

D4. Nous appelons "angles adjacents" deux angles qui ont le somment et un côté communs et qui sont
placés de part et d'autre de ce côté commun. Sur la figure ci-dessus à l'extrême droite, les angles saillants
, , sont adjacents.

Soit, et deux angles d'un même plan. Nous avons admis précédemment qu'il existe un
déplacement qui amène O en O' et A' en un point A de la demi-droite OA; ce déplacement amène OB soit en
, de manière que les deux angles , ne soient pas adjacents, soit en , de manière que
et soient adjacents. Dans ce dernier cas, un demi-tour supplémentaire autour de OA amènera
dans la position . Ce déplacement et ce retournement, s'il y a lieu, remplace par un
angle , égal par définition.

(21.36)

Si est confondu avec OB, il y a des points de l'un des deux angles et qui sont égaux, tout
point de l'un étant un point de l'autre : nous dirons, dans ce cas, que les angles , sont des
"angles égaux", ce qui s'exprime par l'égalité :

(21.37)
Si n'est pas confondu avec OB, il y a des points de l'un des deux angles , par exemple, qui ne sont
pas des points de AOB. Sur la figure ci-dessus, l'angle est couvert de hachures, l'angle
également; les points dont nous parlons sont ceux de l'angle couvert une seule fois de
hachures. Nous conviendrons de dire que l'angle et, par conséquent, l'angle égal à sont, dans
ce cas, plus grands que l'angle , ce qui s'exprime par l'inégalité :

(21.38)

Maintenant que nous sommes en mesure de comparer des angles, étudions comment nous pouvons sommer
(et donc respectivement soustraire) ceux-ci.

Etudions d'abord le cas de la somme de deux angles , adjacents. Deux cas peuvent se présenter
suivant que les angles sont saillants ou rentrants :

1. Soit et les deux angles à additionner (voir figure ci-dessous à gauche). Par définition, la
somme de ces angles est l'angle , ce que nous exprimons par l'égalité :

(21.39)

2. Soit un angle rentrant à additionner à l'angle saillant . Si nous couvrons de hachures


successivement les deux angles (voire figure ci-dessous à droite), l'angle se trouve couvert deux fois :

(21.40)

Dans ce cas, la somme des angles (rentrant) et (saillant) est donc égale à augmenté de
deux "angles plats" (voir plus loin la définition), ce qui s'exprime en écrivant :

(21.41)

Remarque: Ceci peut paraître confus à certains mais ceux qui auront déjà parcouru le chapitre de
Trigonométrie savent que les angles du cercle trigonométriques sont égaux à eux mêmes modulo .

Etudions maintenant le cas de la somme de deux angles quelconques :

La somme de deux angles , est par définition, égale à la somme de l'angle et d'un angle
égal à l'angle et adjacent à l'angle .
(21.42)

Un pareil angle est obtenu par un déplacement qui amène O en O' et A' en un point OA, suivi ou non d'un
retournement autour de OA.

Etudions comme dernier cas la somme de plus de deux angles :

La somme de plusieurs angles , , etc., est, par définition, égale à la somme obtenue en ajoutant
le premier au second, la somme au troisième, et ainsi de suite.

Soit le premier angle, un angle égal au dernier des angles à ajouter et adjacent au précédent. Le
résultat de l'addition sera augmenté d'autant de fois deux angles plats que le plan a été recouvert au
cours des opérations. On constate aisément que ce résultat ne dépend pas de l'ordre des angles à ajouter
, , etc.

MESURES DES ANGLES

Nous avons défini l'égalité et la somme de deux ou plusieurs angles. Ces définitions satisfont aux conditions
de grandeurs de même espèce que nous avons déjà vues précédemment.

Choisissons donc arbitrairement un angle du plan , qui sera l'unité d'angle pour le plan: la mesure du
rapport , effectuée comme il a été expliqué précédemment lors de notre discussion sur les
grandeurs de même espèce, sera un nombre positif , appelé par définition "mesure de l'angle , avec
l'unité choisie ".

Nous désignons par la lettre grecque minuscule "pi" le nombre irrationnel :

(21.43)

qui est par définition la mesure d'un "angle plat" (nous verrons qu'elle en est l'unité un peu plus loin).

Remarque: Comme tous les angles du plan sont plus petits que deux angles plats, le nombre (qui est la
mesure de ) doit être inférieur à .

Ayant défini l'angle plat, nous pouvons maintenant définir d'autres types d'angles d'usage courant :

Définitions:

D1. Nous appelons "angle droit", tout angle égal à la moitié d'un angle plat.
D2. Nous disons que deux angles sont des "angles perpendiculaires", noté , lorsqu'ils sont touts les deux
droits et adjacents.

D3. Nous appelons "angle aigu" tout angle inférieur à un angle droit et "angle obtus" tout angle supérieur à
un angle droit.

D4. Nous disons que deux angles sont des "angles supplémentaires" lorsque leur somme vaut deux angles
droits.

D5. Nous disons que deux angles sont des "angles complémentaires" lorsque leur somme vaut un angle
droit.

Considérons maintenant les symboles comme les mesures de plusieurs angles , , .

Nous n'insistons pas sur le fait évident que les égalités ou sont équivalentes, ainsi que
les inégalités , . Ces remarques de bon sens s'imposeront chaque fois que des grandeurs
de même espèce auront été mesurées, bien entendu avec la même unité.

En revanche, nous insisterons sur le fait que, d'après la définition même de la somme de plusieurs angles,
est la mesure de l'angle augmentée d'autant de fois deux angles plats que le plan a été
recouvert au cours des opérations d'addition.

(21.44)

Le nombre entier n qui s'introduit dans ce calcul a une valeur qui pourrait être précisée, mais qui n'a pour le
géomètre aucune importance, comme nous pourrons le constater ultérieurement. Nous décidons donc de ne
pas écrire en géométrie le inutile (mais sous-entendu). Egalement, nous décidons par convention
d'écrire:

(21.45)

Ainsi, nous avons cette convention d'écriture signifie que est la mesure de l'angle si
nous avons .

Si est supérieur à , l'égalité signifie que la mesure de l'angle est , k étant un nombre
entier positif ou nul choisi de manière que nous ayant .

Remarques:

R1. Il existe un nombre entier positif k et un seul, tel que nous ayons , c'est-à-dire:

(21.46)

car les deux nombres et sont positifs et différents de 1.


R2 Dire que est la mesure de l'angle suppose que nous ayons et entraîne l'égalité
. Mais écrire n'entraîne en général, que soit la mesure de ; il faut, en outre,
que l'on ait .

UNITÉS DE MESURE DES ANGLES

Nous avons défini l'angle plat comme étant égal à sans spécifier l'unité. C'est ce que nous allons
maintenant nous appliquer à faire. Il existe (encore) plusieurs unités de mesures d'angle dont voici la liste :

Définitions:

D1. Nous appelons "degré" la 180ème partie de l'angle plat.

Tous les calculs anciens sont effectués en degrés; les sous-multiples du degré sont: la "minute
sexagésimale", égale au 60ème du degré, et la "seconde centésimale", égale au 60ème de la minute
sexagésimale.

La notation se lit: trente degrés, dix-huit minutes, onze secondes. Ce type de mesure est
courant encore en astronomie.

Remarque: Nous utilisons encore aujourd'hui couramment le degré dans les écoles mais sans la notation
usant des minutes et secondes (pas commode pour la somme des angles). Nous notons alors l'angle en
degrés avec une notation décimale comme par exemple .

D2. Nous appelons "grade" la 200ème partie de l'angle plat.

Le grade est également une ancienne unité d'angle. Ses sous-multiples sont: la "minute centésimale", égale
au 100ème du grade, et la "seconde sexagésimale", égale au 100ème de la minute centésimale.

La notation se lit: quarante grades, dix-huit minutes, vingt-quatre secondes.

D3. Nous appelons "radian" (noté [rad]) l'angle plan décrit par une sécante à un cercle, passant par son
centre, tel que l'arc de cercle ainsi défini par l'axe horizontal passant par le centre du cercle et la sécante soit
d'égale longueur au rayon de ce cercle (cf. chapitre de Trigonométrie).

Ainsi, en radians, un angle plat est égal à et tous les autres angles sont des multiples réels de cette
constante.

BISSECTRICE

Maintenant que nous savons comparer, additionner et mesurer des angles nous allons pouvoir nous pencher
sur un concept important en géométrie qu'est celui de "bissectrice" et de quelques propriétés y relatives que
nous réutiliserons plus loin pour des théorèmes importants.

Définitions:

D1. Nous appelons "bissectrice" la droite qui divise un angle en deux parties égales.

D2. Nous appelons "demi-bissectrice" la demi-droite qui divise un angle en deux parties égales.

Maintenant voyons quelques propriétés importantes de la bissectrice :


Deux droites AB et CD qui se coupent forment comme nous le savons déjà intuitivement, quatre angles:

(21.47)

Les angles , de même que les angles dont les côtés sont opposés, sont dites "angles
opposés par le sommet".

Trivialement, si est la mesure de l'angle , la mesure de l'angle adjacent est ; celle de


l'angle adjacent au précédent est ; celle de est .

Soit OE la demi-bissectrice de l'angle , OG celle de , OF celle de , OH celle de ,


nous aurons:

(21.48)

et, par conséquent :

(21.49)

Nous aurions de même :

(21.50)

Nous résumons ainsi tous ces résultats et propriétés de mesure:

P1. Deux angles opposés par le sommet sont égaux

P2. Deux angles opposés par le sommet ont même bissectrice

P3. Les bissectrices de deux angles adjacents supplémentaires sont rectangulaires

P4. Les bissectrices des angles formés par deux sécantes sont deux droites rectangulaires (à angle droit)

TRIANGLES

Nous avions étudié jusqu'à présent le concept de dimensions, de point, de segment, de ligne, d'angle et de
plan ouvert (infini). Cependant un plan peut-être délimité par plusieurs lignes pour obtenir ainsi des formes
géométriques (planes) dont les plus simples peuvent être considérées comme les triangles.

Définition: Nous appelons "triangle" la figure formée par trois segments AB, BC, CA, les points A,B,C
n'étant pas alignés. Les segments AB, BC, CA, sont les "côtés" du triangle. Les points A,B,C sont les
"sommets" du triangle. L'angle saillant , qui contient toues les points du côté BC, s'appelle angle du
triangle et BC est alors sont "côté opposé".

Remarque: Nous employons la notation lorsque aucune confusion n'est possible; à défaut, nous utilisons
la notation avec le même sens.
Il y a six éléments dans un triangle, à savoir : trois angles , , et trois côtés AB, BC, CA.

Nous désignerons par , , les longueurs des côtés mesurés avec la même unité; par
, , , les mesures des angles.

La somme des angles d'un triangle plan est toujours égale à 180° (ou radians). La démonstration est assez
simple.

Démonstration:

Sur la figure ci-dessous, ABC est un triangle quelconque, et D la parallèle à (BC) qui passe par A. Nous
observons :

1. Les angles bleus ont même mesure car ils sont alternes-internes (les droites (BC) et D étant parallèles).

Remarque: Pour la démonstration de l'égalité des angles alternes-internes voir plus loin le quatrième axiome
d'Euclide.

2. De même, les angles verts ont même mesure car ils sont alternes-internes.

3. Nous remarquons que la somme des angles bleu + rouge + vert forme un angle plat en A, puisque D est
une droite. Donc angle bleu + angle rouge + angle vert = 180°.

4. D'après les égalités d'angles constatées en (1.) et (2.), nous déduisons que :

(21.51)

Cette démonstration étant valable quel que soit le triangle tracé dans le plan.

C.Q.F.D.

TRIANGLES ÉGAUX

Définitions: Nous disons que deux triangles sont des "triangles égaux" lorsque nous pouvons par un
déplacement soit par un retournement ou les deux combinés, superposer tous les sommets du premier
triangle au deuxième. Nous disons alors aussi que les triangles sont des "triangles homologues"

De cette définition, il vient que deux triangles sont égaux lorsque soit:
1. Ils ont un côté égal et deux angles égaux

2. Deux côtés égaux et un angle égal (réciproque de (1.))

Démonstrations:

Premier cas d'égalité : Deux triangles qui ont un côté égal BC=B'C', compris entre deux angles égaux
, sont égaux.

Puisque BC=B'C' (voir figure ci-dessous), il existe un déplacement qui amène B' en B et C' en C. Ce
déplacement amène A' en situé du même côté par rapport à la droite BC, ou en symétrique de par
rapport à cette droite.

Les deux demi-droites BA et font par hypothèse, avec BC le même angle . Comme elles sont par
construction d'un même côté de BC, elles sont confondues. Les deux demi-droites CA et sont
confondues pour la même raison et parce que . est donc confondu avec A. Les deux triangles
ABC, A'B'C' sont donc égaux.

(21.52)

Deuxième cas d'égalité : Deux triangles qui ont un angle égal compris entre deux côtés égaux
AB=A'B', AC=A'C' sont égaux.

Puisque AB=A'B' (voir figure ci-dessous) il existe un déplacement situé par rapport à AB du même côté que
le point. S'il l'amenait en symétrique de par rapport à AB, un demi-tour autour de AB l'amènerait en
. Les demi-droites situées d'un même côté de AB font, par hypothèse le même angle avec AB,
puisque . Elles sont donc confondues. L'hypothèse entraîne alors que et sont
confondus. Les deux triangles ABC, A'B'C' sont donc égaux.

(21.53)

C.Q.F.D.
TRIANGLES ISOCÈLES

Définition: Nous disons qu'un triangle ABC est un "triangle isocèle" lorsque deux de ses côtés sont égaux
("iso" signifiant "même") AB et AC sont égaux. Le troisième côté BC est alors appelé la "base" de ce
triangle.

Remarque: Nous disons qu'un triangle est "scalène" quand il n'est pas isocèle.

Définition: Nous appelons "médiatrice" d'un segment BC, la perpendiculaire à la droite BC au point H de
cette droite, milieu de BC.

(21.54)

Théorème : Dans un triangle isocèle ABC comme représenté ci-dessus:

1. Les angles et opposés aux côtés égaux sont égaux

2. La médiatrice de BC et la bissectrice de l'angle sont confondus (figure ci-dessus)

Démonstration:

Les deux triangles BAH, CAH définis par la bissectrice de ont un angle égal par
construction compris entre deux côtés égaux : AH qui est commun et AB=AC par hypothèse. Comme les
angles sont droits et égaux et que la somme des angles d'un triangle est égal à un angle plat,
alors les angles et sont donc égaux.

C.Q.F.D.

Théorème: Le lieu géométrique des points M équidistants (à même distance) de deux points B et C donnés
est la médiatrice (D) du segment BC.

Remarque: Nous appelons "lieu géométrique" d'un point M, assujetti à des conditions, l'ensemble des
positions occupées par le point M.

Démonstration:
(21.55)

1. Tout point du lieu est sur la droite (D). Autrement dit, l'hypothèse MB=MC entraîne que M est la
médiatrice de BC. En effet, si MB=MC, le triangle MBC est isocèle et le sommet M est sur la médiatrice de
BC.

2. Tout point de (D) est un point du lieu. Ce qui revient à dire que si M est sur la médiatrice de BC, nous
avons MB=MC. En effet, si M est sur la droite (D) qui rencontre en H, milieu de BC, la droite BC, les
triangles MHB, MHC sont égaux (deuxième cas d'égalité : parce que ces angles sont droits,
HM commun; HB=HC parce que H est le milieu de BC) : les côtés MB, MC sont donc égaux et nous avons
bien MB=MC. Le point M est un point du lieu.

C.Q.F.D.

A l'aide de ce théorème nous pouvons en énoncer un second : Par un point A pris hors d'une droite BC, nous
pouvons mener à cette droit une seule et unique perpendiculaire :

Démonstration:

1. Soit un triangle ABC, faisons subir à ce triangle un demi-tour autour de BC (symétrie horizontale) :
A vient en A' symétrique de A par définition, par rapport à BC. Puisque les figures ABC, A'BC sont égales,
AB=A'B et AC=A'C . BC est donc la médiatrice de AA' et les droites BC et AA' sont perpendiculaires. AA' est
donc bien une perpendiculaire à BC menée par A.

2. Nous ne pouvons en mener plusieurs : soit AH une perpendiculaire menée de A à BC, elle rencontre la
droite BC en H qui est différent soit de B, soit de C. Supposons que H soit différente de B. qui
se déduisent l'un de l'autre par retournement, sont égaux, et, comme chacun d'eux est droit, l'angle est
plat. La droite AH est confondue avec la droite AA' est donc bien la seule perpendiculaire à BC qui passe par
A.

C.Q.F.D.

Définitions:

D1. Nous appelons "projection orthogonale" d'un point A sur une droite BC le point H où la perpendiculaire
menée par A à cette droite la rencontre. Le point H s'appelle aussi "pied" de cette perpendiculaire.

D2. Nous appelons "distance géométrique" du point A à la droite BC la longueur du segment AH.
Puisque BC est la médiatrice de AA', H est le milieu de AA'; donc : Un point A et son symétrique A' par
rapport à une droite (D) sont caractérisés par les deux propriétés suivantes :

P1. AA' est perpendiculaire à (D)

P2. Le milieu de AA' est sur (D)

La droite AB, qui joint le point A à un point de la droite BC, autre que le pied H de la perpendiculaire menée
de A à cette droite, s'appelle "droite oblique". Le point B s'appelant "pied l'oblique".

TRIANGLES ÉQUILATERAUX

Définition: Nous disons qu'un triangle ABC est un "triangle équilatéral" lorsque tous ses côtés sont de
longueur égales ou que tous ses angles sont égaux. Chacun de ces côtés est donc une base.

(21.56)

Remarque: Nous prenons pour habitude d'annoter les côtés égaux par deux traits parallèles disposés au
milieu de la base.
Comme la somme des trois angles de ce triangle doit faire 180° (en degrés) et que les trois angles ont même
mesure, chacun d'eux mesure donc : 180°/3 soit 60°.

TRIANGLES RECTANGLES

Définition: Un "triangle rectangle" est un triangle ABC qui a un angle droit :

(21.57)

Dire que le triangle est rectangle en A signifie c'est en se trouve l'angle droit.

Remarque: Dans un triangle rectangle, le côté le plus grand est toujours le côté opposé à l'angle droit. Nous
l'appelons "l'hypoténuse". Nous démontrons cette propriété avec le théorème de Pythagore (voir plus bas).
TRIANGLES RECTANGLES-ISOCÈLES

Définition: Un "triangle rectangle-isocèle" ABC est à la fois rectangle et isocèle, ce qui signifie qu'il a à la
fois un angle droit et deux côtés de même longueur.

(21.58)

Remarques: Le sommet principal correspond à l'angle droit. En effet, comme BC, l'hypoténuse, doit être le
côté le plus grand, ce sont les côtés AB et AC qui ont même longueur (plus petite).

INÉGALITÉS DANS LES TRIANGLES

Voyons maintenant quelques inégalités (propriétés) intéressantes dans le triangle.

P1. Montrons d'abord que dans tout triangle, un côté opposé à un angle droit ou obtus (supérieur à 90°
donc...) est supérieur à chacun des deux autres côtés du triangle.

Démonstration:

Considérons le triangle ABC ci-dessous dans lequel et soit Cx le prolongement du côté BC. Portons,
sur la demi-droite Bx, une longueur pour construire un triangle isocèle dans le triangle initiale:

(21.59)

Le triangle BAD est donc un triangle isocèle de base AD dont l'angle à la base BAD est bien évidemment
aigu (inférieur à 90°).

Donc par construction . La droite AD est intérieure par construction à l'angle et par suite:

(21.60)

et comme par construction nous avons donc:

(21.61)

Ce qui terme notre démonstration. Car la démarche est la même pour montrer que .
C.Q.F.D.

P2. Dans tout triangle dont les côtés ont des longueurs strictement croissantes, alors un côté est toujours
inférieur à la somme des deux autres.

Démonstration:

Supposons que dans le triangle ABC ci-dessous les côtés soient tels que :

(21.62)

Soient D le point du côté BC tel que soit les côtés du triangle isocèle construit ABD. Nous
obtenons:

(21.63)

Le triangle ABD étant isocèle, l'angle à la base est aigu et son supplément est obtus. Dans le
triangle ADC, nous obtenons d'après la propriété P1 précédente que , c'est-à-dire:

(21.64)

ou:

(21.65)

il s'agit de la fameuse "inégalité triangulaire" sous forme géométrique. Nous la retrouverons dans de
nombreux autres chapitres du site dans des espaces et des concepts mathématiques plus abstraits.

La propriété est alors immédiate pour les autres côtés b et c par permutation de la méthode:

(21.66)

C.Q.F.D.

P3. Dans tout triangle un côté quelconque est supérieur à la différence des deux autres.

Démonstration:

Supposons que nous ayons . En retranchant c aux deux membres de l'inégalité:

(21.67)
il vient immédiatement:

(21.68)

La propriété est alors immédiate pour les autres côtés b et c par permutation de la méthode:

(21.69)

En définitive puisque:

et (21.70)

pour tout triangle à côtés croissants nous avons:

(21.71)

C.Q.F.D.

THÉORÈME DE PYTHAGORE

Maintenant que nous avons vu ce qu'était le triangle et certaines de ses propriétés ainsi que le concept
d'angle, nous pouvons démontrer le fameux "théorème de Pythagore" (qui donne donc la relation que
doivent satisfaire trois nombres qui représentent les côtés d'un triangle rectangel) et faire de la trigonométrie
du cercle (cf. chapitre de Trigonométrie).

Il existe plusieurs démonstrations de ce théorème dont en voici une parmi tant d'autres :

Démonstration:

Soit un carré (4 angles droit) dans lequel est inscrit un autre carré, nous déterminons la surface du carré
inscrit à partir des triangles rectangles résultants de l'espace vide entre les deux carrés tel que présenté sur la
figure ci-dessous :

(21.72)

La surface du carré blanc est bien sûr :

(21.73)
Pour avoir la surface du carré gris on peut soustraire au carré blanc la surface des 4 triangles rectangles
(d'une surface de moitié de celle d'un quadrilatère de même longueur et hauteur), chacun de surface :

(21.74)

La surface du carré gris est donc finalement :

(21.75)

Après simplification, Le résultat obtenu étant équivalent au carré des côtés de la surface grise, avons le
résultat du fameux "théorème de Pythagore" :

(21.76)

C.Q.F.D.

Remarque: C'est au chinois Tchao Kiung K'ing (2ème siècle) que l'on doit cette démonstration.

THÉORÈME DE THALÈS

Ayant démontré le théorème de Pythagore et maintenant que les concepts de parallèles, segments, angles et
autres nous sont connus, nous pouvons enfin démontrer le théorème de Thalès dont voici une possible
démonstration qui nécessite d'abord le développement de deux lemmes :

L1. Triangles de même surface

Soit la figure:

(21.77)

Nous avons:

(21.78)

EFGH est un rectangle car ses côtés sont parallèles deux à deux et il a au moins deux angles droits. Donc ses
côtés opposés ont même longueur: EH=FG.

est la hauteur relative à dans le triangle EAB et FG est la hauteur relative à dans le triangle
FAB.
La surface du triangle ne dépend que de la longueur du côté et de la longueur de la hauteur relative à ce côté.
Pour les deux triangles EAB et FAB, ces longueurs sont égales, donc ils ont la même surface.

Conclusion: Si deux triangles ont un côté commun et si les troisièmes sommets sont une parallèle à ce côté
commun, alors ils ont la même surface.

L2. Rapports égaux

Soit le rapport de proportions ("calcul proportionnel" ou "produit en croix"):

(21.79)

alors:

(21.80)

Si ad=bc, alors ad+cd=bc+cd (nous ajoutons un même nombre positif ou négatif aux deux membres). D'où
après factorisation:

(21.81)

et en appliquant inversement la règle des produits en croix:

(21.82)

Exposons maintenant en quoi consiste le théorème de Thalès :

Soit la figure:

(21.83)

Avec:

(21.84)
Nous avons montré précédemment que si deux triangles ont un côté commun et si les troisièmes sommets
son sur une parallèle, alors ils ont la même surface. Donc les triangles ACD et BCD ont la même surface.

En ajoutant à chacune de ces deux surfaces celle du triangle OCD, nous obtenons que les triangles ODA et
OCB ont la même surface.

Nous en déduisons que en utilisant à nouveau le rapport en croix:

(21.85)

Soit la hauteur issue de D dans le triangle OCD et la hauteur issue de C dans le triangle OCD:

et (21.86)

Conclusion:

(21.87)

Soit maintenant la figure:

(21.88)

Les triangles IJD et IDB ont la même surface d'après le lemme 1, ainsi que les triangles OJD et OIB donc :

(21.89)

d'où :

(21.90)

et donc :
(21.91)

De la même manière dans les triangles OIA et OCJ, nous obtenons :

(21.92)

D'après le lemme 2, comme :

(21.93)

alors :

(21.94)

Donc finalement en reprenant tous les résultats obtenus:

(21.95)

qui constitue le "théorème de Thalès" des rapports.

PARALLELISME

Définition: Nous appelons "parallèles" deux droites également distantes l'une de l'autre sur toute leur
longueur.

Ce concept est directement relié au cinquième postulat d'Euclide et est souvent considéré comme le plus
important ayant été montré qu'il ne peut être considéré comme un axiome car n'étant pas respecté dans les
géométries non-euclidiennes (cf. chapitre de Géométries Non-Euclidiennes)

Conséquence de ce postulat sont les suivantes dans une géométrie euclidienne :

1. Si deux droites (AB) et (CD) sont parallèles, toute droite (E'F') qui coupe l'une coupe l'autre.

Démonstration:

Soit F le point commun à la droite (CD) et à la droite (E'F'): si la droite (E'F') ne coupait pas la droite (AB),
elle lui serait parallèle, et par le point F passeraient deux droites (CD) et (E'F') parallèles à une même
troisième (AB), ce qui n'est pas le cas. Donc, la droite (E'F'), coupe la droite (AB).

C.Q.F.D.

2. Deux droites (AB) et (CD) parallèles à une même troisième (E'F') sont parallèles entre elles.

Démonstration:

Si la droite (CD) n'était pas parallèle à la droite (AB), elle la couperait : elle couperait aussi la droite
(E'F') parallèle à la droite (AB), elle ne serait donc pas parallèle à (E'F').
C.Q.F.D.

Théorème : Si deux droites parallèles sont coupées par une sécante :

1. Les angles alternes-internes sont égaux

2. Les angles alternes-externes sont égaux

3. Les angles correspondants sont égaux

Démonstration:

Soient deux parallèles AB et CD et la sécante EF :

(21.96)

1. Par le milieu O de EF menons la perpendiculaire GH à AB, qui est aussi perpendiculaire à CD. Les
triangles rectangles EOG et FOH ont un angle aigu égal à, et l'hypoténuse égale, OF=OE. Ils
sont égaux, et les angles et sont égaux.

2. Les angles alternes externes et sont égaux, car est opposée par le sommet à l'angle
, qui est alterne interne avec l'angle .

C.Q.F.D.

Réciproque : Si deux droites sont coupées par une sécante qui forme avec ces droites :

- Soit deux angles alternes internes égaux

- Soit deux angles alternes externes égaux

- Soit deux angles correspondants égaux, ces deux droites sont parallèles

alors ces deux droites sont parallèles.

Remarque: Pour démontrer le parallélisme de deux droites, il faut et il suffit que les angles alternes internes,
alternes externes ou correspondants, formés par ces deux droites avec une sécante, soient égaux.
CERCLES

Définition: Nous appelons "cercle" le lieu géométrique des points M du plan qui sont à une distance donnée
R, appelée "rayon" de ce cercle, d'un point fixe O, appelé "centre" de ce cercle.

OM=R (21.97)

Remarque: Le mot "rayon" désigne soit le segment OM, soit sa mesure R.

Les cercles sont directement concernés par le troisième postulat d'Euclide que nous avions énoncé. plus
haut.

Nous appelons "diamètre" d'un cercle toute droite qui passe par le centre O du cercle. Tout diamètre
rencontre le cercle en deux points A et B, définis par OA=OB=R, que nous appelons "extrémités du
diamètre". Nous réservons la notation"diamètre AB" pour le diamètre d'extrémités A et B. Nous disons que
deux points d'un cercle sont "diamétralement opposés" quand ils sont les deux extrémités d'un même
diamètre.

Un cercle divise le plan en deux régions : celle qui contient le centre, que nous appelons "région intérieure",
et celle qui ne le contient pas, que nous appelons "région extérieure".

Théorème : La condition nécessaire et suffisante pour qu'un point P soit strictement intérieur à un cercle (O),
de centre (O) et de rayon R, est .

Démonstration:

1. La condition est nécessaire : Si, par hypothèse, P est à l'intérieur du cercle (O), il est situé soit en O, soit
entre les extrémités A et B du diamètre délimité par le lieu géométrique des points M. S'il est en O, la
proposition est évidente, s'il n'est pas en O, il est entre O et A par exemple, et nous avons , c'est-à-
dire .

2. La condition est suffisante : Si, par hypothèse , P se trouve entre les extrémités A et B des lieux
géométriques définis par les points M, donc à l'intérieur du cercle (O).

C.Q.F.D.

Corollaires : la condition nécessaire et suffisante pour que P soit extérieur au cercle (O) est .

Nous appelons "corde" CD d'un cercle le segment dont les extrémités C et D sont sont sur ce cercle.

Théorème : La médiatrice d'une corde CD est un diamètre

Démonstration (voir figure ci-dessous): La médiatrice de CD, corde du cercle (O) de centre O et de rayon R ,
passe par le point O parce que comme nous l'avons démontré lors de notre étude des triangles nous avons
.
(21.98)

C.Q.F.D.

Corollaire : La perpendiculaire menée par le centre O d'un cercle à une corde CD passe par le milieu H de
cette corde.

Théorème : Par trois points A, B, C non alignés, il passe un cercle et un seul.

Démonstration (voir figure ci-dessous):

Tracer la médiatrice (D) de AB et la médiatrice de AC. Si (D) et étaient parallèles, la


perpendiculaire AB à (D) serait perpendiculaire à , donc confondue avec AC. ABC seraient alignés. Donc
(D) et non parallèles se coupent en un point O :

(21.99)

1. Il passe un cercle par A, B, C : le point O étant sur (D), médiatrice de AB, OA=OB par définition : le point
O étant sur , médiatrice de AC, OA=OC. Le cercle (O), de centre O et de rayon OA, passe par B (puisque
OA=OB) et par C (puisque OA=OC). Il passe donc par A, B, C.

2. Il ne passe A, B, C qu'un seul cercle : S'il passait par A, B, C un cercle différent du cercle (O) de centre
O et de rayon OA, son centre O' se trouverait sur la médiatrice de AB et de AC qui sont deux cordes de ce
cercle; il serait donc confondu avec O.

C.Q.F.D.

Remarque: La médiatrice de BC, corde du cercle (O), passe par le point O. Nous pouvons donc dire (résultat
important) que les trois médiatrices des côtés d'un triangle ABC concourent.

AXIOMES DE HILBERT

Euclide a rassemblé toutes les connaissances géométriques de son temps sous la forme des ses cinq
postulats. Il a laissé son nom à la géométrie euclidienne qui utilise son cinquième postulat, à la géométrie
non-euclidienne qui ne l'utilise pas, et aux espaces euclidiens.
Cette base postulée est néanmoins imparfaite, pour démontrer rigoureusement les théorèmes associés à cette
géométrie, il est nécessaire d'admettre comme vrai des hypothèses supplémentaires implicites. David Hilbert
construisit une axiomatique correspondante à l'idée que se faisait Euclide de la géométrie en ajoutant les
hypothèses ad hoc.

Les axiomes de Hilbert sont eux regroupés en cinq catégories: l'association, l'ordre, la congruence, la
continuité et les parallèles.

Trois concepts sont associés à cette axiomatique :

1. Celui de l'association définit le mot "contient", il correspond aux notions "est élément de" et "est inclu
dans" de la théorie des ensembles.

2. Celui de "l'ordre" correspond à "une relation binaire" entre un couple de points et un point, il apparaît
dans les expressions "entre" et permet de définir les segments.

3. La congruence, qui correspond à trois "relations d'équivalence" pour les couples de points, les triangles et
les angles.

Remarque: Les points, droites et plans sont considérés comme distincts par défaut.

Voici donc les "axiomes de Hilbert" :

AXIOMES D'ASSOCATIONS (A)

A.A1. Soit deux points, il existe une droite passant par ces deux points.

A.A2. Soit deux points, il n'existe qu'une unique droite passant par ces deux points (in extenso la droite
décrite en A.A1) est unique.

A.A3. Une droite contient au moins deux points, et pour une droite donnée, il existe au moins un point non
contenu dans la droite.

A.A4. Soit trois points non contenus dans une droite, il existe un plan contenant ces trois points. Tout plan
contient au moins un point.

A.A5. Soit trois points non contenus dans une droite, il n'existe qu'un unique plan contenant ces trois points.

A.A6. Soit deux points contenus dans une droite D et dans un plan A, alors a contient tous les points de d.

A.A7: Si deux plans A et B contiennent tout deux un point C, alors l'intersection de A et B contient au moins
un autre point.

A.A8: Il existe au moins quatre points non coplanaires.

AXIOMES D'ORDRE (O)

A.O1. Si un point B est entre les points A et C, B est aussi entre les points C et A, et il existe une droite
contenant les trois points A,B,C.

A.O2. Soit deux points A et C, il existe un point B élément de la droite AC tel que C se situe entre A et B.

A.O3.: Soit trois points contenus dans une droite, alors un et un seul se situe entre les deux autres.
A.O4. ("Axiome de Pasch") Soit trois points A, B, C non colinéaires, et soit une droite D contenue dans le
plan ABC mais ne contenant aucun des points A, B, C: Si D contient un point du segment AB, alors D
contient aussi soit un point du segment AC soit un point du segment BC.

AXIOMES DE CONGRUENCE (G)

Remarque: Intuitivement "congruent" signifie en géométrie "superposable".

A.G1. Soit deux points A, B et un point A' élément d'une droite d, il existe deux et deux uniques points C et
D, tel que A' se situe entre C et D, et AB est congru A'C et AB est congru à A'D.

A.G2. La relation de congruence est transitive, c'est à dire, si AB est congru à CD et si CD est congru à EF,
alors AB est congru à EF.

A.G3. Soit une droite d contenant les segments adjacents [AB] et [BC], et soit une droite d' contenant les
segments adjacents [A'B'] and [B'C'] . Si [AB] est congru à [A'B'] et [BC] est congru à [B'C'] alors [AC] est
congru à [A'C'].

A.G4. Soit un angle ABC et une demi-droite B'C' , il existe deux et seulement deux demi-droites, B'D et B'E,
tel que l'angle DB'C' est congru à l'angle ABC et l'angle EB'C' est congru à l'angle ABC.

Corollaire: Tout angle est congru à lui-même.

A.G5. Soit deux triangles ABC et A'B'C' tel que AB est congru à A'B', AC est congru à A'C' , et l'angle BAC
est congru à l'angle B'A'C' , alors le triangle ABC est congru au triangle A'B'C' .

Remarque: Ces axiomes permettent de comparer les segments, et aussi les angles de définir le milieu d'un
segment, les droites orthogonales, de parler de triangles équilatéraux, isocèles, etc... Ils permettent
également de définir rigoureusement les déplacements dont Euclide faisait si souvent usage sans les avoir
définis.

AXIOMES DE CONTINUITÉ (C)

DA1. ("Axiome d'Archimède") Soient [AB] et [CD] deux segments quelconques. Alors il existe toujours une
suite finie de points appartenant à la droite contenant le segment [AB] et tels que
qui peuvent satisfaire .

DA2. ("Axiome de Cantor") Si et sont deux suites infinies de points telles que
et telles que , alors il existe un point X appartenant à tous
les segments . En d'autres termes : soit une suite de segments emboîtés dont la longueur tend vers 0
alors il y a un point commun à tous les segments.

Remarque: Ces axiomes permettent d'établir une correspondance entre les points d'une droite et
l'ensemble des nombres réels.

AXIOMES DES PARALLÈLES (P)

A.P1. Soit d une droite et P un point n'appartenant pas à d. Il passe une et une seule droite d' par P qui soit
parallèle à d.

Autre formulation équivalente :


A.P1. Soit une droite d, un point P non inclu dans d, alors il existe un plan contenant d et A. Ce plan contient
une et une unique droite contenant P et ne contenant aucun point de d.

Nous ne pouvons pas réellement démontrer la non-contradiction logique de l'ensemble de ces axiomes.
Cependant nous savons deux choses si nous faisons un parallèle avec ce que nous avons étudié dans la
section d'Arithmétique et d'Algèbre du site (en particulier les chapitres sur la Théorie Des Ensembles,
l'Analyse Fonctionnelle, les Suites Et Séries) :

1. Si ces axiomes sont contradictoires, alors la théorie des nombres réels est contradictoire.

2. Si le système d'axiomes obtenu en supprimant l'axiome de Cantor est contradictoire, alors la théorie des
nombres rationnels est contradictoire.

Ainsi, la confiance qu'on a dans la solidité de ces axiomes repose sur celle qu'on a dans la théorie des
nombres réels, qui est très grande.

BARYCENTRE

Maintenant que nous avons abordé le minimum de la construction d'Euclide et d'Hilbert de la géométrie,
nous pouvons passer à un niveau supérieur pour faire de l'analyse de propriétés des formes géométriques.
Nous commencerons donc par étudier le concept de "barycentre", appelé également mais plus rarement
"centroïde".

Remarques:

R1. La définition du barycentre nécessite certains des outils mathématiques définis dans le chapitre de
Calcul Vectoriel . La lecture de ce chapitre est donc recommandée si le lecteur souhaite comprendre ce qui
va suivre.

R2. Les développements qui vont suivre sont aussi bien utilisés en géométrie qu'en physique!

Définition: Nous appelons "barycentre" ou "centroïde" des points du plan ou de l'espace affectés

respectivement des coefficients ( où les sont des réels tels que ) l'unique point
G tel que :

(21.100)

Le couple noté est appelé "point pondéré" ("point massif" en physique quand représente une
masse).

Remarques:

R1. En mécanique, le "centre d'inertie" d'un corps correspond au barycentre des particules qui composent le
corps en question. Chaque particule étant pondérée par sa masse propre. C'est donc le point par rapport
auquel la masse est uniformément répartie. Si la densité est constante, le centre d'inertie se confond avec le
barycentre.

R2. Le "centre de gravité" d'un corps correspond au barycentre des particules qui composent le corps en
question, chaque particule étant pondérée par son poids propre! Très souvent en mécanique, la dimension
des corps étant faible devant la rotondité de la terre, on considère un champ de gravité uniforme. Sous cette
hypothèse, le centre de gravité et le centre d'inertie sont confondus.
R3. Lorsque pour tout point massif nous avons , nous parlons alors de
"isobarycentre".

Pour un point O arbitraire, nous avons bien évidemment par simple addition vectorielle :

(21.101)

d'où le résultat majeur :

(21.102)

En passant à la limite, si le domaine est continu, nous avons :

(21.103)

Nous pouvons très bien également travailler avec les éléments de surface ou de volumes (pour ne faire
mention que des plus triviaux) pour déterminer le barycentre :

et (21.104)

Dans l'espace muni d'un repère en notant les coordonnées du point pondéré et
celles de G, nous avons alors :

(21.105)

Voyons quelques propriétés du barycentre :

P1. Soit , n points pondérés. Si , nous avons alors pour tout point M :

(21.106)

Démonstration:
(21.107)

Puisque par définition du barycentre :

(21.108)

nous avons alors bien :

(21.109)

C.Q.F.D.

P2. Pour , les points pondérés et ont


même barycentre car (invariance barycentre) :

(21.110)

La démonstration est évidente (si vous ne voyez pas, contactez-nous).

P3. Le barycentre G de n points pondérés est invariant quand on remplace p d'entre eux, par leur barycentre

G', affecté de la condition de leur coefficient, G est alors le barycentre de :

(21.111)

Démonstration:

Si G' est le barycentre des points pondérés alors :

(21.112)

Pour le cas particulier où M = G :

(21.113)
Or G étant le barycentre des n points pondérés donc :

(21.114)

Comme l'égalité précédente prouve que bien que G est le barycentre des points pondérés :

(21.115)

C.Q.F.D.

P4. Si , pour tous points M, N :

(21.116)

Démonstration:

Pour calculons :

(21.117)

puisque , nous avons alors :

(21.118)

C.Q.F.D.

Remarques: Quand un corps a une certaine symétrie, les calculs se simplifient car le barycentre doit
coïncider avec l'élément de symétrique. Si un corps, comme une sphère, un parallélépipède, etc., a un centre
de symétrie, le barycentre est confondu avec lui. Si le corps a seulement un axe de symétrie, le barycentre
est alors sur cet axe.

TRANSFORMATIONS

Les transformations dans le plan (et plus) sont habituellement définies rigoureusement à l'aide de la théorie
des groupes (cf. chapitre d'Algèbre Ensembliste). Mais dans le cadre de la géométrie euclidienne, cette
approche ne nous intéressera pas. Nous ferons donc dans ce chapitre uniquement une approche très peu
formelle (donc plus intuitive) aux transformations élémentaires dans le plan que sont : la translation,
l'homothétie et la rotation.

Remarque: Par définition, "l'isométrie" est une transformation qui conserve les distances et les aires. Comme
nous le verrons ci-après, la translation, la rotation et la réflexion sont des isométries, l'homothétie n'étant elle
pas du tout une isométrie dans le plan.

TRANSLATION

Soit une droite dans un plan P sur laquelle deux points A et B définissent un segment de la droite noté .

Définition: Une "translation" T ("déplacement" dans une direction donnée comme disait Euclide) de ce
segment de droite associe à chaque point A et B de nouveaux points A'B' tels que . Nous pouvons
donc restreindre la notion de translation à un point uniquement tel que nous puissions écrire
mathématiquement:

(21.119)

Autrement dit, une fonction de transformation de type translation de l'ensemble du plan à lui-même associe à
chaque pré-image au plus une seule et unique image. La translation est donc une fonction bijective. Nous
pouvons donc définir une application de transformation réciproque notée telle que (rappel de ce qui a
été vu en arithmétique) :

(21.120)

Nous disons par définition qu'un point est "invariant par translation" si et seulement si :

(21.121)

Dans un autre type de formalisme, le déplacement du point A au point B selon le vecteur est appelé
"translation de vecteur" (cf. chapitre de Calcul Vectoriel). Elle se traduit mathématiquement par la
somme des coordonnées du point et de la matrice des coordonnées du vecteur.

Par exemple dans un espace à trois dimensions:

(21.122)

La translation n'étant pas une transformation linéaire (cf. chapitre d'Algèbre Linéaire), nous ne pouvons nous
autoriser à la représenter par la multiplication d'une matrice carrée comme nous le verrons pour les autres
transformations suivantes.

Il faut pour cela passer alors par un artifice consistant à utiliser un système appelé les coordonnées
homogènes (cf. chapitre de Géométrie Projective) où les points du plan sont représentés par un vecteur à
trois composantes (et respectivement ceux de l'espace par un vecteur à quatre dimensions):

avec (21.123)

Dans le cadre de l'étude de la translation nous posons car dans ce cas:


(21.124)

Ce système de coordonnées homogènes est applicable à toutes les autres transformations que nous verrons
par la suite en rajoutant à chaque fois une coordonnée (cf. chapitre de Géométrie Projective).

Remarque: Une translation envoie une droite sur une droite parallèle (parallèle à l'originale bien
évidemment!).

HOMOTHÉTIE

Soit une forme quelconque dans le plan (point, droite, ovale, polygone,...), un nombre R, et un point C placé
à un endroit prédéfini.

Définition: Une "homothétie" (appelée aussi "changement d'échelle") H de rapport R et de centre C est
l'application qui à chaque point M de la forme associe au segment un nouveau point colinéaire à
mais disposé à une distance supérieure ou inférieure de rapport R par rapport au centre C tel que

Nous pouvons restreindre la notion d'homothétie à un segment de droite tel que nous puissions écrire
mathématiquement:

(21.125)

Autrement dit, une fonction de transformation de type homothétie de l'ensemble du plan à lui-même associe
à chaque pré-image au plus une seule et unique image. L'homothétie est donc une fonction bijective. On peut
donc définir une application de transformation réciproque notée telle que :

(21.126)

Si , alors C est le seul point invariant. Si , alors tous les points sont invariants et l'homothétie est
dite de type "homothétie identité". Si , alors nous disons alors que nous avons une "symétrie
centrale". La symétrie centrale est donc une rotation de 180°.

Dans un autre type de formalisme, une homothétie de centre O et de rapport k, associe au point A un point B
tel que . Le point B se trouvant sur la droite OA et à une distance . Le signe de k
détermine la position de B par rapport à O :

(21.127)
Nous nous permettons maintenant de faire un petit passage dans la géométrie spatiale (le saut n'étant pas
bien grand et nécessitant juste la connaissance du calcul vectoriel et de l'algèbre linéaire) :

Nous pouvons également remplacer le scalaire k par une matrice carrée tel que:

(21.128)

Une solution triviale pour obtenir une homothétie est de poser que d'où la forme
matricielle diagonale évidente de k :

(21.129)

Cette matrice est appelée "matrice de transformation par homothétie de centre O (origine du repère) et de
rapport k" et donc l'homothétie étant une matrice diagonale commute avec toute application linéaire.

Dans le cas présenté précédemment, l'homothétie conserve les formes dans toutes les axes (sa géométrie est
invariante par transformation) nous utilisons en effet le même facteur k pour tous les axes. Mais nous
pourrions également utiliser la matrice suivante:

(21.130)

qui elle déformerait l'objet selon un facteur différent pour chaque axe.

Ou encore faire un cisaillement dans le plan qui déforme la géométrie selon l'axe x, par exemple avec :

(21.131)

La transformation inverse de l'homothétie est bien évidemment l'homothétie de centre O et de rapport


soit sous la forme d'une matrice:
(21.132)

Lorsque le centre d'homothétie ne coïncide pas avec l'origine du repère choisi (ce qui arrive quasiment tout
le temps), la procédure de calcul des coordonnées du point image est très simple. Il faut :

1. Réaliser une translation pour faire correspondre le centre de l'homothétie avec l'origine du repère et
appliquer cette translation à tous les points en jeu.

2. Réaliser l'homothétie proprement dite comme décrit précédemment (le centre est l'origine du repère).

3. Réaliser la translation inverse pour ramener le centre et l'image à sa place.

ROTATION

Soit une forme quelconque dans le plan (point, droite, ovale, polygone), un nombre , et un point C placé à
un endroit prédéfini.

Définition: Une "rotation" R d'angle et de centre C l'application qui à chaque point M de la forme associe
au segment un nouveau point mais ayant subie une rotation positive ou négative d'angle et de centre
C tel que et ont même longueur mais pas même direction.

De cette définition, il ressort que l'axe de rotation d'un objet est le lieu de points de cet objet qui restent
immobiles.

Remarque: La rotation est également, de manière plus savante, une application bijective dans le plan, nous
pouvons donc également définir une application de transformation réciproque notée .

Si , alors C est le seul point invariant. Si (avec ), alors tous les points sont invariants
et la rotation est dite de type "rotation identité". Si nous choisissons un système d'axes perpendiculaires
adéquat tel que leur intersection se confonde avec C et que alors R est dite une "rotation de symétrie
centrale".

Dans un autre type de formalisme, la rotation s'exprime de manière beaucoup plus rigoureuse. Nous allons
nous aider du dessin d'un cercle de rayon unité (donc dans le plan) pour étudier ce type de transformation.
Nous allons considérer le premier cas ou l'origine du repère et de la translation son confondus :

(21.133)

où A' est l'image A par la rotation de centre O et d'angle .


Nous avons dans le plan pour le point A (cf. chapitre de Trigonométrie) :

(21.134)

et identiquement pour le point A' :

(21.135)

avec .

Ce qui nous amène à écrire:

(21.136)

Identiquement (en sa basant sur le fait les relations trigonométriques élémentaires présentées dans le chapitre
de Trigonométrie du site sont connues), nous trouvons :

(21.137)

ce qui nous permet d'écrire la matrice de rotation dans le plan (en s'imaginant que l'axe Z sort de la feuille):

(21.138)

La transformation inverse consiste très simplement à la rotation de centre O (le même qu'auparavant) et
d'angle soit (nous utilisons à nouveaux les relations trigonométriques évidentes des angles opposés):

(21.139)

Lorsque nous souhaitons procéder à une rotation autour d'un point quelconque, tout comme pour
l'homothétie, il convient de réaliser une translation de vecteur (H étant l'origine du repère de
l'homothétie ) pour faire confondre O et H, puis de réaliser la rotation simple autour de H, et enfin de
ramener O (confondu alors avec H) à son point de départ.

Lors de la rotation d'un objet dans l'espace (nous profitons de la lancée... car nous en aurons besoin dans
plusieurs chapitres relatifs à la physique), la transformation est assez similaire à la précédente.

Effectivement, lors d'une rotation d'angle , autour de l'axe Z la coordonnée z ne change pas. Ce qui nous
amène à écrire la matrice de rotation dans l'espace tridimensionnel par rapport au plan x, y comme étant :
(21.140)

La philosophie est ensuite toujours la même relativement aux autres axes :

Rotation autour l'axe X d'angle :

(21.141)

Rotation autour de l'axe Y d'angle :

(21.142)

Nous avons donc finalement trois matrices de rotation correspondant chacune à un des plans de
l'espace tridimensionnel.

Ces trois matrices font partie du groupe des matrices d'ordre trois, noté "SO(3)" et appelé par les physiciens
et mathématiciens "groupe de rotations spatiales SO(3)". Une rotation quelconque peut donc être représentée
par la matrice produit résultant du produit de ces trois matrices.
Toute rotation consiste ensuite en une composition des ces trois rotations mais il est important que le lecteur
se souvienne du chapitre d'Algèbre Linéaire où nous avions vu que la multiplication matricielle n'est pas
commutative. Ainsi, tourner autour de l'axe X de 90° et ensuite autour de l'axe Z de 90° n'est pas équivalent à
faire tourner d'abord selon l'axe Z et ensuite selon l'axe X du même angle comme le montre l'image ci-
dessous:

(21.143)

Enfin, pour obtenir la matrice qui compose un cas particulier des trois rotations voici par exemple les
commandes à fournir dans Maple:

>X:=array([[1,0,0],[0,cos(theta),sin(theta)],[0,-sin(theta),cos(theta)]]);
>Y:=array([[cos(lambda),0,-sin(lambda)],[0,1,0],[sin(lambda),0,cos(lambda)]]);
>Z:=array([[cos(phi),sin(phi),0],[-sin(phi),cos(phi),0],[0,0,1]]);
>evalm(X&*Y&*Z);

Si nous cherchons à réaliser la composition d'une rotation R et d'une homothétie d'échelle H (dans cet
ordre) la matrice de transformation sera :

(21.144)

Remarques:

R1. Nous rappelons (cf. chapitre d'Algèbre Linéaire) que la multiplication de 2 matrices n'est pas
commutative.

R2. La similitude directe de centre C, de rapport R et d'angle est la composée de l'homothétie de centre C
et de rapport R et de la rotation de centre C et d'angle . Nous renvoyons le lecteur au chapitre sur les
Nombres pour revoir que les nombres complexes permettent formellement d'opérer avec les opérations
d'addition et de multiplication à des similitudes (directes ou rétrogades).

R3. Nous pouvons faire des rotations beaucoup plus puissantes et variables à l'aide des nombres quaternions
(ou "hypercomplexes"). Pour plus d'informations le lecteur se reportera au chapitre sur les Nombres.
REFLEXION

Définition: La "réflexion", appelée également "symétrie axiale", notée (en géométrie) par rapport à la
droite est l'application qui associe à chaque point M extérieur à le point M' tel que soit la médiatrice
de MM '. Si M appartient à , alors .

Mathématiquement cela s'écrit:

(21.145)

Autrement dit, une fonction de transformation de type réflexion de l'ensemble du plan à lui-même associe à
chaque pré-image au plus une seule et unique image. La réflexion est donc une fonction bijective. Nous
pouvons donc définir une application de transformation réciproque notée telle que:

(21.146)

Remarque:Tous les points de sont trivialement invariants par la réflexion dans le plan.

Sous forme matricielles les réflexions du plan sont extrêmement simple à formaliser en utilisant l'algèbre
linéaire (voir chapitre du même nom) comme le montrent les exemples ci-dessous:

- Réflexion par rapport à l'axe des Y:

(21.147)

- Réflexion par rapport à l'axe des X:


(21.148)

- Réflexion par rapport à l'origine:

(21.149)
22. GÉOMÉTRIES NON-EUCLIDIENNES

L es géométries non-euclidiennes sont toutes les géométries qui satisfont non nécessairement tous les
axiomes de Hilbert (cf. chapitre de Géométrie Euclidienne) mais sans en contredire aucune (contrairement
aux anciens axiomes d'Euclide et en particulier celui sur les parallèles).

Une représentation particulière de ce type de géométrie consiste à définir les points comme étant répartis sur
la surface d'une sphère (ce sont les intersection des diamètres de la sphère avec la surface), et les lignes, pour
généraliser le concept de droite, (nous disons maintenant "géodésique"), comme les intersections de la
surface de la sphère avec les plans contenant le centre de la sphère. Deux points définissent alors de façon
unique une ligne et un point est toujours donné par l'intersection de deux lignes. Cependant, dans cette
géométrie, si nous nous donnons une ligne AB et un point P, il n'existe aucune ligne passant par P et ne
coupant pas AB. Ainsi, le cinquième postulat d'Euclide n'est pas satisfait car en P nous pouvons tracer
aucune parallèle à AB.

(22.1)
Remarque: Avant d'aborder ce chapitre, nous recommandons vivement au lecteur d'avoir lu et si possible
compris les chapitres traitant du Calcul Tensoriel, de Trigonométrie et de Géométrie Euclidienne car nous
allons utiliser grand nombre de résultats, non nécessairement triviaux, que nous avons pu y démontrer.

En géométrie euclidienne, nous avons étudié un certain nombre de théorèmes relatifs aux plans. Insistons
maintenant sur le fait que le "plan" et une figure bidimensionnelle dont la courbure est nulle et plongée dans
un espace à 3 dimensions (donc le plan peut dès lors s'orienter). Ceci précisé, il convient peut-être de définir
plus rigoureusement ce qu'est le concept intuitif de "courbure".

Définition: Une figure est dite "courbe" s'il existe au moins en un point se situant sur la ou les droites,
surfaces, volumes, ... la délimitant une tangente non confondue au délimitateur et donc tangent en un seul
point.

C'est Gauss qui en 1824 avait formulé la possibilité qu'il existe des géométries alternatives à celles
d'Euclide. Nous distinguons les géométries à "courbure négative", comme celle du russe Nicolaï
Lobatchevsky (1829) et Bolyai (1832) (somme des angles d'un triangle inférieurà 180°, nombre infini de
parallèles possibles à une droite par un point), des géométries à "courbure positive" comme celle de
Riemann (1867) (somme des angles d'un triangle supérieure à 180°, parallèles se rejoignant aux pôles).

Nous allons voir dans ce chapitre différentes géométries non-euclidiennes dont les plus connues sont les
"géométries riemanniennes" (à courbure constante) et les "géométries de Lobatchevski" (de type
hyperbolique donc à courbure non-constante).
Remarque: La géométrie communément appelée "géométrie de Riemann" est un espace sphérique à trois
dimensions, espace fini et cependant sans bornes, à courbure régulière, alternative au postulat euclidien des
parallèles.

L'intérêt de l'étude de ces géométries est que nous ne pouvons déterminer si l'Univers dans lequel nous
vivons est fait d'un type de géométrie plutôt que d'un autre car étant donné notre taille (physique), plongés
que nous sommes dans quelque géométrie que ce soit à faible courbure, toute surface de l'espace nous
semble localement euclidienne (deux droites parallèles ne se coupent pas). Cependant, la relativité générale,
qui fait usage à outrance du calcul tensoriel (généralisation de n'importe quelle géométrie) montre qu'il
existe des zones de l'espace où la géométrie est très fortement courbée et donc localement non-euclidienne et
seulement l'étude de ce genre de géométries nous permet de tirer des théories expliquant des observations
qui ne sont pas exploitables uniquement avec l'intuition humaine.

Avant de nous attaquer de manière formelle et abstraite à certaines géométries non-euclidiennes nous allons
d'abord faire une introduction pragmatique et particulière de certains concepts qui ne nous sont pas
totalement étrangers car déjà traités dans d'autres chapitres de manière théorique. Une fois cette introduction
faite, qui nous sera très utile pédagogiquement parlant, nous aborderons les concepts vus plus
rigoureusement.

GÉODÉSIQUE ET EQUATION MÉTRIQUE

Revenons donc sur les concepts de géodésique et courbure dont nous avons souvent fait mention dans le
chapitre de Calcul Tensoriel (le fait de ne pas avoir lu ce chapitre ne pose aucun problème normalement à la
compréhension de ce qui va suivre).

Considérons la surface bidimensionnelle d'une sphère de rayon R. Etat donnés deux points B et C
diamétralement opposés, nous cherchons la plus courte distance s mesurée sur la sphère entre B et C. La
courbe obtenue est comme nous le savons une "géodésique", notion qui généralise donc, pour une surface
arbitraire, la notion de droite du plan.

(22.2)

Remarque: Nous supposerons comme intuitif que la longueur d'une courbe de l'espace tridimensionnel
euclidien est toujours supérieure ou égale à la longueur de toute projection plane de cette courbe. La courbe
géodésique est donc nécessairement une courbe plane.

Le rayon entre l'axe Oz et l'un des points B ou C est trivialement donné par un peu de trigonométrie
élémentaire :
(22.3)

Et donc la moitié du périmètre du cercle à hauteur de B et C sera donné par :

(22.4)

Et nous avons démontré dans le chapitre de Trigonométrie quel le périmètre d'un cercle en fonction de
l'angle d'ouverture de ce dernier étant donnée par:

(22.5)

Il vient donc automatique :

(22.6)

Comme sur l'intervalle alors (il y a égalité en et ). Les


géodésiques de la sphère sont donc les arcs de grands cercles, trajets empruntés par les avions pour les vols
intercontinentaux, et correspondent aux lignes obtenues entre la surface de la sphère et un plan passant par le
centre de celle-ci.

Les propriétés géométriques des figures tracées sur la surface d'une sphère ne sont donc plus celles de la
géométrie euclidienne. Ainsi, le plus court chemin d'un point B à un point C, sur la surface sphérique, est
constitué par un arc de grand cercle passant par les points B et C. Les arcs de grand cercle jouent le même
rôle pour la sphère que les droites dans le plan. Ce sont les "géodésiques" de la sphère.

Considérons maintenant deux surfaces bidimensionnelles : la surface de la sphère et celle du cylindre. Etant
donnés deux points B et C, nous traçons la courbe géodésique entre ces points :

(22.7)

Le cylindre peut être découpé parallèlement à son axe et déplié à plat. La géodésique apparaît ainsi comme
une droite du plan. Nous disons alors que le cylindre est "intrinsèquement plat" (même si sa topologie
diffère de celle du plan, il faut en particulier ici éviter que la coupure ne traverse la géodésique). Ce n'est
évidemment intuitivement pas le cas de la surface de la sphère.

Dans le cas de la surface cylindrique, nous pouvons définir les coordonnées cartésiennes du plan
et permettant d'écrire la longueur s de la courbe (droite) BC sous la forme du théorème
de Pythagore :
(22.8)

La métrique du plan est euclidienne et sous infinitésimale nous obtenons "l'équation métrique euclidienne" :

(22.9)

Sur le cylindre, le changement de variable donne :

(22.10)

Ou sous forme locale :

(22.11)

La surface du cylindre peut ainsi être représentée par des coordonnées cartésiennes analogues à celles du
plan, la métrique de la surface du cylindre étant euclidienne sous forme infinitésimale et sous forme globale.

Remarque: La relation précédente correspond à ce que nous avions obtenu dans le chapitre de Calcul
Tensoriel pour l'équation métrique en coordonnées polaires.

Nous pouvons nous intéresser maintenant au problème d'écrire l'analogue du théorème de Pythagore pour
une surface sphérique. L'impossibilité de découper la sphère et de l'aplatir pour épouser un plan suggère des
difficultés...

C'est la raison pour laquelle l'équation de la métrique ne peut s'écrire sous forme générale comme le
théorème de Pythagore. Effectivement, nous avons vu dans le chapitre de Calcul Tensoriel que celle-ci était
donnée par :

(22.12)

Cependant, localement (c'est-à-dire dans une région de petite dimension devant le rayon de la sphère), les
propriétés de la sphère peuvent être décrites par des coordonnées cartésiennes d'un plan tangent à sa surface
(c'est la propriété essentielle des espaces de Riemann!) tel que l'équation métrique soit localement
euclidienne :

(22.13)

En posant il vient alors :

(22.14)

Avec :

(22.15)

Alors que sont les coordonnées de Gauss, sont les coordonnées du plan localement tangent.
Cette petite présentation ayant été faite, passons à un cadre plus général en nous intéressant aux espaces de
Riemann.

ESPACES DE RIEMANN

Pour mieux comprendre ce qu'est un espace de Riemann, nous allons de suite passer par un petit exemple
d'une surface à deux dimensions (exemple très classique) :

Considérons une sphère de rayon R, de surface S, située dans l'espace ordinaire à trois dimensions. Les
coordonnées cartésiennes x, y, z d'un point M de la surface S peuvent s'exprimer, par exemple, en fonction
des coordonnées sphériques . La sphère est entièrement décrite pour un rayon donné et
et .

Trois tels paramètres, permettent de déterminer un point sur la surface d'une sphère, sont nous le savons (cf.
chapitre de Calcul Tensoriel) des coordonnées curvilignes sur la surface ou également dites "coordonnées de
Gauss" (Gauss étant un des premiers mathématiciens à s'intéresser à l'étude des corps plongés dans les
espaces non-euclidiens). D'autres paramètres quelconques u, v, w peuvent évidemment être choisis comme
coordonnées curvilignes sur la surface.

L'élément linéaire de la surface , carré de la distance entre deux points infiniment voisins M, M', s'écrit
en fonction des coordonnées sphériques, comme nous l'avons démontré dans le chapitre de Calcul Tensoriel
:

(22.16)

Nous obtenons ainsi une expression de l'élément linéaire en fonction des trois seules coordonnées de Gauss
. Nous pourrions bien sûr imposer une étude locale (plan tangent) afin que l'élément linéaire ne soit
plus fonction que de comme nous l'avons vu plus haut :

(22.17)

Ecrire à l'aide des trois paramètres, la surface de la sphère (considérée comme un espace à deux dimensions)
constitue un exemple d'espace de Riemann à deux dimensions.

Dont l'élément linéaire est de la forme générale bien connue (cf. le chapitre de Calcul Tensoriel) :

(22.18)

où les sont les composantes contravariantes du vecteur par rapport au repère naturel
.

Remarque: L'étude des figures sur des surfaces riemanniennes fait partie de la géométrie différentielle à
laquelle nous consacrons un chapitre entier dans cette section.

Considérons à présent une surface quelconque de coordonnées . Les coordonnées cartésiennes x, y,


z de l'espace ordinaire où se trouve plongée cette surface s'écrivent de manière générale :

(22.19)

Remarquons par ailleurs que l'équation métrique sous forme tensorielle :


(22.20)

peut s'écrire sous forme développée de la manière suivante (cette relation est démontrée avec une approche
géométrique dans le chapitre de Géométrie Différentielle) :

(22.21)

avec :

(22.22)

Remarques:

R1. L'expression donnée ci-dessus de l'élément linéaire s'appelle "forme quadratique fondamentale" de la
surface considérée. Les coefficients E, F, G sont des fonctions des coordonnées curvilignes. De manière
générale cette surface, considérée comme un espace à deux dimensions, constituera un exemple d'espace de
Riemann, pour des coordonnées curvilignes arbitraires.

R2. Les différents espaces de Riemann constituent ce que nous appelons sous une forme générale (parce
qu'il n'y pas que des espaces de type riemannien à courbure constante) une "variété" munie d'une métrique
riemannienne. Une variété peut être définie (non formellement), par exemple, par un ensemble de points
situés dans un espace préexistant. De manière générale une surface donne l'idée d'une variété à deux
dimensions. La sphère et le tors sont des variétés à deux dimensions sans frontière. Un cylindre de
révolution, un paraboloïde hyperbolique, sont des variétés à deux dimensions ouvertes, avec frontières à
l'infini. Mais nous pouvons aussi envisager des variétés abstraites. C'est le cas par exemple d'un espace de
configuration. Il s'agit alors d'un espace de points à n dimensions représenté par un ensemble (ou noté
)de coordonnées généralisées (voir l'introduction au formalisme lagrangien dans la section de mécanique
analytique), ces dernières pouvant avoir des valeurs comprises dans un domaine fini ou non.

Nous pouvons maintenant mieux définir ce qu'est un espace de Riemann.

Définition: Un "espace de Riemann" est une variété à laquelle nous avons attaché une métrique. Cela
signifie que, dans chaque partie de la variété, représentée analytiquement au moyen d'un système de
coordonnées , nous nous sommes donné une forme différentielle quadratique :

(22.23)

qui constitue la métrique de l'espace.

Les coefficients ne sont pas entièrement arbitraires et doivent vérifier, nous l'avons démontré dans le
chapitre de Calcul Tensoriel, les conditions suivantes :

C1. Les composantes sont symétriques .

C2. Le déterminant de la matrice est différent de zéro.


C3. La forme différentielle de l'élément linéaire, et par conséquent le concept de distance défini par les ,
est invariantes vis-à-vis de tout changement de coordonnées.

C4. Toutes les dérivées partielles d'ordre deux des existent et sont continues donc de classe .

Un espace de Riemann est donc un espace de points, chacun étant repéré par un système de n coordonnées
, doté d'une métrique quelconque telle que la forme différentielle de l'élément linéaire vérifiant les
conditions précédentes. Cette métrique est dite dès lors "métrique riemannienne".

Remarques:

R1. Si la métrique est définie positive, c'est-à-dire si pour tout vecteur non nul, nous disons
que l'espace est "proprement riemannien". Dans ce cas, le déterminant de la matrice est strictement
positif et toutes les valeurs propres de la matrice sont strictement positives.

R2. Par définition, nous disons qu'une métrique d'un espace est euclidienne lorsque tout tenseur fondamental
de cet espace peut être ramené, par un changement approprié de coordonnées, à une forme telle que (cf.
chapitre de Calcul Tensoriel) la base orthonormée canonique : .

R3. La définition des espaces riemanniens montre que l'espace euclidien est un cas très particulier de ces
espaces. Il n'existe donc qu'un seul espace euclidien alors que nous pouvons créer une infinité d'espaces
riemanniens.
23. GÉOMÉTRIE PROJECTIVE

D epuis Chasles et jusque dans les années 1930, la géométrie projective était souvent synonyme de
"géométrie supérieure". Elle s'opposait à la géométrie euclidienne : élémentaire... , et analytique. A l'époque
de Monge, de Carnot, de von Staudt, on parlait aussi de "géométrie de position" ou de "situation". Ces
géométries étudient les figures au point de vue de leurs positions respectives et des propriétés invariantes qui
les lient dans une transformation géométrique (rotation, symétrie, homothétie,...), homographique tout
particulièrement. Outre la division harmonique, notion de base, elle fait appel au célèbre rapport
anharmonique (birapport), à l'inversion, l'involution, la transformation par polaires réciproques, la projection
stéréographique, la corrélation, l'homologie, la dualité, les coniques, etc. (voir plus loin dans ce texte pour
les définitions)

Cette géométrie très abstraite en dehors de quelques généralités et principes de base exposés ci-dessous, est
relativement difficile à appréhender et requiert, avant de s'y plonger, une bonne connaissance en géométrie
élémentaire voire, dans l'espace, une parfaite maîtrise de l'espace tridimensionnel, dans le cycle observation-
représentation-interprétation. Ceci nous amené à introduire certains concepts qui n'ont normalement pas leur
place ici mais qui nous le pensons, peuvent aider grandement l'intéressé à mieux comprendre cette branche
des mathématiques.

Dans un premier lieu, nous allons étudier les concepts élémentaires de la perspective en s'attardant
particulièrement sur le concept de présentation "projective" (il existe d'autres méthodes de perspective
empiriques : cavalière, isométrique, militaire, … mais ces dernières n'ont pas de sens mathématique ou réel
même si elles représentent assez convenablement des objets volumiques). Ensuite, nous étudierons les
représentations mathématiques de quelques objets tridimensionnel dans le cadre d'applications pour enfin
passer à l'étude de la géométrie projective dure. Enfin, nous étudierons la mathématique utilisé dans la
représentation informatique des formes géométriques (splines, courbes de bézier, etc...)

Remarque: La "géométrie descriptive" est une forme artistique rigoureuse de la géométrie projective mais
non formelle (dans le sens qu'elle ne s'étudie pas mathématiquement).

PERSPECTIVE CONIQUE (CENTRALE)

Un des problèmes de l'étude des volumes tridimensionnels et de leur représentation est le concept de
"perspective". Effectivement, l'être humain ne peut voir les 3 dimensions d'un objet, c'est le cerveau qui
interprète les ombres et reflets d'un objet afin que nous l'interprétions comme ayant un volume (il existe des
illusions d'optique qui vont dans ce sens…: les trompe l'oeil).

Nous allons nous intéresser dans les paragraphes qui suivent à la "perspective conique", aussi appelée
"perspective centrale" ou encore "linéaire".

Remarque: Dans le domaine de la géométrie projective nous ne parlons pas de "perspective conique" mais
de "projection conique".

Définition: La "perspective conique" ou "projection perspective" est par construction la représentation la


plus proche de nos perceptions visuelles, elle permet notamment de voir une sphère comme un cercle.

Remarque: La perspective conique est celle des peintres de la Renaissance. C'est aussi celle qui apparaît sur
une photo.

La difficulté de la représentation en perspective est de traduire dans un plan (celui de la feuille de papier par
exemple ou l'écran d'ordinateur) une construction qui est définie - de manière assez simple, d'ailleurs - dans
l'espace à l'aide d'outils mathématiques.
Une projection conique de l'espace à 3 dimensions usuel est donc transformation projective qui envoie tous
les points de cet espace sur un même plan de cet espace. Elle nécessite la donnée d'un point O (équivalent à
la position de l'oeil de l'observateur) et d'un plan de projection appelé "tableau" ou encore "Vitre de Dürer"
(l'équivalent de la rétine).

Nous verrons lors des développements théoriques que contrairement aux projections affines (voir le sous-
chapitre suivant), la projection conique ne conserve pas le barycentre (donc les rapports de longueurs sur
une droite donnée) mais elle conserve l'alignement et le birapport.

Lorsque nous parlons de perspective conique, nous utilisons quelques plans et droites particuliers dans
l'espace tridimensionnel (voir figure plus bas):

- Le "plan du tableau" ou "vitre de Dürer", noté T, est le plan sur lequel nous faisons le dessin (plan de
projection).

- Le "plan du sol", noté S, est un plan fixé, perpendiculaire au tableau T.

- Le "point de vue" (ou "centre de projection"), noté O, est un point hors de T et de S : c'est le point où devra
se placer l'oeil pour que le dessin sur le tableau T coïncide avec l'image réelle.

- Le "plan de l'horizon", noté H, est le plan parallèle au plan du sol S passant par le point de vue O.

- La "ligne d'horizon", notée h, est l'intersection du plan d'horizon H et du tableau T.

- La "ligne de Terre", notée LT, est l'intersection du plan de sol S et du tableau T.

- Un plan ou une droite parallèles au plan du sol S sont appelés "horizontaux".

- Un plan ou une droite perpendiculaires au plan du sol S sont appelés "verticaux".

- Un plan ou une droite parallèles au tableau T sont appelés "frontaux".

- Un plan ou une droite perpendiculaires à T sont appelés de "bout".

Voici un schéma qui représente ces différentes notions:

(23.1)
IMAGES DE POINTS

Tout objet volumique (ce qui ne peut être déterminé qu'au touché ou au niveau de l'abstraction
mathématique) composé par un ensemble de points M, est à notre cerveau, l'image d'une projection plane
m dont le support est une surface dans l'espace se trouvant entre l'objet observé et notre oeil.

En mathématique, cette surface appelée donc "tableau" est délimitée dans sa vue centrale par la ligne
d'horizon (là où se situent les points de fuite) et par un référentiel physique appelé donc la ligne de terre
(voir schéma ci-dessous):

(23.2)

La hauteur entre la ligne de Terre et le point de vue est appelée la "hauteur d'horizon" et est notée h.

L'objectif à partir de ce schéma est de déterminer mathématiquement une représentation d'un objet
volumique sur une surface (plan dans un cas simple, quelconque sinon) en connaissant l'équation de la droite
entre le point M et le point V (point de vue) afin d'en déterminer les coordonnées d'intersection entre cette
droite et le tableau.

Nous pouvons du schéma ci-dessus tirer les relations suivantes selon les théorèmes de Thalès (cf. chapitre de
Géométrie Euclidienne) dans les différents triangles:

(23.3)

avec .

Si nous posons , conformément à ce que nous montre le schéma ci-dessus, les coordonnées du point
m deviennent:

et (23.4)
A partir de ces relations, le problème de la représentation plane d'une forme volumique est complètement
résolu, puisque nous pouvons toujours projeter un point (ou la distance entre deux points) sur un tableau à
partir des coordonnées de l'original.

Le terme est communément appelé la "longueur focale" du point de vue à l'écran et les spécialistes de
l'optique le notent habituellement par la lettre f.

Pour mieux comprendre ce dernier résultat, nous pouvons nous mettre dans la contexte d'une étude
bidimensionnelle où l'observateur est à la hauteur de la ligne de Terre (h=0) et disposé de façon à représenter
une personne regardant le tableau (assimilable à un écran télé, ordinateur ou tout autre) dans lequel nous
posons les axes conventionnels x et y dans le plan de l'écran et Z perpendiculairement (ainsi, relativement au
premier schéma, Y devient Z et inversement).

Ainsi la relation précédente des rapports :

(23.5)

devient avec ce changement d'axes:

(23.6)

et comme h=0 (ce qui est souvent le cas devant des écrans):

(23.7)

Remarque: Cette relation est une forme particulière de ce que nous appelons les "transformations
homographiques". Nous reviendrons plus loin sur celles-ci et démontrerons certaines de leurs propriétés.

Si le tableau est posé sur l'axe du référentiel (le tableau de projection est assimilé à l'écran), nous avons alors
z'=0 ce qui nous donne :

(23.8)

et en procédant de même:

(23.9)

Remarque: Ces deux dernières relations sont celles que nous utilisons pour faire des animations 3D
programmées dans le logiciel Macromedia Flash (par exemple).

Nous voyons sur les deux dernières relations un terme identique:

(23.10)

ce terme correspond à la "profondeur" de la perspective.


Dans certains ouvrages, cette profondeur est notée (simple mise en facteur):

(23.11)

Si nous considérons deux points ( ou ) visibles de la surface d'un volume vu par un observateur
et leur distance respective ou , ces grandeurs se conservent si les deux points se confondent dans le
plan du tableau car nous avons alors:

P=1 (23.12)

puisque .

Il est intéressant d'étudier quelle doit être la valeur de la focale pour afin d'avoir ou
. Ainsi, si nous prenons la limite:

(23.13)

en appliquant la règle de l'Hospital (dérivée au numérateur et dénominateur) et en se rappelant que z est fixé,
alors:

(23.14)

De ce résultat nous pouvons conclure la chose suivante:

Pour que tout distance réelle entre deux points non confondus dans le tableau mais se trouvant dans un
même plan aient une distance de projection égale, il faut que les équations des deux droites qui déterminent
leur intersection avec le tableau soient parallèles. Ce qui implique, puisque l'observateur est un point
convergent, qu'il faut éloigner l'observateur à une distance infinie du plan pour conserver les grandeurs ainsi
projetées sur le tableau: c'est la "projection orthographique".

Un très bon exemple pour visualiser ces résultats est de programmer en pseudo-3D sur un ordinateur.

Exemple:

Il existe de nombreuses manières de faire de la 3D avec l'informatique. Les plus connues techniquement
parlant sont avec OpenGL ou DirectX ou du C++ mais ne sont pas très pédagogique d'accès... nous allons
donc voir comment faire tourner une pseudo-sphère dans l'espace projectif avec Macromedia Flash dans le
but de montrer comment s'appliquent les différents éléments théoriques présentés plus haut mais aussi de
montrer que ce ne sont pas les seuls outils disponibles.

Pour cela, ouvrez le logiciel Macromedia Flash et enregistrez la nouvelle animation sous le nom Cercle.fla :
(23.15)

Avec l'outil Cercle dans la barre de dessin, dessinez un cercle de dimension respectable dans la zone
d'animation:

(23.16)

Ensuite après avoir sélectionné votre cercle, avec l'outil Remplissage choisissez un Dégradé Radial:

(23.17)

Faites un clic droit sur le cercle et choisissez l'option Convert to Symbol et saisissez les informations telles
que présentées ci-dessous:

(23.18)
Renommez le calque où se trouve votre movie clip avec le nom 3d Clip:

(23.19)

Faites un double clic sur votre cercle pour entrer dans votre Movie Clip.

Sélectionnez-y à nouveau le cercle, faites-un clic droit dessus et sélectionnez Convert to Symbol:

(23.20)

Ensuite, dans les propriétés du cercle saisissez-y le nom Point:

(23.21)

Maintenant, dans le Movie Clip nommé Cercle, nous allons insérer trois frames: la première pour définir les
fonctions mathématiques recalculant les différentes variables, la deuxième qui appelle les fonctions, la
troisième qui permet de relancer en boucle et indéfiniment la deuxième.

Afin de faire les choses au propre, nous allons créer un deuxième calque (en renommant celui qui contient
notre cercle en Cercle) que nous appellerons Code:

(23.22)

Faisons un clic droit sur la troisième image du calque contenant notre cercle:
(23.23)

et choisissons l'option Insert Frame et pour le calque Code faites presque de même mais en choisissant
l'option Insert Key Frame. Vous devriez alors obtenir le visuel suivant:

(23.24)

Ensuite en sélectionnant la première image du calque Code activez l'affichage des Actions pour y insérer le
code suivant:

(23.25)

Faites de même avec la deuxième image du calque Code mais en mettant:

(23.26)

et enfin de même avec la troisième image mais en y mettant:

(23.27)

Nous obtenons alors le résultat suivant:

(23.28)
Nous allons maintenant faire intervenir l'axe Z en fixant Y (et en faisant donc bouger Z). Bien évidemment,
nous ne verrons rien se passer en ce qui concerne Z tant que nous ne définissons pas la projection
homographique et parce qu'un ordinateur est incapable de montrer basiquement le concept de profondeur...
Le code s'écrit alors:

(23.29)

Le calcul de Zpos va nous permettre plus loin de calculer la profondeur du mouvement de l'objet selon l'axe
Z. Et c'est là qu'interviendra la projection homographique.

Nous obtenons alors une pseudo-sphère qui tourne autour d'un axe dans un plan perpendiculaire à l'écran.
Raison pour laquelle nous voyons la pseudo-sphère faire des allers-retours gauche/droite (le concept
d'éloignement n'est pas encore présent faut de présence d'un facteur profondeur):

(23.30)

Maintenant nous allons utiliser les relations:

(23.31)

démontrées plus haut. Si nous cherchons à représenter la profondeur de tout point du tableau de projection
c'est le rapport de distance entre deux des points de ce tableau qui vont nous intéresser pour déterminer le
changement d'échelle:

(23.32)

Il faudra donc appliquer ce résultat comme définissant l'échelle du tableau de projection.


Nous avons alors le code suivant où la profondeur P joue sur la hauteur et la largeur de la surface
d'animation de l'instance Point de notre pseudo-sphère:

(23.33)

Ce qui nous donne:

(23.34)

et bien évidemment cela fonctionne quelque soit l'équation paramétrique de la trajectoire! Nous pouvons
ensuite copier cette instance d'animation, changer la hauteur, l'angle de départ pour avoir les 4 sommets d'un
cube qui tourne dans l'espace.

C'est la prochaine étape:

Effectivement, changeons notre code comme indiqué ci-dessous pour avoir quatre pseudo-sphères tournant
autour d'un axe Z imaginaire sortant de l'écran (nous utilsons les matrices de rotation démontrées dans le
chapitre de Géométrie Euclidienne):
(23.35)

Ce qui nous donne en charme... quatre pseudo-sphères tournant autour d'un centre commun:

(23.36)

Maintenant, nous inversons Y et Z à nouveau et appliquons la projection homographique:


(23.37)

Et nous obtenons:

(23.38)

Pour la suite, nous allons générer 8 pseudo-sphère et au lieu de les faire tourner toujours autour du même
axe nous allons les faire tourner autour des 3 axes X, Y ou Z en utilisant les variables XAngle, YAngle ou
ZAngle et les matrices de rotation autour de chacun des ces axes respectifs:
(23.39)

Et voici le résultat final:


(23.40)

IMAGES DE DROITES

Déterminons à partir des résultats précédents, l'image d'une droite parallèle à la ligne de terre (donc à l'axe x)
du tableau XY. Dans ce cas, nous avons:

(23.41)

où a et b sont des constantes et pour toute valeur de h. Ce qui nous donne d'après les relations obtenus plus
haut:

(23.42)

Donc toute droite parallèle à la ligne de Terre devient en perspective une droite se trouvant à une hauteur
y' dans le plan parallèle à XY de notre écran (on pouvait le deviner intuitivement…).

Pour toute droite parallèle à l'axe Z de l'écran (donc dans sa "profondeur"), nous avons:

(23.43)

où a et b sont des constantes et pour toute valeur de h. Ce qui nous donne:

(23.44)

Les droites d'équation:

(23.45)

passent toutes par le point lorsque qui est le "point de fuite principal" et par le
point lorsque tel que représenté sur la projection ci-dessous faite dans Adobe
Photoshop (les lignes horizontales ont été rajoutées pour donner l'effet de perspective):
(23.46)

A partir de la figure ci-dessus, nous pouvons définir le concept "d'angle de fuite" donné par la figure ci-
dessous:

(23.47)

Une représentation géométrique autre peut aider à mieux comprendre le résultat. Rappelons donc que le
point de fuite d'une droite D est le point d'intersection F du plan du tableau T avec la droite parallèle à
D passant par O. Deux droites parallèles D et D' ont donc le même point de fuite. Représenté comme ci-
dessous:

(23.48)

Si nous notons A le point d'intersection de D avec T, le dessin en perspective de D est la droite ,


intersection de T avec le plan contenant O et D. Puisque deux droites parallèles ont le même point de fuite
F, elles sont donc représentées par deux droites sécantes en F.

Pour toute droite quelconque se situant dans le plan XZ de l'écran (donc dans sa "profondeur"), nous avons:

et pour (23.49)
ce qui nous donne:

(23.50)

De cette dernière équation, nous déduisons:

(23.51)

en portant z dans l'expression de x:

(23.52)

nous remplaçons x et z dans l'équation de la droite , et calculs et simplifications faits, nous


trouvons:

(23.53)

Examinons le cas particulier de droites passant par les sommets opposés d'un carrelage, c'est-à-dire inclinées
à donc avec un coefficient directeur (une pente) de .

L'image de ces droites est alors donnée par:

(23.54)

Si , nous avons selon la relation ci-dessus:

(23.55)

cela signifiant que toute projection de droites de coefficient directeur se situant dans le plan XY pour
constitue des points de fuite secondaires situés sur la ligne d'horizon à une distance égale de part et
d'autre du point de fuite principal tel que représenté ci-dessous (dans le contexte d'un cours sur Adobe
Photoshop, nous y avons rajouté un cube dans cette perspective):
(23.56)

Nous voyons bien dans la figure ci-dessus la symétrie par rapport à l'axe vertical et les deux points de fuites
qui sont l'origine du carrelage.

Considérons maintenant des droites parallèles à l'axe Y de l'écran et leur équation de projection si et
:

(23.57)

Ces droites images restent donc des droites parallèles à l'axe y. Autrement dit, les droites images restent
parallèle aux droites "objet" tel que représenté ci-dessous (pour différentes positions du point d'observation):

(23.58)

Prenons pour exemple de ce dernier résultat, des segments de même hauteur H dont le pied est sur le plan
horizontal:

(23.59)
La hauteur du segment image se déduit par:

(23.60)

Considérons maintenant , c'est-à-dire des colonnes verticales de même hauteur H alignées sur la droite
. Calculons les coordonnées des sommets images:

(23.61)

C'est l'équation d'une droite et remarquons que toutes ces droites joignant les sommets passent par le point
de coordonnées qui n'est d'autre que le point de fuite principal P.

Une représentation géométrique peut à nouveau aider à la compréhension des résultats précédents. Soit la
figure suivante:

(23.62)

La ligne de fuite du plan P est la droite d'intersection h' du plan P', parallèle à P et passant par O, avec le
plan du tableau. Elle contient par conséquent les points de fuite de toutes les droites contenues dans
P comme nous l'avons déjà démontré.

Le point de fuite principal du plan P est le projeté orthogonal F' du point O sur la droite h'. C'est le point de
fuite des droites de P parallèles à , donc orthogonales à h'.

Il résulte de ces définitions que deux plans parallèles ont les mêmes éléments de référence.

A partir de l'exposé précédent, nous avons une nouvelle méthode pour présenter un objet en rotation dans un
espace tridimensionnel. Au lieu de faire tourner l'objet autour de différents axes, nous pouvons imaginer à
l'aide des équations ci-dessus faire tourner l'observateur autour de l'objet (c'est un point de vue…).

Nous n'avons considéré ici que la perspective projective sur un plan. Au fait, pour travailler sur des
méthodes de projection quelconques (sphère sur plan, plan sur sphère, sphère sur sphère, n'importe quoi sur
n'importe quoi) il suffit d'étendre l'analyse que nous avons faite ci-dessus dans un système de coordonnées
adapté au système étudié (coordonnées polaires, cylindriques, sphérique, …). C'est probablement ainsi que
procèdent les logiciels de simulation 3D pour projeter une image sur une surface réfléchissante et semi-
transparente tel qu'un verre ondulé.

Remarque: Des résultats que nous avons obtenus ci-dessus, nous pouvons tirer une conclusion intéressante
et intuitive: Pour que l'observateur d'une photo ou d'un tableau voie l'image telle qu'elle était à l'origine,
celui-ci doit se placer à des coordonnées déterminées du tableau (de la photo ou du tableau).

PERSPECTIVES AFFINES

Même si la meilleure méthode de la représentation en perspective est la méthode la perspective conique,


nous ne pouvons nous permettre systématiquement de faire des grosses quantités de calcul pour représenter
un volume. Ainsi, il est possible de définir des techniques de perspectives qui découlent d'une approximation
des résultats mathématiques obtenus précédemment pour arriver à deux techniques (il en existe un plus
grand nombre mais ces deux perspective sont de loin les plus utilisées) que l'on retrouve quotidiennement
sur de nombreux supports papiers techniques ou artistiques. Ces deux techniques sont respectivement la
"perspective cavalière" et la "perspective isométrique" qui font partie de la famille des "perspectives
affines" dites également "projections affines".

Définition: Une "projection affine" de l'espace à 3 dimensions usuel est une transformation affine qui
envoie tous les points de cet espace sur un même plan de cet espace. Si le point M(x, y, z) n'est pas sur le
plan de projection, lui et son image m(x', y', z') forment une droite dont la direction est constante: nous
l'appelons "direction de projection". La perspective qui en découle est appelée familièrement "perspective
parallèle" ou encore "perspective cylindrique". Comme toutes les transformations affines de l'espace, une
projection affine conserve:

- Le parallélisme entre les droites

- Le barycentre, donc toutes les proportions existantes sur une droite donnée

Seule les longueurs et les angles situés dans un plan parallèle au plan de projection sont conservés.

Sans trop nous attarder sur ces deux techniques, nous les présentons brièvement car elles doivent faire partie
de la culture générale du physicien.

PERSPECTIVE CAVALIÈRE

Prenons une vue (par exemple la vue de face), et nommons les axes x (horizontale) et y (verticale). L'axe
z étant l'axe perpendiculaire à la vue.

Dans la perspective cavalière, nous traçons l'axe z avec un certain angle par rapport à l'axe x (par exemple
ou ), et l'on y reporte les distances en les multipliant par un coefficient inférieur à 1 en appliquant
les règles trigonométriques de base tel que:

(23.63)
C'est en mathématique, par exemple, que la perspective cavalière est fréquemment choisie pour représenter
sur le tableau des classes d'écoles les figures géométriques tridimensionnelles dans une base orthonormée
canonique de direction E.

Si la direction de projection n'est pas orthogonale au plan de projection, alors la perspective cavalière
transforme une sphère en ellipse. Cette distorsion de la sphère rend la perspective cavalière tout à fait
impropre à une utilisation en dessin d'art. Cet inconvénient n'est par contre pas rédhibitoire dans une
utilisation en dessin industriel.

PROJECTION ORTHOGONALE

Si la direction de projection est orthogonale au plan de projection, alors la perspective transforme une sphère
en cercle. C'est donc un type de perspective utilisable en dessin comme alternative à la perspective conique
(avec laquelle elle va d'ailleurs coïncider quand l'oeil de l'observateur est placé infiniment loin du tableau).

La projection orthogonale la plus simple à exprimer est évidemment celle qui envoie l'espace sur un plan
parallèle au tableau, de cote constante égale à a. Autrement dit, tel que:

(23.64)

On obtient alors trivialement les coordonnées dans un repère orthonormé 2D propre à ce plan où et
.

Inconvénient de cette méthode: l'effet réel de la profondeur, est entièrement perdu. Pour y remédier il existe
deux solutions équivalentes (généralisables aux autres perspectives): l'une consiste à tourner l'objet par
isométrie de l'espace et l'autre à changer le tableau.

Un cas particulier de la projection orthogonale est la "perspective isométrique". Elle est très utilisée en
dessin industriel, elle projette orthogonalement les points de l'espace sur le plan isotrope, d'équation:

(23.65)

La direction de projection est donc la normale à ce plan, de vecteur directeur .

Le perspective isométrique consiste à placer les axes x, y, z à (soit 120°) les uns des autres et y
reporter les distances telles quelles (d'où son nom).

(23.66)

À titre de comparaison, nous avons représenté selon les deux perspectives présentées précédemment un cube
avec un cercle inscrit dans le carré de chaque face:
Perspective cavalière (gauche) et isométrique (droite)
(23.67)

COORDONNÉES HOMOGÈNES

En mathématique, les coordonnées homogènes, introduites par August Ferdinand Möbius, rendent les
calculs possibles dans l'espace projectif comme les coordonnées cartésiennes le font dans l'espace euclidien.
Les coordonnées homogènes sont largement utilisées en infographie et plus particulièrement pour la
représentation de scènes en trois dimensions (3D) car elles sont adaptées à la géométrie projective et elles
permettent de caractériser les transformations de l'espace sous une forme algorithmique optimale. La
notation sous forme matricielle est plus particulièrement employée dans les bibliothèques de programmation
graphique 3D telles que OpenGL et Direct3D.

Nous avons vu lors de notre étude des transformations dans le plan et l'espace (cf. chapitre de Géométrie
Euclidienne) que parmi la translation, l'homothétie, la rotation ou la réflexion que la translation ne pouvait
être représentée sous forme matricielle sans passer par une astuce qui a consistait à ajouter une dimension
supplémentaire factice au vecteur des coordonnées ainsi qu'à la matrice associée à la transformation.

Ainsi, nous avions vu que la translation dans pouvait s'écrire sous forme matricielle:

(23.68)

Ainsi, toujours dans , une homothétie de facteur k qui s'écrivait:

(23.69)

devient en coordonnées homogènes:

(23.70)

Ainsi, toujours dans , une rotation d'angle de facteur k qui s'écrivait:


(23.71)

devient:

(23.72)

Ainsi, toujours dans , la réflexion qui s'écrivait selon l'axe X :

(23.73)

devient:

(23.74)

Les mathématiciens disent alors que nous nous plaçons dans l'espace projectif .

In extenso, nous pouvons faire de même avec un point P de qui sera alors dans représenté par un
vecteur de coordonnées:

(23.75)

Ainsi nous avons dans l'espace les matrices de transformations suivantes pour les translations:

(23.76)

pour les rotations (voir le chapitre de Géométrie Euclidienne pour la démonstration)

(23.77)

sans oublier que les rotations sont non commutatives!


Et pour les homothéties:

(23.78)

Nous avons démontré plus haut que dans le cas de la perspective conique, que nous avions les
transformations homographiques suivantes:

(23.79)

où sont les projections du point réel sur le tableau avec une distance focale .

Ce qui est traditionnellement noté en posant et :

(23.80)

où nous voyons donc que si la distance focale f est infinie, l'objet se confond avec le plan XY ou que si l'objet
est infiniment loin....

Posons . Nous avons alors:

(23.81)

Nous utilisons alors la matrice suivante pour la projection conique:

(23.82)

et ensuite nous normalisons les coordonnées par le rapport z/f.


24. GÉOMÉTRIE ANALYTIQUE

L a "géométrie analytique" est la branche de la géométrie qui s'occupe de l'étude des formes géométriques
et de leurs propriétés en utilisant les outils avancés du calcul algébrique tel que l'analyse fonctionnelle, le
calcul vectoriel ou l'algèbre linéaire. Sa frontière se situe au niveau des outils utilisés.

Remarque: Lorsque nous faisons usage pour ces mêmes études du calcul différentiel et intégral, alors nous
faisons de la "géométrie différentielle" (voir chapitre du même nom).

La géométrie analytique est un très vaste domaine (comme tout le reste) alors... nous aborderons ici que les
éléments absolument indispensables à l'étude de la physique et de l'ingénierie. Ces éléments sont par ailleurs
souvent étudiés dans les petites classes et sont (cités dans l'ordre) : les coniques, les équations de la droite,
du plan, de la sphère, etc... leurs intersections, leurs plans tangents et encore bien d'autres.

CONIQUES

Il nous a été très difficile de choisir s'il fallait mettre l'étude des coniques dans la section d'algèbre ou de
géométrie. Nous avons finalement décidé de mettre cette étude dans le présent chapitre (donc de
géométrie...) qui permet de supposer que le lecteur ayant fait une lecture linéaire du site a déjà parcouru tous
les chapitres présentant les outils mathématiques nécessaires à l'étude des coniques. Nous espérons que notre
choix s'avérera le meilleur pour le lecteur.

Remarque: L'étude des coniques nous sera très utile dans le chapitre d'Astronomie ainsi que dans le chapitre
d'Optique Géométrique. Il convient donc de s'y attarder dans les détails.

Soit un repère orthonormé du plan. Les courbes algébriques les plus simples que l'on trouve après
les droites dont les équations sont sous forme générale (rappel):

(24.1)

sont les courbes du deuxième degré, à savoir par extension :

(24.2)

avec non tous nuls. Ces courbes de second degré sont appelées "coniques" (appelées également
"quadriques" de par la présence d'un terme quadratique).

Notre première tâche va consister à obtenir, par translation et rotation du repère dans laquelle cette relation
est exprimée, une équation réduite beaucoup plus simple tel en éliminant le terme en xy . En effet,
choisissons un nouveau repère se déduisant de l'ancien par une rotation d'angle . Soit x' et y' les nouvelles
coordonnées des points. Nous avons (cf. chapitre de Géométrique Euclidienne) :

(24.3)

D'où:
(24.4)

L'équation devient:

(24.5)

Nous cherchons donc à ce que termes en x'y' regroupés soient tels que :

(24.6)

Puisque (cf. chapitre de Trigonométrie) :

et (24.7)

par substitution, nous obtenons :

(24.8)

Pour avoir que les termes en x'y' se simplifient, il suffit donc de choisir l'angle de rotation tel que:

(24.9)

Nous considérerons alors désormais l'équation:

(24.10)

1. Si nous posons et . Quitte à diviser par , nous pouvons nous ramener à une équation du
type:

(24.11)

où:

- Si , nous nous retrouvons avec une équation décrivant la figure d'une "parabole" d'axe parallèle à
.

- Si , il s'agit d'un cas dégénéré

2. Si nous posons et le cas se traite comme précédemment

3. Si et , nous pouvons supprimer les termes et de la façon suivante:


(24.12)

Par un simple changement de repère de translation, nous arrivons donc à une équation du type:

(24.13)

- Si , alors la relation précédente se réduit à un point dans si et sont de même signe, et à une
droite si et sont de signe contraire.

- Si et posons:

(24.14)

où signifie: 1 multiplié par le signe de .

Et divisions le tout par tel que:

(24.15)

Posons:

(24.16)

Nous obtenons:

(24.17)

Nous avons donc plusieurs situations possibles:

(24.18)

Deux termes ci-dessus sont impossibles dans , c'est pourquoi nous les avons tracés (la somme de deux
nombres positifs ne peut être négative et inversement).
Il y a plusieurs cas de figures intéressants:

- Pour:

ou (24.19)

et nous avons un cercle de rayon unité.

- Pour:

, (24.20)

et nous avons une ellipse.

- Pour:

(24.21)

et , nous avons des hyperboles dont l'axe de symétrie est soit parallèle à OX soit à OY

Remarque: Pour voir les figures, utilisez la fonction implictitplot(...) dans Maple.

Le terme "conique" provient du fait que l'une des premières définitions des conques consistait en
l'intersection d'un cône et d'un plan.

En effet, soit l'équation d'un cône ayant un angle de au sommet (voir géométrie spatiale)

l'équation d'un plan de vecteur normal (nous utilisons les cosinus directeurs):

(24.22)

Posons:

(24.23)

Explications: nous avons ainsi un vecteur normal de le plan ZOY et un plan qui n'est jamais en intersection
avec l'axe X. Si le cosinus directeur , nous avons un plan vertical translaté de h sur l'axe des Y. Si
, nous avons un plan horizontal translaté de h sur l'axe des Z

Soit la matrice de rotation dans l'espace par rapport à l'axe Z (cf. chapitre de Géométrie Euclidienne):
(24.24)

avec:

(24.25)

Nous avons donc pour expression de rotation du plan:

(24.26)

Après simplification:

(24.27)

Donc après rotation, nous avons un plan vertical translaté de h selon l'axe des Y.

Identiquement, pour le cône, une rotation correspond selon l'axe des Z (donc il ne se passe pas grand chose):

(24.28)

Après développement et simplification:

(24.29)

Equation qui donne un cône horizontal si et un cône vertical si .

Ainsi, nous avons le système général:

(24.30)

Si nous traçons dans Maple la fonction (en s'amusant avec les angles):

>implicitplot3d({x^2-(y^2-z^2)*cos(2* )+y*z*2*sin(2* )=0,z=h},x=-20..20,y=-20..20,z=-20..20)

Nous voyons que pour:

- nous obtenons une intersection entre le plan et le cône donnant une ellipse

- nous obtenons une parabole

- nous obtenons une hyperbole

Voici à peu près ce que cela donne:


(24.31)

Nous donnons également à la courbe d'équation le nom d'hyperbole car, par changement de variable:

(24.32)

Ce qui nous ramène à:

(24.33)

ce qui comme nous l'avons vu précédemment, est bien l'équation d'une hyperbole.

Cependant, les coniques on aussi une définition géométrique:

Soit F un point du plan, D une droite ne contenant pas F et e un réel strictement positif. Nous nous
intéressons à:

(24.34)

F s'appelant le "foyer", D la "directrice de la conique" et e l'excentricité.

Nous choisissons F comme origine du repère, de façon que D ait pour équation:

avec (24.35)

Alors:

(24.36)

Nous nous retrouvons bien avec l'équation d'une conique. Nous pouvons considérer maintenant plusieurs cas
particuliers:

1. Cas où :

L'équation se limite alors à:


(24.37)

Il s'agit d'une parabole d'axe orthogonal à D, dont le sommet est le milieu du segment , où K est la
projection de F sur D.

Relativement à l'origine , l'équation se réduit à:

(24.38)

où h est appelé "paramètre de la parabole" et relativement à , le foyer sera donné par les coordonnées
et la directrice par l'équation .

(24.39)

2. Cas où :

Il s'agit d'une ellipse:

(24.40)

Le dernier terme donnant après développement :

(24.41)

Posons que est l'origine de l'ellipse. L'équation précédente se simplifie et devient:

(24.42)
Pour connaître le demi-grand axe de l'ellipse il suffit de poser . Ainsi:

(24.43)

d'où le demi-grand axe valant:

(24.44)

de la même manière, nous obtenons le demi-petit axe:

(24.45)

en posant étant le "paramètre de l'ellipse" ou "paramètre focal de l'ellipse", nous obtenons :

(24.46)

dont la première relation sera très utile dans le chapitre d'Astronomie et de Relativité Générale.

Puisque , nous avons :

(24.47)

Etant donné que est sur l'axe X, nous pouvons prendre le cas particulier où tel que :

(24.48)

il existe donc deux foyers à l'ellipse à une distance équivalente mais opposée de .

Nous définissons dès lors l'excentricité d'une ellipse par le rapport:

(24.49)

Nous pouvons dès lors démontrer une relation que nous retrouvons couramment dans les formulaires :

(24.50)

C'est-à-dire :
(24.51)

L'égalité est donc démontrée.

(24.52)

Une représentation paramétrique utile et évidente de l'ellipse est:

(24.53)

Effectivement si nous considérons l'équation cartésienne de l'ellipse démontrée précédemment :

(24.54)

et en posant et alors nous obtenons:

(24.55)

Si nous nous souvenons du cercle trigonométrique, cette équation admet les solutions et
. Il vient alors :

et (24.56)

Voilà...

Cependant, il existe une autre forme d'équation de l'ellipse, bien plus importante, que l'on retrouve aussi bien
en physique classique, astrophysique et physique quantique corpusculaire.

Rappelons que:

(24.57)

En coordonnées polaires, cela donne:


(24.58)

Donc:

ou (24.59)

après mise en évidence:

ou (24.60)

Nous obtenons deux équations différentes, mais il s'agit en fait de la même courbe. Nous remarquerons en
effet que:

(24.61)

Etant donné que est défini comme le paramètre de la conique, l'équation polaire de l'ellipse s'écrit:

(24.62)

Dans le cas général, D peut faire un angle quelconque avec l'axe des angles polaires, et l'équation générale
est alors:

(24.63)

2. Cas où :

Il s'agit d'une hyperbole (même raisonnement que l'ellipse):

(24.64)

Posons que :

(24.65)

est l'origine de l'hyperbole. L'équation précédente se simplifie et devient:

(24.66)
Mais encore:

(24.67)

ce qui s'écrit sous forme condensée:

(24.68)

et nous avons pour demi-grand axe et demi-petit axe (raisonnement identique à l'ellipse):

(24.69)

et:

(24.70)

et la figure correspondante :

(24.71)

PARAMÉTRISATIONS

Pour certaines des formes présentées ci-dessous, il est possible de choisir un autre système de coordonnées
que les coordonnées cartésiennes tel que par exemple les coordonnées cylindriques ou sphériques qui sont
dans certains cas beaucoup plus simples à mettre en place. Nous tacherons dans la mesure du possible de
présentes les plus importantes.

ÉQUATION DU PLAN

Soit un plan P dont nous connaissons un vecteur normal et unitaire mais pas l'équation et
un point de P.
Pour qu'un point M de coordonnées (x, y, z) appartienne au plan P il faut et il suffit que les vecteurs et
soient orthogonaux. Donc soit le point donné par le vecteur étant de coordonnées:

(24.72)

Si est perpendiculaire à alors le produit scalaire doit être nul tel que:

(24.73)

Ce qui s'écrit aussi :

(24.74)

tel que nous obtenions l'équation cartésienne générale du plan:

(24.75)

Cette équation où qui vérifie que les coordonnées d'un point quelconque du
plan P appartienne à ce plan est donc appelée "équation cartésienne du plan P".

Si nous écrivons l'équation avec les cosinus directeurs de (cf. chapitre de Calcul Vectoriel), nous avons
dès lors aussi :

(24.76)

Remarque: Pour obtenir un cube dans l'espace, il suffit d'avoir six plans délimités par des conditions telles
que

ÉQUATION D'UNE DROITE

Comme nous l'avons vu en analyse fonctionnelle, une droite dans le plan peut-être décrite par la fonction :

(24.77)

L'équation cartésienne généralisée de la droite est alors simplement donnée par :

(24.78)

Effectivement, en simplifiant nous retrouvons "l'équation cartésienne réduite" :


(24.79)

Définition: Nous appelons "vecteur directeur" d'une droite D , tout vecteur non nul de même direction que
la droite.

Montrons maintenant les deux petits théorèmes sympathiques suivants :

T1. Si une droite a pour équation alors le vecteur est directeur de cette droite

T2. Si une droite a pour équation alors le vecteur est directeur de cette droite.

Démonstrations:

DM1. Soit et A, B deux points de cette droite pris tel que . Comme A, B sont
deux points de D alors est un vecteur directeur de D alors :

(24.80)

Un petit corollaire intéressant aus passage qui a une application en physique!:

Si une droite D1 à un vecteur directeur valant:

(24.81)

et une autre droite D2 un vecteur directeur valant:

(24.82)

alors leur produit scalaire (cf. chapitre de Calcul Vectoriel) est nul, ce qui montre que deux droites dont la
multiplication des pentes (deuxième coordonnée du vecteur directeur) vaut -1 sont perpendiculaires!

DM2. Soit donc alors le vecteur est un vecteur directeur de


D ainsi que tout vecteur . Ainsi, il existe une infinité de manières de définir la même droite,
puisque la droite est composée d'une infinité de points (qui peuvent tous servir de point d'ancrage) et qu'il
existe une infinité de multiples du vecteur directeur.

C.Q.F.D.

Souvent, nous recherchons la distance entre une droite et un point externe à celle-ci. Ainsi, considérons la
figure suivante :
(24.83)

avec H la projection orthogonale de A sur la droite d, P un point arbitraire de d et un vecteur orthogonal


(normal) à d.

Nous avons (cf. chapitre de Calcul Vectoriel) :

(24.84)

car ou . Ainsi :

(24.85)

Nous obtenons donc la relation :

(24.86)

Considérons maintenant le point et la droite .

Choisissons un point ainsi qu'un vecteur , normal à (rappelons que


est vecteur directeur). Ainsi, en appliquant la relation précédente nous avons :

(24.87)

Si nous considérons maintenant deux plans non parallèles de l'espace, leur intersection est une droite. Soit
deux plans d'équations respectives:

(24.88)

et D leur droite d'intersection.

Un point de l'espace appartient à la droite D si et seulement si le point M satisfait le système


d'équations:
(24.89)

Remarque: Alors que dans le plan une droite est caractérisée par une équation du type (cf.
chapitre d'Analyse Fonctionnelle). Dans l'espace, une seule équation de la forme
caractérise un plan. Pour caractériser une droite en dehors des plans des axes, il est
nécessaire (équation paramétrique mis à part) d'avoir deux équations.

Il est trivial (mais nous allons quand même le démontrer) que l'équation paramétrique d'une droite est un
système d'équations du type :

(24.90)

Ainsi, chaque composante croit linéairement par rapport à la même variable à une constante et un facteur
près. Ceci s'écrit aussi sous forme vectorielle (plus traditionnelle) :

(24.91)

Le vecteur est appelé "vecteur directeur".

Démonstration: Nous avons donc le système d'équations (deux équations à trois inconnues, ainsi une
inconnue sera indéterminée) :

(24.92)

Eliminons une des variables (commençons arbitrairement par z) :

(24.93)

où donc d'où :

(24.94)

donc (c'est un peu bête à écrire mais bon...) :


(24.95)

De manière similaire avec tel :

(24.96)

Finalement nous avons :

(24.97)

Le vecteur directeur et le vecteur d'ordonnée sont des constantes. Ce qui nous permet d'écrire de manière
plus générale :

(24.98)

C.Q.F.D.

Remarques:

R1. L'équation d'une droite est presque ce qu'il y a de plus important en synthèse d'images 3D car à partir de
ces dernières nous pouvons construire des polygones et assembler ces derniers pour construire des formes
tridimensionnelles plus complexes.

R2. Pour savoir si une droite est perpendiculaire à un plan il faut déterminer au moins deux droites sécantes
dans ce même plan et effectuer le produit vectoriel de leur vecteur directeur et ensuite calculer le produit
scalaire entre le résultat du produit vectoriel et la première droite dont nous cherchons l'orthogonalité.
Effectivement, une seule droite du plan ne permet pas de déterminer l'orientation de ce dernier il en faut au
moins deux.

ÉQUATION D'UN CÔNE

Soit la figure ci-dessous:


(24.99)

Nous remarquons tout d'abord que , d'où (l'origine du repère est notée par la lettre ):

(24.100)

Or ici, d'où:

(24.101)

étant donné que:

(24.102)

donc :

(24.103)

c'est l'équation cartésienne d'un cône dans l'espace que nous retrouverons en relativité restreinte lors de notre
étude des cônes de lumière.

ÉQUATION D'UNE SPHÈRE

Considérons le repère orthonormé , soit S la sphère de centre et de rayon r :

(24.104)
appartient à la sphère S de centre et de rayon r si et seulement si c'est à dire :

(24.105)

D'où l'équation cartésienne de la sphère dans le repère :

(24.106)

Il existe une autre manière de décrire la sphère en utilisation l'équation paramétrée. Effectivement, nous
avons vu dans le chapitre de Calcul Vectoriel que le passage des coordonnées cartésiennes aux coordonnées
sphériques sont données par les coordonnées curvilignes :

(24.107)

Ainsi, nous avons bien :

(24.108)

Nous retrouvons donc bien l'équation cartésienne d'une sphère à une constante de translation près.

ÉQUATION D'UN ELLÏPSOÏDE

Nous avons lors de notre étude des coniques que l'équation d'une ellipse dans le plan était donnée par :

(24.109)

avec a, b étant les deux axes de l'ellipse (le petit et le grand).

Ainsi, sans démonstration rigoureuse, nous pouvons vérifier à la main ou à l'aide des ordinateurs que
l'équation cartésienne :

(24.110)

est un ellipsoïde :
(24.111)

Cependant, il existe une autre manière de décrire l'ellipsoïde en utilisant les coordonnées curvilignes :

(24.112)

Nous avons donc :

(24.113)

d'où :

(24.114)

Finalement :

(24.115)

ÉQUATION D'UN CYLINDRE

Il va sans dire que l'équation d'un cylindre de rayon r est donnée par l'équation paramétrique :

(24.116)

Nous voyons bien que les composantes x, y satisfont l'équation cartésienne d'un cercle puisque :

(24.117)

Au même titre l'équation paramétrique d'un cylindre à base elliptique est donnée par :
(24.118)

qui vérifie aussi l'équation paramétrique d'une ellipse dans le plan :

(24.119)

SURFACES DE RÉVOLUTION

De manière plus générale de nombreuses surfaces (dont certaines que nous avons vues précédemment)
peuvent être décrites par révolution d'une forme primaire de dimension inférieure et ensuite par rotation.

Définition: Une "surface de révolution" est une surface obtenue en faisant tourner une courbe plane (par
exemple autour de l'axe Oz. Ainsi, nous passons alors d'un plan de a un repère de , l'axe Ox
engendre dès lors un plan devenu yOz.

Prenons deux exemples classiques (parmi l'infini) :

E1. Soit la parabole d'équation :

(24.120)

(rappelons que ) qui tourne autour de l'axe Oz. Nous avons bien évidemment (en coupant le
paraboloïde par un plan ce qui donne un cercle de rayon r) la relation:

(24.121)

(dite "équation cylindrique") . Or, nous avons aussi:

(24.122)

d'où l'équation du paraboloïde de révolution :

(24.123)

E2. La droite tourne autour de Oz. Donc:

(24.124)

ce qui nous donne :

(24.125)

Définition: Toute surface engendrée par une droite est une "surface réglée".

Prenons l'exemple important (cheminée de centrales nucléaire, engrenages, etc.) qu'est l'hyperboloïde à une
nappe d'équation :
(24.126)

Pour simplifier l'exemple prenons . Nous avons donc :

(24.127)

ce qui s'écrit aussi comme le produit de l'équation de deux droites tel que :

(24.128)

Ainsi, ses deux droites (de pente opposées) appartiennent à la nappe et tout point appartenant à une de ses
deux droites y est contenu. Les figures ci-dessous montrent bien qu'au fait, tout point appartient à ses deux
droites.

(24.129)

On pourrait ceci dit très bien décrire par des cercles tel que :

(24.130)

où .
(24.131)
25. GÉOMÉTRIE DIFFÉRENTIELLE

C omme nous l'avons déjà en géométrie non-euclidienne, la géométrie différentielle est la branche de la
géométrie qui vise à étudier les propriétés locales (au voisinage d'un point) et intrinsèques des courbes et des
surfaces non-euclidiennes (comme une généralisation des surfaces euclidiennes!).

La géométrie différentielle tient son nom du fait qu'elle est née de la possibilité d'une interprétation
cinématique que le calcul infinitésimal apporte à l'étude des courbes. Les points que nous aborderons ici
serviront aussi bien dans l'étude de la mécanique classique que de l'analyse complexe appliquée à de
nombreux domaines de l'étude des champs.

Remarque: Avant de nous attaquer à la manière très formelle et abstraite d'aborder la géométrie
différentielle avec les outils de la topologie (méthode habituelle aux mathématiciens) nous avons choisi dans
un premier temps de présenter les éléments essentiels de manière simple et agréable telle qu'elle est faite
dans les écoles d'ingénieurs. Les puristes nous excuseront donc au cas où en attendant mieux...

Définition: Nous assimilerons "l'espace physique" à et le supposerons muni d'un repère


et nous noterons B la base

Soient un ensemble et une fonction telle que :

(25.1)

Remarques:

R1. Si f est continue, alors est une courbe de l'espace appelée "courbe d'un seul tenant".

R2. Une parabole, une sinusoïde sont des courbes appelées "courbes planes". Une ellipse, un cercle sont
elles appelées des "courbes planes fermées". Pour ces exemples, tous les points des courbes considérées sont
situés dans un même plan. Inversement, une courbe est appelée "courbe gauche" (gauchir = dévier, tordre)
s'il n'en est pas ainsi.

Choisissons et posons que nous noterons par abus de langage nous pouvons alors
énoncer la définition suivante : le couple (f , I) où f est une fonction continue est appelé "arc paramétré".
est appelée le "support" de (f , I) et est une "origine" de (f , I).

Remarques:

R1. Abusivement, nous disons aussi que (f , I) est un "paramétrage" de .

R2. Il est facile de définir d'autres arcs paramétrées admettant aussi comme support. Pour ce faire, il suffit
de se donner une fonction bijective de I vers et telle que .

Avant de continuer, rappelons qu'en géométrie différentielle, "l'abscisse curviligne" est une sorte de variante
algébrique de la longueur d'un arc (c'est donc l'analogue, sur une courbe, de l'abscissse sur une droite
orientée).

Considérons maintenant l'abscisse curviligne (cf. chapitre de Calcul Tensoriel) :


(25.2)

nous savons que dans un espace euclidien canonique dans l'abscisse curviligne s'écrit alors :

(25.3)

avec et comme nous avons , il reste :

(25.4)

Dans le système cartésien :

(25.5)

il vient donc que :

(25.6)

Qui est donc l'élément différentiel linéaire d'un espace euclidien (le plus court chemin ou encore la
"géodésique" ou encore " l'abscisse curviligne différentielle").

Nous pouvons bien évidemment écrire (par multiplication des deux côtés de l'égalité) :

(25.7)

Voyons une application avec une hélice (les exemples sont jolis en géométrie différentielle et valent donc la
peine d'être vus...) qui est un exemple typique de courbe gauche :

Soit et la fonction :

(25.8)

avec et les coordonnées paramétriques :

(25.9)

Nous avons alors avec Maple en prenant r et h comme étant égaux à l'unité:

>spacecurve([cos(t),sin(t),t,t=-4*Pi..4*Pi,numpoints=1000]);
(25.10)

La fonction f est un arc paramétré dont le support est appelé une "hélice", r en est le rayon et h le pas. En
prenant comme origine, l'abscisse curviligne de cette hélice (un morceau) est donné par :

(25.11)

Donc :

(25.12)

et alors:

(25.13)

ISOCLINES

Voyons maintenant un point très important en mathématique mais en plus dans l'ingénierie médicale,
astrophysique, météorologie (parmi encore beaucoup d'autres domaines) que sont les isoclines.

Avant d'aborder le sujet sous forme mathématique, nous proposons au lecteur d'ouvrir Matlab et d'y écrire:

EDU» [xx,yy,z]=peaks;
EDU» figure(1);mesh(xx,yy,z);title('peak')
(25.14)

ensuite pour des raisons esthétiques, d'écrire:

EDU» figure(2);surf(xx,yy,z);title('surf')

(25.15)

Ensuite nous aimerions que Matlab nous trace quelques courbes de niveau (les points où la valeur de la
fonctions f(x,y) est constante), appelées par les matheux des "isoclines" ou "courbes d'iso-niveau". Il faut
alors écrire:

EDU» figure(3);contour3(xx,yy,z);title('contour 3D')


(25.16)

Nous allons ensuite lui demander de les projet sur le plan X,Y.

Ce qui donne:

EDU» figure(3);contour3(xx,yy,z);title('contour 3D')

(25.17)

Et ce sont ces courbes qui vont nous intéresser. Nous souhaiterions déterminer les équations dans le plan de
celles-ci sous forme explicite. Mais avant cela amusons nous avec Matlab en écrivant encore:

EDU» figure(4);pcolor(xx,yy,z);title('gradient')
(25.18)

mais nous pouvons faire encore mieux en enlevant la grille avec la commande:

EDU» shading interp

(25.19)

Ensuite, sans fermer le graphique ci-dessous créé par Matlab rajoutez maintenant la ligne:

EDU» hold on
EDU» contour(xx,yy,z,'k')
(25.20)

Considérons pour déterminer l'équation des isoclines la fonction de et que nous imposerons
-différentiable.

La relation:

(25.21)

définit une courbe plane appelée "isocline". C'est une courbe telle que lorsque x varie, y ne varie donc pas
n'importe comment mais précisément de telle sorte que f reste constante.

Nous avons vu dans le chapitre de Calcul Différentiel Et Intégral que la différentielle de f, pour des
variations infinitésimales quelconques de x et y, est:

(25.22)

Maintenant, si nous voulons que quand x varie de dx, la valeur de la fonction f ne change pas, il faut que dy
ne soit pas n'importe quoi mais tel que la variation df soit nulle. Autrement dit:

(25.23)

le long de . Mais cette équation ne sert à rien en tant que tel mais elle nous fixe le rapport de la dérivée de
l'isocline dans la plan tel que:

(25.24)

ce qui nous donne la pente de la tangente à et donc après par intégration, la fonction recherchée elle-
même!
Il va de soit que le vecteur tangent à la courbe est donc un vecteur parallèle à celui ayant pour
composantes:

(25.25)

que nous noterons:

(25.26)

De plus rappelons que le gradient est donné par (cf. chapitre de Calcul Vectoriel):

(25.27)

Nous remarquerons que ces deux derniers vecteurs sont perpendiculaires (résultat qui nous sera utile dans le
chapitre d'Analyse Complexe). Effectivement:

(25.28)

En d'autres termes, le vecteur définit les lignes orthogonales à la courbe .

Exemple:

Prenons l'équation d'une parabole particulière dans :

(25.29)

Nous avons donc les isoclines qui sont données par:

(25.30)

d'où leur équation dans le plan:

(25.31)

Soit des cercles dans le plan dont le rayon est égal à la racine carrée de la constante choisie correspondante à
la hauteur z de la fonction f !

Calculons maintenant la pente de la tangente à :

(25.32)
ce qui est conforme à la simple dérivée de:

(25.33)

Nous avons aussi:

(25.34)

Nous voyons qu'en ce vecteur est vaut:

(25.35)

ce qui est bien conforme au vecteur tangent que nous avons au cercle en ce point de l'axe des abscisses.

TRIEDRE DE FRENET

Le repère de Frenet est un outil d'étude du comportement local des courbes. Plus exactement, il s'agit d'un
repère local associé à un point décrivant une courbe . Son mode de construction est différent selon si
l'espace ambiant est de dimension 2 (courbe plane) ou 3 (courbe gauche).

Le repère de Frenet, et les formules de Frenet (donnant les dérivées des vecteurs de ce repère), permettent de
mener de façon systématique des calculs de courbure, de torsion pour les courbes gauches et d'introduire des
concepts géométriques intéressants associés aux courbes.

Considérons pour commencer une courbe avec son abscisse curviligne s(t) et son origine.
Nous notons par définition:

(25.36)

la tangente à la courbe de paramètre t au voisinage d'un point M par rapport à un repère posé en O avec ds
qui se calcule comme nous l'avons montré précédement.

Il est intéressant de remarquer que si t s'interprète comme le temps, alors nous avons une vitesse:

(25.37)

et donc le vecteur est dirigé dans le sens du mouvement.

De plus, par construction et définition de l'abscisse curviligne nous avons toujours :

(25.38)

et donc le vecteur tangent au point M est unitaire (et non nul!).


Maintenant, sans savoir exactement à quoi cela va nous servir pour l'instant, intéressons nous au vecteur:

(25.39)

Sachant trivialement de ce qui précède que :

(25.40)

Alors nous avons :

(25.41)

donc déjà n'est à priori pas unitaire et lui est perpendiculaire (résultat qui va nous servir plusieurs fois
par la suite donc il faut s'en rappeler)!

Posons maintenant:

(25.42)

Etant donné le résultat précédent, est le vecteur perpendiculaire unitaire à en M (nous disons que ce
couple de vecteur est "orthonormal direct") et C est par définition la "courbure".

Nous pouvons également aborder la courbure C d'une façon plus géométrique plutôt que par une définition
tombée du ciel:

Nous savons à ce point de notre discours qu'en un point d'une courbe (dérivable au moins une fois en
tout point...), il existe un vecteur tangent non nul qui est .

En tout point voisin M (d'abscisse curviligne s), le vecteur tangent peut s'écrire en approximation :

(25.43)

si la courbe se trouve localement dans un même plan (car nous étudions ici la courbure et non la torsion de
la courbe)!

Deux normales en M et M0 se coupant donc en un point Ω, la figure suivante:


(25.44)

montre qu'au premier ordre en ds, le point M peut être considéré localement comme déduit du point M0 par
une rotation de centre Ω.

Le cercle ainsi défini, de rayon:

(25.45)

est celui qui tangente le mieux la courbe localement au point M0. Son rayon se déduit de la figure (deux
triangles semblables à la limite) :

(25.46)

d'où, puisque est unitaire, la définition et la valeur de la courbure :

(25.47)

et voilà!

Il est possible d'interpréter le concept de courbure comme la vitesse de rotation de la base de Frenet par
rapport à une direction fixe.

Le couple de vecteurs ( , ) est appelé "repère de Frenet" et ses vecteurs de base les "vecteurs de Frenet".

Le repère de Frenet est un repère mobile puisque les éléments de ce repère changent selon le point
considéré. En physique, il ne faut pas confondre cette notion avec celle de référentiel : puisque les vecteurs
de Frenet se déplacent avec le point!
Remarque: La définition de C tel que ci-dessus est vraie dans le cadre d'un choix d'une courbure positive.
C'est un point de vue pris en mécanique mais non nécessaire en mathématique.

Si , alors comme vu précédement:

(25.48)

où R est appelé le "rayon de courbure".

Quant à la relation :

(25.49)

elle est appelé "1ère formule de Frenet" et montre que et sont colinéaires et donc leur produit
vectoriel est nul (résultat utilisé plus loin).

Ces relations se jusitifient par l'analogie avec la mécanique. Effectivement, nous avons démontré plus haut
que:

(25.50)

Calculons maintenant l'accélération:

(25.51)

nous retrouvons alors le résultat obtenu dans le chapitre de Mécanique Classique lors de notre étude du plan
osculateur.

Pour donner une interprétation géométrique plus exacte de la courbure nous définissons d'abord par le
centre du "cercle osculateur" (se trouvant dans le plan osculateur) ou "cercle de courbure" de rayon R qui
tangente le mieux localement tel que dans le repère de Frenet:

(25.52)

Pour préciser géométriquement ce qu'est le cercle osculateur, prenez une courbe, et un point M sur cette
courbe. Tracez ensuite la normale au point de cette courbe localement plane et prenez un point sur la
normale. Alors, le cercle de centre O passant par le point M est tangent à la courbe. Mais tous les cercles
tangents à la courbe ne sont pas tangents de la même façon! En effet, si est proche de M, le cercle va se
situer plutôt à l'extérieur de la courbe (cercle bleu dans la figure ci-dessous). Si est proche de M, le cercle
va se situer plutôt à l'intérieur de la courbe (cercle rose dans la figure ci-dessous). Le rayon limite entre être
"à l'intérieur de la courbe" et être "à l'extérieur de la courbe" est par convention le "rayon de courbure" que
nous avons défini plus haut. Le cercle correspondant à ce rayon est alors le fameux "cercle osculateur".
(25.53)

Dans le cas particulier où est un vecteur constant :

(25.54)

et donc ce qui implique que R n'est plus défini. Nous disons quelque fois dans ce cas que le rayon de
courbure à est infini (une droite présente alors une courbure nulle en tout point).

Etudions maintenant le vecteur perpendiculaire au plan osculateur défini par:

(25.55)

Nous pouvons déjà dire, étant donné que et sont unitaires que l'est aussi (ce qui va nous servir plus
loin)!

Démontrons que est orthogonal à :

(25.56)

où nous avons pris le cas particulier (mais de toute manière en généralité et sont colinéaires
comme nous l'avons démontré donc le produit vectoriel entre ces deux vecteurs est toujours nul).

C.Q.F.D.

Démontrons maintenant que est colinéaire à :


De la même manière que nous avons démontré plus haut que est perpendiculaire à , nous démontrons

que est perpendiculaire à !

Nous avons donc:

(25.57)

Et étant donné que est aussi perpendiculaire à (démonstration précédente) il est donc colinéaire à .

C.Q.F.D.

Posons maintenant :

(25.58)

Cette relation constitue la "2ème formule de Frenet" où par définition, est le "vecteur binormal" de au
point M et en est la "torsion" et R' le "rayon de torsion".

Nous pouvons maintenant établir la "3ème formule de Frenet" :

(25.59)

d'où nous tirons :

(25.60)

Or de par les propriétés du produit vectoriel :

(25.61)

d'où la 3ème formule de Frenet :

(25.62)

Nous appelons "trièdre de Frenet" associé à au point M, le repère naturel orthonormal de l'espace
:
(25.63)

où, en mécanique, le vecteur est colinéaire à la vitesse et l'accélération tangentielle et est colinéaire à
l'accélération normale.

Remarque: Le rayon de courbure R est donc dans le plan osculateur (plan formé par le vecteur tangent et
normal à la courbe) qui est le meilleur plan dans lequel est contenu la courbe. Du coup, le rayon de courbure
donne en un point (localement) le meilleur ("le plus vrai") rayon de la courbe. La torsion nous donne par
contre la tendance qu'à la courbe à sortir du plan osculateur (in extenso si la courbe est contenue dans un
plan, la torsion est nulle).

Cherchons le rayon et le centre de courbure en tout M à notre hélice définie plus haut comme exemple
pratique. Rappelons que sa fonction paramétrique est donnée par :

(25.64)

et que :

(25.65)

Nous avons dès lors :

(25.66)

Au passage, vous remarquerez que nous avons bien:


(25.67)

Ainsi, la courbure (l'inverse du rayon de courbure) est donnée par :

(25.68)

Donc le rayon de courbure vaut :

(25.69)

Ce qui est conforme à l'intuition puisque lorsque le pas h de l'hélice est nul, le rayon de courbure vaut r et
lorsque le pas h tend vers l'infini le rayon de courbure tend vers l'infini aussi et la courbure vers zéro.

Et il vient par la première formule de Frenet le vecteur normal:

(25.70)

et dont tous les points (extrémités du vecteur) sont confondus à l'axe Z de notre hélice quelque soit h! La
coordonnées de la composante z de ce vecteur est nulle étant donnée que la normale est pris par rapport à un
point M de la courbe déjà à une hauteur h implicite.

De par la 3ème formule de Frenet nous avec le vecteur binormal:

(25.71)

et le rayon de torsion étant donné par la relation :


(25.72)

Nous avons donc :

(25.73)

d'où :

(25.74)

NAPPES PARAMETRÉES

Soient :

avec (25.75)

Appelons . Si g est continue, alors est une surface de l'espace "surface d'un seul tenant". Par
définition, dans ce qui suit, le couple où g est une fonction supposée continue sera appelé "nappe
paramétrée", et le "support" de la nappe paramétrée. Nous disons encore que et sont des
paramétrages de .

Remarquons que pour une surface (par exemple un disque), il existe plusieurs nappes paramétrées
associées (par exemple les coordonnées cartésiennes, polaires, sphériques).

Soit maintenant et:

(25.76)

tels que

Nous pouvons définir :

(25.77)

Si nous supposons h continue, il est claire que est un arc paramétré. Appelons son support, nous
avons et nous disons que est une "courbe tracée" ou "courbe inscrite" sur .
Remarque: Nous supposerons toujours désormais que

Soit . Intéressons nous aux deux courbes tracées sur définies par les arcs
paramétrés suivants :

avec

avec
(25.78)

et sont les deux fonctions dites "fonctions partielles" de g en .

Les supports de et sont appelés "courbes-coordonnées" de en relativement au


paramétrage . Nous les notons respectivement et . Nous appelons aussi "1ère courbe-
coordonnée" et "2ème courbe-coordonnée".

Il est bien sûr évident (cf. chapitre de Calcul Différentiel Et Intégral) que :

(25.79)

est tangent à en et que est tangent à en .

(25.80)

MÉTRIQUE D'UNE SURFACE

Soit :

avec (25.81)
Notons , autrement dit :

(25.82)

Nous avons aussi (cf. chapitre de Calcul Différentiel Et Intégral) :

(25.83)

et nous avons démontré au début de ce chapitre que l'abscisse curviligne dans un espace cartésien était
donnée par :

(25.84)

Nous avons donc après substitution :

(25.85)

Ce qui est équivalent à écrire :

(25.86)

De manière plus traditionnelle avec la notation :

(25.87)

Nous obtenons la "première forme quadratique fondamentale":

(25.88)

Comme nous l'avons déjà démontré en calcul tensoriel, cette expression est indépendante de la nappe
paramétrée car l'élément de longueur infiniment petit ds est indépendant du paramétrage de . Cette
forme quadratique est donc un invariant qui représente la métrique sur .
26. FORMES GÉOMÉTRIQUES

N ous avons déjà défini au début du chapitre de Géométrie Euclidienne les concepts de dimensions
topologiques, ce qu'était un point de dimension nulle et une courbe de dimension unité. Nous ne reviendrons
pas sur ces dernières et nous intéresserons aux formes de dimensions supérieures.

Le but du présent chapitre est de répertorier avec démonstrations quelques propriétés mathématiques
remarquables des formes et corps géométriques connus (surface, volume, centre de masse, moment
d'inertie). Effectivement, il existe nombre de formulaires les répertoriant sans démonstration mais peu voire
pas, d'ouvrages les démontrant toutes (nous n'en avons jamais vu en tout cas...). La liste ci-dessous est à ce
jour loin d'être exhaustive (puisqu'il existe une infinité de formes géométriques) mais elle sera complétée
avec le temps.

Les quelques formes que nous avons souhaité présenter permettent assez facilement de trouver les propriétés
remarquables d'un très grand nombre de formes non répertiorées sur cette page par assemblage ou
décomposition.

Remarques:

R1. Les relations trigonométriques remarquables dans les formes géométriques ci-dessous ne sont pas
démontrées dans ce chapitre. Celles-ci se trouvent déjà toutes dans le chapitre traitant spécifiquement de la
Trigonométrie.

R2. Nous entendons par "centre de gravité", le "barycentre" tel que vu dans le chapitre de Géométrie
Euclidienne.

SURFACES CONNUES

Il existe plusieurs définitions du concept de surface dont une due à Euclide et une autre moderne due à la
topologie (voir chapitre du même nom).

Définitions:
D1. Une "surface plane" est ce qui a longueur et hauteur.

D2. Une "surface" est une variété topologique de dimension 2

Remarque: Nous nous intéresserons dans un premier temps uniquement aux propriétés (périmètre, surface,
centre de gravité,...) de surfaces plongées dans des géométries euclidiennes.

POLYGONES

Définition: Un "polygone" est une figure plane limitée par des segments de droites consécutifs (autrement
dit: par une polyligne fermée).

(26.1)

Par définition, un "quadrilatère", "pentagone", "hexagone", "heptagone" sont des polygones à


respectivement quatre, cinq, six, sept... côtés.

Nous distinguons trois grandes familles (mais elles ne sont pas les seules!) de polygones : les polygones
croisés, les polygones concaves et les polygones convexes (nous retrouverons ces deux familles dans
différents chapitres du site).

Définition: Un polygone est dit "polygone croisé" si deux au moins de ses côtés sont sécants, c'est-à-dire si
au moins deux de ses côtés se coupent. C'est le cas du pentagone ABCDE ci-dessous :

(26.2)

Remarque: "L'enveloppe" d'un polygone est le polygone obtenu en suivant le contour extérieur de celui-ci.
Par exemple, l'enveloppe du pentagone précédent est un décagone dont les sommets sont les cinq sommets
du pentagone et les cinq intersections de ses côtés.

Définition: Un polygone est dit "polygone concave" s'il n'est pas croisé et si une ou plusieurs de ses
diagonales ne sont pas entièrement à l'intérieur de la surface délimitée par le polygone.
Par exemple, le pentagone ACDBE ci-dessous est dit concave car les diagonales BC et CE sont
respectivement à l'extérieur et partiellement à l'extérieur de la surface délimitée par le polygone.

(26.3)

Définition: Un polygone est dit "polygone convexe" s'il n'est pas croisé et si toutes ses diagonales sont
entièrement à l'intérieur de la surface délimitée par le polygone. Ainsi, l'hexagone MNOPQR ci-dessous est
dit convexe :

(26.4)

Relativement aux définitions données précédemment où les diagonales étaient mises en évidence, voyons s'il
y a une relation permettant de connaître leur nombre relativement au nombre d'arêtes du polygone.

Partons pour cela d'un polygone de n côtés (notons qu'il a aussi n sommets) :
(26.5)

Nous définissons le total de segments s égale à la quantité de côtés (arêtes) n plus quantité de diagonales d
tel que :

(26.6)

Maintenant, prenons le premier point de notre pentagone. Nous voyons que nous pouvons joindre tous les
points n, sauf le point considéré (-1) soit la formation de n - 1 segments comme le montre la figure ci-
dessous :

(26.7)

Avec le deuxième point, nous pouvons aussi joindre tous les points n, sauf le point considéré (-1) et le
premier point déjà vu (-1) soit la formation de n - 2 segments :
(26.8)

Avec le troisième nous pouvons aussi joindre tous les points n, sauf le point considéré (-1) et sauf les deux
points déjà vu (-2) soit la formation de n - 3 segments

(26.9)

Nous continuons avec les autres points: le 4ème qui donne n - 4 segments, le 5ème qui donne n - 5
segments... In extenso, nous voyons donc que le (n - 2)ème point donne donc n - (n - 2) segments, etc.

Nous avons donc finalement pour :

(26.10)

En simplifiant nous trouvons donc :

(26.11)

Nous nous retrouvons donc avec deux relations :

et (26.12)

Dès lors il vient que :

(26.13)
RECTANGLE

Définition: Le "rectangle" est un cas particulier du quadrilatère (forme à quatre côtés délimités par des
segments finis tel que : losange, carré, rectangle, trapèze, etc.) dans le sens où ses côtés L et H (notation pour
Longeur et Hauteur selon figure ci-dessous) sont égaux deux à deux et à angle droit (en d'autres termes, L
n'est pas forcément égal à H).

D'autres définitions possibles consistent à dire qu'un rectangle est un parallélogramme disposant d'un angle
ou un quadrilatère ayant quatre angles droits.

Remarque: Le rectangle peut être vu comme la composition de deux (ou plus) triangles rectangles (voir plus
loin la définition). Pour construire un rectangle, il suffirait d'avoir un seul et unique triangle rectangle et lui
faire subir une double réflexion et une rotation par rapport à un axe bien choisi (cf. chapitre de Géométrie
Euclidienne).

(26.14)

De par les axiomes d'Euclide (cf. chapitre de Géométrie Euclidienne), le périmètre d'un rectangle est donné
par :

(26.15)

Et par définition, sa surface par :

(26.16)

et la longueur de sa diagonale par (application du théorème de Pythagore) :

(26.17)

La position du centre de gravité du rectangle, si nous posons le repère cartésien dans le coin inférieur gauche
de la forme, est trivialement donné par :

(26.18)

Enfin, indiquons que si nous étions des êtres vivants dans un espace à deux dimensions, le rectangle serait ce
que nous apercevrions si un parallélépipède traversait notre univers parallèlement à ses faces.

CARRE

Définition: Le "carré" est un cas particulier du rectangle dans le sens où ses quatre côtés sont égaux tel que
.
(26.19)

De par les axiomes d'Euclide (cf. chapitre de Géométrie Euclidienne), le périmètre du carré est donné par :

(26.20)

Ainsi, il vient pour la surface que :

(26.21)

et pour sa diagonale :

(26.22)

La position du centre de gravité du carré, si nous posons le repère cartésien dans le coin inférieur gauche de
la forme, est trivialement donné par :

(26.23)

Enfin, indiquons que si nous étions des êtres vivants dans un espace à deux dimensions, le carré serait ce que
nous apercevrions si un cube traversait notre univers parallèlement à ses faces.

TRIANGLE

Définition: Le "triangle quelconque" est un polygone à trois côtés et englobe dans les cas particuliers, les
triangles : isocèles, équilatéraux et rectangles.

(26.24)

De par les axiomes d'Euclide (cf. chapitre de Géométrie Euclidienne), le périmètre d'un triangle quelconque
est donné par :

(26.25)
Le triangle quelconque est toujours décomposable en deux triangles rectangles. Ainsi, celui de la figure ci-
dessous peut se décomposer en deux triangles rectangles de base respective et (définis par la
projection orthogonale du sommet opposé au segment a) tels que :

(26.26)

La surface de ces deux triangles rectangles sont comme nous l'avons déjà implicitement dit dans notre étude
du rectangle, la moitié de la surface d'un rectangle de même longueur et même hauteur. Ainsi :

(26.27)

Ainsi la somme de ces surfaces, nous donne la surface du triangle quelconque :

(26.28)

Nous pouvons de cette dernière relation, que la surface tout triangle quelconque est assimilable à la moitié
de la surface d'un rectangle de longueur et hauteur .

Remarque: Quelque soit la base a, b, c et la hauteur respective , le raisonnement précédent reste


bien évidemment totalement juste.

La détermination du centre de gravité (ou barycentre) G (cf. chapitre de Géométrie Euclidienne) est un peu
moins intuitive que dans le cas du rectangle...

Nous pouvons bien sûr nous servir d'un repère et des outils du calcul vectoriel pour très facilement
déterminer ce dernier. Nous allons donc démontrer que le centre de gravité d'un triangle quelconque est à
l'intersection de toutes les médianes :

Démonstration:

Soit un triangle ABC. Nous appelons A' le milieu du segment BC, B' celui de AC et C' celui de AB:

(26.29)

Nous allons démontrer que le seul point G vérifiant (cf. le chapitre de Géométrie Euclidienne) :

(26.30)

est le point de concours des trois médianes du triangle ABC. Cette démonstration s'effectuera en deux étapes,
en deux propositions. Au terme, nous pourrons conclure par le théorème.

Propositions :
P1. Si ABC est un triangle alors il existe un et un seul centre de gravité G tel que

P2. Les trois médianes d'un triangle sont concourantes. Leur point d'intersection est ce point G.

Démonstrations:

DM1. Soit G un point du plan tel que . Nous pouvons alors écrire que :

(26.31)

d'où :

(26.32)

Cette relation vectorielle garantit que le point G est unique et que nous pouvons même le placer!

C.Q.F.D.

DM2. Pour démontrer que les trois médianes sont concourantes, nous allons prouver que G appartient à
chacune des trois médianes.

Au point P1., nous avons démontré que G vérifie l'égalité :

(26.33)

Comme A' est le milieu du côté BC, nous pouvons alors écrire que :

(26.34)

Il vient alors que :

(26.35)

Les vecteurs et sont donc colinéaires! Donc les points A, G, A' sont alignés. Autrement écrit, le
point G fait partie de la médiane AA' du triangle ABC. Nous pouvons même dire qu'il se trouve au deux tiers
du segment AA' à partir du sommet A.

Ce que nous venons de montrer avec la médiane AA' est bien évidemment aussi vrai pour les deux autres
médianes. Ainsi :

(26.36)
En résumé, le point G fait donc partie des trois médianes AA',BB' et CC'. Ces trois droites sont donc
concourantes et le point G en est le point d'intersection. Ce résultat nous sera utile plus tard lors de notre
étude des polyèdres.

C.Q.F.D.

Enfin, indiquons que si nous étions des êtres vivants dans un espace à deux dimensions, le triangle serait ce
que nous apercevrions si des formes géométriques composées d'au moins trois faces jointes traverseraient
notre univers par un des sommets.

Nous arrêterons là cette analogie avec un espace à deux dimensions généralisable à chaque forme
géométrique que nous allons présenter par la suite (cercle et sphère, ellipse et ellipsoïde, etc.). L'idée était
surtout de soumettre la conception que les volumes que nous connaissons dans notre quotidien peuvent aussi
être vus comme des formes à 4 dimensions traversant notre espace de 3 dimensions.

TRIANGE ISOCELE

Définition: Un "triangle isocèle" est un cas particulier du triangle quelconque, dans le sens où il a deux
côtés égaux (isométriques).

(26.37)

Le périmètre d'un tel triangle reste :

(26.38)

mais comme il a deux côté égaux tel que par exemple :

(26.39)

La surface comme nous l'avons démontré dans le cas général reste :

(26.40)

Et le centre de gravité reste, comme nous l'avons démontré dans le cas général, à la position :

(26.41)
Propriétés remarquables d'un triangle isocèle : la médiatrice et la médiane h du troisième côté non égal aux
deux autres sont confondues (cf. chapitre de Géométrie Euclidienne).

TRIANGLE EQUILATERAL

Définition: Un "triangle équilatéral" est un cas particulier du triangle, dans le sens où il a trois côtés égaux :

(26.42)

Le périmètre d'un tel triangle reste :

(26.43)

mais comme il a trois côtés tel que :

(26.44)

La surface comme nous l'avons démontré dans le cas général reste :

(26.45)

Et le centre de gravité reste comme nous l'avons démontré dans le cas général, reste à la position :

(26.46)

Propriété remarquables d'un triangle équilatéral : Médiatrices et médianes sont confondues (cf. chapitre de
Géométrie Euclidienne)!

TRIANGLE RECTANGLE

Définition: Un "triangle rectangle" est un cas particulier du triangle, dans le sens que sur un de ses trois
angles, il y a au moins un angle droit.
(26.47)

Le périmètre d'un tel triangle reste :

(26.48)

La surface comme nous l'avons démontré dans le cas général reste (surface de la moitié d'un rectangle de
même base et de même hauteur):

(26.49)

Et le centre de gravité reste comme nous l'avons démontré dans le cas général, reste à la position :

(26.50)

Propriété remarquable d'un triangle rectangle : le triangle rectangle à ceci de particulier, que nous pouvons
directement lui appliquer le théorème de Pythagore (cf. chapitre de Géométrie Euclidienne).

TRAPÈZE

Définition: Un "trapèze", est un quadrilatère (non croisé) ayant deux côtés (au moins) parallèles.

(26.51)

Lorsque les deux côtés ont même longueur (ou, sont de même longueur), nous obtenons les cas particuliers
du carré, du rectangle, du losange, du parallélogramme (ici, ordre du plus précis au plus général, nous
pourrions mettre le losange en n° 2).

Aussi un usage courant consiste à ne retenir qu'une définition plus restrictive, afin de ne pas prendre en
compte ces figures particulières. Nous ajoutons dans ce cas que les longueurs des deux côtés parallèles ne
sont pas égales (cela permet aux élèves des petites classes d'éviter les confusions résultant de l'existence de
deux noms pour le même objet, par exemple losange et trapèze).
Remarque: Il existe un cas particulier de trapèze, le "trapèze isocèle", dont les deux côtés non parallèles sont
de même longueur. (nous pouvons ajouter : Comme ces deux côtés ne sont pas parallèles, il ne s'agit pas
d'un parallélogramme).

PARALLÉLOGRAMME

Définition: Le "parallélogramme" est un cas particulier du quadrilatère (et du losange aussi), où les côtés
sont parallèles deux à deux :

(26.52)

Remarque: Tous les parallélogrammes sont donc dans la famille des trapèzes.

LOSANGE

Définition: Le "losange" est un cas particulier du parallélogramme dans le sens où ses quatre côtés sont
égaux.

(26.53)

CERCLE

Il existe plusieurs définitions possibles du cercle. Voyons au moins deux.

Définitions:

D1. Un "cercle" est un cas particulier d'un polygone avec une infinité de côtés.

D2. Un "cercle" est une courbe plane dont tous les points sont à égale distance d'un point fixe appelé
"centre".
(26.54)

Nous démontrons dans la section d'Informatique Théorique (cf. chapitre de Méthodes Numériques), que le
périmètre d'un cercle de rayon R et donc de diamètre est donné par :

(26.55)

La relation de surface peut être obtenue de deux manières :

1. Par recherche de la primitive du périmètre P ce qui nous donne :

(26.56)

2. La seconde méthode est plus esthétique et fait appel à l'équation paramétrique du cercle, trivialement
donnée par les projections orthogonales des coordonnées cartésiennes :

(26.57)

Nous savons que l'aire décrite par une fonction f(x) est donnée par :

(26.58)

Il nous suffit alors de substituer dans cette intégrale les variables paramétrées :

(26.59)

Ainsi :

(26.60)

Les bornes d'intégration étant bien évidemment nous avons :


(26.61)

Nous avons donc aussi par cette méthode :

(26.62)

La longueur l d'une tranche d'angle d'ouverture d'un cercle de rayon R est bien évidemment donné par :

(26.63)

et la surface S d'une tranche d'angle d'ouverture d'un cercle de rayon R de manière identique par :

(26.64)

Soit connue la relation de calcul de la surface d'un triangle. Nous avons selon la figure ci-dessous (la
démonstration tient seulement dans le résultat lui-même) :

(26.65)

Remarque: Par définition du cercle, il est évident que le centre de gravité du cercle se confond avec le centre
de celui-ci.

ELLIPSE

Définition: Une "ellipse" est une courbe fermée dont chaque point est tel que la somme de ses distances à
deux points fixes appelés "foyers" est constante (comme nous l'avons vu dans le chapitre d'Algèbre
Ensembliste, l'ellipse peut aussi être vue comme une transformation affine du cercle).
(26.66)

Introduisons pour commencer un petit texte relativement au calcul du périmètre de l'ellipse:

Soit l'équation paramétrique en coordonnées cartésiennes d'une ellipse :

(26.67)

La distance entre le centre de l'ellipse et son périmètre est alors donnée par le théorème de Pythagore :

(26.68)

Un élément d'arc est alors donné par :

(26.69)

Le périmètre de l'ellipse est alors donné par l'intégrale :

(26.70)

et là sa commence à se corser... Ce genre d'intégrale n'est pas facilement calculable à l'aide des primitives
connues, intégration par parties, changements de variable ou autre. Il s'agit de ce que nous appelons une
"intégrale elliptique du second ordre en J" pour (cf. chapitre de Calcul Différentiel Et Intégral) :

(26.71)

De longs développements que nous présenterons dans quelques années dans le chapitre de Calcul
Différentiel Et Intégral donnent pour le périmètre après un calcul en série limitée :

(26.72)

La relation de surface de l'ellipse peut être obtenue de manière très similaire à celle du cercle et les calculs
sont curieusement beaucoup plus simples que ceux du périmètre. Rappelons que l'équation paramétrique
l'ellipse est :
(26.73)

Nous savons que l'aire décrite par une fonction f(x) est donnée par :

(26.74)

Il nous suffit alors de substituer dans cette intégrale les variables paramétrées :

(26.75)

Ainsi :

(26.76)

Les bornes d'intégration étant bien évidemment nous avons :

(26.77)

Remarque: Il faut faire attention dans ce genre de calculs à l'ordre des bornes d'intégration. Effectivement, si
nous avions pris les bornes allant de (au lieu de ) il faut imaginer que la fonction intégrée
parcoure le périmètre dans le sens négatif de l'axe des abscisses. Donc l'intégrale serait alors forcément
négative.

Nous avons donc aussi par cette méthode :

(26.78)

Remarques:

R1. Nous supposons comme évident que le centre de gravité de l'ellipse se confond avec le centre de celle-
ci.

R2. Nous renvoyons le lecteur à l'étude des coniques (cf. chapitre de Géométrie Analytique) pour le calcul
de la surface d'une ellipse à partir de son "paramètre d'ellipse" et son "excentricité" (tout y est démontré).

VOLUMES CONNUS

Il existe plusieurs définitions du concept de volume (surface qui limite un corps). Une définition due à
Euclide et une autre due au domaine de la topologie (voir le chapitre du même nom).
Définitions:

D1. Un "volume" est ce qui a longueur, largeur et hauteur.

D2. Un "volume" est une variété topologique de dimension 3.

Les surfaces qui limitent un corps peuvent être planes ou courbes:

(26.79)

A gauche, le corps est limité uniquement par des surfaces planes, au milieu par une et une seule unique
surface courbe, et à droite par une surface courbe et deux surfaces planes.

Remarque: Nous nous intéresserons dans un premier temps uniquement aux propriétés (surface, volume,
centre de gravité, moment d'inertie...) de volumes plongés dans des géométries euclidiennes.

POLYÈDRES

L'étude des polyèdres (particulièrement les polyèdres platoniciens) est très importante en physique (pour la
cristallographie par exemple) et en mathématique car il permet d'avoir une application sympathique des
groupes finis (cf. chapitre d'Algèbre Ensembliste). Il convient donc de porter une lecture relativement
attentive à ce qui va suivra.

Par ailleurs, l'étude des polyèdres est aussi un moyen très pédagogique et esthétique pour voir la mise en
oeuvre de plusieurs théorèmes géométriques, de trigonométrie et d'algèbre vectoriel.

Précisons avant toute chose que les différents polyèdres ne seront délibérément pas présentés sur un pied
d'égalité. Ainsi, nous nous concentrerons sur certaines propriétés pour certains et pas pour d'autres.

Définitions:

D1. Un "polyèdre" est un solide dont la frontière est formée de plans ou de portions de plan. Les portions de
plan qui comprennent ainsi entre elles le polyèdre, sont les faces, chaque face, étant limité par intersections
(les arêtes) avec les faces voisines, est un polygone. Les côtés de ce polygone sont les arêtes du polyèdre.
Nous appelons "sommet" d'un polyèdre tout sommet d'une quelconque de ses faces.
(26.80)

D2. Un "polygone régulier" est un polygone dont les côtés, et tous les angles sont égaux (cette définition
nous sera utile pour les polyèdres réguliers).

PARALLELEPIPEDE

Définition: Le "parallélépipède" est un volume à six faces parallèles deux à deux (donc il n'est pas un
polyèdre régulier!).

(26.81)

Son volume est simplement donné par la définition même du volume... :

(26.82)

Quand à sa surface, il s'agit simplement de la somme des surfaces des rectangles sans rien de particulier.

Calculons maintenant le moment d'inertie d'une plaque (parallélépipède) d'épaisseur e et de surface


transversale S dont l'axe de rotation est y :

(26.83)

Un élément de volume du rectangle (en gris) est donné par :

(26.84)

et :
(26.85)

et occupons nous maintenant du moment d'inertie de ce rectangle par rapport à l'axe z (perpendiculaire à x et
à y donc) et disposons les axes de façon à avoir:

(26.86)

Nous avons :

(26.87)

où r est donc dans la plan de x et y.

Avec :

(26.88)

d'où :

(26.89)

Soit le moment d'inertie d'une plaque rectangulaire :

(26.90)

si la plaque est carrée de côté L :

(26.91)

Nous allons montrer qu'il est dès lors possible de calculer le moment d'inertie du triangle équilatéral et
rectangle.
Le moment d'inertie toujours par rapport au même axe mais pour la moitié du carré est donnée par :

(26.92)

Si le centre de gravité est posé sur le tiers de la médiane partant du centre de gravité du carré et que nous
faisons usage du théorème de Steiner (cf. chapitre de Mécanique Classique), il vient :

(26.93)

Qui est donc le moment d'inertie d'un triangle équilatéral.

En procédant exactement de même pour un triangle rectangle de côtés a, b dont l'axe de rotation passe par le
centre de masse G, il vient :

(26.94)

PYRAMIDE

Définition: La "pyramide" est un polyèdre qui a pour base un polygone et pour faces latérales des triangles
réunis en un point appelé "sommet". La pyramide n'est donc pas dans le cas général un polyèdre régulier!

(26.95)

Considérons une surface S(t) de la section de la pyramide avec le plan d'équation , alors le volume V
cherché est égal à :

(26.96)

Nous parlons d'équation de plan alors qu'il n'y a pas de repères défini pour l'instant. Au fait, dans l'intégrale,
t varie entre 0 et h. Cela sous-entend que nous prenons un repère centré en H (le pied de la hauteur de la
pyramide), d'axe de la droite (la hauteur de la pyramide) orientée de O vers H (du pied de la hauteur
vers le sommet). Les deux autres axes sont choisis quelconques dans le plan de la base de la pyramide.

Il nous faut préciser maintenant ce que vaut S(t) en fonction de t :

Soit S l'aire de la base de la pyramide. La section de la pyramide par le plan d'équation se déduit par
l'homothétie de centre O et de rapport t/h. Donc l'intégrale s'écrit :
(26.97)

Le fait d'avoir pris le carré de t/h provient du fait que chaque terme intérieur de S est le produit de deux
termes (selon le calcul de la surface d'un triangle) chacun de rapport d'homothétie t/h.

Ainsi, nous avons :

(26.98)

PRISME DROIT

Définition: Le "prisme droit" est un polyèdre dont les bases sont deux polygones égaux à côtés parallèles
(elles ont la même surface!), les faces latérales étant des parallélogrammes. Donc le prisme droit n'est pas un
polyèdre régulier! Les deux faces parallèles et de même forme sont appelées les bases du prisme droit.

(26.99)

Pour calculer le volume V d'un prisme droit, nous devons tout simplement multiplier l'aire de sa base B par
sa hauteur h :

(26.100)

Sa base est un polygone, c'est-à-dire qu'elle peut être un triangle, un quadrilatère, ou un pentagone... Il faut
donc savoir calculer ces aires pour calculer le volume du prisme droit.

POLYÈDRES RÉGULIERS

Définitions:

D1. Un "polyèdre régulier" est constitué de faces toutes identiques et régulières.

D2. Un "polyèdre convexe" est tel que chaque point d'un segment de droite qui joint deux points
quelconques appartient au polyèdre.

Les polyèdres réguliers sont au nombre de neuf, dont cinq sont convexes et étaient connus de Platon. Nous
appelons parfois polyèdres réguliers uniquement les solides de Platon et ce sont ceux-ci qui vont nous
intéresser ici.

Démontrons d'abord n'existe que cinq polyèdres réguliers convexes qui sont donc appelés les "les cinq
solides platoniciens" (les autres colonnes du tableau ci-dessous seront démontrées et expliquées un peu plus
loin) :
Nom (m,n) Image S A F F-A+S

Tétraèdre (3,3) 4 6 4 2

Hexaèdre ou cube (4,3) 8 12 6 2

Octaèdre (3,4) 6 12 8 2

Dodécaèdre (5,3) 20 30 12 2

Icosaèdre (3,5) 12 30 20 2

Tableau: 2161 - Cinq polyèdres réguliers

Démonstration:

Soient m le nombre de côtés de chaque face d'un polyèdre régulier, n le nombre des arêtes qui se rencontrent
en chaque sommet. Nous avons alors que chaque angle d'une face quelconque est donné par :

(26.101)

Attention c'est l'angle qui définit donc l'angle d'une face et non pas !

Ce qui découle de la figure suivante :

(26.102)
où nous avons :

(26.103)

et :

(26.104)

Mais, la somme des n angles groupés autour d'un sommet est plus petit que les n angles qui coupent un plan
en partie égales (nous supposerons cela intuitif par découpage)! Chacun d'eux est donc inférieur à :

(26.105)

donc :

(26.106)

d'où :

(26.107)

Les nombres m et n sont tous deux au moins égaux à 3 (le plus petit polygone étant le triangle). Il en résulte
que les seuls cas possible sont :

(26.108)

C.Q.F.D.

Notons maintenant F le nombre de faces, A le nombre d'arêtes et S le nombre de sommets. Alors, rappelons
que nous avons démontré dans le chapitre de Théorie Des Graphes la "formule d'Euler" (ou "théorème de
Descartes-Euler") que :

(26.109)

et celle-ci est bien évidemment valable aussi pour l'aplatissement d'un polyèdre dans la plan (et donc in
extenso d'un polyèdre).

Remarque: La représentation sous forme d'un graphe de l'aplatissement d'un polyèdre est appelé
"diagramme de Shlegel".
(26.110)

Dans le cas des polyèdres réguliers, chaque face possède m arêtes de sorte que est l'ensemble des
arêtes des faces et comme chaque arête rencontre exactement deux faces, nous avons l'égalité (prendre un
exemple pour s'en convaincre au cas où!) :

(26.111)

et comme n est le nombre des arêtes qui se rencontrent en chaque sommet, et que chaque arête relie deux
sommets, nous avons également :

(26.112)

Soit :

(26.113)

En injectant dans la formule d'Euler, nous avons alors :

(26.114)

et nous retrouvons l'inégalité du théorème précédente. Reprenons notre calcul :

(26.115)

d'où nous tirons :

(26.116)

Nous pouvons maintenant entreprendre la classification des polyèdres réguliers.

Le tétraèdre :
(26.117)

L'octaèdre :

(26.118)

L'hexaèdre ou cube :

(26.119)

L'icosaèdre :

(26.120)

Le dodécaèdre :

(26.121)

ce qui termine notre classification.

TÉTRAÈDRE RÉGULIER

Nous avons montré que pour le tétraèdre et il est relativement aisé de deviner qu'un tel
polyèdre est formé de 3 triangles équilatéraux identiques comme le montre la figure ci-dessous :

(26.122)

Pour cela, commençons par étudier le triangle équilatéral suivant :


(26.123)

Dans ce triangle équilatéral, a est la côté, h la hauteur. Les médiatrices sont h, h', h'' des côtés respectifs BC,
AB, AC.

h et h' se coupent en un point P (barycentre). Par construction du triangle équilatéral, nous avons
(il suffit d'appliquer Pythagore pour le démontrer).

Nous avons par ailleurs démontré lors de notre étude du triangle, que le barycentre de celui-ci se situe
toujours à 2/3 de la hauteur de la médiane. Comme médiane et médiatrices sont confondues dans le cas du
triangle équilatéral, nous avons alors .

Maintenant, nous tirons une droite passant par le point P et perpendiculaire au plan dans lequel se trouve le
triangle. Soit D un point sur cette droite, comme nous aurons bien sûr
(il suffit d'appliquer Pythagore à nouveau!).

Il ne nous reste donc plus qu'à nous arranger pour que et nous aurons le tétraèdre régulier que nous
voulions. Nous calculons alors :

(26.124)

et donc :

(26.125)

donc :

(26.126)
(26.127)

La médiatrice de BC passant par M coupe H en un point O, qui n'est rien d'autre que le centre de la sphère
circonscrite au tétraèdre. En effet, par construction, nous avons et la médiatrice nous donne
.

Thalès nous donne également :

(26.128)

et pour les développements qui suivront nous poserons .

Calculons maintenant la surface totale. Elle sera nécessairement donnée par la surface d'une seule face
multipliée par le nombre de faces, et comme nous avons démontré comment calcul la surface d'un triangle
plus haut il vient immédiatement :

(26.129)

Pour le volume c'est tout aussi simple puisque nous avons démontré plus haut quel était celui d'une
pyramide. Il vient alors immédiatement :

(26.130)

HEXAÈDRE RÉGULIER (CUBE)

Le cube est le polyèdre régulier qui nous est le plus familier, il compte 6 faces et sa construction ne nécessite
probablement pas d'être présentée.
(26.131)

Puisque tous les côtés sont de longueur a, la surface est simplement donné par la multiplication de la surface
des 6 faces. Ainsi :

(26.132)

et le volume :

(26.133)

OCTAÈDRE RÉGULIER

Nous avons montré que pour l'octaèdre et il est relativement aisé de deviner que l'octaèdre
régulier est formé (par définition) de 6 triangles équilatéraux identiques.

Pour construire, et montrer qu'il est possible de construire, un tel polyèdre nous posons comme
précédemment que son côté vaut a.

(26.134)

Ensuite, nous notons O le point d'intersection des deux diagonales. Nous avons alors :

(26.135)

et :

(26.136)
Sur la droite perpendiculaire au plan qui contient notre carré, et passant par O, nous ajoutons deux sommets
E, F à une distance que nous calculons comme suit :

(26.137)

d'où nous tirons :

(26.138)

Donc :

(26.139)

Notre polyèdre est bien composé de huit triangles équilatéraux tous identiques. Chaque sommet compte
quatre arêtes et quatre faces, ce qui nous permet d'affirmer qu'il est bien régulier et termine ainsi notre
construction.

La surface de l'octaèdre régulier est :

(26.140)

avec h étant la hauteur du triangle équilatéral de côté a que nous avons déjà calculé plus haut. Pour le
volume, c'est encore basé sur celui de la pyramide. Ainsi :

(26.141)

Et nous supposerons qu'il est évident pour le lecteur que notre octaèdre est inscrit dans une sphère de rayon
R dont le centre est le point O. Pour R, nous avons :

(26.142)

Montrons déjà maintenant que nous pouvons construire l'icosaèdre régulier à partir de l'octaèdre et que ce
premier existe est bien constructible.

Pour cela, nous allons d'abord considérer un repérage vectoriel des points suivants de l'octaèdre avec
l'origine O placée au barycentre:
(26.143)

Nous avons alors :

(26.144)

Une fois ceci posé, considérons la figure suivante :

(26.145)

Sur la figure ci-dessus, A' est un point qui part de A et qui arrive en B, et soit B' un point qui part de C et qui
arrive en B, et pour finir E' un point qui part de B et arrive en E. Ces trois points partent en même temps et
avancent à la même vitesse. Si nous suivons ces trois points, qui forment un triangle A'B'E', nous sentons
bien intuitivement qu'il existe un lieu tel que A'B'E' soit un triangle équilatéral.

Déterminons ce lieu :

(26.146)

et donc :

(26.147)
et nous voulons :

(26.148)

Alors :

(26.149)

Soit :

(26.150)

Ce qui se simplifie en :

(26.151)

et comme , nous obtenons pour la résolution de ce polynôme du deuxième degré (cf. chapitre de
Calcul Algébrique) la seule solution acceptable :

(26.152)

le lecteur remarquera peut-être qu'il s'agit de l'inverse du nombre d'or.

Selon la figure ci-dessous, si nous posons alors nous retrouvons à nouveau la même valeur
pour (soit le lecteur le vérifiera lui-même, soit nous sur demande nous pouvons faire le détail des calculs)
et idem pour tous les autres points :

(26.153)
Notre nouveau polyèdre comporte donc une face par face de l'octaèdre et une face par arête de l'octaèdre.
Nous avons ainsi vingt faces composées de triangles équilatéraux identiques. De plus, cinq arêtes et cinq
faces se rencontrent en chaque sommet. Nous obtenons alors un icosaèdre régulier.

Nous avons pour les coordonnées de chaque sommet (il faut bien observer que les sommets sont opposés par
paire en une composante sur la figure) :

(26.154)

ICOSAÈDRE RÉGULIER

Nous avons vu précédemment comment construire l'icosaèdre régulier. Il existe donc bien.

(26.155)

Connaissant les coordonnées des différentes sommets, calculons maintenant la surface et le volume de
l'icosaèdre régulier.

Le calcul de la surface est simple puisqu'il s'agit de 20 triangles équilatéraux. Nous avons doc :

(26.156)

donc :

(26.157)

Donc :

(26.158)

Donc :
(26.159)

Le calcul du volume est lui un peu plus subtil...

L'icosaèdre est construit autour du pentagone et de la section d'or comme nous avons pu nous en apercevoir
lors de notre étude de l'octaèdre.

Si jamais le lecteur n'est pas convaincu voici une figue supplémentaire où nous voyons bien que chaque
arête de l'icosaèdre est une arête d'un pentagone (AFECB, LGHJK, DAJKC, DEGHA, BJILC, FELIH...) :

(26.160)

Utilisant la méthode des pyramides, nous avons 20 triangles équilatéraux qui servent de base à une pyramide
dont la hauteur va jusqu'à l'origine O de l'icosaèdre (où l'origine confondue de la sphère inscrite ou
circonscrite).

Prenons pour exemple la base ABD avec l'intersection des médiatrices se trouvant au point M comme
représenté ci-dessous.
(26.161)

Comme nous le savons, le volume de chaque pyramide est :

(26.162)

La surface b est dans notre situation celle du triangle équilatéral ADB et la hauteur h est le segment OM.

Si nous notons a le côté de triangle, alors la surface est donnée par :

(26.163)

Pour trouver h, nous savons par construction du point M que les triangles OMA, OMB, OMD sont des
triangles rectangles.

Travaillions arbitrairement avec le triangle OMD. D'abord, déterminons la longueur DM. Nous avons
démontré lors de notre étude des médiatrices de longueur H du triangle équilatéral (cf. chapitre de
Géométrique Euclidienne) que DM vaut alors :

(26.164)

Or :

(26.165)

Donc finalement :
(26.166)

Pour trouver h nous devons trouver la longueur en termes de longueur des arêtes a de l'icosaèdre.
Pour cela, nous devons reconnaître une des propriétés géométrique élémentaires de l'icosaèdre.

Avant d'aller plus loin, montrons une propriété du pentagone ci-dessous avec ses diagonales d et ces cotés c :

(26.167)

BSEA est un parallélogramme. Effectivement, la diagonale BD est parallèle au côté AE (par exemple, parce
que tout deux sont perpendiculaire à l'axe de symétrie passant par OC). Comme S est sur BD, cela prouve
que BS et AE sont parallèles. Nous montrons de la même manière que AB et SE sont parallèles.

Nous en déduisons que :

(26.168)

et de même pour CS :

(26.169)

Continuons..., nous avons l'égalité . Comme de plus CD et BE sont parallèles, les triangles SCD
et ABE sont semblables. Par conséquent, les rapports de distances entre leurs côtés sont conservés (Thalès) :

(26.170)

d'où la relation :

(26.171)

Si désigne maintenant le rapport d/c, la relation précédente devient :

(26.172)
et étant strictement positif, nous avons déjà vu lors de notre étude de l'octaèdre que l'unique racine
positive est le nombre d'or :

(26.173)

Nous venons donc de montrer qu'une diagonale d'un pentagone est égale au nombre d'or multiplié par la
longueur d'une arête de ce même pentagone.

Ainsi, nous avons dans les pentagones AFECB et LGHJK de notre icosaèdre :

(26.174)

Remarquons également le rectangle FBGK dont le barycentre est confondu avec celui de l'icosaèdre. Par
ailleurs, FK et BG représentent par construction le diamètre de la sphère circonscrite à l'icosaèdre et donc
en sont le rayon r que nous allons cherchons.

Nous avons :

(26.175)

Donc :

(26.176)

d'où :

(26.177)

Maintenant, nous pouvons calculer h :

(26.178)

Or :

(26.179)

puisque le nombre d'or est racine de l'équation .

Soit :

(26.180)

Donc finalement :
(26.181)

et :

(26.182)

Ainsi, le volume d'une pyramide de l'icosaèdre est :

(26.183)

Comme il y a 20 pyramides :

(26.184)

DODÉCAÈDRE RÉGULIER

Faut d'avoir trouvé dans la littérature une manière esthétiquement et simple de faisabilité de construction du
dodécaèdre, nous nous en passerons pour l'instant (il est possible de vivra sans).

Remarquons simplement que le dodécaèdre est composé de 12 pentagones réguliers et son volume est
assimilable à un parallélépipède sur lequel nous avons posé sur chacune des faces une sorte de petit toit qui
au final donner les pentagones :

(26.185)

Pour notre étude du dodécaèdre, nous nous intéresserons uniquement à déterminer sa surface et son volume.

Pour cela, considérons dans un premier temps le pentagone régulier ci-dessous :


(26.186)

Nous allons d'abord devoir déterminer la longueur de h et de b.

Rappelons d'abord que nous avons lors de notre étude l'icosaèdre déjà démontré que la diagonale d'un
pentagone est reliée à la longueur de ses côtés par la relation :

(26.187)

où est donc le nombre d'Or. Il nous reste alors à déterminer h.

Il est d'abord évident que et que :

(26.188)

Or, deux informations nous manquent ici : l'angle et c. Commençons par déterminer combien vaut le cosinus
sans utiliser la calculatrice (vous comprendrez pourquoi...).

Nous avons d'abord selon la relation (cf. chapitre de Trigonométrie) :

(26.189)

Ce qui s'écrit aussi :

(26.190)

Mais cela s'écrit également en utilisant toujours la même relation trigonométrique remarquable :

(26.191)

Soit après simplification :


(26.192)

En faisant un changement de variable et en réarrangeant les différents termes :

(26.193)

Nous avons -1 et 1/2 qui sont deux racines évidentes et nous obtenons donc (cf. chapitre de Calcul
Algébrique) :

(26.194)

Nous n'avons plus qu'à résoudre une simple équation du deuxième degré dont la solution est triviale en
appliquant les méthodes vues dans le chapitre de Calcul Algébrique, et nous obtenons :

(26.195)

Soit en ne prenant que la seule solution admissible nous avons alors :

(26.196)

nous retrouvons donc nombre d'Or là aussi! et ceci nous amène directement à écrire que :

(26.197)

Il nous reste à déterminer c. Nous avons :

(26.198)

et comme nous avons :

(26.199)

et donc :

(26.200)

d'où :
(26.201)

Nous avons donc pour le calcul de la surface du pentagone, une surface composée de 12 pentagones dont
chacun est composé d'un triangle de base a et de hauteur h.

(26.202)

Pour calculer le volume nous allons faire usage de l'astuce mentionnée au début. C'est-à-dire de découper
dans un premier temps le dodécaèdre en un parallélépipède de côté :

(26.203)

puisque le côté du parallélépipède est une diagonale du pentagone de côté s et de 6 petits toits (qui sont bien
visibles sur la figure du dodécaèdre donnée précédemment).

Chaque petit toit selon deux vues différentes aura les longueurs suivantes (où nous retrouvons bien
évidemment pour certaines arêtes celles des pentagones s ou encore les diagonales c de ceux-ci) :

(26.204)

Pour chaque petit toit nous traitons à part les extrémités en les séparant et en les réunissant. Finalement nous
avons deux morceaux à traiter : la partie majeure du toit visible à gauche sur la figure ci-dessous et la partie
secondaire du toit à droite sur la figure qui n'est d'autre que la réunion des extrémités du toit :

(26.205)

Il nous faut donc déterminer x et l et h puisque c et s nous sont déjà connus.

D'abord nous voyons trivialement que :

(26.206)
Du théorème de Pythagore, nous avons alors :

(26.207)

En combinant ces deux relations, nous avons :

(26.208)

Il vient alors :

(26.209)

Donc :

(26.210)

Nous pouvons maintenant calculer le volume de chacune des 6 petits toits :

(26.211)
Donc le volume total du dodécaèdre est finalement le volume des 6 petits toits sommé au volume du
parallélépipède central :

(26.212)

CORPS DE RÉVOLUTIONS

Définition: Un "corps de révolution" est un volume que nous obtenons en faisant tourner une
courbe 2D autour d'un axe.

Il existe donc autant de corps de révolution que de type de courbe fermée ou non que nous pouvons faire
tourner autour d'un axe.

Voyons avant d'aller plus loin la méthode générale permettant de déterminer l'aire d'un corps de révolution.
C'est-à-dire la surface du corps engendré par la rotation d'une courbe de longueur finie autour d'un axe:

(26.213)

Pour cela, nous remarquons que lorsque la courbe est donnée par une équation nous remarquons
par Pythagore (voir figure ci-dessous) que l'élément de longueur dl vérifie (relation que nous avons déjà
rencontrée dans d'autres chapitres du site):

(26.214)

donc :

(26.215)
Ainsi l'élément de surface engendré par la rotation de l'élément de longueur dl est donné par:

(26.216)

L'aire de la surface de révolution engendrée par une fonction continûment différentiable est
donc donnée par la relation:

(26.217)

CYLINDRE

Définition: Un "cylindre" est une surface engendrée par une droite qui se déplace parallèlement à une
direction fixe en rencontrant une courbe plane fixe, dont le plan coupe la direction donnée.

(26.218)

Le volume d'un cylindre de révolution de rayon et de hauteur égale à h se calcule par la méthode des
disques en sachant que la surface d'un cercle (disque) vaut :

(26.219)

La surface d'un disque étant simplement la somme de la surface des deux disques de base et du sommet et de
la surface du rectangle plié de hauteur h et de longueur :
(26.220)

Calculons maintenant le moment d'inertie d'un cylindre plein par rapport à son axe de symétrie vertical (axe
de révolution) :

(26.221)

Nous avons :

(26.222)

Donc :

(26.223)

Soit maintenant G le centre de gravité du cylindre, coïncide avec l'axe de révolution du cylindre. Les axes
et jouent des rôles identiques. Les moments d'inertie et par rapport à ces axes sont donc égaux
et s'écrivent :

(26.224)

d'où :

(26.225)

d'où :

(26.226)

La première intégrale est en fait le moment d'inertie du cylindre par rapport à l'axe et nous savons quelle
vaut :

(26.227)
La deuxième intégrale se calcule facilement en découpant le cylindre en tranches d'épaisseur dz
perpendiculaires à l'axe . La masse de la tranche élémentaire est soit :

(26.228)

Le moment d'inertie d'un cylindre par rapport à un axe perpendiculaire à son axe de révolution s'écrit donc :

(26.229)

Calculons maintenant le moment d'inertie d'un tube ou d'un cylindre creux d'épaisseur non nulle (toujours
donné dans les formulaires techniques) : le moment d'inertie d'un tube par rapport à son axe de révolution est
un grand classique du traitement du moment d'inertie du cylindre. Ainsi, considérons un tube de rayon
extérieur et de rayon intérieur . Comme (cf. chapitre de Mécanique Classique) :

(26.230)

Il vient dès lors que le moment d'inertie d'un tube peut-être vu comme le moment d'inertie du cylindre de
rayon égal au rayon externe du tube diminué du moment d'inertie du cylindre de rayon égal au rayon interne
du tube. Ainsi :

(26.231)

et si , il vient dès lors la relation classique disponible dans nombre de formulaires de physique :

(26.232)

CONE

Définition: Un "cône" est une surface engendrée par une droite mobile, passant par un point fixe et
s'appuyant sur une courbe fixe; solide déterminé par cette surface.

Le volume d'un cône de révolution de rayon à la base r et de hauteur égale à h se calcule également par la
méthode des disques.

La droite passant par les points (extrémité de la base du cône) et (sommet du cône) est :

(26.233)

La rotation de cette droite par rapport à l'axe des y donne le volume du cône :
(26.234)

(26.235)

Calculons maintenant d'inertie d'un cône par rapport à son axe de révolution :

Pour ce calcul, nous allons utiliser la valeur du moment d'inertie du cylindre et considérer le cône
comme un empilement de cylindres infinitésimaux.

Donc :

(26.236)

SPHÈRE

Définition: La "sphère" est le volume engendré par la rotation d'un disque (ou cercle) de rayon r autour de
son centre de gravité.

(26.237)

Nous pouvons voir une sphère de rayon R, comme une surface qui est formée par la rotation d'un demi-
cercle autour de son grand axe. La fonction décrivant un demi-cercle étant :

(26.238)

La sphère peut être disséquée donc comme un somme de disques d'épaisseur . Les demi-disques étant
perpendiculaires à l'axe des abscisses et de largueur à la position (voir figure ci-dessous).
(26.239)

Nous avons ainsi :

(26.240)

Le volume d'un disque (cylindre) étant donné par (en passant à la limite) :

(26.241)

et le rayon étant donné par la fonction :

(26.242)

nous avons alors :

(26.243)

En intégrant entre , nous avons alors le volume de la sphère :

(26.244)

Nous pouvons également prendre les bornes entre cela revenant au même à un facteur 2 près :

(26.245)

Après simplification, nous obtenons pour le volume :

(26.246)
L'expression de la surface étant donnée par dérivant par rapport à l'élément générant la surface, nous
obtenons ainsi (c'est un peu limite comme raisonnement mais bon...):

(26.247)

Il existe une autre manière d'aborder ces calculs un peu plus rigoureuse. Effectivement, dans le chapitre de
Calcul Différentiel Et Intégral nous avons introduit le concept de Jacobien qui permet de changer les
variables d'intégration en fonction du système de coordonnées sur lequel nous travaillons.

(26.248)

et nous avons démontré que le jacobien en coordonnées sphériques est :

(26.249)

Dès lors, nous avons :

(26.250)

et pour la surface (pour laquelle le rayon est constant) :

(26.251)

Au besoin, on peut trouver l'élément de surface de manière géométrique plutôt que de passer par la jacobien
car ce dernier n'est pas très pédagogique dans les petites classes...

Alors en se rappelant que dans le chapitre de Trigonométrie nous avons démontré que la longueur d'un arc
de cercle est donné par:

(26.252)

Alors il devient très aisé de compléter la figure suivante:


(26.253)

et nous voyons alors immédiatement que:

(26.254)

ce qui est quand même plus sympa...

Calculons maintenant le moment d'inertie d'une boule pleine homogène de masse M et de masse volumique
. Pour cela, la boule présentant une symétrie maximum, il est plus commode de calculer d'abord le
moment d'inertie polaire (cf. chapitre de Mécanique Classique), puis de déterminer le moment d'inertie axial
à partir de ce premier :

(26.255)

Comme sont égaux par symétrie de la boule, il vient :

(26.256)

TORE

Définition: Un "tore" est la surface engendrée par la rotation d'un cercle c de rayon r autour d'une droite
située dans son plan, mais ne passant pas par son centre.

Soit l'équation d'un demi-cercle de centre :


(26.257)

Afin d'écrire y sous la forme d'une fonction de x, isolons y dans cette équation:

(26.258)

Le cercle est constitué des graphes des deux fonctions :

- Demi-cercle supérieur :

(26.259)

- Demi-cercle inférieure :

(26.260)

Le volume demandé est la différence entre les volumes engendrés par la rotation des surfaces (surfaces
définies par l'aire comprise entre la fonction du cercle concerné et l'axe des abscisses compris entre
) dans l'espace autour de l'axe des abscisses.

En appliquant la relation d'intégration des corps de révolution :

(26.261)

Calculons cette dernière intégrale par la substitution classique donc :

(26.262)

si :

(26.263)

si :

(26.264)

donc :
(26.265)

Linéarisons cette expression en utilisant à nouveau les relations trigonométriques :

(26.266)

Donc le volume d'un tore de "rayon mineur" r et de "rayon majeur" c est donné par :

(26.267)

Adapté à la figure ci-dessous (prise de la littérature) :

(26.268)

et la surface (par dérivation de l'élément génération de surface) :

(26.269)

Le moment d'inertie du tore relativement à son axe de révolution se calcule de la manière suivante :

Soit le volume du tore (démontré précédemment) noté :

(26.270)

La densité volumique du tore est donnée par (masse sur volume):


(26.271)

En coordonnées cylindriques, nous avons :

(26.272)

d'où :

(26.273)

Le moment d'inertie est alors donné par :

(26.274)

Posons , dès lors :

1. Les bornes d'intégration deviennent dès lors puisque nous ramenons tous les points d'intégration à
l'origine en posant

2. Trivialement, puisque nous avons donc

Ce qui nous donne :

(26.275)

Comme l'intégrale entre deux bornes égales d'une fonction ou produit de fonction impaires est nul (cf.
chapitre de Calcul Différentiel Et Intégral), les intégrales de :

(26.276)

sont nulles.

Nous avons donc à calculer :

(26.277)
Posons maintenant et donc . Il vient donc :

(26.278)

Or, comme :

(26.279)

Donc :

(26.280)

Soit (cf. chapitre de Calcul Différentiel Et Intégral) :

(26.281)

Donc finalement :

(26.282)

ELLISPOÏDE

Définition: Un "ellipsoïde" est un solide engendré par la révolution d'une ellipse autour de l'un de ses axes.
(26.283)

Pour calculer le volume délimité par l'ellipsoïde, prenons l'équation que nous avons déterminée lors de notre
étude des coniques (cf. chapitre de Géométrie Analytique) :

(26.284)

La section par un plan parallèle au plan Oyz et se trouvant à la distance x de ce dernier, donne l'ellipse :

(26.285)

ou :

(26.286)

avec pour demi-axes :

(26.287)

Mais comme nous l'avons démontré, la surface d'une ellipse vaut . Par conséquent :

(26.288)

Le volume de l'ellipsoïde est alors égal à :

(26.289)

Donc :

(26.290)
et si , nous retrouvons l'expression du volume d'une sphère :

(26.291)

Remarque: Le calcul du moment d'inertie d'un ellipsoïde est très important en astrophysique puisque un
grand nombre d'étoiles ou de planètes en rotation sur elles-mêmes de par leur déformation à l'équateur à
cause de la force centrifuge se voient déformés en première approximation en tel volume.

Pour un ellipsoïde, définissons C comme étant le moment d'inertie le long de l'axe c, A le moment d'inertie
le long de l'axe a et B le moment d'inertie le long de l'axe b.

Pour commencer, considérons le moment d'inertie le long de l'axe c que nous assimilerons à l'axe z. Dès
lors, en coordonnées cartésiennes, nous avons :

(26.292)

En faisant la substitution suivante, nous sous-entendons que l'intégrale précédente est une normalisation d'un
ellipsoïde :

(26.293)

ce qui nous donne pour notre intégrale (nous transformons donc ainsi le volume V de l'ellipsoïde en le
volume V' d'une sphère) :

(26.294)

Nous pouvons maintenant passer les coordonnées cartésiennes en coordonnées sphériques (cf. chapitre de
Calcul Vectoriel) sans oublier d'utiliser le Jacobien (cf. chapitre de Calcul Différentiel Et Intégral) que nous
avions démontré comme valant en coordonnées sphériques :

(26.295)

Donc (nous utilisons les primitives usuelles démontrées dans le chapitre de Calcul Différentiel Et Intégral) :
(26.296)

en y insérant pour l'ellipsoïde :

(26.297)

nous obtenons alors :

(26.298)

et par symétrie, nous avons les résultats triviaux suivants :

(26.299)

La matrice d'inertie (cf. chapitre de Mécanique Classique) est alors :

(26.300)

PARABOLOÏDE

Définition: Un "paraboloïde" est un solide engendré par la révolution d'une parabole autour de son foyer :
(26.301)

La méthode de calcul du volume du paraboloïde à base elliptique est exactement la même que celle pour la
pyramide à la différence que l'équation d'une parabole est du type et que nous avons aussi .
Dès lors, nous avons évidemment . Le carré de la fonction nous amène à écrire :

(26.302)

et idem pour . Dès lors :

(26.303)

TONNEAU À SECTION CIRCULAIRE

Maintenant regardons pour la plaisir un volume très connu par les viticulteurs (et pas seulement!):

(26.304)

Considérons que la courbe latérale du tonneau est une parabole d'équation:

(26.305)

Posons:
et (26.306)

étant donné la manière dont nous avons disposé les axes x, y il est relativement aisé de déterminer les
coefficients du polynôme. Déterminer le coefficient c est le plus simple:

(26.307)

Nous avons aussi:

(26.308)

De même que:

(26.309)

Ainsi, nous avons:

(26.310)

Le rayons d'une section horizontale d'ordonnée x est et sa surface est donc:

(26.311)

ou:

(26.312)

Développons:

(26.313)

Le volume de liquide pour une hauteur h sera donc:


(26.314)

Pour calculer la surface intérieure du tonneau, nous considérons la courbe extérieure donnée par un arc de
parabole comme représenté ci-dessous:

(26.315)

Pour calculer l'aire latérale de ce tonneau nous devons d'abord déterminer l'expression de la parabole ci-
dessus.

En regardant la figure nous obtenons :

(26.316)
qui est un système de trois équations en les inconnues .

Après résolution nous obtenons :

(26.317)

La surface latérale du tonneau incluant la surface des deux disques aux extrémités est alors donnée par :

(26.318)

En faisant le changement de variable nous obtenons :

(26.319)

Cette dernière intégrale peut être calculée en utilisant les relations suivantes (dont la deuxième a été
démontrée dans le chapitre de Calcul Différentiel et Intégral):

(26.320)

où pour rappel:

(26.321)

Nous n'irons pas plus loin car la formule obtenue serait énorme et sans grand intérêt.

Voici néanmoins une application numérique. Supposons:

(26.322)

Nous calculons :

(26.323)

Donc:
(26.324)

la première des intégrales vaut :

(26.325)

La deuxième vaut :

(26.326)

Et finalement:

(26.327)
27. THÉORIE DES GRAPHES

L 'histoire de la théorie des graphes (ou des "complexes cellulaires") débute peut-être avec les travaux
d'Euler au 18ème siècle et trouve son origine dans l'étude de certains problèmes, tels que celui des ponts de
Königsberg (les habitants de Königsberg se demandaient s'il était possible, en partant d'un quartier
quelconque de la ville, de traverser tous les ponts sans passer deux fois par le même et de revenir à leur point
de départ), la marche du cavalier sur l'échiquier ou le problème de coloriage de cartes et du plus court trajet
entre deux points.

La théorie des graphes s'est alors développée dans diverses disciplines telles que la chimie (isomères), la
biologie, les sciences sociales (réseaux de transports), gestion de projets (C.P.M.), informatique (topologie
des réseaux, complexité algorithmique. protocoles de transferts), la physique quantique, etc.. Depuis le début
du 20ème siècle, elle constitue une branche à part entière des mathématiques, grâce aux travaux de König,
Menger, Cayley puis de Berge et d'Erdös.

De manière générale, un graphe permet de représenter la structure, les connexions d'un ensemble complexe
en exprimant les relations entre ses éléments : réseau de communication, réseaux routiers, interaction de
diverses espèces animales, circuits électriques, ...

Les graphes constituent donc une méthode de pensée qui permet de modéliser une grande variété de
problèmes en se ramenant à l'étude de sommets et d'arcs.

Les derniers travaux en théorie des graphes sont souvent effectués par des informaticiens, du fait de
l'importance qu'y revêt l'aspect algorithmique (voir le début du chapitre de Méthodes Numériques pour un
petit exemple).

Effectivement, il s'agit essentiellement de modéliser des problèmes. Nous exprimons le problème en termes
de graphes et ensuite il devient un problème de la théorie des graphes que nous savons le plus souvent
résoudre car il rentre dans une catégorie de problèmes connus.

Les solutions de problèmes de graphes peuvent être faciles et efficaces (car le temps nécessaires pour les
traiter informatiquement est raisonnable car il dépend polynomialement du nombre de sommets du graphe)
ou difficiles (car le temps de traitement est exponentiel) dans quel cas nous utilisons une heuristique, c'est-à-
dire un processus de recherche d'une solution (pas forcément la meilleure).

La théorie des graphes connaît un assez grand engouement ces 30 dernières, peut-être est-ce parce qu'elle ne
nécessite pas dans ses concepts élémentaires de bagage mathématique considérable. Effectivement, il suffit
d'avoir parcouru les chapitres de Probabilités, de Théorie Des Ensembles et d'Algèbre Linéaire ainsi que de
Topologie présentés sur le site pour déjà se sentir à l'aise avec les différentes définitions.

Nous allons introduire le vocabulaire de base de la théorie des graphes. Les termes employés sont ceux du
langage commun de la géométrie euclidienne (et malheureusement ils sont aussi en grand nombre...).

Définitions:

D1. Un "graphe" (ou "polygraphe") G est un couple constitué d'un ensemble X non vide et fini
(les sommets), et d'un ensemble E (les arêtes) de paires d'éléments de X ou autrement dit (...) d'une partie du
produit cartésien (cf. chapitre de Théorie Des Ensembles).

Remarque: Un graphe est souvent noté en français G=(S,A) où le S est la première lettre de Sommet et A la
première lettre de Arêtes.
L'ensemble des sommets est noté G(X) et l'ensemble des arêtes G(E).

Un graphe est aussi dit "graphe planaire" quand nous pouvons le représenter dans un plan sans qu'il y ait
intersection d'arêtes.

Maintenant, montrons que si F est le nombre de faces d'un graphe planaire (on compte aussi la face
extérieure infinie), A son nombre d'arêtes et S sont nombre de sommets nous avons alors ::

(27.1)

qui est la relation connue sous le nom de "formule d'Euler" ou "théorème de Descartes-Euler"
(démonstration après l'exemple) et qui nous sera utile plusieurs fois sur ce site (dans le présente chapitre et
lors de notre étude des polyèdres dans le chapitre sur les Formes Géométriques).

Exemple:

Un graphe à 2 faces (la face en gris claire est la face extérieure infinie), 4 sommets et 4 arêtes :

(27.2)

Démonstration:

Nous démontrons cette formule en effectuant une récurrence sur A-S :

D'abord, la formule est vraie pour car, dans ce cas, le graphe est un arbre donc il n'a qu'une seule
face, donc , donc .

Puis, prenons un graphe connexe (voir définition plus loin) contenant au moins un cycle G (la figure ci-
dessous est un exemple de graphe avec 3 cycles) :

(27.3)

Si nous retirons une arête e à ce cycle, nous devrions pouvoir alors par récurrence appliquer au graphe
la même formule si elle est juste. Effectivement le graphe amputé de l'arête aura F faces, S sommets
et A arrêtes et donc la formule :

F - A + S = 2 (27.4)

si nous lui remettons l'arrête alors nous écrirons :

(F + 1) - (A + 1) + S = F - A + S =2 (27.5)
C.Q.F.D.

D2. Les éléments de X sont donc les "sommets" du graphe G, ceux de E sont les "arêtes" du graphe
G (effectivement, une arrête est composée de deux sommets, d'où l'allusion aux paires d'éléments dans la
définition précédente).

Remarque: Dans un "multigraphe", les deux sommets d'une arête peuvent être identiques (boucle) et deux
arêtes distinctes peuvent avoir leurs deux extrémités communes. Un multigraphe ne satisfait plus alors la
définition D1.

D3. Soit une arête de G, nous disons que les sommets x, y qui sont les "extrémités" de l'arête de
G, sont "adjacents" ou "voisins" dans le graphe G, et que l'arête e est "incidente" aux sommets x, y.

D4. Si deux arêtes e et e' ont une extrémité en commun, nous dirons qu'elles sont "incidentes", autrement,
qu'elles sont indépendantes.

Remarque: Si e est une arête de G, nous noterons le sous-graphe de . Si X ' est un


sous-ensemble de X, nous noterons le graphe G privé des sommets de X '.

D5. Ce que nommons "ordre" du graphe est le nombre de ses sommets.

Soit G un graphe d'ordre n (donc le nombre de sommets), l'ensemble E doit être par définition choisi comme
sous-ensemble de l'ensemble des paires d'éléments de l'ensemble X, donc d'un ensemble (trivial - puisque un
sommet ne peut pas être voisin à lui-même) de cardinal :

(27.6)

En conséquence, il existe (voir le chapitre de Probabilités : arrangements de n éléments non-distinguables


par couple de deux) :

(27.7)

choix possibles pour E et donc autant de graphes admettant X pour ensemble de sommets. Certains de ces
graphes, sont par le fait que nous considérons leurs sommets comme non-distinguables "automorphes" (voir
la définition de ce terme un peu plus loin dans ce chapitre).

Le résultat obtenu signifie qu'il existe environ 2 millions de graphes à 7 sommets, et quelques
graphes à 27 sommets - chiffre à comparer avec le fait que nous estimons à moins de le
nombre d'atomes dans l'Univers (...).

D6. Le "voisinage" d'un sommet est l'ensemble de ses voisins.

D7. Nous appelons "degré" d'un sommet s et notons D(s), le nombre de ses voisins, qui est également le
nombre d'arêtes qui lui sont incidentes (un sommet de degré zéro étant appelé un "sommet isolé").

Remarque: Un sommet de degré 1 est appelé "sommet pendant".

Propriétés (sans démonstration) :

P1. La somme des degrés des sommets est égale au double du nombre d'arêtes.
P2. Dans un graphe, le nombre de sommets de degré impair est toujours pair.

P3. Un graph ayant tous ses sommets de degré pair est d'ordre impair (excepté pour le sommet isolé).

Remarque: Un "graphe régulier" est un graphe dont tous les sommets ont même degré k. Nous disons alors
que le graphe est "k-régulier".

D8. Nous dirons qu'un graphe est un "sous-graphe" ou "sous-graphe induit" d'un graphe
lorsque et .

D9. Un "sous-graphe recouvrant" d'un graphe est un sous-graphe , c'est-à-dire un


sous-graphe dont sont sommets tous les sommets de G et dont les arêtes sont dans E'.

D10. Pour un graphe d'ordre n, il existe deux cas extrêmes pour l'ensemble de ses arêtes : soit le graphe n'a
aucune arête, soit toutes les arêtes possibles pouvant relier les sommets deux à deux sont présentes. Dans ce
dernier cas le graphe est dit appelé un "graphe complet".

Exemple:

Voici quelques graphs complets pour lesquels nous avons bien :

(27.8)

arêtes. Nous remarquons que les quatre premiers graphs sont planaires (effectivement remarquez comment il
est possible de transformer le quatrième K4 de manière à ce qu'il n'y ait plus d'intersections). Le cinquième
graph K5 est non-planaire (nous ne pouvons trouver des déplacements évitant les croisements).

(27.9)

Remarque: Un graphe complet est donc un graphe où chaque sommet est relié à tous les autres. Le graphe
complet d'ordre n est noté . Dans ce graphe chaque sommet est de degré n-1 ("l'étoile de David" n'est
complète que si l'on joint tous les sommets entre eux - ainsi nous perdons la géométrie de l'étoile mais
obtenons un graphe ).
D11. Un "graphe stable" est sous-graphe sans arête et une "clique" un sous-graphe complet.

D12. Dans un graphe il est naturel de vouloir se déplacer de sommet en sommet en suivant les arêtes. Une
telle marche passant par n sommets est appelée une "chaîne" ou un "chemin" :

Un chemin ("path" en anglais) est une liste de sommets telle qu'il existe dans le graphe
une arête entre chaque paire de sommets successifs : . La longueur du chemin
correspond au nombre d'arêtes parcourus : k-1.

Un chemin est dit "chemin simple" si chaque arête du chemin est empruntée une seule fois. Voici par
exemple une chemin simple avec 5 sommets:

(27.10)

Ainsi, nous définissons aussi un "cycle" :

(27.11)

comme étant un chemin simple finissant à son point de départ tel que . Ainsi, s'il existe deux chaînes
distinctes reliant deux sommets x et y d'un graphe G, alors ce graphe admet un cycle.

D13. Un "cycle simple" est un cycle dont toutes les arêtes sont différentes.

D14. Un "graphe orienté" est un graphe dont les arêtes ont une direction et un sens et sont dès lors appelées
des "arcs" (donc à l'opposé du graph non-orienté).

Remarques:

R1. Les termes de "chemin" et de "circuit" s'emploient en propre pour les graphes orientés. Pour les graphes
non orientés que nous manipulons principalement ici, nous parlons de "chaîne" et de "cycle". Cependant la
définition formelle est exactement la même dans les deux cas, seule change la structure (graphe orienté ou
non) sur laquelle ils sont définis.

R2. Un graphe non orienté n'est qu'un graphe orienté symétrique. Effectivement, si un arc relie le sommet a
au sommet b et un autre arc relie le somme b au sommet a, nous ne traçons alors qu'un trait entre a et b que
nous appelons... une arête.

D15. Un chemin est dit "chemin élémentaire" si chacun des sommets du parcours est visité
une seule fois : . Un chemin élémentaire est donc un chemin simple et sans
cycle.

Propriétés : Dans un graphe G d'ordre n :

P1. Tout chemin élémentaire est de longueur au plus n-1. Effectivement, Un chemin élémentaire visitant au
plus 1 fois chaque sommet du graphe, sa longueur (nombre d'arêtes) ne peut effectivement excéder n-1.
P2. Le nombre de chemins élémentaires dans le graphe est fini. Effectivement, le nombre de chemins de
longueur est au plus la combinatoire du choix d'une suite de k+1 sommets distinguables
parmi n. Il y en a donc (cf. chapitre de Probabilités):

(27.12)

Les chemins élémentaires sont la restriction naturelle que nous recherchons à la notion de chemin. La
question qui se pose est de savoir si nous perdons quelque chose en ne considérant que les chemins
élémentaires dans un graphe : peut-on toujours remplacer un chemin du graphe par un chemin élémentaire?

Le "lemme de König" répond affirmativement à cette question : de tout chemin nous pouvons extraire un
sous-chemin élémentaire.

L1. S'il existe un chemin entre 2 sommet x et y, alors il existe un chemin élémentaire entre x et y.

Démonstration:

L'idée de la preuve est de choisir un chemin particulier entre x et y et de montrer qu'il est élémentaire. Quel
chemin choisir? Si un chemin comporte un circuit, ce circuit est un détour sur la route menant de x et y. Un
bon candidat à être un chemin élémentaire semble donc être un plus court chemin.

Parmi tous les chemins reliant x à y, choisissons ainsi un chemin comportant le moins
d'arêtes. Supposons par l'absurde que p n'est pas élémentaire. Il existe alors un sommet z apparaissant au
moins 2 fois le long du chemin p. Soient i, j les 2 premiers indices tels que et :

(27.13)

Pour obtenir une contradiction, il suffit de supprimer le cycle entre et . Alors :

(27.14)

est un chemin, reliant x à y. Sa longueur est strictement inférieure à celle de p', ce qui contredit notre choix
de p' comme étant un plus court chemin.

D16. Un graphe est dit "graphe connexe" si et seulement si, il existe au moins un chemin entre chaque paire
de sommets (le chemin n'étant donc implicitement pas nécessairement direct - pouvant passer par un ou
plusieurs sommets intermédiaires).

Remarques: Que se passe-t-il si le graphe G n'est pas connexe? Il apparaît alors comme un ensemble de
graphes connexes mis les uns à coté des autres. Chacun de ces graphes est un sous-graphe particulier de G,
appelé "composante connexe". Il est souvent utile de se placer sur les composantes connexes d'un graphe
pour se ramener au cas d'un graphe connexe.

D17. Un "arbre" ou "arbre couvrant" est un graphe connexe, sans cycle simple (acyclique) et sans boucles (il
s'agit donc d'une forêt connexe). Dans un arbre le nombre d'arrêtes est égal au nombre de sommets - 1.

D18. Un "arbre valué" ou "graphe valué" est un arbre (respectivement un graphe) où les arêtes ont des
valeurs (pondérations) positives. La somme de toutes les valeurs qui sont sur les arêtes parcourues d'un arbre
est appelé alors le "coût d'un arbre valué" (respectivement "coût d'un graphe valué").
Remarque: Les arbres valués sont utilisés dans de très nombreux domaines. Citons les réseaux informatiques
dans lesquels on cherche à optimiser le nombre d'interconnexions entre machines pour éviter les
redondances d'envois de paquets de données ou la gestion de projets (voir l'exemple ci-dessous).

Exemple:

Un excellent exemple pratique de graphe connexe valué et orienté (abrégé sous le terme de "digraphe") est
celui utilisé en gestion de projets pour le calcul du chemin critique. Il s'agit d'un graphe qui représente les
dépendances entre n tâches intermédiaires nécessaires pour réaliser un projet, communément appelé
"diagramme de Gantt" ou en encore "graphe d'ordonnancement". La durée (poids) de chaque tâche est la
valeurs des arcs incidents extérieurement au noeud correspondant. Les arcs représentent les contraintes
d'enchaînement des tâches. Nous ajoutons toujours un noeud (dans le monde de la gestion de projets on
parle plutôt de jalon...) initial et un noeud final. Le premier est relié par un arc de valeur nulle à tous les
noeuds sans prédécesseurs, et tous les noeuds sans successeurs sont reliés au noeud final. Le graphe obtenu
doit évidemment être acyclique.

Un "chemin critique" est un chemin de longueur maximale entre les deux jalons. Il peut éventuellement y en
avoir plusieurs, de même longueur. Toute tâche située sur un chemin critique ne peut être retardée sans
répercussion sur la durée totale du projet. En d'autres termes, sa "marge totale" est nulle (nous disons alors
aussi que sa date de fin/début au plus tôt est strictement égale à sa date de fin/début au plus tard). Par
ailleurs, nous définissons aussi en gestion de projets, la "marge libre" qui indique la durée sur laquelle une
tâche peut glisser sans bouger la tâche successeur. La marge libre se calcule comme la différence entre la
date de début au plus tôt d'une tâche sommé de sa durée et la date de début au plus tard de la tâche
successeur.

Prenons pour l'exemple un projet qui se compose des tâches suivantes :

TÂCHES TÂCHES ANTÉRIEURES DURÉE


A E 3
B K,C 4
C - 3
D E,J 2
E - 2
F G,L 3
G - 4
H A,M,R 2
J E 2
K C 2
L G 5
M C 4
N G 3
R J 2
Tableau: 27.1 - Ordonnancement de tâches

Le graphe orienté valué connexe correspondant à ce tableau une fois la définition du chemin critique
appliqué est le suivant en utilisant les dates de début :
(27.15)

Nous voyons dans ce graphe que les tâches sont critiques.

Un excellent outil d'utilisation de tels graphes est MS Project dont le diagramme correspondant à l'exemple
ci-dessous est :

D19. Une "composante connexe" d'un graphe G est un sous-graphe connexe maximal.

Remarque: Un graphe ne possédant qu'une seule composante connexe est simplement un graphe connexe.
Un sommet isolé (de degré 0) constitue toujours une composante connexe à lui seul. La relation sur les
sommets "il existe un chemin entre ..." est une relation d'équivalence (réflexive, symétrique et transitive).
Les composantes connexes d'un graphe correspondent aux classes d'équivalences de cette relation.

Propriété (triviale) : Un graphe G d'ordre n connexe comporte au moins n-1 arêtes.

D20. Un "cycle" est un chemin simple rebouclant sur lui-même. Un graphe dans lequel il n'existe aucun
cycle possible est dit "acyclique".

Les graphes acycliques non connexes constituent une classe intéressante de graphes, avec des propriétés
remarquables et un nom : les "forêts" (terme très souvent utilisé par les informaticiens réseaux)
Exemple de graphe contenant un cycle
(27.16)

Exemple de forêt (graphe acyclique)


(27.17)

Exemple d'arbre (forêt connexe)


(27.18)

Nous voyons ainsi qu'une forêt est un graphe dont les composantes sont des arbres. Les sommets de degré 1
sont appelées "feuilles" d'un arbre.

Propriétés :

P1. (triviale) Si dans un graphe G tout sommet est de degré supérieur ou égal à 2, alors G possède au moins
un cycle.

Remarque: Cette propriété simple implique qu'un graphe sans cycle possède au moins un sommet de degré 0
ou 1. A l'inverse, nous pouvons lier cette fois l'absence de cycle dans un graphe avec le nombre d'arêtes.

P2. (triviale) Un graphe acyclique G à n sommets possède au plus n-1 arêtes.


D21. Un "cycle eulérien" est un cycle passant une et une seule fois par chaque arête du graphe et revenant au
point de départ (nous verrons plus loin les propriétés que doit posséder un tel graphe pour qu'un tel cycle y
existe)

D22. Un graphe est dit "graphe eulérien" s'il admet un cycle eulérien.

D23. Un "cycle hamiltonien" est un cycle simple passant par tous les sommets du graphe une et une seule
fois. Pour avoir un cycle hamiltonien, le graphe doit être connexe et il ne doit pas y avoir de sommets
pendant.

D24. Un "graphe hamiltonien" est un graphe qui possède un cycle hamiltonien.

Il convient d'ouvrir maintenant une parenthèse (pour les paillettes...) sur le problème le plus connu en théorie
des graphes : les ponts de Königsberg.

Euler (voir page des biographies), aimait à faire une promenade dans sa bonne ville de Königsberg. Il
affectionnait selon la légende tout particulièrement de parcourir les 7 ponts qui enjambent la rivière. L'âge
venant (les connaissances mathématiques aussi...), il se demanda si sans sacrifier à sa promenade, il pouvait
en raccourcir la longueur en ne parcourant chaque pont qu'une seule fois. Ce problème est sans doute l'un
des plus anciens en théorie des graphes : celui de l'existence d'une chaîne passant une et une seule fois par
chaque arête.

(27.19)

La rivière sépare la ville de Königsberg en quatre parties, a, b, c, d. Un pont relie deux de ces parties. Nous
pouvons alors représenter notre problème par un graphe avec quatre sommets, où chaque arête représente
l'un des sept ponts de Königsberg. Sur cet exemple le graphe n'est pas un graphe simple :

(27.20)
Comment savoir si un graphe est eulérien ou non ? Si pour notre problème le graphe obtenu est eulérien, il
faut exhiber un cycle eulérien, ce qui ne semble pas facile. Mais s'il ne l'est pas ? Euler a donné une
caractérisation très forte des graphes eulériens donnée par l'énoncé suivant :

Théorème d'Euler : Un graphe est eulérien si et seulement s'il est connexe et tous ses sommets sont de degré
pair (il y a donc un nombre pair d'arêtes qui arrivent sur chaque sommet dont la moitié d'entre elles servant à
arriver sur le sommet, l'autre à en repartir) sauf au plus deux (ces deux exceptions étant les sommets de
départ et d'arrivée).

De façon plus précise :

- le graphe n'a pas de sommets impair, alors il est eulérien (et la chaîne est donc cyclique)

- le graphe ne peut avoir un seul sommet impair de par la propriété (déjà énoncée plus haut) que dans un
graphe, le nombre de sommets de degré impair est toujours pair.

- si le graphe a deux sommets impairs, ces sommets sont alors les extrémités de la chaîne eulérienne

Corollaire : un graphe ayant plus de deux sommets impairs ne possède pas de chaîne eulérienne.

Avec cette caractérisation (que nous allons démontrer de suite après), les sommets a, b, c, d étant de degré
impair, on sait immédiatement qu'il est impossible de parcourir tous les ponts de Königsberg seulement une
fois au cours d'une promenade.

Démonstration:

1. Supposons qu'un graphe G soit eulérien. Il existe alors une chaîne c parcourant une et une seule fois
chaque arête (jusque là c'est facile). Bien évidemment, dans le cas d'une chaîne, les sommets se situant aux
extrémités de la chaîne sont de degré impair et sont au nombre de deux.

2. Considérons maintenant un sommet x et considérons cette fois-ci un cycle eulérien. Lors du parcours du
cycle, à chaque fois que nous passons par le sommet x, nous sommes au point de départ et nous pouvons
repartir par 2 arêtes non encore parcourues dans le début du nouveau cycle (le chemin peut-être parcouru
dans les deux sens puisque le graph est non orienté). Le sommet x est donc de degré pair et peut être défini
n'importe où dans le cycle, d'où le fait que l'ensemble des sommets sont de degré pair.

3. Réciproquement considérons un graphe G connexe dont tous les sommets sont de degré pair. Nous allons
montrer par induction sur le nombre d'arêtes que G est alors eulérien :

- Si G se réduit à un unique sommet isolé, il est évidemment eulérien. Sinon tous les sommets de G sont de
degré supérieur ou égal à 2. Ceci implique qu'il existe un cycle sur G :

- Considérons le graphe partiel H constitué des arêtes en dehors du cycle . Les sommets de H sont
également de degré pair, le cycle contenant un nombre pair d'arêtes incidentes pour chaque sommet. Par
induction chaque composante connexe de H est un graphe eulérien, et admet donc un cycle eulérien .
Pour reconstruire un cycle eulérien sur G, il nous suffit de fusionner le cycle avec les différents cycles .
Pour cela nous parcourons le cycle depuis un sommet arbitraire; lorsque nous rencontrons pour la
première fois un sommet x appartenant à , nous lui substituons le cycle . Le cycle obtenu est un cycle
eulérien pour G, le cycle et les cycles formant une partition des arêtes.
(27.21)

Remarque: Ce principe de décomposer un graphe en graphes connexes et de les sommer permet de


construire un algorithme récursif permettant de déterminer si un graphe est eulérien ou non.

D25. Deux graphes G et G ' sont "graphes complémentaires" lorsqu'ils vérifient les conditions suivantes :

1. Ils ont le même ensemble de sommets

2. Deux sommets x, y sont voisins dans G ne sont pas voisins dans G '

D26. Un "graphe biparti" est un graphe tel que nous puissions partitionner l'ensemble de ses sommets
en deux classes de sorte que toute arête ait une extrémité dans chacune des deux classes.

Exemple:

Voici donc une représentation d'un graphe biparti K3,3 classique. Il représente le problème fameux de
l'approvisionnement de trois maisons avec trois usines (eau, électricité, gaz) sans droit d'alignement des
services. Nous voyons immédiatement que ce graph est non-planaire.

Remarque: Le graphe biparti complet est un graphe de sommets de sorte que chacune des
deux classes de cardinaux respectifs p, q de sorte que chaque sommet d'une classe soit adjacent à tous les
sommets de l'autre et seulement à ceux-ci.

D27. Deux graphes sont isomorphes s'il existe une bijection f de X dans X ' telle que, pour tous sommets x et
y de G :

x adjacent à y dans adjacent à f(y) dans G '

Nous disons aussi que f est un "isomorphisme de G sur G ' ".


S'il existe une bijection f de X dans lui-même telle que :

x adjacent à y dans adjacent à f(y) dans G

Nous disons alors que f est un automorphisme dans G (par permutation des sommets il existe beaucoup
d'exemples possibles...).

Remarque: Attention ! Parfois nous parlons de graphes équivalents à "un isomorphisme près". Cela signifie
plus clairement, qu'à l'exception d'une et unique violation parmi l'ensemble des arêtes, les graphes sont
isomorphes.

Comme l'isomorphisme dans le cas des graphes va d'un ensemble à un autre de même cardinal n, le nombre
de bijections possibles différentes est (voir le chapitre de Probabilité sur les arrangements) :

n! (27.22)

Cela signifie qu'il existe au maximum n! graphes qui peuvent se regrouper dans une même classe
d'équivalence - mais cependant qu'il n'en existe pas une seule (sans que cela en donne le nombre, nous en
connaissons le majorant). En conséquence, il existe au minimum (minorant) le rapport du nombre total de n
sommets sur le cardinal majoré de la plus grande classe d'équivalence possible (mais pas nécessairement
existante) :

(27.23)

En utilisant la majoration grossière , nous avons :

(27.24)

D'où :

(27.25)

Soit encore :

(27.26)

Ainsi, quand n tend vers l'infini, admet un minorant de l'ordre de .

MATRICE D'ADJACENCE

Au plan formel, un graphe est aussi un ensemble sur lequel nous avons défini une relation binaire,
antiréflexive (aucun élément n'est en relation avec lui-même) et symétrique (si x est en relation avec y, alors
y est en relation avec x). La structure de graphe peut alors sembler particulièrement pauvre.
Mais nous pouvons aussi associer à un graphe G de sommets une matrice carrée M de dimensions
appelée "matrice d'adjacence" du graphe et dont les éléments valent 0 ou 1. En notant le terme
située au croisement de la ligne i (représentant le sommet ) et de la colonne j (représentant le sommet ),
M est défini par :

si et seulement si sont adjacents

De par cette définition et celle du graphe lui-même, il vient que dans une matrice d'adjacence d'un graphe
formel que les éléments diagonaux pour lesquels valent tous 0 et que .

Rappelons qu'une telle matrice est dite "symétrique" (cf. chapitre d'Algèbre linéaire).

Remarque: Nous savons aussi que les graphes sont représentés par des matrices dans le cadre de l'étude des
chaînes de Markov dans le domaine des probabilités (cf. chapitre de Probabilités)

Voyons un exemple à la fois abstrait mais facilement applicable à n'importe à de nombreux domaines de
l'industrie, de la sociologie et de la biologie. Considérons le graphe orienté suivant et observons qu'il n'est
pas antiréflexif ni symétrique:

(27.27)

Nous pouvons représenter ce diagramme sous forme d'un tableau dans lequel nous noterons "1" dans un cas
quand une transition est possible de l'état mentionné en haut de cette case vers celui mentionné au début de
la ligne et "0" sinon:

E1 E4 E2 E3 E5 E7 E6
E1 0 0 0 0 0 0 0
E4 0 0 1 0 0 0 0
E2 1 1 1 1 0 0 0
E3 0 0 1 0 0 0 0
E5 0 0 0 1 0 0 0
E7 0 1 1 1 0 0 0
E6 0 1 1 1 0 0 0
Tableau: 27.2 - Matrice d'adjacence

Il est indispensable de comprendre parfaitement la signification des valeurs se trouvant dans ce tableau!
Mais à ce niveau du site cela ne devrait pas poser de difficulté majeure.
Maintenant évaluons le nombre de manières permettant d'aller:

1. De E2 vers E2 en deux étapes

2. De E3 vers E4 en deux étapes

3. De E2 vers E7 en deux étapes.

Il est facile dans le cas particulier ci-dessus de dénombrer ces possibilités. Mais dans le cas d'un graphe plus
complexe cela devient difficile voir impossible pour un être humain dans un temps raisonnable.

Nous devons faire appel alors au théorème suivant:

Soit un graphe orienté avec sommet de matrice d'adjacence :

(27.28)

Pour tout entier naturel k, alors le nombre de chemins de longueur k du sommet au sommet est donné
par:

(27.29)

où l'exposant sur M dénote la puissance de k de la matrice d'adjacence.

Démonstration:

Effectuons une récurrence sur k:

(27.30)

désigne bien le nombre de chemins allant de à (où i et j peuvent être égaux). Supposons le résultat
vrai pour l'entier k-1, avec comme:

(27.31)

nous avons alors (par construction de la multiplication matricielle):

(27.32)

Par hypothèse de récurrence, est le nombre de chemins de longueur k-1 allant de à et est
nous le savons (par construction) le nombre de chemins de longueur 1 allant de à et en particulier il
est égal à 1 si est une arête du Graphe et 0 sinon!

Donc le produit:

(27.33)
donne pour une valeur de l donnée le nombre de chemins de longueur k allant de à dont la dernière
arête est .

La somme:

(27.34)

donne donc toutes les possibilités (chemins) de longueur k allant de à quelque soit le point de début
de la dernière arête!

C.Q.F.D.

Ainsi, dans notre exemple, la matrice d'adjacence M est donnée par:

(27.35)

est n'est ni symétrique, ni antiréflexive comme nous en avions déjà fait mention.

Donc si nous la mettons à la puissance k, chaque composant donnera toutes les possibilités (chemins)
de longueur k allant de à . Et nous avons:

(27.36)

en utilisant par exemple la fonction PRODUITMAT( ).

Nous avons alors la réponse à nos trois questions en lisant la matrice ci-dessus:

1. De E2 vers E2 en deux étapes nous avons donc trois possibilités.

2. De E3 vers E4 en deux étapes nous avons donc 1 possibilité.

3. De E2 vers E7 en deux étapes nous avons donc 3 possibilités.


Il est possible de gagner un peu de temps dans ce genre de calculs. Si nous notons , la i-ème colonne de la
matrice M, alors:

(27.37)

donnera la i-ème colonne de la matrice M au carré. Et ainsi de suite:

(27.38)

Donc nous obtenons systématiquement le nombre de chemins de longueur k d'un point de départ donné
correspondant à la colonne i.

Cet exemple à une autre approche très intéressante dans certains domaines étudiant le comportement
d'individus dans diverses situations (achats, tourismes, accidents,...).

Si au lieu de noter dans la matrice M le nombre de chemins possibles d'un sommet à l'autre nous notons la
probabilité (la partie) du nombre total d'individus qui partent de ce même sommet pour en arriver à un autre
alors nous avons par exemple (pris au hasard):

(27.39)

En considérant que ces probabilités ne changent pas au cours du temps, nous avons alors une chaîne de
Markov homogène (sans cycles).

Nous voyons que:

1. La somme des probabilités de transitions au départ de chaque sommet (état) doit toujours logiquement
être égale à 1

2. Tout le monde part de la première étape E1

3. Certains stagnent (s'arrêtent) à une certaine étape

4. Ceux qui arrivent à une étape de fin E5, E6 ou E7 y restent et ne reviennent pas sur leurs pas.

Le graphe équivalent devient alors:


(27.40)

En appelant N (au lieu de M pour ne pas confondre) la matrice construite à partir du graphe ci-dessus nous
voyons que si est une des colonnes de la matrice M alors par exemple:

(27.41)

donne la somme des probabilités de transition que ce qui part de E1 arrive en 2 étapes en respectivement
E1(0), E2(0.662), ...

Si nous multiplions ensuite encore une fois:

(27.42)

donne la somme des probabilités de transition que ce qui part de E1 arrive en 3 étapes en respectivement
E1(0), E2(0.691), ... et ainsi de suite. Nous pouvons ainsi savoir qu'elle est la probabilité qu'un individu
arrivant à E2 puisse arriver à un des sommets terminaux (E5, E6 ou E7) en un nombre d'étapes donné.

Remarque: La somme des probabilités des colonnes T obtenues est toujours égale à 1.

CATÉGORIES

L'introduction des catégories à travers la "théorie des catégories" par Eilenberg et MacLane en 1942 avait
pour but de transformer de difficiles problèmes de Topologie en problèmes plus abordables d'algèbre. Plus
tard, la théorie des catégories s'est beaucoup développée, à la fois pour elle-même et pour ses applications
dans les domaines les plus variés des mathématiques (par exemple en géométrie différentielle). Même si une
partie de son développement autonome a parfois été critiquée, les catégories sont maintenant reconnues
comme un langage puissant pour développer une sémantique universelle des structures mathématiques. On
les utilise aussi en logique et plus récemment en physique, et une collaboration fructueuse semble se
développer entre catégoriciens et informaticiens.

Définitions:

D1. Intuitivement une "catégorie" est juste un graphe orienté sur lequel nous nous sommes donné une loi
pour composer des flèches consécutives, vérifiant certains axiomes.

D2. Un "graphe orienté" est formé d'un ensemble d'objets, appelés sommets du graphe, avec des liens entre
eux, représentés par des flèches d'un sommet A vers un sommet B, ce que nous notons .
Nous disons que A est la "source" de la flèche, et B son "but". Il peut y avoir plusieurs flèches de même
source et de même but (nous les disons "parallèles") et il peut y avoir des flèches "fermées", dont la source
et le but sont confondus.

D3. Deux flèches f, g sont dites "flèches consécutives" si le but de la première est en même temps la source
de la seconde:

(27.43)

Nous disons alors qu'elles forment un chemin de longueur 2 de A vers C. Plus généralement, un chemin (de
longueur n) de A vers est une suite de n flèches consécutives :

(27.44)

Une catégorie est donc un graphe dans lequel nous définissons une composition de flèches, associant à tout
chemin (f , g) de longueur 2 de A vers C une flèche du graphe de A vers A, dite composée du chemin, et
notée fg :

(27.45)

Cette composition vérifie les axiomes suivants:

A1. Associativité : Si fgh est un chemin de longueur 3, les deux composés f(gh) et (fg)h que nous en
déduisons sont associatifs. Il s'ensuit qu'à tout chemin de longueur n est aussi associé un seul composé de
sommets (invariance de l'itinéraire).

A2. Identités : A tout sommet A est associée une flèche fermée de A vers A, dite "identité" de A et notée ,
dont le composé avec une flèche de source ou de but A est égal à cette autre flèche.
Remarques:

R1. Les sommets du graphe sont aussi appelés "objets" de la catégorie et ses flèches des "morphismes" (ou
simplement "liens") dans le cadre de la théorie des catégories

R2. Une flèche f est un isomorphisme (cf. chapitre de Théorie Des Ensembles) s'il existe une flèche g
(appelée "inverse") telle que les composés fg et gf soient des identités (cet inverse est alors unique).

Ainsi, une catégorie est formée par des objets (les sommets du graphe) et des liens entre eux (les flèches ou
morphismes), mais l'idée essentielle est de privilégier les liens sur les objets. En fait, le succès des catégories
dans les domaines les plus variés est dû à la richesse des informations sur les objets qui peuvent être
déduites de la seule considération des liens et des opérations sur ceux-ci, quelle que soit la nature et
l'anatomie de ces objets.

Dans les quelques lignes qui suivent, nous expliquerons comment lire les graphes orientés que nous pouvons
rencontrer parfois dans les livres de math. Ceci sera un bon exemple de la théorie des catégories car nous
avons déjà rencontrés de tels graphes sans les décrire dans les chapitres sur les Nombres et la Cryptographie
par exemple.

Pour simplifier nous allons expliquer ces diagrammes lorsque les objets de base sont les ensembles (ce qui
est le cas le plus courant sur l'ensemble du site de toute manière).

Considérons trois ensembles A, B, et C et trois applications :

, et (27.46)

Nous pouvons considérer les applications f, g et h comme des flèches qui relient les objets (ensembles) A, B,
et C pour former un triangle.

(27.47)

Définition (simpliste): Nous disons que le diagramme fléché ci-dessus est "un diagramme commutatif" si
tous les chemins que nous empruntons pour aller d'un objet (ensemble) à un autre représentent la même
application.

Remarque: Il existe deux façons d'aller de A à C . Nous pouvons y aller directement par g ou bien suivre
d'abord f puis h. Ce dernier chemin est représenté par l'application composée (cf. chapitre de Théorie
Des Ensembles). Ainsi le diagramme ci-dessus est commutatif si .

Nous pouvons donc introduire la définition plus formelle :

Définition: Le diagramme ci-dessus est commutatif si .

Remarque: Rappelons que ceci veut dire que pour tout élément .

Nous pouvons compliquer à souhait les diagrammes en considérant plus d'ensembles et de flèches
(applications) les reliant. Par exemple :
(27.48)

Ce diagramme étant commutatif si et seulement si .

Remarques:

R1. Généralement dans la littérature mathématique lorsque de tels diagrammes sont sous-entendu comme
étant commutatifs.

R2. Comme déjà mentionné, les objets de ces diagrammes peuvent plus généralement être des groupes des
anneaux des espaces topologiques etc. Dans ces cas, les flèches ne sont plus des applications quelconques
mais respectivement des homomorphismes de groupes, des homomorphismes d'anneaux, des applications
continues, etc.
28. PRINCIPES

E n introduisant la mécanique nous faisons enfin, après une longue incursion préalable et obligatoire dans
la mathématique, nos premiers pas dans le domaine de la physique théorique... version simplifiée...

Comme nous l'avons déjà dit, la physique est donc une science fondamentale qui a une profonde influence
sur toutes les autres sciences et sur la société humaine et qui a pour objectif d'expliquer le comment et non le
pourquoi (voir l'introduction du site pour plus de détails). Les futurs physiciens et les futurs ingénieurs ne
sont ainsi pas les seuls qui doivent avoir parfaitement compris ses idées fondamentales, mais tous ceux qui
envisagent une carrière scientifique (y compris les étudiants qui se spécialisent en biologie, en chimie et en
mathématiques) doivent avoir acquis la même compréhension.

Le but premier de ce site, nous insistons..., est donc de donner à l'étudiant une vue unifiée de la physique en
présentant ce que nous pensons être les idées fondamentales constituant l'essentiel (minimum minimorum)
de la physique contemporaine.

Jusqu'à présent, la physique est enseignée comme si elle était une juxtaposition de plusieurs sciences, plus
ou moins bien reliées, mais sans aucun réel souci d'unité. Nous avons rejeté ce mode de présentation (pour
l'avoir subi pendant nos études) et avons opté pour une présentation logique et unifiée en faisant au besoin à
chaque fois référence à un chapitre du site qui contiendrait les démonstrations des outils mathématiques
utilisés ou d'une autre théorie physique sous-jacente.

Ce site diffère des supports habituels de physique utilisés à l'université non seulement dans sa conception
mais aussi dans son contenu. Nous y avons inclus des sujets fondamentaux que nous ne trouvons pas dans la
plupart des cours de physique générale et les avons soigneusement développés et démontrés tout en
présentant de la manière la plus pédagogique et rigoureuse possible dans la section de mathématique du site,
les outils nécessaires à leurs développements.

Nous insistons sur le fait que tout étudiant devrait connaître les bases de la logique, l'arithmétique, l'algèbre,
l'analyse vectorielle, le calcul tensoriel, le calcul différentiel et intégral et la géométrie analytique et
différentiel avant toute étude des phénomènes physiques ceci afin de travailler avec rigueur et toute la
compréhension nécessaires aux raisonnements mathématiques qui vont être introduits à partir de maintenant
(les mathématiques sont les fondations de l'immense édifice de la physique théorique). Effectivement, pas
un des outils ou résultats mathématiques présentés jusqu'à maintenant ne sera pas utilisé dans ce qui va
suivre.

Rappelons tout de même que la "physique" est donc la "science exacte/déductive" qui s'occupe de modéliser
mathématiquement au mieux les phénomènes naturels, artificiels, observables ou non-observables. En de
plus brefs termes, nous pourrions parler de description de la "réalité" (quant à savoir s'il s'agit de la réalité
sensible ou vraie...).

Lorsque nous voulons prédire ou décrire un phénomène physique concret, nous pouvons généralement
passer par un modèle analytique où les différentes grandeurs sont exprimées par des indéterminées (valeurs
abstraites) et les lois de la physique par des fonctions, dans la mesure où elles sont connues (le cas échéant,
nous pouvons faire une hypothèse et la tester). En mettant en équation un phénomène physique, nous
traduisons la réalité en une expérience mathématique, virtuelle, selon certaines règles. Nous procédons à une
simulation de la réalité portée sur des grandeurs exprimées.

Les différentes "lois" sont élaborées historiquement très souvent sur des faits d'abord empiriques et sont
vérifiées expérimentalement par la suite (voir la méthode hypotético-déductive dans le chapitre de Théorie
De La Démonstration). En admettant que ces lois soient valables dans le contexte, nous pouvons donc nous
attendre à ce que l'expérience mathématique soit en adéquation avec les faits expérimentaux attendus (ou
inversement). Bien sûr, une expérience virtuelle n'est pas réelle et ne saurait exprimer la réalité dans toute sa
subtilité. Ce n'est qu'un modèle ! Il est donc clair que la prédiction d'un phénomène physique peut diverger
des faits expérimentaux réels.

Remarque: Il convient peut-être de rappeler (faute d'un abus ou d'une mauvaise compréhension que nous
retrouvons trop fréquemment sur les divers forums de l'Internet), qu'une "expérience scientifique" est un
travail pratique de l'étude d'un phénomène qui est reproductible (par des groupes de chercheurs
indépendants) et dont le nombre de reproductions est suffisamment élevé pour s'assurer que les erreurs
(écarts-types) sur les mesures deviennent négligeables.

Il convient aussi de préciser que la plupart des modèles théoriques que nous allons exposer sur ce site et qui
font usage de l'analyse vectorielle peuvent êtres récrits avec les outils de l'analyse tensorielle et basés sur un
raisonnement propre au formalisme Lagrangien (voir chapitre de Mécanique Analytique pour ce savoir ce
qu'est cela...). Or, ces dernières méthodes ne peuvent êtres facilement utilisées pour une introduction simple
à la physique car elles demandent des efforts supplémentaires de la part du lecteur et beaucoup plus de
papier (souvent en tout cas) et de temps pour les mêmes résultats. Cependant, et nous y reviendrons, ces
méthodes sont aujourd'hui incontournables et de première importance dans les différents domaines de la
physique moderne comme la mécanique des fluides, la relativité générale, la physique quantique des
champs, l'analyse de systèmes chaotiques et bien d'autres.

Avant de commencer notre étude des phénomènes physiques, il nous faut définir les concepts sur lesquels se
base la physique théorique. Ainsi, nous verrons dans l'ordre que :

- L'être humain a créé un système d'unités de mesures et de dimensions de bases, dont les grandeurs
représentatives sont arbitraires à un coefficient près, propres à identifier chaque phénomène physique de
façon simple

- Certains concepts indissociables de la vision de notre environnement nous amènent à poser des hypothèses
et des principes (à postuler quelque chose donc..) qui sont relatifs à notre réalité sensible tout en étant
transposable à tout autre réalité de ce type.

- La physique fondamentale nous amène à considérer les fondements de la nature en tant que concepts
mathématiques abstraits. Ainsi, notre observation commune nous donne une vue concrète de l'Univers alors
que la physique théorique nous en donne une vue abstraite.

Nous pouvons alors êtes amenés à nous poser cependant la question suivante : les faits déterminent-ils quelle
théorie est vraie ?

En observant la nature, nous pouvons constater des faites : ce sont des données que nous ne créons pas. Les
astronomes par exemple, constatent la position des objets célestes. Nous comprenons un fait dans la mesure
où il apparaît comme la conséquence de l'ordre des choses décrit par une théorie. Mais les théories gardent
toujours le statut d'hypothèses : même lorsqu'une théorie s'accorde avec l'ensemble des faits observés, cela
ne prouve pas qu'elle soit vraie. En effet, il existe toujours une infinité de théorie possibles qui sont toutes
compatibles avec tous les faites observés. Nous disons alors que les faits "sous-déterminent" les théories :
les faites imposent des contraintes sur les théories, au sens où, seules les théories compatibles avec les faites
observés, sont acceptables. Mais ces contraintes seront toujours assez faibles pour laisser le chois parmi une
infinité de théories.

Bien entendu, les scientifiques n'envisagent réellement qu'un nombre fini de théories, en fonction de ce qui
paraît le plus simple dans un cadre conceptuel donné. A l'époque de Kepler, il existait par exemple trois
grandes théories pour expliquer les mouvements des planètes, toutes compatibles avec les faits observés.
Selon la théorie ptoléméenne, les orbites des planètes sont circulaires ou situées sur un épicycle autour de la
Terre, immobile au centre de l'Univers. Dans la théorie copernicienne, le Soleil occupe le centre, les orbites
des planètes et de la Terre étant situées sur des cercles et épicycles. Enfin, dans la théorie képlérienne, les
orbites des planètes sont des ellipses dont le Soleil occupe un foyer.
SYSTÈMES D'UNITÉS

Définition: Une "grandeur" est l'expression nomologique quantitative d'une propriété, d'un effet ou d'une
quantité abstraite définie par un modèle que présente l'objet ou le phénomène étudié. Une grandeur ne
s'explique pas, elle se décrit par rapport à une définition.

Nous reconnaissons deux types de grandeurs :

- Les constantes : elles possèdent une valeur concrète exprimable numériquement et n'évoluent pas au cours
du phénomène étudié. Ce sont des "grandeurs passives" (nous y reviendrons plus loin et énumérerons
quelques unes d'entre elles)

- Les variables : elles ne possèdent une valeur concrète que dans un état déterminé, mais pas lorsque nous
observons le phénomène physique dans son ensemble. Ce sont des "grandeurs actives". Les différentes
variables décrivant un phénomène physique sont souvent corrélées entre-elles par le biais de fonctions. Nous
disons alors par définition que ces variables ont une "relation fonctionnelle" entre elles.

Remarque: Une grandeur n'a de sens que si elle est "observable", grandeur à laquelle nous associons un
nombre, résultat d'une mesure effectuée à l'aide d'un appareil.

Mesurer une grandeur physique revient à la comparer à une grandeur physique connue, de même nature
(nous disons aussi "de même dimension"), pris comme étalon arbitraire. Le résultat de la mesure s'exprime
ainsi à l'aide de deux éléments :

- un nombre qui est le rapport de la grandeur mesurée à la grandeur étalon

- un nom identifiant l'étalon choisi

Le "nombre" constitue au fait la valeur mesurée de la grandeur et le "nom" est ce que nous appelons
communément "unité physique", ou plus simplement "unité" (l'expression quantitative d'une variable ou
d'une fonction). Ces deux éléments sont indissociables, la valeur mesurée n'a de sens que si nous indiquons
en même temps l'unité choisie. Elle change si nous changeons d'unité.

Remarque: Le passage d'une unité à une autre pour exprimer une même grandeur est appelé "conversion
d'unité".

Définition: Certaines grandeurs peuvent, par souci de simplification d'écriture, s'exprimer à partir d'autres
grandeurs. Nous disons alors que la nouvelle grandeur "dérive" des unités de bases. Nous disons également
que deux grandeurs physique sont des "grandeurs homogènes" si elles sont de même nature physique ou si
nous pouvons les exprimer toutes les deux dans la (les) même(s) unité(s) de base.

Ainsi, après un longue période de réflexion, et en dernière analyse le monde physique semble pouvoir se
ramener aux concepts d'espace, d'énergie et de temps.

Ainsi apparaît donc une autre définition possible de la physique :

Définition: La physique est la science des propriétés et des relations mutuelles dans le temps de la matière et
de l'énergie à un facteur de charge près.

Notre rôle consiste donc à donner une description de ces propriétés et relations sous forme de lois ou
relations physiques appliquées aux phénomènes observés, dans le cadre d'une théorie fournissant les
éléments de prévision.
Les grandeurs physiques ne sont pas toutes indépendantes les unes des autres mais reliées entre elles par
certaines lois ou relations. Il serait alors peu raisonnable, quoique possible, de choisir une unité particulière
pour chacune des grandeurs physiques sans tenir compte de leurs relations mutuelles.

Constituer un système cohérent d'unités revient donc à déterminer un nombre minimum d'unités qui
établissent les règles de construction de ces relations mutuelles. Ce sont les "unités fondamentales". A partir
des lois physiques et les relations entre les différentes unités fondamentales, nous déduisons les unités des
autres grandeurs qui deviennent alors par souci de simplification d'écriture les "unités dérivées".

Les unités fondamentales sont au nombre de quatre (nous le justifierons plus loin): la longueur (mètres), la
masse (kilogrammes), le temps (secondes), la charge électrique (coulombs). Le système ainsi constitué est le
système M.K.S.C. (l'auteur assume le choix d'ajouter le Coulomb).

Les unités du système M.K.S.C sont donc :

1. Le mètre [m], pour la longueur L (nous avons déjà défini le concept de longueur dans le chapitre
Géométrie mais nous y reviendrons à nouveau plus loin)

2. Le kilo [kg], pour la masse M (nous reviendrons plus loin sur la définition du concept de masse)

3. La seconde [s], pour le temps T (le temps n'est pas mesurable en soi mais l'intervalle de temps est un
concept arbitraire tout à fait valable - nous reviendrons également plus loin sur la définition de ce concept)

4. Le coulomb [C] utilisé comme unité élémentaire de charge électrique q (ne dérive d'aucune unité connue
à ce jour - nous reviendrons également plus loin sur la définition de ce concept).

Remarques:

R1. Le concept d'angle (en radians, degrés ou stéradian - voir les textes traitant de la trigonométrie plane,
trigonométrie sphérique et géométrie plane dans la section de géométrie) n'a pas d'unité puisqu'il s'agit par
définition d'un rapport de longueurs (pour le radian ou le degré d'angle) ou de surface (pour le stéradian). Il
convient donc de l'assimiler à une unité dérivée non pas comme unité fondamentale. Cependant, en
physique, nous avons pris pour habitude d'indiquer sa présence dans les équations dimensionnelles afin
d'aider à la relecture de certaines de celles-ci et de savoir que leur résultat est donné par rapport à une unité
d'angle (sinon cela pourrait générer des erreurs d'interprétation hasardeuses pour ceux qui utilisent des
équations sans en avoir vu la démonstration...).

R2. Le lecteur remarquera que toutes les unités du système M.K.S.C. sont des "grandeurs extensives" c'est-
à-dire que dans un système sur lequel nous effectuons une mesure, celles-ci sont additives (contrairement
aux grandeurs intensives). Nous reviendrons plus en détails sur les grandeurs extensives et intensives en
grande partie lors de notre étude de la thermodynamique (voir chapitre du même nom).

R3. C'est une énorme chance d'avoir un système homogène tel que celui que nous avons au 21ème siècle.
Effectivement, pour l'anecdote, en 1522 rien que dans la région de Baden (Allemagne) il y avait 112 unités
de mesures différentes de longueur et 92 de surfaces.... c'est dire... le cauchemar!

Ces précisions étant faites, toute grandeur physique connue à ce jour peut être exprimée à l'aide d'une unité
qui s'exprime comme le produit de cinq facteurs dimensionnels et d'un facteur d'échelle arbitraire K :

(28.1)

où les nombres appelés respectivement "ordre de masse", "ordre de longueur", "ordre de temps",
"ordre d'angle" et "ordre de charge" sont des entiers positifs, négatifs ou nuls.
L'expression précédente s'écrira sous la "forme canonique" définie par les étalons:

(28.2)

l'angle n'ayant pas d'unité, nous ne le notons plus (mais il s'y trouve implicitement).

Toute grandeur physique X s'exprime donc comme:

(28.3)

où x est la valeur de la grandeur physique dans le système d'unité associé au facteur d'échelle K. Il existe
plusieurs couples (x, K) possibles, mais nous aurons toujours:

(28.4)

où la constante est la valeur de la grandeur physique lorsque nous choisissons de l'exprimer dans le
système M.K.S.C.

Donc deux grandeurs physiques et sont homogènes si et seulement si les quadruplets:

(28.5)

qui leur sont attachés sont égaux:

(28.6)

Il découle, de ce que nous avons dit, que :

- La somme ou la différence d'un nombre quelconque de grandeurs n'a un sens que si ces grandeurs sont
homogènes et le résultat aura donc les mêmes unités que les opérandes.

- Le produit ou la division de plusieurs grandeurs a pour unité le produit, respectivement la division des
unités des opérandes.

Remarques:

R1. Les unités des différentes grandeurs ont un côté pratique mais pas infaillible en physique théorique: elles
permettent cependant au physicien de vérifier si une relation démontrée entre deux grandeurs est au moins
correcte au niveau des unités. Nous appelons ce genre de démarche une "analyse dimensionnelle" (nous
vous conseillons d'aller voir la démonstration de la loi de Stokes dans le chapitre de Mécanique Des Milieux
Continus pour un très bon exemple d'application).

R2. Le développement des sciences a conduit la conférence générale des poids et mesures à introduire
quelques unités supplémentaires pratiques (mais pas nécessaires) telles que: la température exprimée en
"Kelvins" (qui dérive de l'énergie moyenne - mouvement brownien), la quantité de matière exprimée en
Moles, l'intensité de courant exprimée en Ampères et l'intensité lumineuse exprimée en Candelas. Ainsi, le
Système International (S.I.) actuel, composé de sept unités de base (centimètre, gramme, seconde, kelvin,
candela, mole et l'ampère) et de dix-sept unités dérivées suggère-t-il que sept unités sont nécessaire décrire
toute la physique ? En fait non ! Comme l'analyse de Gauss le suggère, parmi les sept unités de base, quatre
- le Kelvin, le Candela, la Mole et l'Ampère - peuvent être dérivées des trois autres. L'introduction de sept
unités de base représente un équilibre pragmatique des expérimentateurs qui ont besoin d'unités adaptées à
leurs mesures, et l'idéalisme des théoriciens, dont le but est de réduire l'arbitraire, la redondance, à son
minimum.

ANALYSE DIMENSIONNELLE

L'analyse dimensionnelle est donc un domaine de la physique qui concerne les unités des grandeurs.
Notamment, le fait que les unités soient relativement arbitraires fait que toute équation valable de la
physique est homogène : quelque chose qui se mesure en mètres par seconde ne peut pas être égal à quelque
chose qui se mesure en kilogrammes par mètre. C'est un moyen très prisé et très efficace de vérifier ses
propres calculs (et celui des autres...).

La puissance prédictive de cette approche valable dans des cas d'études simples a amené certains physiciens
à énoncer le "principe zéro" de la physique ainsi : Ne jamais faire de calculs avant d'en connaître le résultat.

Cet énoncé, qui peut sembler a priori paradoxal, signifie concrètement : Ne pas se lancer (si possible...) dans
un calcul compliqué sans avoir trouvé au préalable la forme qualitative du résultat avec l'analyse
dimensionnelle.

Cette forme qualitative est nommée traditionnellement "l'équation aux dimensions" et représente donc la
formule qui permet de déterminer l'unité dans laquelle doit être exprimé le résultat d'une recherche. C'est une
équation de grandeurs, c'est-à-dire dans laquelle on représente les phénomènes mesurés par un symbole
d'unité comme ceux que nous avons vus dans les paragraphes plus haut.

Exemple:

Voyons donc un exemple de légende souvent cité dans divers magazines ou livres de vulgarisation:

L'analyse dimensionnelle a permis à Geoffrey Ingram Taylor d'estimer en 1950 l'énergie dégagée par
l'explosion d'une bombe atomique, alors que cette information était classée top secret. Il lui a suffit pour cela
d'observer sur un film d'explosion, imprudemment rendu public par les militaires américains.

Le physicien Taylor suppose pour arriver à ce résultat que le processus d'expansion de la sphère de gaz
dépend au minimum des paramètres du temps t, de l'énergie E dégagée par l'explosion et de la masse
volumique de l'air .

L'analyse dimensionnelle le conduit alors pour le rayon de la sphère de gaz à l'instant t à :

(28.7)

où k est une constant sans dimensions.

Et par tâtonnement nous trouvons rapidement tel que :

(28.8)

Effectivement :

(28.9)

Taylor trouve alors la loi de dilatation du champignon atomique :


(28.10)

Si nous connaissons r et t à partir d'un film, et, k étant supposée de l'ordre de l'unité et étant connue, nous
obtenons finalement :

(28.11)

ce qui reste une grossière approximation. Mais arriver à un résultat pareil (d'ordre de grandeur) avec
l'artillerie lourde de la physique théorique nécessiterait beaucoup plus de temps et de feuilles de calculs.

NOTATIONS SCIENTIFIQUES

Il est fréquent en physique que les grandeurs manipulées soient très grandes et lourdes à écrire. Par exemple,
il est toujours embêtant d'avoir des grandeurs comme 8'000'000'000 ou 0.000'000'000'1.

Alors nous pouvons adopter une convention d'écriture en puissance de dix dite "notation scientifique" telle
que :

- 8'000'000'000 s'écrive (neufs zéros après le "8")

- 0.000'000'000'1 s'écrive (10ème position après la virgule) ou (neufs zéros après la virgule)

Une écriture encore plus simplifiée consiste à utiliser le tableau ci-dessous mais uniquement si nous avons à
travailler avec des grandeurs physiques :

Préfixe Facteur Symbole Préfixe Facteur Symbole


exa 1018 E déci 10-1 d
15 -2
péta 10 P centi 10 c
12 -3
téra 10 T milli 10 m
giga 109 G micro 10-6
méga 106 M nano 10-9 n
3 -12
kilo 10 k pico 10 p
hecto 102 h femto 10-15 f
1 -18
déca 10 da atto 10 a
Tableau: 28.1 - Préfixes des grandeurs d'ordre

Par exemple, 10'000'000 grammes notés conventionnellement:

10'000'000 [g] (28.12)

sera écrit en notation scientifique:

(28.13)

mais en écriture physique (selon le tableau ci-dessus):

ou (28.14)
Définition: Nous disons que est "l'écriture scientifique" d'un nombre positif A si a est un nombre
décimal (c'est-à-dire que a s'écrit avec un seul chiffre autre que zéro avant la virgule), n est un
nombre entier relatif.

Exemple:

(28.15)

L'avantage de cette écriture est de donner un ordre de grandeur de A compris entre 2 puissances consécutives
de 10 tel que :

(28.16)

Si de plus, comme il arrive souvent, si nous utilisons des unités de physiques de multiple de 1'000 cela
permet de placer ces grandeurs entre 2 unités dérivées consécutives.

Remarques:

R1. Si nous avons un chiffre de la forme 154'434'347'786, fréquemment et selon le contexte, nous nous
permettons de tronquer ce dernier et nous écrivons alors fréquemment avec une précision de trois chiffres
après la virgule ainsi ce dernier nombre devient ce qui est plus simple à écrire mais dangereux
à manipuler à cause de l'erreur induite par la troncation. Nous renvoyons à ce sujet le lecteur dans le chapitre
de Statistiques à la lecture de la partie traitant des erreurs relatives.

R2. Pour les mathématiciens la notation scientifique n'est qu'une écriture d'un nombre parmi d'autres et le
choix de cette écriture est en relation avec le contexte du problème. Evidemment ces "nombres résultats"
obtenus peuvent être des nombres purs et durs solution de problèmes abstraits mais aussi de problèmes
concrets issus d'expériences, de mesures etc.. et là nous nous rejoignons les physiciens.

TEMPS

Définition: Le "temps" est une variable d'état (et non un "mesurable") et donc une notion impalpable mais
cependant rigoureusement définie. Il s'agit aussi d'un outil mathématique qui permet de mettre en équation
l'observation de phénomènes physiques (observables) et d'en tirer ainsi un certain nombre d'informations.
Cet outil existe car il existe des êtres pour observer (et mesurer) la nature et ses changements (principe
socratique) et de la matière et du mouvement pour qu'il y ait ces changements.

Remarques:

R1. Le temps (et ses intervalles) étant un concept arbitraire, il est symétrique c'est-à-dire que tout
phénomène observé enregistré peut dans l'imaginaire du temps inversé retrouver ces conditions initiales.
Nous parlons alors de "symétrie du temps" (pour l'instant il n'a jamais été à notre connaissance démontré ou
ne serait-ce observé, que le temps peut subir une "brisure de symétrie").

R2. Le temps n'est ni une grandeur extensive ou intensive. On ne peut ni additionner le temps des éléments
d'un système physique pour avoir la durée totale de celui-ci (de plus cette question n'a pas de sens) ni la
pondérer. Cependant on peut additionner les intervalles de temps qui décrivent l'évolution d'un système!

Nous représentons très souvent en physique le temps (compris dans un intervalle) par une flèche (axe)
horizontale représentant le sens du temps. Comme le temps est une notion purement utilitaire, nous pouvons
alors définir chaque instant du temps comme étant le temps zéro noté . Cette notion est très utilisée en
physique car souvent la seule chose qui intéresse les physiciens est la différence de temps notée (de par
l'utilisation du calcul différentiel et intégral).
Démontrons maintenant que la référence temporelle est indépendante du choix pour observateur au repos.
Soit un temps noté par la lettre t, nous avons alors :

(28.17)

où t' est la base arbitraire (non nécessaire) lorsque nous comparons une différence temporelle.

L'intervalle de temps est donné par une mesure étalon qui ne peut être qu'un mouvement au mieux
parfaitement périodique (qui se répète dans le temps). Ainsi, les premiers moyens de mesure du temps ont
été le jour et la nuit, les positions du soleil et de la lune dans le ciel, le mouvement du pendule, la détente de
ressorts, la période de dégénérescence du césium 137 ou encore les systèmes binaires d'étoiles massives.
Bref, tant qu'un système observable produit un phénomène périodique stable et suffisamment petit pour que
toute mesure physique puisse y être réduite, celui-ci peut être utilisé comme étalon d'intervalle temporel.

Définitions:

D1. Un "événement" consiste à donner une signification à un point de l'espace-temps

D2. Deux événements sont dits "événements simultanés", s'ils sont même valeur de la coordonnée
temporelle

D3. Nous appelons "coïncidence" la simultanéité de deux événements en un même point de l'espace. La
coïncidence est un fait absolu, indépendant du choix du référentiel (c'est en fait un cas particulier du principe
de conservation de la causalité. Deux événements coïncidant dans un repère peuvent être cause à effet l'un
de l'autre (et réciproquement), et cette possibilité est conservée dans le nouveau repère.)

LONGUEUR

Définition: Le concept de "longueur" x est donnée par l'information qui donne le chemin parcouru par un
objet dans un intervalle de temps donné.

Remarques:

R1. S'il n'y avait pas de matière dans l'Univers il n'y aurait pas de notion de mouvement et donc de longueur
parcourue et aussi comme nous l'avons déjà fait remarquer, de temps (et encore... c'est sans considérer
certains résultats de la physique quantique que nous démontrerons dans le chapitre qui lui est consacré).

R2. La longueur est une grandeur extensive (additive). Effectivement, la longueur totale d'un système est la
somme des grandeurs.

Comme pour le temps il n'y a pas d'origine absolue de mesure des longueurs (il n'existe pas de point zéro
dans l'Univers comme le postule la théorie de la relativité) et les physiciens s'intéressent de toute façon plus
particulièrement aux différences de chemin parcouru par rapport à une origine comme ils le font pour le
temps.

Ainsi, de manière identique au temps, nous avons pour un observateur au repos qui observe un point
matériel en mouvement:

(28.18)

où x' est une base arbitraire mathématiquement inutile lorsque nous comparons une différence de position
dans une différence de temps d'un point matériel.
Si un point matériel se situe dans un espace à trois dimensions spatiales (cas le plus fréquent en mécanique
classique) dont nous avons arbitrairement choisi l'origine O, nous notons la position de ce corps par sa
distance en longueur x, largeur y et hauteur z (appelées "coordonnées cartésiennes") par une flèche
imaginaire dit "vecteur" (cf. chapitre de Calcul Vectoriel) reliant le point d'origine arbitraire du référentiel
spatial au point intéressé de la façon suivante :

(28.19)

Remarque: La flèche au-dessus du signifie bien évidemment qu'il s'agit d'un vecteur.

La notation:

(28.20)

est une notation simplificatrice utilisée fréquemment en physique et qui devrait s'imposer dans les petites
classes (attention le fait que les chiffres soient abaissés en indice ne signifie absolument pas ce que sont des
composantes covariantes - voir chapitre de Calcul Tensoriel de la section d'Algèbre - il s'agit juste d'une
convention simplificatrice d'écriture). Cependant sur le présent site Internet nous passerons de l'une à l'autre
des notations en fonctions des besoins et des traditions en vigueur (ce sera donc à vous de faire attention à ne
pas confondre).

La matrice:

(28.21)

est quant à elle le tenseur métrique d'un espace pré-euclidien canonique à signature positive (cf. chapitres de
Calcul Vectoriel et Calcul Tensoriel). Ceci constitue un cas particulier en physique théorique mais
cependant un cas très fréquent d'étude en mécanique classique (il faut commencer par des espaces simples
avant d'aller plus loin...).

Nous reviendrons plus en détails sur ces concepts lors de notre étude des espaces ponctuels plus loin.

MASSE

Définitions:

D1. La "masse" m d'un corps est dans un système fermé une quantité qui se conserve et qui caractérise
l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais de différentes forces (attractives).

Remarques:

R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de masse. L'apparition de
masse ne peut être due qu'à une action extérieure. Une autre façon de dire la même chose est que la masse
totale contenue dans l'Univers est constante.

R2. La masse est une grandeur extensive (additive). Effectivement, la masse totale d'un système est égale à
la somme des masses qui le compose.
En toute rigueur, nous devrions définir également :

D2. La "masse grave" (ou "masse de gravitation") qui est l'amplitude avec laquelle un corps matériel
interagit avec un champ de potentiel (selon la loi de gravitation de newton - voir chapitre de Mécanique
Classique).

D3. La "masse inerte" (ou "masse inertielle") qui est l'amplitude qui caractérise la résistance avec laquelle un
corps en translation est susceptible de changer de vitesse (c'est-à-dire celle intervenant dans la deuxième loi
de Newton - voir chapitre de Mécanique Classique)

Remarques:

R1. Des expériences ont toutefois prouvé que ces deux masses étaient proportionnelles au dix-milliardième
près. Cette identité expérimentale appelée "principe d'équivalence galiléen" est à la base d'un des postulats
de la relativité générale (cf. chapitre de Relativité Restreinte).

R2. Contrairement aux charges électriques (voir plus loin de la définition de la "charge"), qui caractérisent
l'amplitude d'interaction par la force électrique, il n'existe que des masses positives. Ainsi les charges
électriques peuvent se repousser aux mêmes titres qu'elles peuvent s'attirer.

De plus, la masse est étant une propriété additive (donc "extensive" comme nous l'avons déjà dit) de la
matière : pour un système de n points matériels de masse , la masse totale est :

(28.22)

De même, pour une distribution continue (voir plus loin au cas où pour un rappel du concept de distribution
continue) en volume de la masse d'un système de volume total V :

(28.23)

où est la "masse volumique" ou "densité volumique" du système au point A, c'est-à-dire la masse d'un
élément de matière, centré autour de A, de dimensions caractéristiques devant celles du système, mais
grandes devant les distances interatomiques dans ce système ( est la masse volumique du système au
point repéré par ) définie par :

(28.24)

Remarques:

R1. L'intégrale est une intégrale triple (sur les trois dimensions de l'espace), mais elle pourra être ramenée à
une intégrale simple en exploitant les symétries du système pour choisir judicieusement les volumes
élémentaires d'intégration.

R2. Le calcul de la masse lors d'une distribution non continue (discrète) de matière doit être fait avec les
composantes vectorielles calculées séparément. Une fois ce travail effectué, il convient d'en prendre la
norme.
R3. La masse volume est une grandeur intensive. Effectivement, la densité d'un système physique
n'est pas égale à la somme de ces densités (c'est du bon sens!). Le lecteur remarquera que cette grandeur
intensive qu'est la masse volumique est égale au rapport de deux grandeurs extensives.

Définitions:

D1. Nous disons qu'un système est un "système homogène" si sa masse volumique, surfacique, linéique
(voir définition ci-dessous) est constante.

D2. Nous disons qu'un système est un "système isotrope", si ses propriétés physiques sont identiques en tout
point.

Nous définissons aussi parfois la "masse surfacique" (ou "densité surfacique" de masse) pour des systèmes
quasiment sans épaisseur et une "masse linéique" (ou "densité linéique" de masse) pour des systèmes de
section négligeable devant leur longueur. Nous avons alors (S étant une surface et s une abscisse curviligne)
:

ou (28.25)

avec dans le cas général :

(28.26)

Remarque: Souvent, dans la littérature, ainsi que dans le présent site internet, la masse volumique est notée
simplement , la masse surfacique , et la masse linéique .

Définition: Avec ce qui précède, nous pouvons définir la "densité" comme étant la quantité d'éléments tous
identiques et dénombrables par unité de volume, surface ou linéique.

ÉNERGIE

Nous ne savons pas ce qu'est exactement l'énergie (notée sous sa forme générale par la lettre E dans les
petites classes) mais nous en connaissons ses effets. Ce que nous savons cependant, c'est qu'il en existe
plusieurs formes dont voici une liste des plus connues :

- "L'énergie travail" qui est l'énergie créée par l'application d'une force sur un corps lui donnant une certaine
énergie cinétique (cf. chapitre de Mécanique Classique) ou énergie potentielle (qu'elle soit gravifique,
électrostatique comme démontré en mécanique classique ou électrodynamique).

- "L'énergie chaleur " qui est une forme d'énergie déterminée par le nombre de micro-états d'un système (cf.
chapitre de Thermodynamique)

- "L'énergie de masse" qui est l'énergie contenu dans une certaine quantité de masse (cf. chapitre de
Relativité Restreinte)

De ces trois énergies découlent une grande quantité de familles d'énergies dérivées dont les plus connues
sont : l'énergie nucléaire, l'énergie électrique, l'énergie solaire, l'énergie éolienne, l'énergie mécanique,
l'énergie gravifique, l'énergie des marées, l'énergie électromagnétique, l'énergie fossile, l'énergie
hydraulique, l'énergie corporelle, etc.

Remarques:
R1. La masse et l'énergie sont équivalentes comme nous le verrons lors de notre étude de la relativité
restreinte (cf. chapitre de Relativité Restreinte), si nous définissons un système d'unités telles que la vitesse
de la lumière vaille (convention très utilisée par les physiciens dans la recherche de pointe).

R2. L'énergie au même titre que la masse est une grandeur extensive.

Nous pouvons quand même tenter de nous demander ce qu'est l'énergie exactement?

Définition: "L'énergie" est l'effet d'une cause d'un changement ou de la conservation des propriétés d'un
système. Cette cause étant non nécessairement déterministe et en moyenne nulle et conservative dans un
système fermé.

Remarques:

R1. La vitesse, le potentiel, le nombre de micro-états peuvent êtres considérés comme l'acquisition d'une
quantité d'informations sur un système.

R2. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée d'énergie. L'apparition
d'énergie ne peut être due qu'à une action extérieure. Une autre façon de dire la même chose est que la
l'énergie totale contenue dans l'Univers est constante.

CHARGE

Il est difficile de dire quelque chose sur la charge électrique (vous pouvez chercher une définition sur
l'internet vous verrez...). Cependant si nous nous référons à l'approche de Yukawa (cf. chapitre de Physique
Quantique Des Champs) nous pouvons tenter d'en donner la définition suivante :

Définition: Une "charge électrique" est une propriété conservative qu'a une particule se situant dans un
champ de potentiel à symétrie sphérique à interagir avec la source de ce champ dans le cadre de l'échange
d'un quantum d'interaction (le photon en l'occurrence créé par les fluctuations quantique du vide en présence
d'une masse) définissant un champ vectoriel de type Coulombien.

Remarques:

R1. Dans un système isolé, il ne peut pas y avoir création ou destruction spontanée de charges. L'apparition
de charges ne peut être due qu'à une action extérieure. Une autre façon de dire la même chose est que la
charge totale contenue dans l'Univers est constante.

R2. La charge est une grandeur extensive. Effectivement, la charge totale d'un système physique est égale à
la somme algébrique des charges qui la constitue.

Ou une autre définition similaire à la masse :

Définition: La "charge électrique" q d'un corps est dans un système fermé une quantité qui se conserve et
qui caractérise l'amplitude avec laquelle ce corps interagit avec d'autres corps par le biais des forces
électrostatiques et magnétiques.

Contrairement à la masse, il existe des charges électriques positives et négatives. La charge électrique reste
cependant une propriété additive (extensive). Ainsi, pour un système de q particules de charge
, la charge totale est :

(28.27)
et est donc aussi comme la masse, une propriété extensive.

De même, pour une distribution continue en volume de la charge d'un système de volume total V (nous
notons les densités de charge de manière identique si l'ambiguïté n'est pas possible de la même manière que
pour la masse):

(28.28)

où est la "densité volumique de charges" du système au point A, c'est-à-dire la charge d'un élément de
matière, centré autour de A, de dimensions caractéristiques devant celles du système, mais grandes devant
les distances interatomiques dans ce système ( est la densité volumique de charge du système au point
repéré par ) définie par :

(28.29)

Remarques:

R1. L'intégrale est une intégrale triple, mais elle pourra être ramenée à une intégrale simple en exploitant les
symétries du système pour choisir judicieusement les volumes élémentaires d'intégration.

R2. Le calcul de la charge lors d'une distribution non continue (discrète) de matière doit être fait avec les
composantes vectorielles calculées séparément. Une fois ce travail effectué, il convient d'en prende la
norme.

R3. La charge volumique est une grandeur intensive. Effectivement, la densité de charge d'un d'un
système physique n'est pas égale à la somme de ces densités (c'est du bon sens!). Le lecteur remarquera
encore une fois que cette grandeur intensive qu'est la masse volumique est égale au rapport de deux
grandeurs extensives.

De même que pour la masse, nous pouvons donner les définitions suivantes :

D1. Nous disons qu'un système est "système homogène" si sa charge volumique, surfacique, linéique (voir
définition ci-dessous) est constante.

D2. Nous disons qu'un système est "système isotrope", si ses propriétés physiques sont identiques en tout
point

Nous définissons aussi parfois la "densité surfacique de charge" (ou "densité de surface" de charge) pour des
systèmes quasiment sans épaisseur et une "charge linéique" (ou "densité linéique" de charge) pour des
systèmes de section négligeable devant leur longueur. Nous avons alors (S étant une surface et s une abscisse
curviligne) :

ou (28.30)

avec :

(28.31)
Remarque: Souvent, dans la littérature, ainsi que dans le présent site internet, la densité volumique de
charge est notée simplement , la densité surfacique de charge , et la masse linéique .

DISTRIBUTIONS

Définitions:

D1. Une masse ou une charge sont dites "ponctuelles" si elles occupent un volume dont les dimensions sont
très inférieures aux distances d'observations.

Remarque: La charge élémentaire est une excellente approximation d'une charge ponctuelle étant sa petite
taille dont le rayon classique est de l'ordre du femtomètre, ce qui est bien sûr très petit devant les dimensions
d'observation classiques.

D2. Si nous considérons N corps de charge ou masse finies dans un volume V. Si ce volume est supposé
suffisamment grand pour que la distance moyenne entre les corps soit très supérieur à la dimension de ceux-
ci, nous avons affaire à une "distribution discontinue" ou "distributions discrète" de ces corps (nous parlons
parfois aussi de distribution non-uniforme).

Les calculs sont impossibles à faire en partant d'une distribution discrète car, en général, le nombre de corps
en considération est très élevé lorsque le volume est de dimension macroscopique. Dans ce cas, il faut
introduire un autre type de distribution.

D3. Si nous considérons N corps de charge ou masse finies dans un volume V. Si la répartition des éléments
est telle qu'il n'y pas de "trous" entre chacun d'eux (en d'autres termes : chaque élément est serré contre un
autre) alors nous avons affaire à une "distribution continue". Une distribution continue peut alors être décrite
par une fonction qui représente la manière dont les éléments se répartissent dans un volume, surface ou
ligne.

Remarques:

R1. Nous pouvons préciser parfois, comme nous en avons déjà fait mention lors des définitions de la masse
ou de la charge que les distributions définies précédemment peuvent être de type volumique, surfacique ou
linéique. Si cela n'est pas précisé, c'est que l'information est implicitement triviale.

R2. Le terme "continue" dans "distribution continue" provient du fait que nous intégrons la fonction d'où la
nécessité qu'elle soit continue (au sens de Riemann ou de Lebesgue suivant les cas... - voir chapitre de
Calcul Différentiel Et Intégral).

CONSTANTES

La physique à l'opposé des mathématiques est une science exacte dans le sens que sa vérification et sa
validité se base et est mise constamment à l'épreuve par des faits expérimentaux.

Comme l'être humain a du choisir arbitrairement un système de mesures, certaines lois établies
théoriquement à l'aide de propriétés de la matière ne sont souvent exactes qu'à un facteur multiplicatif
constant près de normalisation relativement à ce système de mesure. Apparaissent alors dans les équations
de la physique des constantes dont l'existence n'est due qu'à ce système de mesure mais cependant ce n'est
pas toujours le cas, certaines constantes bien qu'en adaptant le système de mesure n'égaleront (du moins il
semblerait) jamais l'unité.

Il existe de nombreuses constantes en physique (une infinité au fait) mais certaines ont un statut particulier
dans le sens qu'elles ne peuvent se déduire d'autres constantes. Nous en proposons ici la liste et les valeurs
(non exactes) et nous le retrouverons fréquemment lors de nos développements dans ce site.
Remarque: Les constantes sont données pour certaines au temps auquel le lecteur les lit (...) car selon
certaines théories, les valeurs ne sont pas tout à fait fixes.

CONSTANTES UNIVERSELLES

Les valeurs listées ci-dessous sont des valeurs dont les scientifiques ont remarqué qu'elles semblaient (...)
constantes et indépendantes de tous paramètres utilisés, et que la théorie suppose donc réellement
constantes.

Constante gravitationnelle

Température absolue

Vitesse (célérité) de la lumière

Nombre d'Avogadro

Charge de l'électron

Constante de Planck

Constante de Boltzmann

Permittivité du vide

Susceptibilité magnétique

Pi

Constante de Dirac (utilitaire)

Constante de Coulomb
(utilitaire)

Tableau: 28.2 - Constantes universelles

Remarques:

R1. La célérité de la lumière, la permittivité du vide et la susceptibilité magnétique du vide se déduisent les
uns des autres par une relation que nous lors de notre étude des équations de Maxwell (cf. chapitre
d'Électrodynamique)

R2. La constante de Dirac est aussi parfois appelée "constante de Planck réduite".

R3. La constante de Boltzmann peut être calculé comme le rapport de la constante molaire des gaz R (voir
plus bas les constantes chimiques) sur le nombre d'Avogadro N (cf. chapitre de Mécanique Des Milieux
Continus).

Il existe d'autres constantes d'ordre pratique qui se déterminent théoriquement et dont la valeur sera utile à
tout ingénieur ou physicien qui souhaiterait appliquer dans la pratique certaines des relations qui seront
démontrées sur ce site :

CONSTANTES PHYSIQUES
Définition: Une "constante physique" est une quantité physique dont la valeur numérique est fixe.
Contrairement à une constante mathématique, elle implique directement et toujours une grandeur
physiquement mesurable.

Masse de l'électron (au repos)

Masse du neutron (au repos)

Masse du proton (au repos)

Constante de structure fine

Quantum de flux magnétique

Constante de Stefan

Constante de Stefan-
Boltzmann
Rayon classique de l'électron

Impédance du vide

Magnéton de Bohr

Constante de Rydberg

Rayon de Bohr

Electron-Volt

Accélération gravitationnelle
terrestre moyenne

Pression standard
Tableau: 28.3 - Constantes physiques

CONSTANTES PHYSICO-CHIMIQUES

Les constantes physico-chimiques sont des constantes physiques que l'on retrouve plus particulièrement
dans l'ensemble des domaines ayant trait à la chimie.

Constante molaire des gaz

Constante de Faraday

Volume molaire

Unité de masse atomique


Tableau: 28.4 - Constantes physico-chimiques
Remarque: Le lecteur intéressé par les propriétés des éléments chimiques peut télécharger le tableau
périodique des éléments proposé dans la rubrique de téléchargement du site.
CONSTANTES ASTROPHYSIQUES

Le tableau suivant contient les valeurs des constantes et paramètres couramment utilisés en astrophysique et
aussi plus particulièrement en cosmologie.

Constante de Hubble

Densité critique de l'Univers

Distance Terre-Soleil (parsec)

Rayon Terrestre

Rayon Solaire

Masse Terrestre

Masse Solaire
Tableau: 28.5 - Constantes astrophysiques

CONSTANTES DE PLANCK

Les constantes de Planck sont principalement des curiosités physiques qui découlent d'un système d'unités
particulier et dont les valeurs selon le système S.I. sont données dans le tableau ci-dessous.

Remarque: Le lecteur intéressé par la provenance des différentes constantes de Planck (longueur de Planck,
masse de Planck, etc.) devra se rendre dans le chapitre de Physique Quantique Ondulatoire du site où ces
constantes sont déterminées avec les détails nécessaires.

Longueur de Planck

Temps de Planck

Masse de Planck

Température de Planck

Energie de Planck

Densité de Planck

Force de Planck

Puissance de Planck

Pulsation de Planck

Charge de Planck

Courant de Planck

Tension de Planck
Impédance de Planck
Tableau: 28.6 - Constantes de Planck

Malgré les exemples donnés combien y-a-t'il de constantes ? Pourquoi jouent-elles un "rôle central" dans les
théories physiques ? Ont-elles toutes la même importance ou certaines sont-elles plus fondamentales ? Selon
quels critères ? Peut-on alors tester si elles sont vraiment constantes ?

Pour essayer de répondre à certaines de ces questions, remarquons tout d'abord qu'à chaque étape de nos
constructions théoriques il subsiste des paramètres constants qui ne sont pas et ne peuvent pas être
expliquées en termes de quantités plus fondamentales, simplement parce que ces derniers n'existent pas dans
l'état de nos connaissances. Quant les théories s'affinent, il est en effet possible qu'une constante se trouve
expliquée en termes de nouveaux paramètres, plus fondamentaux. Ainsi, la masse du proton est une constant
fondamentale de la physique nucléaire, mais doit en principe pouvoir se calculer, dans le cadre de la
chromodynamique quantique, en fonction de la masse des quarks et des énergies des liaisons
électromagnétique et forte. Ce changement de statut est associé à celui du proton, qui de particule
élémentaire devient corps composite.

Nous définirons modestement les constantes comme tous les paramètres non déterminés dans un cadre
théorique donné. Cette définition revient à accepter que nous soyons incapables d'écrire une équation
d'évolution pour ces constantes qui se révèlent donc comme la limite de ce que les théories où elles
apparaissent sont en mesure d'expliquer. Cependant l'hypothèse de constance est implicitement contrôlée par
la validation expérimentale de ces théories. Les résultats des expériences doivent être reproductibles à divers
moments et dans divers laboratoires. Si c'est le cas, dans la limite des précisions expérimentales, alors il est
légitime de considérer que l'hypothèse de constance est valide. Cette définition implique qu'il n'existe pas de
liste absolue de constantes, car l'appartenance à une telle liste dépend des cadres théoriques choisis pour
décrire la nature et peut donc changer avec les progrès de la connaissance.

Se pose maintenant la question de savoir s'il est possible de caractériser plus précisément le concept de
constante et de déterminer si, parmi toutes les constantes, certaines sont plus fondamentales que d'autres.
Pour cela, il faut commencer par révéler une relation entre constantes et unités.

Ainsi, Planck découvre en 1900 qu'il était possible d'utiliser les trois constantes physique fondamentales :

(28.32)

pour définir les trois unités de masse, de temps et de longueur à partir de la masse de Planck, de la longueur
de Planck et du temps de Planck (voir le chapitre de Physique Quantique Ondulatoire pour la démarche
mathématique qui permet de déterminer leur valeur).

Planck baptise ces unités "Système d'Unités Naturelles" (SUN) car elles sont indépendantes d'un corps ou
d'un matériau et [...] gardent nécessairement leur signification pour tous les temps et toutes les civilisations,
même celles qui sont extra-terrestres et non humaines. La signification de ces unités met longtemps à
émerger. Elles signalent l'échelle où gravitation et mécanique quantique deviennent de même amplitude.
Elles sont donc très adaptées à la cosmologie primordiale et à l'étude des trous noirs ainsi que la mécanique
quantique relativiste.

Le choix des unités de Planck comme unités naturelles est lié aux considérations justifiant que G, c, h sont
les trois constantes dimensionnées les plus fondamentales (connues à ce jour). Dans ces unités, la valeur
numérique de ces trois constantes fondamentales est 1 comme nous l'avons déjà fait déjà remarquer.
Le rôle des constantes dans la structuration des théories physiques peut être assez magnifiquement illustré
par le cube magique ou "cube de Okun" des théories physiques ci-dessous (dont la validité reste à vérifier
bien sûr). L'idée consiste à "allumer" ou "éteindre" une à une les trois constantes fondamentales afin de voir
comment les théories physiques s'articulent les unes par rapport aux autres.

Remarque: Le lecteur comprendra mieux les explications qui vont suivre lorsqu'il aura étudié la relativité
générale, la physique quantique des champs ainsi la physique quantique ondulatoire donc si jamais il peut
sauter ce texte en attendant.

(28.33)

Quand G est mis à 0, cela revient à supprimer toutes les forces gravitationnelles et à découpler la matière de
l'espace et du temps. Quand h est mis à 0, nous supprimons le caractère quantique de la nature et nous
découplons les natures corpusculaires et ondulatoire (de par la relation de De Broglie), quand 1/c est mis à 0,
la vitesse de la lumière est infinie et le temps et l'espace se découplent l'un de l'autre (de par les
transformations de Lorentz). Pour visualiser cela, nous considérons le cube ci-dessus introduit par le
physicien soviétique Mikhaïl Bronshtein qui reprend une idée développée initialement par Lev Landau,
Dimitri Ivanenko et Georgi Gamow.

Tout naturellement, au niveau le plus bas, nous trouvons (0,0,0) la mécanique newtonienne, qui ne prend pas
en compte les effets relativistes, quantiques et gravitationnels. Au niveau supérieur où nous considérons
l'effet d'une constante, nous trouvons les trois théories de la relativité restreinte (1,0,0), de la mécanique
quantique en (0,1,0) et de la gravitation newtonienne en (0,0,1), trois théories testées avec une grande
précision dans leur domaine de validité.

A un niveau encore supérieur, la théorique quantique des champs en (1,1,0) prend en compte les effets
quantiques et relativistes; la relativité générale en (1,0,1) prend en compte les effets gravitationnels et
relativistes et la gravité quantique newtonienne en (0,1,1) est censée offrir une description quantique et non
relativiste de la gravitation. Seules les deux premières théories sont actuellement fondées expérimentalement
et théoriquement.

Au niveau ultime se trouve en (1,1,1) la théorie de Tout (dénomination très prétentieux et trop
commerciale), censée donner une description quantique et relativiste de la gravitation. Sa formulation n'est
pas encore connue, bien que les théories des cordes (voir chapitre du même nom), intensivement étudiées de
nos jours, semblent des candidats sérieux. Ces théories apparaissent comme des cas limites d'une théorie
plus large et plus profond mais non encore formulée : la théorie M (le M pour "Mère")

PRINCIPES DE LA PHYSIQUE
Les progrès de la science en général et de la physique en particulier étaient fondés il y deux siècles
principalement sur l'expérimentation, c'est-à-dire que l'on reproduisait en laboratoire des phénomènes
donnés pour les analyser systématiquement (la reproduction d'une observation validant une hypothèse). Cela
revenait systématiquement à poser des questions précises à la nature et à décrire et étudier les réactions ainsi
provoquées. La répétition à volonté d'un phénomène lors d'une expérience ne serait pas garantie s'il n'existait
pas un principe général de causalité.

PRINCIPE DE CAUSALITÉ

Définition: Nous définissons le "principe de causalité" par le fait que dans exactement les mêmes
conditions, les mêmes causes conduisent toujours aux mêmes effets. Autrement dit, si certaines conditions
initiales sont parfaitement connues, le phénomène se déroulera de façon déterminée, toujours la même.

Au fait, l'expérience n'est pas nécessaire si nous considérons les principes de premier ordre qui sont par
définition "les principes logiques que nous pouvons déduire par induction et que nous ne pouvons vérifier
expérimentalement avec certitude".

Or, les exigences de la société ont très peu souvent laissé le temps aux grands hommes de science de penser
à ces principes du premier ordre par des expériences imaginaires (méthode très usitée par Albert Einstein
pour la parenthèse...).

C'est dans un trilemne proposé par le sceptique de l'antiquité Agrippa, selon un argument rapporté par
Sextus Empiricus, que la question de la justification de la connaissance a été posée le plus explicitement :

H1. Ou bien la connaissance est fondée en dernière instance sur des principes premiers mais arbitraires

H2. Ou bien nous ne trouvons pas de tels principes et nous avons une régression à l'infini

H3. Ou bien la justification est circulaire

Ce trilemne porte aussi souvent, dans la philosophie contemporaine, notamment chez Karl Popper, le nom
de "trilemne de Fries" ou "trilemne de Münchhausen" et nous ne savons actuellement pas dans quel cas de
figure (H1, H2 ou H3) nous nous situons.

Énonçons maintenant trois principes (ou hypothèses) premiers élémentaires :

PRINCIPE DE CONSERVATION DE L'ÉNERGIE

Le principe premier de conservation de l'énergie s'énonce (basiquement... voir remarques plus bas...) ainsi :
L'énergie totale, notée de tout système isolé et inertiel ne varie pas en fonction du temps s'il n'y a pas apport
ou retrait d'énergie (ou de masse) ou de chaleur de l'extérieur de ce système.

Ce principe peut être exprimé par la formule :

où est la variation totale d'énergie du système, la variation de l'énergie interne du système. C'est à
dire son énergie propre correspondant aux énergies cinétiques et potentielles microscopiques, des particules
qui le constituent.

est la variation de l'énergie cinétique à l'échelle macroscopique (mouvement du système dans un


référentiel donné) et est la variation de l'énergie potentielle à l'échelle macroscopique, du système en
interaction avec des champs gravitationnel ou électromagnétiques.
est la partie de l'énergie qui correspond au travail échangé avec le milieu extérieur et est la
quantité d'énergie mise en jeu sous forme de chaleur (cf. chapitre de Thermodynamique).

En physique, une loi de conservation (rien ne se perd, rien ne se crée) exprime qu'une propriété mesurable
particulière d'un système physique isolé reste constante au cours de l'évolution de ce système. La liste ci-
dessous énumère des lois de conservations utiles à l'ingénieur et qui n'ont jamais été prises en défaut à ce
jour et qui découlent pour la plupart de la conservation de l'énergie:

- conservation de la quantité de mouvement


- conservation du moment cinétique
- conservation de la charge électrique
- conservation du flux magnétique
-conservation de la masse

Le théorème de Noether que nous verrons un peu plus bas exprime l'équivalence qui existe entre les lois de
conservation et l'invariance des lois physiques en ce qui concerne certaines transformations (typiquement
appelées symétries). Ce théorème ne s'applique qu'aux systèmes descriptibles par un lagrangien (cf.chapitre
de Mécanique Analytique). Par exemple, l'invariance par translation dans le temps implique que l'énergie est
conservée, l'invariance par translation dans l'espace implique que la quantité de mouvement est conservée, et
l'invariance par rotation dans l'espace implique que le moment angulaire est conservé.

Ce principe est donc démontrable et découle de l'invariance dans le temps des lois de la physique. Il s'agit du
premier principe de Noether que nous allons démontrer un peu plus loin.

L'énergie que l'être humain quantifie avec l'unité "Joules" ne peut cependant être définie avec exactitude.
Répondre à cette question revient à savoir ce qu'est la masse (relation d'équivalence d'Einstein) et donc à
connaître l'élément fondamental de l'Univers (nous en avons déjà fait mention plus haut dans le présent
texte).

Remarques:

R1. L'énergie peut sous trouver sous plusieurs formes (cela ne voulant pas dire qu'il existe plusieurs énergies
différentes !!!) comme la chaleur, l'énergie cinétique, potentielle, électrique, magnétique, etc... comme nous
en avons déjà fait mention plus haut.

Ainsi, dans les applications grand public, et notamment dans le domaine de la nutrition, nous exprimons
fréquemment l'énergie en calories. La calorie étant en toute rigueur l'énergie qu'il faut fournir pour faire
chauffer un gramme d'eau de un degré Celsius (cf. chapitre de Thermodynamique) , mais les nutritionnistes
nomment par simplification "calorie" ce que les physiciens nomment (correctement) "kilocalorie".

En électricité, nous utilisons aussi le "Watt-heure", énergie consommée pendant une heure par un appareil
ayant une puissance d'un Watt (joules par secondes).

R2. La violation de ce principe dans un système isolé n'a encore jamais été observée mais sa validité ne peut
être démontrée (d'où le fait que ce soit un "principe premier").

R3. Certains physiciens débattent du fait que ce principe premier découle de théorème de Noether que nous
verrons plus. Mais cela est tout à fait discutable étant donné que le théorème de Noether considère l'énergie
potentielle comme constante dans le temps d'où...

PRINCIPE DE MOINDRE ACTION

Le principe premier de moindre action (dit également "principe premier d'économie" ou "principe
variationnel") s'énonce ainsi :
Tous les phénomènes naturels s'accordent avec le fait que, la Nature, dans la production de ses effets, agit
toujours par les voies les plus simples et les plus directes.

Avec cet énoncé et le principe de conservation de l'énergie, nous pouvons alors établir des outils
mathématiques d'une formidable puissance pour l'étude de la physique théorique. Mais nous ne pouvons
développer à ce niveau du discours le formalisme mathématique de ce principe car il demande des outils que
nous souhaiterions introduire plus loin, dans le chapitre de Mécanique Analytique (lors de l'étude du
formalisme lagrangien pour être plus précis).

En attendant voici les deux relations qui le résument :

(28.34)

Remarque: La violation de ce principe dans un système isolé n'a encore jamais été observée mais sa validité
ne peut être démontrée (d'où le fait que ce soit aussi un "principe premier").

PRINCIPE DE NOETHER

Le principe premier de Noether (appelé traditionnellement "théorème de Noether") associe de façon élégante
des quantités physiques conservées aux symétries des lois de la nature. La symétrie de translation dans le
temps (phénomène invariant dans le temps) correspond à la conservation de l'énergie, celle de translation
dans l'espace à la conservation de l'impulsion (quantité de mouvement), celle de rotation dans l'espace à la
conservation du moment cinétique etc.

En d'autres termes, le principe premier de Noether énonce que la physique est :

- Symétrique (invariant) par translation dans le temps (ceci ayant pour conséquence qu'il n'y pas d'origine du
temps)

- Symétrique (invariant) par translation dans l'espace (ceci ayant pour conséquence qu'il n'y a pas d'origine à
l'espace)

- Symétrique (invariant) par rotation (ceci ayant pour conséquence qu'il n'y a pas de direction privilégiée
dans l'espace)

Remarques:

R1. Ce principe implique donc qu'un référentiel galiléen (cf. chapitre de Mécanique Classique) est
homogène (pas d'origine de temps ou d'espace privilégiée) et isotrope (pas de direction privilégiée).

R2. Il ne faut pas confondre l'invariance des lois et la non invariance des solutions théoriques auxquelles
aboutissent ces lois! Par exemple, la décharge d'un condensateur (cf. chapitre d'Électrocinétique) est
invariante par translation dans le temps mais pas la solution.

Ce résultat établi en 1915 par Emmy Noether juste après son arrivée à Göttingen, fut qualifiée par Albert
Einstein de "monument de la pensée mathématique". C'est maintenant un des piliers de la physique
théorique.
Aujourd'hui, il est souvent présenté à l'occasion de cours sur la théorie quantique des champs. Cela le fait
paraître plus compliqué et mystérieux qu'il n'est, et c'est oublier qu'il s'applique aussi à la mécanique
classique.

Remarque: Il est recommandé au lecteur de lire la démonstration du théorème de Noether en parallèle des
chapitres de mécanique analytique et de mécanique classique.

Ainsi, les symétries jouent un rôle majeur en physique. Elles permettent d'une part de simplifier les
problèmes d'une part et de tirer de nouvelles lois d'autre part. Pour illustrer la première application des
symétries il suffit d'évoquer la forme mathématique du potentiel gravitationnel engendré par une masse
ponctuelle située à l'origine du référentiel (cf. chapitre de Mécanique Classique). En coordonnées
cartésiennes, l'expression du potentiel gravitationnel est relativement complexe

(28.35)

alors qu'en coordonnées sphériques (système de coordonnées qui tire partie de la symétrie sphérique du
potentiel) il prend une forme très simple :

(28.36)

Les propriétés de symétrie d'un problème sont ici exploitées de façon à simplifier le traitement
mathématique des lois physiques. Même si ces considérations mathématiques nous renseignent sur les
propriétés physiques du système considéré, elles conservent cependant un caractère purement technique.

Les symétries trouvent pourtant une autre application dont la signification physique est beaucoup plus
profonde. Le fait, non fortuit, qu'un système possède des symétries doit certainement avoir des implications
physiques. Intuitivement, nous pouvons saisir que la présence de symétries dans un système physique se
traduit par l'invariance de certaines de ses propriétés physiques sous l'application de transformations spatio-
temporelles ou, plus généralement, des transformations géométriques. L'invariance de propriétés physiques
doit induire nécessairement des relations d'une nature nouvelle entre les variables du système. De telles
relations doivent à leur tour révéler des lois plus profondes qui associent la géométrie du système aux lois de
la nature. Ce raisonnement, bien qu'intuitif, nous invite à explorer plus en profondeur les relations qui
pourraient exister entre les lois physiques et les propriétés géométriques de l'espace-temps.

Considérons une expérience de mécanique plus ou moins complexe observée simultanément par deux
physiciens O et O' situés en des lieux différents tel que chacun d'eux choisit un référentiel dont il est
l'origine.

Ils entreprennent de mesurer diverses grandeurs physiques et obtiennent des résultats numériques qui dans
l'ensemble diffèrent. Cependant, les lois physiques qu'ils en tirent (à niveau de connaissance égal) sont
identiques. Cette conclusion est triviale car nous savons tous que les lois de la nature ne doivent pas
dépendre pas de l'emplacement des observateurs.

Mathématiquement, la différence entre les référentiels de O et O' selon le référentiel de l'expérience étudiée
est le passage de l'un à l'autre dans un plan par une rotation une translation (cf. chapitre de
Géométrie Euclidienne).

Le fait que les lois physiques sont indépendantes de la position de l'observateur implique qu'elles ne varient
pas après leur avoir appliqué une rotation et/ou une translation. Nous disons alors qu'elles sont "invariantes
par rotation et par translation" ou encore qu'elles sont "symétriques par rotation et par translation".
Rappel : En géométrie le terme symétrie prend un sens plus général qui peut se définir comme suit :
"transformation qui ne change ni la forme, ni les dimensions d'une figure". Nous pouvons remarquer que le
sens courant du mot "symétrie" correspond à un cas particulier de symétrie au sens géométrique du terme,
qui consiste à inverser les objets par rapport à un plan.

Remarque: En physique, la définition d'une symétrie est semblable à celle des mathématiciens mais
s'applique aux lois de la nature et non plus aux figures géométriques. Ainsi une symétrie en physique est une
transformation des variables du système - qui peuvent être des variables géométriques ou des variables plus
abstraites - qui ne change pas la formulation des lois physiques.

Donnons une définition rigoureuse d'une symétrie en physique:

Soit un système S dont l'état évolue au cours du temps. Désignons l'état de S à l'instant t par S(t). A l'instant
initial , S se trouve donc dans l'état . Considérons une transformation géométrique T qui agit en
chaque point de l'espace et éventuellement du temps. En un instant t, l'action de T sur le système S a pour
effet de le transformer en un système tel qu'à l'instant , le transformé par T de est
.

Définition: La transformation T est appelée une "symétrie physique" si le transformé par T du système S (ce
qui donne S') évolue de la même façon que S, c'est-à-dire que si nous appliquons les lois de la mécanique sur
pour connaître son état S'' en un instant postérieur t alors .

INVARIANCE PAR TRANSLATION DANS L'ESPACE

Considérons un système isolé constitué de n particules en interaction repérées par les vecteurs position .
L'interaction de deux particules i,j dérive d'un potentiel (cf. chapitre de Mécanique Classique).
Chaque particule est soumise à des forces résultant de l'interaction avec les autres particules. Pour une
particule i donnée, la résultante de ces forces s'exprime selon la loi de Newton (voir chapitre de mécanique
classique) :

(28.37)

Appliquons au système la translation dans l'espace suivante :

(28.38)

où est un vecteur quelconque. Dire que la translation du système est une symétrie signifie que
l'accélération et la force qui agit sur chaque particule sont inchangées après la transformation.

(28.39)

Ce qui implique :

(28.40)

Cette égalité doit être vraie quelle que soit la position des particules, donc quels que soient et . Il est
clair que la seule manière de vérifier la dernière égalité dans ces conditions est d'égaler deux à deux les
potentiels entre chaque particule j avec la particule i, c'est-à-dire :
(28.41)

Les potentiels sont alors nécessairement (et c'est là, la puissance du théorème de Noether!) des fonctions de
tel que :

(28.42)

Dès lors, nous en déduisons que :

(28.43)

Ce qui entraîne immédiatement que la résultante de toutes les forces appliquées aux particules du système
est nulle et que donc la quantité de mouvement totale est conservée :

(28.44)

L'invariance par translation de la loi de Newton entraîne donc nécessairement :

1. Le potentiel entre les particules d'un système isolé est une fonction de leur distance relative (cela se
confirmera en astronomie lors de notre étude du champ de potentiel gravitationnel, ainsi qu'en
électromagnétisme en ce qui concerne le potentiel électrostatique et les potentiels de Yukawa à symétrie
sphérique en théorie quantique des champs).

2. La loi de l'égalité entre l'action et la réaction.

3. La conservation de la quantité de mouvement totale d'un système !

Conséquence du point (3) : l'origine de l'espace est inobservable (puisque la conservation de la quantité de
mouvement est équivalente à l'invariance par translation dans l'espace)!

INVARIANCE PAR ROTATION DANS L'ESPACE

Imposons maintenant que les rotations autour d'un point fixe soient des symétries. Cette propriété doit être
vraie quel que soit le point fixe considéré, notamment, si ce point fixe est précisément la position de l'une
des particules du système. Il s'ensuit que le potentiel présente nécessairement une symétrie sphérique. Les
forces agissant entre les particules sont donc colinéaires aux vecteurs qui les relient.

Le moment cinétique du système s'exprime comme suit (cf. chapitre de Mécanique Classique) :

(28.45)

La dérivée par rapport au temps du moment cinétique total donne :

(28.46)

Or le dernier terme peut s'écrire :


(28.47)

Où les sont les forces internes au système des particules j agissant sur la particule i. L'avant dernière
expression devient alors :

(28.48)

Nous pouvons regrouper les termes et deux à deux et de par la propriété du produit vectoriel
nous avons nécessairement :

(28.49)

Donc nous en concluons que le moment cinétique est donc conservé et la conservation du moment cinétique
est donc équivalente à l'invariance par rotation.

Conséquence : il n'y a pas de direction privilégiée dans l'espace!

INVARIANCE PAR TRANSLATION DANS LE TEMPS

L'énergie totale du système est la somme de l'énergie cinétique de toutes les particules et de l'énergie
potentielle résultant de l'interaction mutuelle des particules, soit sous la forme de la mécanique classique :

(28.50)

Nous supposerons que le potentiel ne varie pas avec le temps. Cette hypothèse se justifie de
manière empirique par le constat que les potentiels observés dans la nature sont indépendants du temps dans
des systèmes fermées à l'équilibre.

Calculons la dérivée de l'énergie par rapport au temps :

(28.51)

Or, si le système est fermé (pas d'apport de masse de l'extérieur ni apport d'énergie de l'extérieur), le terme
est nul (pas de variation relativiste de la masse non plus car la vitesse de chaque corpuscule ou du
système entier est constante ou sa variation est en moyenne nulle). Il en est de même pour le terme
où si le système est fermé (pas d'apport d'énergie de l'extérieur sous quelque forme que ce soit)
l'accélération moyenne de chaque corpuscule ou de l'ensemble du système par rapport au centre de gravité
sera nulle. Donc:

(28.52)
Donc nous en concluons que l'énergie totale du système est donc une constante!

Quelle est la grandeur mécanique invariante par translation revient donc à se demander quelles sont les
grandeurs mathématiques qui sont inchangées lorsque nous leur appliquons une translation. Il en existe
deux : les scalaires et les vecteurs.

Intuitivement, un scalaire est assimilé à un nombre réel (cf. chapitre sur les Nombres). Or, en mécanique, les
nombres réels que nous pouvons construire le sont à l'aide de grandeurs vectorielles comme le vecteur
position, la vitesse, etc. Pour qu'un tel nombre réel ait le statut de scalaire il doit être indépendant de
l'espace. Ainsi, un vecteur position ne peut manifestement être considéré comme un scalaire. L'énergie de la
particule est un nombre réel mais n'est pas un scalaire car elle dépend explicitement, dans sa formulation, de
la position de la particule dans l'espace au travers de l'énergie potentielle.

De la même façon, un vecteur n'est pas seulement un être mathématique possédant des composantes dans
une base. Pour jouir du statut de vecteur, une entité mathématique doit se transformer de la même manière
que les vecteurs de base de l'espace vectoriel. Selon cette définition, le moment cinétique n'est pas un vrai
vecteur car, étant la composition par produit vectoriel de deux vecteurs, il ne se transforme pas comme les
vecteurs de base. D'un point de vue mathématique il s'agit d'un pseudo-vecteur (cf. chapitre de Calcul
Vectoriel).

Le seul vrai vecteur qui reste est la quantité de mouvement car il est construit à l'aide de la dérivée du
vecteur position qui est, bien évidemment, un vrai vecteur. Nous en déduisons que la seule grandeur
susceptible d'être conservée par translation est la quantité de mouvement totale du système.

Par un raisonnement analogue au précédent, il est possible de supposer quelle grandeur pourrait être
invariante par rotation. Sachant que seuls les scalaires et certains pseudo-vecteurs sont effectivement
invariants par rotation, nous en concluons que la seule grandeur susceptible d'être conservée lors de rotations
est le moment cinétique total du système.

Enfin, toujours par le même raisonnement, l'invariance des lois de la mécanique par déplacement dans le
temps, revient à rechercher les grandeurs conservées par une translation dans le temps. Ces grandeurs sont
les vrais scalaires et les vecteurs sur la droite du temps. Aucune grandeur mécanique ne peut être assimilée à
un vecteur sur la droite du temps. En revanche, l'énergie est bien un scalaire invariant par translation dans le
temps puisque l'énergie potentielle est par hypothèse indépendante du temps. L'invariance des lois de la
mécanique par déplacement dans le temps laisse donc supposer intuitivement la conservation de l'énergie.

Ces raisonnements ne peuvent évidemment faire office de démonstration mais ils mettent en évidence une
relation étroite entre la géométrie et les propriétés d'invariance d'un système.

THÉORÈME DE NOETHER

Soit L le lagrangien (cf. chapitre de Mécanique Analytique) d'un système représenté par les 2n coordonnées
généralisées dans l'espace de configuration. Supposons que ce système est invariant par la
transformation infinitésimale suivante :

(28.53)

Où s est un paramètre réel et continu et pour lequel nous avons :

(28.54)

La fonction agit continûment sur le chemin variationnel selon la démarche intellectuelle qui sera
énoncée en mécanique analytique.
Supposons que les fonctions sont solutions des équations de Lagrange (ce que démontrerons en
Mécanique Analytique). D'après nos hypothèses les fonctions (définies) :

(28.55)

sont dès lors nécessairement également solutions des équations de Lagrange, ce qui se traduit par (nous
omettrons l'indication de la somme par la suite afin d'alléger la lecture!) :

(28.56)

D'autre part, par hypothèse, le lagrangien est invariant pour les transformations du type de celles décrites par
. Il s'ensuit que sa dérivée par rapport au paramètre s est nécessairement nulle :

(28.57)

Et nous démontrerons par ailleurs aussi en Mécanique Analytique (sous forme d'intégrale comme étant
nulle) la relation :

(28.58)

ce qui peut finalement s'écrire :

(28.59)

mais nous avons aussi de par l'équation d'Euler-Lagrange (cf. chapitre de Mécanique Analytique):

(28.60)

Nous obtenons alors :

(28.61)

Donc la grandeur est une constante du mouvement ! Le théorème de Noether s'énonce alors ainsi :

Soit un système ayant un lagrangien auquel nous appliquons une transformation infinitésimale
, où s est un paramètre réel et continu. Alors il existe une constante du mouvement notée
dont l'expression est donnée par :
(28.62)

Appliquons le théorème de Noether aux cas étudiés précédemment. Fixons un référentiel arbitraire O
cartésien. Notons la base orthonormée de ce référentiel. Considérons un système constitué de n
particules repérées dans O par leur vecteur position . Le lagrangien de ce système est alors bien

évidemment , où distingue les composantes spatiales des vecteurs .

Supposons maintenant que le système soit invariant par translation de longueur s le long de l'axe x. La
translation le long de cet axe s'écrit comme suit :

(28.63)

La constante du mouvement donnée par application du théorème de Noether est alors :

(28.64)

Nous définirons par ailleurs en mécanique analytique comme étant le moment conjugué . Nous en
déduisons dès lors que la quantité conservée est : , c'est-à-dire la quantité de mouvement totale du
système le long de l'axe x !!!

En procédant de même avec les autres axes, nous démontrerions aisément la conservation de la quantité de
mouvement totale le long des axes pour ceux-ci, ce qui nous permet de conclure que dans le cas général

d'une translation infinitésimale la grandeur conservée est la quantité de mouvement


totale du système.

Supposons maintenant que le système soit invariant par rotation d'un angle infinitésimal s autour de l'axe z.
Cette rotation s'écrit :

(28.65)

La dérivée de par rapport à s donne :

(28.66)

En remarquant encore une fois que , la grandeur conservée obtenue par application du théorème de
Noether est alors :

(28.67)
et nous avons démontré dans le chapitre de Calcul Vectoriel que :

(28.68)

ce qui nous amène à écrire :

(28.69)

On montrerait de la même façon que l'invariance du lagrangien sous les rotations selon les autres axes ce qui
conduit à la conservation des composantes suivant ces axes du moment cinétique total du système.

En conclusion, nous avons mis en évidence trois lectures différentes des lois de la physique :

Observation Loi de conservation Signification physique


Invariance des lois de la physique Conservation de la quantité de Homogénéité de l'espace : lespace
par translation mouvement présente les mêmes propriétés en tous
points
Invariance des lois de la physique Conservation du moment Isotropie de l'espace : lespace présente
par rotation cinétique les mêmes propriétés dans toutes les
directions
Invariance des lois de la physique Conservation de l'énergie Homogénéité du temps : les lois de la
par déplacement dans le temps nature ne varient pas dans le temps
Tableau: 28.7 - Lois de convervation

Autrement dit, l'Univers serait :

P1. Homogène (pas d'origine de temps, ou d'espace, privilégiée)

P2. Isotrope (pas de direction privilégiée).

PRINCIPE DE CURIE

Le principe de Curie (que nous devons à Pierre Curie) découle un peu intuitivement du théorème de Noether
et s'énonce ainsi :

Si une cause présente une certaine symétrie ou invariance, alors son effet aura la même symétrie (ou la
même invariance), ou une symétrie supérieure, à condition toutefois que la solution du problème soit unique.

Remarque: A noter que les éléments de symétrie agissent sur les directions des grandeurs vectorielles, tandis
que les invariances agissent sur les variables dont dépendent ces grandeurs.

Exemple:

Conservation de l'énergie/invariance par translation dans le temps, conservation de la quantité de


mouvement/invariance par translation dans l'espace, conservation du moment cinétique/invariance par
rotation dans l'espace tel que nous l'avons démontré lors de notre étude du théorème de Noether.

Ainsi, dans un espace homogène et isotrope, si nous faisons subir une transformation géométrique à un
système physique susceptible de créer certains effets (forces, champs), alors ces effets subissent les mêmes
transformations.

Autrement dit, si un système physique S possède un certain degré de symétrie, nous pourrons alors déduire
les effets créés par ce système en un point à partir des effets en un autre point.
Voici les six propriétés de symétrie découlant du principe de Curie :

P1. Invariance par translation : si S est invariant dans toute translation parallèle à un axe, les effets sont
indépendants des coordonnées de cet axe (l'intérêt étant alors de travailler en coordonnées cartésiennes).

P2. Symétrie axiale : si S est invariant dans toute rotation autour d'un axe donné, alors ses effets exprimés ne
dépendent pas de l'angle qui définit la rotation (l'intérêt étant alors de travailler en coordonnées
cylindriques).

P3. Symétrie cylindrique : si S est invariant par translation et rotation, alors ses effets ne dépendent que de la
distance à l'axe de rotation (l'intérêt étant alors aussi de travailler en coordonnées cylindriques).

P4. Symétrique sphérique : si S est invariant dans toute rotation autour d'un point fixe, alors ses effets ne
dépendent que de la distance à ce point fixe (l'intérêt étant alors de travailler en coordonnées sphériques).

P5. Plan de symétrie : si S admet un plan de symétrie, alors en tout point de ce plan :

- un effet à caractère vectoriel est contenu dans le plan

- un effet à caractère pseudo-vectoriel (voir le chapitre de Calcul Vectoriel pour voir la définition d'un
pseudo-vecteur) lui est perpendiculaire

P6. Plan d'antisymétrie : si, par symétrie par rapport à un plan, S est transformé en -S alors en tout point de
ce plan :

- un effet à caractère vectoriel est perpendiculaire au plan

- un effet à caractère pseudo-vectoriel est contenu dans ce plan

La symétrie est fondamentale dans les sciences quelles que soient les disciplines. La symétrie est partout.
Elle permet de décrire de manière précise de nombreux systèmes, de clarifier et de simplifier l'étude de leurs
propriétés. Des résultats très importants peuvent ainsi être prédits de manière rigoureuse sans que l'on ait à
faire appel à des théories mathématiques sophistiquées.

ESPACES PONCTUELS

L'étude des phénomènes physiques recourt dans un premier temps à leur représentation dans l'espace de la
géométrie classique euclidienne à une dimension temporelle et à un nombre quelconque de dimensions
spatiales.

Les vecteurs que nous avons étudié dans le chapitre de Calcul Vectoriel (tenseurs d'ordre 1) et les tenseurs
(d'ordre quelconque) que nous avons aussi étudié dans le chapitre de Calcul Tensoriel peuvent comme nous
avons en déjà fait mention, êtres utilisés pour relier chacun des points de l'espace-temps à un référentiel et
former ainsi des champs de vecteurs ou/et de tenseurs. Cet état de fait mathématique, nécessite la définition
mathématique d'espaces formés de points ou également appelés "espaces ponctuels".

La définition précise d'espace vectoriel ponctuel que nous allons faire sera construite à partir de la notion
d'espace vectoriel que nous avons vu dans le chapitre de Calcul Vectoriel (voir section d'algèbre)

Voyons tout d'abord l'exemple particulier de l'espace ponctuel formé par des triplets de nombres qui est issu
directement de l'espace géométrique classique à trois dimensions.

Ainsi, donnons-nous des triplets de nombres notés:

(28.70)
etc... Appelons l'ensemble de tous les éléments {A,B,...} formés par des triplets de nombres. À tout
couple (A,B) de deux éléments de , pris dans cet ordre, nous pouvons faire correspondre un vecteur ,
appartenant à un espace vectoriel espace vectoriel , noté géométriquement , en définissant celui-ci
par un triplet de nombres tel que (nous utilisons la notation indicielle vue dans le chapitre Calcul Tensoriel) :

(28.71)

avec . Nous avons donc:

(28.72)

Si nous définissons par rapport à cet élément l'addition et la multiplication par un scalaire, nous nous
retrouvons comme nous l'avons déjà vu en théorie des ensembles avec une structure d'espace vectoriel.

La correspondance que nous établissons ainsi, entre tout couple (A,B) de deux éléments de et un vecteur
d'un espace vectoriel , vérifie manifestement les propriétés suivantes :

P1.

P2. Associativité par rapport à l'addition:

P3. Si O est un élément arbitraire choisi dans , à tout vecteur de , il correspond un point M et un
seul tel que .

Lorsque nous avons muni l'ensemble de cette loi de correspondance avec , vérifiant les trois
propriétés précédentes, nous disons que l'ensemble des triplets de nombres constitue un "espace ponctuel",
noté . Les éléments de sont alors appelés des "points".

L'espace ponctuel se confond en tant qu'ensemble d'éléments avec l'ensemble mais il s'en
distingue en tant qu'espace ponctuel qui constitue un ensemble structuré par la loi de correspondance que
nous nous donnons. De même, les espaces et sont distincts par suite de leur structure différente et
nous pouvons établir une distinction entre les éléments de chacun des espaces. Nous disons que
constitue le support des espaces et .

Nous pouvons bien évidemment généraliser le support à . Ainsi, muni de la structure d'espace
vectoriel que nous avons définie précédemment constitue un espace ponctuel à n dimensions que nous
noterons . Les éléments de étant appelés des "points".

L'espace vectoriel est appelé "l'espace associé" à . Lorsque l'espace vectoriel associé est un espace
pré-euclidien (muni du produit scalaire), nous disons alors que est un "espace ponctuel pré-euclidien".

Considérons un point O quelconque d'un espace ponctuel pré-euclidien et une base de l'espace
vectoriel associé .
Définitions:

D1. Nous appelons "repère de l'espace" l'ensemble constitué par les éléments O (origine) et de la base
. Ce genre de repère est noté :

(28.73)

ou encore simplement :

(28.74)

D2. Les "coordonnées" d'un point M d'un espace ponctuel pré-euclidien , par rapport au repère , sont
les composantes (contravariantes) du vecteur de l'espace par rapport à la base .

Soient deux points M et M' de définis par leurs coordonnées respectives et , nous avons:

(28.75)

En utilisant les propriétés P1 et P2 données précédemment :

(28.76)

Nous en déduisons que les composantes du vecteur , par rapport à la base , sont les n quantités
, différences des coordonnées des points M et M'.

Soient et deux repères quelconques de liés entre eux par les relations générales (cf. chapitres de
Calcul Tensoriel et d'Algèbre Linéaire) :

et (28.77)

Cherchons les relations entre les coordonnées d'un point M de par rapport à ces deux repères. Pour cela,
exprimons les vecteurs et sur chacune des bases de :

(28.78)

ainsi que les vecteurs et , soit:

(28.79)

Nous avons d'autre part:

(28.80)

Identifiant ce résultat par rapport au vecteur dans l'expression de , nous avons:


(28.81)

En de façon analogue:

(28.82)

Ces deux relations sont plus que pratiques en physique où nous avons souvent à considérer un référentiel
dans un repère (ainsi nous pouvons exprimer la position d'un point depuis l'un ou l'autre repère en usant de
ces deux relations).

Considérons maintenant un espace ponctuel pré-euclidien ainsi que M et M' deux points de cet espace. Nous
avons démontré lors de notre étude de la topologie (cf. chapitre de Topologie), que la norme du vecteur
MM' est une mesure possible de la distance entre M et M' . Nous avons donc :

(28.83)

Si les deux points M et M' ont respectivement pour coordonnées et , par rapport à un repère ,
nous savons que nous avons :

(28.84)

La norme au carré est donc donnée comme nous l'avons vu lors de notre étude du calcul tensoriel (cf.
chapitre de Calcul Tensoriel) par la relation:

(28.85)

Si le point M' est infiniment proche du point M, ses coordonnées sont notées et le vecteur
a pour composantes les quantiques .

Si nous notons ds la distance entre les points M et M' . La relation précédente donne l'expression du carré de
la distance entre ces points sous la forme:

(28.86)

Rappelons également (cf. chapitre de Calcul Tensoriel) que pour un espace ponctuel pré-euclidien où les
vecteurs de base sont donc orthonormés, nous avons:

(28.87)

et l'expression de la distance devient alors :

(28.88)

Nous obtenons ainsi une expression qui généralise, à n dimensions, le carré de la distance élémentaire, par
rapport à un repère cartésien orthonormé, dans l'espace de la géométrie classique (euclidienne).
Les vecteurs de la physique sont généralement des fonctions d'une ou plusieurs variables, celles-ci pouvant
être des variables d'espace ou du temps. Lorsque à un point M d'un espace ponctuel , nous attachons un
tenseur, défini par ses composantes par rapport à un repère , nous dirons que nous nous sommes donnés
un "champ de tenseurs" (le champs de tenseur d'ordre 1 étant des champs vectoriels).

Pour des vecteurs à n dimensions, la notion de dérivée d'un vecteur à trois dimensions se généralise et nous
obtenons toutes les relations classiques relatives aux dérivées.

Considérons ainsi un vecteur appartenant à un espace pré-euclidien dont les composantes, sur une
base , sont des fonctions d'un paramètre quelconque . Nous noterons ce vecteur et nous aurons:

(28.89)

Par définition, la dérivée du vecteur par rapport à la composante est un vecteur noté:

(28.90)

selon la notation utilisée par les mathématiciens. Ou :

(28.91)

selon la notation abrégée des physiciens. Ou encore:

(28.92)

selon l'humeur du physicien. Ou encore :

(28.93)

si nous respectons les écritures...

Dans ce site, nous basculons d'une notation à l'autre sans préavis en fonction de l'envie de simplifier les
écritures (il faudra s'y faire..).

Etant donné que nous faisons actuellement plus de la mathématique que de la physique, nous noterons:

(28.94)

En rappelant (cf. chapitre de Calcul Différentiel Et Intégral) que la différentielle est donnée par:

(28.95)

Les différentes expressions de dérivations des vecteurs à trois dimensions relatives à la somme de vecteurs,
au produit par un scalaire de deux vecteurs, sont aisément transposables aux vecteurs à n dimensions.

Si un vecteur de dépend de plusieurs paramètres indépendants, , la dérivée partielle du vecteur


par rapport à la variable , par exemple, est un vecteur noté:
ou (28.96)

dont les composantes sont les dérivées partielles des composantes de , soit:

(28.97)

La différentielle totale du vecteur s'écrivant (cf. chapitre de Calcul Différentiel Et Intégral):

(28.98)

Considérons maintenant un espace vectoriel pré-euclidien associé à un espace ponctuel . Dans un


repère tout point M de est associé à un vecteur de tel que . Si le vecteur dépend
d'un paramètre et admet une dérivée , il en est de même alors pour .

Montrons que le vecteur dérivé ne dépend pas du point origine O (statique) mais seulement du point
M considéré. En effet, si O' est un autre point origine, nous avons:

(28.99)

et puisque le vecteur est fixe et ne dépend pas de , nous avons:

(28.100)

d'où:

(28.101)

Nous pouvons donc noter la dérivée du vecteur en mentionnant seulement le point M et nous écrirons:

(28.102)

La différentielle de s'écrit alors:

(28.103)

Si un point M de est associé, par rapport à un repère à un vecteur , les dérivées


partielles de ne dépendront que du point M et nous écrirons, par exemple:

(28.104)
Afin d'alléger les expressions des dérivées partielles totales des fonctions dépendantes de n variables, nous
utilisons quand le contexte s'y prête, les notations indicielles suivantes. Si est une fonction
des n variables , nous noterons les dérivées partielles sous la forme:

(28.105)

Les dérivées secondes par rapport aux variables et s'écriront:

(28.106)

Lorsque est un vecteur tel que , dont les composantes sont des fonctions de n variables , soit:

(28.107)

les dérivées partielles du vecteur seront notées, en utilisant la convention de sommation:

(28.108)

Le concept d'espace ponctuel étant maintenant introduit, nous pouvons maintenant passer à l'étude du
formalisme lagrangien et la détermination de la formulation mathématique du principe de moindre action
(voir chapitre suivant).
29. MÉCANIQUE ANALYTIQUE

N ous devons la forme actuelle de la mécanique analytique appelée aussi parfois "mécanique
lagrangienne" aux travaux des frères Bernoulli et particulièrement d'Euler et Lagrange. C'est effectivement
en 1696 que commence l'histoire de la vraie physique théorique.

Au fait, l'événement de départ de la mécanique analytique provient de l'observation suivante (énoncée au


17ème siècle) : Tout système semble évoluer d'un état à un autre toujours en utilisant les moyens les plus
simples et en conservant une grandeur constante entre les deux états.

Remarques:

R1. Les moyens précités peuvent êtres : le chemin le plus court, le chemin le plus rapide (les trajectoires
spatio-temporelles à plus faibles amplitudes en gros...).

R2. Selon le premier principe fondamental de la physique, la grandeur constante est choisie comme étant
l'énergie.

Cet énoncé est appelé dans le cadre de la mécanique "principe de moindre action (de Maupertuis)" ou dans
le cadre de la physique générale "principe variationnel" ou encore parfois dans le cadre de l'optique
"principe d'économie" ou "principe de Fermat". Dans le cadre mathématique faisant purement abstraction
des concepts physiques, nous parlons de "principe de Hamilton".

Plus techniquement, il est aussi formulé de la manière suivante : Un système se meut d'une configuration à
une autre de telle façon que la variation de l'action (voir plus loin) entre la trajectoire naturelle effectivement
suivie et toute trajectoire virtuelle infiniment voisine ayant les mêmes extrémités dans l'espace et dans le
temps soit nulle.

Au fait, bien que cet énoncé puisse paraître comme cohérent, il peut faire douter mais... nous verrons :

1. Qu'en mécanique classique, nous pouvons démontrer la première loi de Newton en admettant ce principe
comme vrai et en y superposant le principe de conservation de l'énergie et nous pouvons expliquer le
mouvement de nutation presque tout solide simple.

2. En électromagnétisme, nous retrouverons toutes les équations de Maxwell (in extenso la loi de Biot-
Savart, Faraday, force de Lorentz, loi de Laplace, etc.) à partir des propriétés du principe de moindre action
et de conservation de l'énergie.

3. En optique, nous démontrerons que le chemin suivi par la lumière est toujours la plus courte et nous
permettra donc de démontrer le principe de Fermat à la base de toute l'optique géométrique.

4. En physique atomique, les propriétés du principe de moindre action nous permettront de déterminer
certaines propriétés mathématique des atomes et autres particules (les fermions et les bosons en physique
quantique des champs).

5. Le principe de moindre action nous permettra également de démontrer que tout corps, avec ou sans masse,
est dévié par un champ d'accélération et... permet donc de déterminer l'équation d'Einstein des champs qui
est à la base de tout le chapitre sur la relativité générale.

6. Ce principe s'applique également pour obtenir des résultats puissants en géométrie comme nous allons le
voir un peu plus loin. Ainsi, les techniques de la mécanique analytique est très intiment liée à la
mathématique pure.
Il va donc sans dire par ces six petits exemples les applications phénoménales de ce principe!!

Historiquement, il est intéressant de savoir que c'est Pierre-Louis Moreau de Maupertuis qui a énoncé le
premier le principe de moindre action sous forme peu scientifique. L'intervention d'Euler et Lagrange dans
ce domaine a été de mettre sous forme mathématique ce principe et de démontrer (tenez-vous bien...) qu'il
découle d'une simple propriété mathématique des optima des fonctions continues. Il va sans dire, que
sachant que cela a permis de redémontrer toutes les lois de la physique en a dérangé plus d'un...

Ce principe a eu (et a toujours) des répercussions inimaginables et le problème fut d'appliquer l'expression
mathématique de ce dernier à tous les phénomènes physiques qui avaient déjà étés démontrés de façon
expérimentale et empirique à l'époque. Effectuer cette démonstration revenait ainsi à expliquer pourquoi tel
phénomène ou tel loi était ainsi plutôt qu'autrement. Imaginez !

Ainsi, le premier à s'attaquer au problème fût donc le Bâlois (Suisse) Léonhard Euler. Mais nous avons
également gardé le nom de Lagrange (d'où l'appellation : "formalisme lagrangien") pour définir toute la
méthode et le formalisme mathématique construit autour du principe de moindre action.

FORMALISME LAGRANGIEN

La mécanique classique peut être formalisée de différentes manières. La plus courante est la formulation de
Newton, qui utilise la notion de force (cf. chapitre de Mécanique Classique). Elle est de loin la plus simple
lorsqu'il s'agit de considérer un problème concret et c'est pourquoi c'est celle qui est enseignée. Mais pour
pouvoir traiter des problèmes plus complexes ou plus finement, et pour pouvoir faire des démonstrations
rigoureuses, cette formulation n'est pas la plus pratique.

La mécanique analytique, initiée dès le 18ème siècle, regroupe ainsi différentes formulations très
mathématisées de la mécanique classique, notamment les mécaniques de Hamilton et de Lagrange (toutes
ces formulations sont équivalentes!).

Cette formalisation est assez peu enseignée dans les petites écoles car il faut bien l'avouer le formalisme
lagrangien et hamiltonien (contenant donc le principe de moindre action sous forme mathématique) fait
appel à un niveau d'abstraction un peu plus élevé que les méthodes normales et malgré qu'il soit souvent
d'une aide précieuse dans l'élaboration de théories (physique fondamentale, physique quantique, relativité
générale, théorie quantique des champs, théorie des supercordes), il en découle rarement de nouvelles
solutions (mais plutôt une réduction et une méthode de validation utile et très puissante).

Commençons donc notre travail :

COORDONNÉES GÉNÉRALISÉES ET RÉFÉRENTIELS

Un réflexe naturel conduit généralement à référer la position d'un point dans l'espace à la seule connaissance
de ses trois coordonnées cartésiennes x, y, z. Cette attitude est d'ailleurs le plus souvent justifiée par la
simplicité d'un grand nombre de situations rencontrées dans la pratique, où il n'est pas nécessaire de
rechercher de méthodes plus élaborées ou de passer dans d'autres systèmes de coordonnées (cf. chapitre de
Calcul Vectoriel).

Pour repérer la position d'un mobile (ou d'un point matériel) en physique il est nécessaire dans un premier
temps d'associer un repère au référentiel. Ainsi, un "repère" est un système (physique concret) de repérage
dans l'espace associé au référentiel.

Les repères conventionnels en mécanique classique constituent majoritairement des bases d'espaces pré-
euclidiens canoniques (cf. chapitre de Calcul Vectoriel) orientés et où chaque point, ou vecteur de l'espace,
peut-être représenté algébriquement par ses valeurs d'affixes (la valeur à l'ordoonnée (projection sur l'axe
vertical) et la valeur à l'abscisse (projection sur l'axe horizontal).
Voici quelques exemples triviaux:

(ou plan d'Argand-Cauchy)

(29.1)
Remarque: Comme nous l'avons vu dans le chapitre de Géométrie Différentielle, la distance entre deux
points d'une trajectoire courbe en parcourant la courbe est appelée "abscisse curviligne". Sinon, la distance
entre deux points d'une trajectoire rectiligne est appelée simplement "abscisse".

Définitions:

D1. Un repère, assimilé à un référentiel, est dit "référentiel Galiléen" (c'est rare que nous en fassions
explicitement mention en physique par manque de rigueur) si :

- Nous pouvons le considérer comme immobile pendant toute l'étude du mouvement du système ou comme
étant en translation rectiligne uniforme par rapport à un autre référentiel lui même immobile.

Donc si on néglige le mouvement de rotation du Soleil autour du centre de la galaxie, alors le référentiel
héliocentrique peut être considéré comme galiléen. Si on néglige le mouvement de rotation de la Terre
autour du Soleil, alors le référentiel géocentrique peut être considéré comme galiléen. Si on néglige le
mouvement de rotation de la Terre sur elle même, alors le référentiel terrestre peut-être considéré comme
galiléen. Dans beaucoup d'expériences de mécanique à la surface de la Terre, nous constatons que le
référentiel terrestre peut-être considéré comme galiléen avec une très bonne précision. Heureusement qu'il y
a quand même un tas de phénomène où il faut tenir compte de la rotation de la Terre (déviation vers l'est,
pendule de Foucault...etc.)

- Nous pouvons le considérer comme un système où les lois de Newton sont vérifiées (cf. chapitre de
Mécanique Classique)

D2. Un repère, assimilé à un référentiel, est dit "barycentrique" (cf. le chapitre de Géométrie Euclidienne)
s'il a pour origine le centre de masse (cf. chapitre de Mécanique Classique) du corps étudié.

Ainsi, le "repère de Copernic" est assimilé au centre de gravité (d'inertie) du système solaire, le "repère
héliocentrique" appelé aussi "repère de Kepler" au centre d'inertie du Soleil.

D3. Un repère, assimilé à un référentiel, est dit "référentiel géocentrique" lorsque nous prenons pour
référence un système d'axes placés au centre d'inertie de la Terre. Les axes, parallèles à ceux du référentiel
de Copernic, pointent vers trois étoiles fixes. Dans ce référentiel la Terre tourne sur elle même en 24 [h.].
D4. Un repère, assimilé à un référentiel, est dit "référentiel Terrestre" lorsque nous prenons pour référence
un système d'axes placés au centre d'inertie de la Terre et qui à un mouvement de rotation uniforme
correspondant à la vitesse de rotation de la Terre. Traditionnellement un des axes est dirigé vers l'étoile
polaire. C'est le référentiel auquel nous nous référons le plus dans la vie courante il n'est donc pas galiléen
en toute rigueur! Ceci va induire des effets particuliers sur les mouvements dans l'atmosphère tels que nous
les ressentons.

Remarque: Dire qu'un repère orthonormé est un "repère direct" signifie que l'angle orienté a
pour mesure principale (dans le sens horaire). Dire qu'un repère orthonormé est un "repère
indirect" signifie que l'angle orienté a pour mesure principale . Dans tout ce qui suit, si nous ne
spécifions pas l'orientation, cela sous-entend que est direct.

Il est bien exact que les trois paramètres x, y, z suffisent parfaitement à repérer un point matériel dans
l'espace usuel comme nous en avons déjà fait mention dans notre étude des espaces ponctuels (cf. chapitre
sur les Principes), mais il n'en demeure pas moins qu'il est parfois inévitable, ou même tout simplement plus
avantageux, d'utiliser un nombre de paramètres supérieur à trois. Nous pouvons évidemment envisager
toutes sortes de paramétrages pour atteindre les coordonnées d'un point dans l'espace, de telle sorte que,
d'une façon plus généralisée nous serons amenés à prendre en considération des relations du type (nous ne
gardons plus la même écriture que celle que nous avions lors de notre étude des espace ponctuels par
cohérence avec les nombreuses références déjà existant sur le sujet):

(29.2)

Les paramètres portent le nom de "coordonnées généralisées", paramètres auxquels un


problème sera le plus souvent référé. Connaître leur expression en fonction du temps est le problème
fondamental de la dynamique. Cela signifie que nous serons parvenus à une solution quand nous disposerons
des relations indépendantes :

(29.3)

Il est donc important de retenir que le nombre de paramètres définissant le repérage d'un point dans
l'espace est au moins égal à trois, sans être nécessairement différent de trois. C'est finalement la nature des
situations envisagées qui suggèrent le choix du nombre des paramètres à utiliser (coordonnées cartésiennes,
cylindriques, sphériques,...).

Dans une vision plus générale, la configuration instantanée d'un système, quelle qu'en soit la nature, sera
déterminée par la connaissance, en fonction du temps, de n paramètres, n définissant le nombre de "degrés
de liberté" du système (cf. chapitre de Mécanique Classique).

Il est tout naturel, mathématiquement, d'associer la manipulation des n paramètres au recours à un hyper-
espace à n dimensions, dans lequel les apparaîtraient comme les coordonnées d'un point P représentatif
de la configuration d'un système quelconque. Nous donnons à cet espace à n dimensions , le nom
"d'espace de configuration".
Mais la rigueur de la mathématique-physique, nous amène à disposer d'une description plus précise des
phénomènes en ajoutant cette variable importante qu'est le temps, considérée souvent comme variable
indépendante, aux . Nous en arriverons donc fatalement à utiliser un autre hyper-espace auquel nous
avons donné le nom "d'espace des événements".

Ce dernier espace de référence revêt un intérêt capital pour un grand nombre de problèmes de la science
moderne et se trouve particulièrement bien adapté aux raisonnements de nature relativiste. Les variables
indépendantes constituant les coordonnées spatiales et temporelle forment alors ce que nous appelons les
"variables d'Euler".

Dans la mesure où les paramètres sont simplement présentés comme des fonctions explicites du temps,
le point P décrit une courbe paramétrée, définie par , avec . Cela revient à exploiter
simultanément les équations:

(29.4)

Il arrivera fréquemment que, pour des raisons d'opportunité, nous souhaitions changer de système de
coordonnées généralisées, et utiliser un autre ensemble plus compatible avec les spécificités du problème
envisagé. Nous substituerons alors au jeu des un nouveau jeu de coordonnées . Il est alors évident que
nous devrons, avant toute chose, nous doter des relations de dépendance existant entre les deux ensembles
de coordonnées (cf. chapitre de Calcul Vectoriel) :

(29.5)

Les fonctions seront maintenant supposées définies, continues, de classe (pour travailler avec
l'accélération) par rapport aux et devront conduire à un jacobien différent de zéro (cf. chapitre
de Calcul Différentiel Et Intégral).

Dans ces conditions, à chaque point de l'espace des configurations des x, noté , correspondra un point
de l'espace de configuration des q , noté . Nous avons ainsi effectué une transformation ponctuelle,
autrement dit une application de l'espace sur lui-même.

Pour étudier des milieux continus (concept radicalement différent du point matériel), nous aurons cependant
deux approches différentes:

1. Méthode de Lagrange: nous cherchons à caractériser le mouvement du milieu décrit par une formulation
Lagrangienne consistant donc à le caractériser en se donnant un système d'équations au sens newtonien. Par
dérivations, nous avons alors la vitesse et l'accélération du milieu.

2. Méthode d'Euler: Au lieu de suivre le parcours d'un point, nous portons notre attention sur l'évolution des
caractéristiques physiques en un point donné comme la vitesse, l'accélération la température, la pression ou
autre. Nous parlons alors fréquemment de "système Eulérien".
PRINCIPE VARIATIONNEL

Le "principe variationnel" n'est donc que la forme mathématique contemporaine du principe de moindre
action qui est, comme nous en avons déjà fait mention, à la base du formalisme lagrangien.

Rappelons que selon l'énoncé du principe variationnel nous devons trouver dans tout phénomène physique,
une certaine quantité qui est naturellement optimisée (minimisée ou maximisée) et qui décrit toutes les
variables du système étudié et ainsi son issue.

Voici la démarche que nous allons suivre, une fois cette démarche présentée, nous nous attaquerons à sa
formalisation mathématique.

Les propositions sont les suivantes:

P1. Nous supposons donc le principe variationnel et le principe de conservation de l'énergie comme justes.

P2. L'énergie totale d'un système fermé est constante et constituée de la sommation de l'énergie cinétique et
l'énergie potentielle.

Si nous ne considérons que l'énergie cinétique, alors le système est dit "système libre", si les deux énergies
sont considérées, nous disons alors que le système est un "système généralisé".

P3. Nous définissons une fonction mathématique (dont les variables sont les coordonnées généralisées)
appelée "Lagrangien" qui est donnée par la différence entre les deux énergies précitées.

P4. Sur l'évolution d'un système entre deux états, nous cherchons les propriétés de la fonction (du
langrangien) qui donne la minimisation de la variation de la différence des deux énergies sur l'évolution
temporelle ou métrique du système.

Enfin, une fois cette propriété déterminée (mise sous la forme que nous appelons "équation d'Euler-
Lagrange") nous chercherons toutes les autres propriétés possibles afin d'avoir les outils nécessaires pour la
physique théorique et vous allez voir cela marche terriblement bien...

Donc, pour mettre cela sous forme mathématique, nous commençons par poser qu'il existe une fonction
réelle de 2n variables:

(29.6)

que nous appellerons "Lagrangien généralisé" du système, dont l'intégrale satisfait à l'énoncé suivant :

Dans un mouvement naturel partant d'un point à l'instant , arrivant au point à


l'instant , l'intégrale suivante appelée "intégrale d'action" ou simplement "action":

(29.7)

qui peut aussi être notée dans une écriture plus abrégée :

(29.8)
doit être un extrémum (en fait, "un minimum" ou "un maximum", puisque nous aurions pu tout aussi bien
prendre -L au lieu de +L dans le choix de la définition du Lagrangien généralisé).

L'action S est ce que nous appelons communément en physique une "fonctionnelle" et a les unités de
l'énergie multiplié par le temps puisque L est une énergie.

ÉQUATION D'EULER-LAGRANGE

Le principe de moindre action énonce donc que (l'intégrale) S est extrêmale si:

(29.9)

est la trajectoire naturelle effectivement suivie par le système physique.

Considérons alors une trajectoire très voisine à la précédente, que nous noterons:

(29.10)

Remarque: Nous avons omis maintenant l'écriture des arguments t des fonctions du temps afin d'alléger les
écritures.

Si est bien l'évolution d'un système évoluant selon le principe de moindre action, alors l'action donné
par la variation :

(29.11)

est nulle pour et tendant vers zéro (sous-entendu que tout système physique revient à son état initial
sans intervention extérieure).

Ce qui nous amène à écrire :

(29.12)

Ce qui nous permet de justifier la dénomination de "principe variationnel" (aussi appelée parfois le "principe
de stationnarité de l'action"):

(29.13)

Ce principe stipule donc que la trajectoire d'une particule (ou d'un système plus général) s'obtient en
demandant qu'une certaine fonctionnelle S appelée "action" soit stationnaire par rapport à une variation de la
trajectoire. En d'autres termes, si nous effectuons une variation infiniment petite de la trajectoire, la variation
doit être nulle.

Pour un système mécanique simple l'action est alors évidemment de par le principe de conservation de
l'énergie égale à l'intégrale sur la trajectoire de (par définition du lagrangien) la différence entre l'énergie
cinétique et l'énergie potentielle.

Dès lors, dans une théorie pour laquelle les forces dérivent d'un potentiel V, nous sommes naturellement
amenés à définir le "Lagrangien" par la relation (il faudra s'en souvenir !) :
(29.14)

où T et V sont la notation traditionnelle dans le formalisme Lagrangien de l'énergie cinétique et de l'énergie


potentiel données par :

et (29.15)

Remarque: Pour l'étude de la relativité générale, nous ne chercherons pas à ce que la variation de la
différence des énergies soit minimale tel que c'est le cas pour les systèmes mécaniques, mais la variation de
la longueur d'un arc ds (non dépendant du temps contrairement à l'exemple précédent) dans un espace
quelconque lors d'une trajectoire d'un système libre. Ce qui nous amènera à écrire simplement (rappelez-
vous en aussi car ce sera très important) l'action:

(29.16)

pour un masse unitaire et en prenant les unités naturelles.

Pour revenir à notre application du principe variationnel dans le cas du lagrangien généralisé, nous pouvons
alors écrire la différentielle totale exacte (cf. chapitre de Calcul Différentiel Et Intégral) de dL et nous
obtenons alors la relation :

(29.17)

Intégrons par parties (cf. chapitre de Calcul Différentiel Et Intégral) le deuxième terme de la somme de
l'intégrale précédente :

(29.18)

Le premier terme de la dernière égalité est nul puisque

(29.19)

Effectivement, par définition, les ont exactement le même ordre de grandeur.

L'expression de l'intégrale de moindre action peut finalement s'écrire :

(29.20)
Mais les et tendent vers 0 d'une infinité de manières différentes et nous devons cependant avoir
néanmoins . Cela veut dire alors que chaque terme sommé de l'intégrale peut être pris
indépendamment et doit satisfaire :

(29.21)

Mais comme les fonctions et peuvent toujours tendre vers zéro de multiple façon, et que cette
intégrale doit être quand même nulle, nous en déduisons que ce sont les intégrandes qui sont nuls :

(29.22)

Ces n équations, satisfaites par le lagrangien généralisé du système pour le mouvement effectivement suivi,
sont appelées "équations d'Euler-Lagrange", ou plus brièvement (mais plus rarement) "équations de
Lagrange". Ce sont, comme nous allons le voir, les équations du mouvement du système: résolues, elles
donnent l'évolution effective du système dans le temps.

(29.23)

Remarque: C'est en étudiant la physique (les chapitres suivants du site) que l'on comprend mieux les
applications de cette équation (obtenue quasiment que par des développements purement mathématiques !!!)
et qu'il devient alors possible de comprendre sa signification. A notre niveau du discours, il est inutile de
dire quoi que ce soit. Il faut faire de la physique, et encore de la physique pour la comprendre et la voir
apparaître.

Donc dans l'approche lagrangienne, nous apprenons à raisonner à partir des concepts d'énergie potentielle et
cinétique, au lieu des concepts de force. Les deux approches sont évidemment équivalentes physiquement,
mais les énergies n'étant pas des quantités vectorielles, elles sont conceptuellement plus faciles à utiliser
dans une vaste gamme de problèmes. En physique quantique par exemple, la notion de force n'a aucune
signification mais les notions d'énergie demeurent valables. C'est une raison de plus pour se familiariser
avec leur utilisation. De plus, la force au sens de Newton est une action instantanée à distance. En relativité,
une telle chose est impossible. La notion de force est donc une création purement classique et
macroscopique contrairement à notre intuition, son intérêt est limité.

Exemple d'application (les autres exemples seront vus pendant notre étude des lois de Newton, de
l'électrodynamique, de la relativité restreinte, de la relativité générale, de la physique quantique des champs,
etc..):

Dans un premier temps, posons sous une forme mathématique conventionnelle l'équation d'Euler-Lagrange
(la notation des coordonnées généralisées n'est pas identique en mathématiques à celle de la physique...):

(29.24)

Prenons un exemple mathématique pratique simple mondialement connu et très important (nous réutiliserons
les développements effectués ici pour l'étude du pendule de Huygens).

L'énoncé du problème est le suivant : déterminer quel est le plus court chemin entre deux points d'un plan
(nous devinons que c'est la droite mais il faut le démontrer!).
Ce problème consiste à trouver la courbe paramétrée la plus courte qui relie deux points
(attention la variable t n'a rien à voir avec le temps!) :

(29.25)

Ainsi la longueur infinitésimale par application de Pythagore est :

(29.26)

Ainsi, la longueur de la courbe paramétrée est donnée par :

(29.27)

Il s'agit d'une relation que nous retrouverons souvent en physique et en mathématiques!!

Ainsi, ce problème, dont la solution géométrique est très simple, se formule sous forme de problème de
calcul variationnel de la manière suivante :

(29.28)

Ecrivons l'équation d'Euler-Lagrange que la solution de ce problème, si elle existe, doit vérifier.

Nous avons :

(29.29)

L'équation d'Euler-Lagrange dans ce cas particulier devient alors :

(29.30)

Donc :

(29.31)

où C est une constante d'intégration (cf. chapitre de Calcul Différentiel Et Intégral). Cette dernière égalité
implique que :
(29.32)

En revenant aux notations utilisées au début :

(29.33)

donc nous avons par intégration :

(29.34)

ce qui est bien l'équation d'une droite. Autrement écrite :

(29.35)

THÉORÈME DU CALCUL VARIATIONNEL

Le théorème du calcul variationnel consiste à montrer qu'en considérant f une fonction continue sur à
valeurs réelles et H l'ensemble des fonctions continues sur indéfiniment dérivables sur et qui
s'annulent en a et b alors pour toute fonction :

(29.36)

f est nulle sur .

Pourquoi s'intéresser à ce théorème? Parce que nous le rencontrerons très souvent lors de l'application du
principe variationnel ayant une configuration de ce type. Effectivement, rappelons que le principe
variationnel amène à avoir :

(29.37)

et l'expression intégrée est rarement une fonction simple comme le lecteur s'en apercevra au cours de sa
lecture des différentes chapitres du site. Il est donc important de connaître une propriété qui simplifie parfois
l'analyse du problème.

Remarque: Certains penseront que le cas avec avec et contredit l'énoncé


du théorème! Au fait ce n'est pas vraiment ça... le théorème se doit d'être valable pour et non juste
pour l'exemple cité. D'où le fait que f devra bien être nul comme nous allons le démontrer.

Démonstration:

Pour simplifier nous prendrons le cas , . A quelques détails techniques près la preuve par
l'absurde ci-dessous peut être adaptée au cas a, b quelconques.
Supposons que f ne soit pas nulle sur . Alors il existe tel que . Nous pouvons
supposer (même raisonnement si ).

Par l'hypothèse initiale de continuité et de non nullité de f il existe alors un petit intervalle autour de sur
lequel f est strictement positive. C'est-à-dire, qu'il existe tel que et
.

Considérons à présent la fonction définie par

(29.38)

Nous vérifions assez facilement que est continue (positive) sur et indéfiniment dérivable sur
(cf. chapitres d'Analyse Fonctionnelle et de Calcul Différentiel Et Intégral).

De plus, . Et donc, . Voici une représentation graphique de :

(29.39)

A partir de nous voulons obtenir une fonction continue sur , indéfiniment dérivable sur
positive sur et nulle en dehors de afin de montrer l'absurde de
l'hypothèse de non nullité de f pour que le théorème soit vérifié (rappelons que nous sommes en train de
faire un démonstration par l'absurde!) .

Pour ceci, il suffit de centrer en et de la contracter.

La fonction définie par :


(29.40)

répond aux critères exigés. De plus, et donc, .

Ainsi, la fonction sera continue sur positive sur et nulle ailleurs.

Nous avons :

(29.41)

Or, si une fonction est continue et positive et :

(29.42)

cela entraîne forcément (nous supposerons cela comme trop intuitif pour avoir besoin d'être démontré)
sur .

Par conséquent sur or selon notre hypothèse absurde


initiale, ce qui est contradictoire.

L'hypothèse de départ est donc bien fausse et f doit être nulle sur

C.Q.F.D.

FORMALISME CANONIQUE

Le formalisme canonique n'introduit pas une nouvelle physique mais propose une nouvelle gamme d'outils
pour étudier les phénomènes physiques. Son élément central, le "Hamiltonien", joue un grand rôle en
physique quantique.

Comme dans le formalisme de Lagrange nous travaillerons avec des quantités comme l'énergie, T et V plutôt
qu'avec des quantités vectorielles comme la force de Newton.

Dans le formalisme de Lagrange, la description d'un système mécanique à n degrés de liberté décrits par les
coordonnées générales indépendantes (non contraintes) nous mène à n équations d'Euler-Lagrange:

(29.43)

qui sont des équations différentielles du 2ème ordre.

Dans le formalisme canonique (ou de Hamilton), un système mécanique à n degrés de liberté toujours
décrits par des indépendants nous mènera à 2n équations du premier ordre (plus simple à résoudre).
Chez Lagrange nous comparons principalement des trajectoires et par conséquent les et les sont tous
indépendants. Chez Hamilton nous devrons d'abord apprendre à définir les "moments généralisés", notés
, pour remplacer les coordonnées généralisées et qui sont aussi tous indépendants.

Remarque: L'origine des moments conjugués sera triviale dès que nous aurons vu un premier exemple
concret.

TRANSFORMATION DE LEGENDRE

Cette transformation est souvent utilisée en thermodynamique où elle permet de relier entre eux les
différents potentiels thermodynamiques. En mécanique ou en géométrie elle permet de définir le hamiltonien
à partir du lagrangien et inversement. Nous en donnons une description simplifiée et suffisante.

Soit une fonction f(u,v) où u,v sont les deux variables indépendantes dont dépend f.

Définissons:

(29.44)

La transformation de Legendre permet de définir une fonction qui peut remplacer :

(29.45)

Soit maintenant la différentielle totale de f (cf. chapitre de Calcul Différentiel Et Intégral) :

(29.46)

De la définition de g nous calculons:

(29.47)

et nous avons donc:

(29.48)

HAMILTONIEN

Soit un lagrangien que nous traiterons comme la fonction f ci-dessus avec les jouant le rôle de u
et les le rôle de v. A la place de w, nous définissons les moments généralisés également appelés
"moments canoniques":

(29.49)
avec .

Avant de continuer voyons ce que nous permet de faire cette définition :

Nous définissons donc, en analogie avec g, une fonction des et des que nous noterons :

(29.50)

Attention! La relation obtenue :

(29.51)

appelée "fonction de Hamilton" ou "Hamiltonien" est plus qu'importante (comme tout le reste d'ailleurs).
Nous la retrouverons, entre autres, en physique quantique relativiste ou encore en physique quantique des
champs. Par ailleurs, un très joli exemple de tout ce que nous avons vu maintenant est donné dans le chapitre
de Relativité Restreinte où nous calculons le lagrangien et hamiltonien d'une particule libre. Les résultats
sont assez pertinents et leur utilité et justesse en électrodynamique plus que étonnante.

Exemple:

Une autre application importante et très connue de la mécanique analytique est le calcul des surfaces
minimales (physique et architecture). Si nous nous intéressons à la détermination d'une telle surface en
imposant qu'elle soit une surface de révolution, nous allons voir que nous trouvons une caténoïde (soit la
forme prend un film de savon ente deux anneaux).

Nous nous donnons les rayons et de deux cercles et l'écartement l entre les deux cercles. Nous
cherchons une fonction y de classe telle que:

et (29.52)

et que la surface de révolution sous forme paramétrique:

(29.53)

possède une surface minimale.

Nous savons que la surface d'un volume de révolution peut s'écrire (cf. chapitre Formes Géométriques):

(29.54)

Soit en faisant varier la fonction:

(29.55)
Puisque l'intégration par parties du deuxième terme donne:

(29.56)

Comme les bornes d'intégration sont fixes, le premier terme sera nul. Il reste alors:

(29.57)

et donc:

(29.58)

Le minimum cherché correspond à quelque soit ce qui impose la condition:

(29.59)

nous retrouvons l'équation d'Euler-Lagrange.

Cette équation peut aussi s'écrire sous une autre forme. En introduisant le moment canonique pour
simplifier:

(29.60)

Nous avons alors immédiatement:

(29.61)

Nous obtenons alors:

(29.62)

Ainsi, en posant l'analogie vue plus haut (méthode de Hamilton):

(29.63)

nous aboutissons à:

(29.64)
Ainsi en se rappelant qu'au début nous avions:

(29.65)

Nous aboutissons à:

(29.66)

Ce que nous pouvons aussi noter (car la constante a un signe indéterminé):

(29.67)

Nous avons alors:

(29.68)

Nous avons déjà intégré ce type d'équation différentielle en détails dans le chapitre de Génie Civil dans
l'étude de la chainette. Le résultat est:

(29.69)

la surface de révolution de cette courbe étant une caténoïde:

(29.70) Source: Wikipédia

Ce qui est un exemple remarquable qui montre l'intime relation entre la mathématique et la physique!

Cette figure peut-être obtenue avec Maple comme suit:

y:=cosh(x);
plot3d([x,y*cos(phi),y*sin(phi)],x=0..2,phi=0..2*Pi)

Maintenant, si L dépend du temps (ce qui est quand même assez souvent le cas..) nous avons comme
différentielle totale :
(29.71)

nous calculons aussi la différentielle totale de et y substituons le résultat obtenu précédemment :

(29.72)

ce qui montre bien que est fonction des (et du temps).

Nous pouvons donc aussi écrire pour sa différentielle totale :

(29.73)

et comme les et sont indépendants nous identifions, en comparant nos deux expressions que:

(29.74)

Ces relations sont elles extrêmement importantes car nous les retrouverons en magnétostatique, en physique
quantique relativiste et aussi en physique quantique des champs sous une forme un peu plus barbare (mais
magnifique aussi...).

Considérons maintenant le deuxième terme du premier membre de l'équation d'Euler-Lagrange. Nous avons
:

(29.75)

et ainsi, nous obtenons les 2n équations ci-dessous :

(29.76)
Ces 2n équations sont appelées "équations canoniques du mouvement" et sont des équations différentielles
du premier ordre.

Remarque: L'apparition du signe moins " - " entre les équations pour les et celles pour leurs moments
conjugués, s'appelle une "symétrie symplectique".

De :

(29.77)

nous pouvons, sur une trajectoire qui obéit aux équations canoniques, calculer:

(29.78)

Remarque: Si H ne dépend pas du temps nous avons alors , alors H (ainsi que L), sont une
"constante du mouvement".

Un exemple s'avère indispensable à ce niveau d'avancement de l'étude du formalisme Lagrangien. Nous


allons nous restreindre à un cas particulier d'une particule soumis à une force en une dimension. Mais bien
que cet exemple et les développements qui y sont liés soient simples nous retrouverons les résultats obtenus
ici dans bien d'autres parties du site. Il est donc important de bien l'étudier et de bien le comprendre (ce qui
nécessite malheureusement aussi que le contenu du chapitre de Mécanique Classique soit connu par le
lecteur).

Exemple:

Soit une particule de masse m se déplaçant en une dimension (disons x) et soumise à une force dérivant d'un
potentiel tel que:

(29.79)

Nous savons que son lagrangien est:

(29.80)

Nous n'aurons qu'un seul moment (la quantité de mouvement), noté p, conjugué à x et défini par:

(29.81)

équation que nous pouvons (que nous devons !) inverser (de la définition de la quantité de mouvement) :

(29.82)
Nous pouvons noter en ce point le moment p correspond (ô hasard !!) à la composante x de la définition
élémentaire (ce qui ne sera pas toujours aussi trivialement le cas).

Selon la définition de l'Hamiltonien il vient alors :

(29.83)

que nous écrivons souvent sous la forme :

(29.84)

où T est donc l'énergie cinétique exprimée en fonction des moments.

CROCHETS DE POISSON

Le crochet de Poisson est la façon standard de noter une certaine opération qui implique les
quantités et ainsi que l'ensemble des variables canoniques définie par :

(29.85)

qui exprime la manière de parcourir un champ (le crochet étant nul si les deux types de parcours sont égaux).

de cette définition nous pouvons déduire certaines propriétés relativement triviales :

P1.

Démonstration:

(29.86)

C.Q.F.D.

P2.

Démonstration:
(29.87)

C.Q.F.D.

P3.

Démonstration:

(29.88)

C.Q.F.D.

P4.

Démonstration (nous allons simplifier la notation pour condenser...):

(29.89)
Bon et ici, histoire de pas avoir un truc illisible, long et ennuyeux on va démontrer la propriété pour et
nous supposerons (bien évidemment) qu'elle est valable pour tout n :

(29.90)

Nous avons en plus (cf. chapitre de Calcul Différentiel Et Intégral) sous certaines conditions la propriété
. Dès lors l'ensemble des termes s'annulent (c'est de l'algèbre élémentaire) pour avoir finalement :

(29.91)

où la dernière expression est appelée "identité de Jacobi".

C.Q.F.D.

Au delà d'une simple notation, le calcul des crochets de Poisson est assez facile et permet d'obtenir nombre
de résultats intéressants. D'autre part, ils sont intimement reliés aux "commutateurs" de la physique
quantique que nous étudierons dans le détail dans le chapitre concerné.

Considérons maintenant une fonction quelconque dont la dérivée totale par rapport au temps le
long d'une trajectoire s'écrit (vous y reconnaîtrez quelque chose que vous connaissez déjà... ) :

(29.92)

Si cette trajectoire est une trajectoire physique, elle obéit aux équations canoniques de l'hamiltonien H du
système:

(29.93)

et alors:

(29.94)
En particulier, cette équation permet un calcul facile des constantes du mouvement, . En effet, le
calcul de est immédiat et le calcul de un assez simple exercice.

Il existe une famille de résultats intéressants des crochets de Poisson. Parmi les plus importants, calculons
certains de ces crochets entre des variables canoniques, coordonnées et moments :

(29.95)

puisque par définition, les coordonnées et moments ne sont pas directement dépendants :

(29.96)

d'où :

(29.97)

et de manière identique :

(29.98)

Mais :

(29.99)

où rappelons-le, est le symbole de Kronecker défini par :

(29.100)

Attention ! n'est pas commutatif. Effectivement, le lecteur contrôlera facilement que :

(29.101)

Ce qui implique un résultat assez général que nous retrouverons en physique quantique :

(29.102)

TRANSFORMATIONS CANONIQUES

Nous disons des que ce sont des "variables canoniques généralisées". Ce n'est pas un euphémisme
puisqu'il n'y a pratiquement aucune limite à ce qu'elles peuvent représenter physiquement.

Puisque tel est le cas, il doit exister des transformations entre ces différents choix. Nous noterons les
nouvelles variables canoniques obtenues suite à une telle transformation.
Nous ne sommes pas surpris par contre de constater que ces transformations sont soumises à des conditions
assez sévères. En effet, les sont généralisés et obéissent à :

(29.103)

et les équations canoniques :

(29.104)

sont invariantes de forme. Ainsi, à la suite d'une transformation des vers les et définissant un
nouvel hamiltonien que nous noterons nous devrons avoir :

(29.105)

et les équations canoniques :

(29.106)

Strictement, les équations de transformation peuvent s'écrire :

(29.107)

avec et doivent pouvoir s'inverser puisque la physique reste indépendante des variables que
nous employons pour la décrire, donc nous pouvons écrire les transformations inverses :

(29.108)

avec . Les forment 4n variables mais il est évident que seules 2n d'entre elles sont
indépendantes.
30. MÉCANIQUE CLASSIQUE/RATIONNELLE (1/2)

A vant d'aborder l'étude des corps solides en mouvement dans le cadre de la mécanique classique (à
l'opposé de la mécanique relativiste) appelée également "mécanique rationnelle" ou "mécanique
newtonienne", il peut sembler être dans l'ordre logique des choses de définir et d'étudier les propriétés
relativement à leur état statique.

Définitions:

D1. Un phénomène est dit "statique" ou "en équilibre" lorsqu'il ne subit aucune dynamique (accélération ou
in extenso : force), du moins apparente. Nous pouvons considérer un équilibre comme un état statique, bien
qu'il ne soit qu'apparent car il peut être le résultat de deux dynamiques opposées qui se compensent ! Ainsi,
les grandeurs qui décrivent un phénomène statique sont des constantes, les valeurs concrètes de ces
grandeurs sont calculables.

De manière plus technique cette définition est érigée au rang de principe appelé le "principe fondamental de
la statique" qui énonce que pour qu'un système soit en équilibre, il faut que la résultante générale et le
moment résultant des forces extérieures soit équivalent à zéro par rapport à son centre de masse ou de
gravité. (la condition est suffisante pour les problèmes de mécanique qui traitent des solides indéformables).

D2. La "statique" est l'étude des conditions d'équilibre d'un point matériel soumis à des forces en équilibre

D3. Toute cause capable d'accélérer (concept défini plus loin) ou de déformer un corps est appelé "force"
(concept introduit rigoureusement par Newton et sur lequel nous reviendrons en détail plus loin lors de
l'énoncé des trois lois de Newton).

Remarque: En mécanique classique nous ne nous posons naturellement pas la question d'une transformation
du temps. Les changements envisagés concernent la grandeur position et ses dérivées. En effet, en
mécanique classique, nous postulons le "temps de Newton" : le temps s'écoule de façon identique d'un
référentiel à l'autre.

D4. Un système matériel S (ensemble de points matériels ) est dit "solide indéformable" (rigide), ou
simplement "solide", si les distances mutuelles des points matériels le constituant ne varient pas au cours du
temps :

(30.1)

LOIS DE NEWTON

Les trois lois de Newton sont à la base de la mécanique classique. Elles sont à posteriori indémontrables et
non formalisables car elles énoncent des observations et découlent donc de notre expérience quotidienne.

Cependant, les développements de la physique moderne et qui se basent sur les conséquences de ces trois
lois sont en tel accord avec les conditions théoriques qu'impose le principe de moindre action et les
expériences y relatives, que leur validité pourrait ne plus être mise en doute (...)

PREMIÈRE LOI (LOI D'INERTIE)

Définition: Tout corps ponctuel ou étendu persévère dans sa forme (géométrie) ou son état de repos ou de
mouvement rectiligne uniforme (décrit par le centre de masse), sauf si des "forces imprimées" le
contraignent d'en changer.
Autrement dit: Tout corps au repos ou en mouvement rectiligne uniforme est soit imprimé par un nombre de
forces nulles, soit la somme des forces imprimées est nulle (c'est le principe fondamental de la statique
appelé aussi "principe d'inertie").

Corollaire: Lorsque la trajectoire d'un corps n'est pas une droite ou lorsque la vitesse de ce corps n'est pas
constante, on peut en conclure d'après le Principe d'inertie que les forces qui s'exercent sur ce corps ne se
compensent pas.

Remarque: Nous avons démontré ce corollaire lors de notre étude du théorème de Noether dans le chapitre
traitant des Principes de la physique.

Après la virgule de la première phrase, jaillit en pleine lumière le mot "force". Questionnons donc ce mot : le
langage courant regorge de significations différentes: la force du poignet, la force de l'âme... Aussi, la force
peut-elle être aveugle ou majeure, selon le cas... Quoi qu'il en soit, elle a le pouvoir de changer le cours (le
mouvement) et la forme (géométrie) des choses. Sans ignorer ce halo qui entoure le mot et qui a embarrassé
plus d'un physicien avant lui, Newton donne à la force une signification très précise, qui se démarque de
l'idée intuitive d'un effort physique.

Propriétés :

P1. La force est une grandeur vectorielle

P2. L'effet d'une force, ne change pas si nous faisons glisser la force sur sa droite d'action.

Une force est donc une grandeur physique qui se manifeste par ses effets :

E1. Effet dynamique : une force est une cause capable de produire ou de modifier le mouvement ou la forme
(géométrie) d'un corps

E2. Effet statique : une force est une cause capable de produire une déformation d'un corps.

Toute force peut être représentée par un vecteur dont les quatre propriétés sont :

P1. Direction : droite selon laquelle l'action s'exerce

P2. Sens : sens selon lequel l'action s'exerce sur la droite

P3. Point d'application : point où l'action s'exerce sur le corps

P4. Intensité : la valeur (norme) de la force

Il est possible de ranger la plupart des forces par famille telles que :

F1. Les "forces de réaction" : chaque corps exerce une force sur un autre corps qui est en contact avec lui.
Par exemple, si un objet repose sur une table, cette table exerce une force égale et opposée sur l'objet (afin
que ce dernier ne s'enfonce pas dans la table - ce sont des mécanismes quantiques qui sont à l'origine de
cette force de réaction). Cette force est toujours à la verticale du point de contact.

F2. Les "forces de frottement" : la force de frottement existe lorsque deux corps sont en contact. Elle
s'oppose toujours au mouvement. La force de frottement qui s'oppose au mouvement n'a pas seulement un
effet négatif, elle est indispensable pour assurer aussi le contact entre deux surfaces (par exemple : contact
des pneus sur la route, freinage, ...).

F3. Les "forces de tension" exercées sur un corps : c'est une force qui tire sur un élément d'un corps comme
par exemple, la tension exercée par un fil, par un ressort (cf. chapitre de Génie Mécanique).

F4. Les "forces à distance" : ce sont les forces qui agissent par l'intermédiaire de champs vectoriels comme
par exemple le champ électrique, le champ magnétique, le champ gravitationnel. Ce dernier a comme
particularité s'il est isotrope (nous le démontrerons lors de notre étude de la statique des forces) de pouvoir
se réduire à l'étude du centre de gravité du corps.

DEUXIÈME LOI (PRINCIPE FONDAMENTAL DE LA DYNAMIQUE)

Définition: Le changement de mouvement est proportionnel à la "force motrice imprimée", et s'effectue


suivant la droite par laquelle cette force est imprimée.

Une force, nous le savons, est dans le langage de Newton ce qui provoque le "changement du mouvement"
et pas autre chose... Mais, supplément au programme, les mots "changement du mouvement" de cette loi
cachent une signification mathématique, différente de l'intuition "changement de vitesse". Pour Newton,
nous avons vu qu'un corps au repos était caractérisé par sa quantité de matière, sa masse. S'inspirant de
certains prédécesseurs, Newton pose qu'un corps en mouvement "transporte une certaine quantité", appelée
sans fioritures : la "quantité de mouvement". C'est en fait cette quantité qui, sous le simple mot
"mouvement" est contenue dans l'énoncé de la seconde loi. La quantité d'un mouvement est la mesure que
nous tirons à la fois de sa vitesse (concept que nous définirons plus loin lors de notre étude de la
cinématique) et de sa quantité de matière, autrement dit, par définition, le produit de sa masse par sa vitesse.

(30.2)

En utilisant les symboles mathématiques modernes, la première partie de cette deuxième loi peut alors se
reformuler :

La force est égale à la variation en fonction du temps de la quantité de mouvement, soit dans un cadre non
relativiste :

(30.3)

Cette relation est donc valable tant que la vitesse est très inférieure à celle de la lumière comme nous le
verrons en lors de notre étude de la mécanique relativiste bien plus tard, car Newton supposa que la masse
ne variait pas (ou ne semblait pas varier...) en fonction de la vitesse. Ainsi, la "relation fondamentale de la
dynamique" (R.F.D.) est donnée par :

(30.4)

et peut s'énoncer ainsi : Soit un corps de masse m constante, l'accélération subie par un corps dans un
référentiel galiléen est proportionnelle à la résultante des forces qu'il subit, et inversement proportionnelle à
sa masse m.
Rappel : La "masse" est une mesure pour la quantité de matière contenue dans le corps (cf. chapitre sur les
Principes De La Mécanique). La masse est une constante indépendante de l'endroit où elle se trouve (unité
S.I. kilogramme : [kg]). Le "poids", correspond lui à la force (unité S.I. newton : N) qu'un objet exerce sur
une autre par l'intermédiaire d'un champ gravitationnel. Il dépend de l'endroit où nous nous trouvons (voir
ci-dessous l'équation de la force gravitationnelle de Newton).

Nous verrons (démontrerons) que dans le cadre d'un corps tombant dans un champ gravitationnel à symétrie
sphérique, nous avons :

(30.5)

dans le cadre de notre vieille Terre, nous avons pour habitude de poser:

(30.6)

Dans le système Eulérien et en coordonnées cartésiennes, une grandeur donné d'un milieu continu aura
une distribution en fonction des quatre variables indépendantes x, y, z, t. Pour de petites variations dx, dy,
dz et dt, la variation totale de s'exprimant par (cf. chapitre de Calcul Différentiel Et Intégral):

(30.7)

En suivant une particule dans son mouvement, nous observons pendant un temps dt des déplacements dx, dy,
dz. Nous pouvons donc exprimer à partir de l'expression précédente la variation totale de pendant le
temps dt. Nous obtenons ainsi l'expression d'une dérivée très importante en physique théorique dite "dérivée
particulaire":

(30.8)

En mécanique nous allons particulièrement travailler avec le champ gravitationnel Newtonien. Dès lors, la
relation reliant la force à l'accélération prend une forme plus générale:

Soit la dérivée particulaire de la vitesse (pour les trois coordonnées spatiales):

(30.9)

Ce qui s'écrit aussi :

(30.10)

Ce qui peut s'écrire aussi sous forme condensée:

(30.11)

La deuxième loi de Newton s'écrit alors:


(30.12)

Cette formulation de la deuxième loi de Newton est de la plus haute importance en physique. Elle rend
compte explicitement de la force subie par un point matériel dans un champ vectoriel en fonction de la
vitesse et non plus de la position. Nous retrouverons cette formulation en mécanique des milieux continus
dans notre étude des fluides et plasmas, en électromagnétisme ainsi qu'en Relativité Générale.

TROISIÈME LOI (LOI D'ACTION ET RÉACTION)

Énoncé : la réaction d'un corps étendu ou ponctuel solide est toujours de sens opposée et d'intensité et de
direction égale à la force imprimée.

Cette troisième loi est plus connue sous le nom de : "principe d'action/réaction" et découle de la première loi
de Newton selon le raisonnement mathématique lors de notre étude du théorème de Noether dans le chapitre
traitant des Principes de la physique.

Nous pouvons également dire encore que deux corps solides ponctuels ou étendus en contact exercent l'un
sur l'autre toujours des forces opposées en sens mais égales en intensité et en direction

CONDITIONS D'ÉQUILIBRE

Pour qu'un point matériel, soumis à des forces soit en équilibre statique, il faut que la résultante
de ces forces soit nulle. Soit :

(30.13)

Définitions:

D1. Un solide rigide est un ensemble de points rigidement liés.

D2. Si les lignes d'action de toutes les forces agissant sur un corps sont dans un même plan, le système de
forces est dit "système coplanaire".

Une observation plus approfondie fait apparaître la force comme le résultat macroscopique de phénomènes
microscopiques complexes, à savoir des interactions à distance entre particules. Ces interactions sont au
nombre de quatre et je désire nullement en parler maintenant car elles font appel à des outils mathématiques
qui sont hors contexte dans cette section du site.

Remarque: La relation précédente, qui définit donc tout corps à l'équilibre, ouvre l'étude a de très nombreux
cas pratiques et constitue à elle seule un immense chapitre d'applications pratiques que nous appelons la
"statique des forces" et que nous développerons après avoir introduit le concept de moment de force.

CENTRE DE MASSE ET MASSE RÉDUITE

Il s'agit du cas particulier du barycentre avec toutes ses propriétés que nous avons déjà largement développé
dans le chapitre de Géométrie Euclidienne (donc nous vous conseillons fortement de vous y référer) mais
rapporté à la physique :

Soit un solide formé de n points de masse et repérés par leurs vecteurs de position
respectifs.
Définition: Nous appelons "centre de masse" (ou "centre d'inertie" s'il y a égalité stricte entre masse grave et
masse inerte comme nous en avons fait mention dans le chapitre traitant des Principes de la mécanique) un
point G auquel nous pouvons rattacher tout la masse du système (et donc son analyse!!) et tel que, l'origine
étant arbitrairement choisie il soit donné par (nous démontrerons cette relation lors de l'étude de la statique
des forces) :

(30.14)

De façon identique, nous définissons la masse réduite du système par la relation :

(30.15)

Si nous considérons le solide comme continu (vrai seulement à l'échelle macroscopique en première
approximation) alors il vient :

(30.16)

Intégrales étendues au volume du solide en entier.

De plus, si le solide est homogène (cas particulier), de masse volumique , alors , dV étant
l'élément de volume. L'équation peur alors s'écrire (la notation de la triple intégrale est réduite à une seule
par souci de condensation d'écriture):

(30.17)

Soit en composantes :

(30.18)

Propriétés :

P1. Si le solide possède un axe de symétrie, alors G est sur cet axe

P2. Si le solide possède un plan de symétrie, alors G est sur ce plan

P3. Si le solide possède plusieurs axes de symétrie, alors G est à leur intersection

Remarques:
R1. Le centre de masse G peut se trouver hors du solide (exemple: un tabouret, un boomerang, etc.)

R2. Il ne faut pas confondre "centre masse" et "centre de gravité" (dit également "barycentre" - voir le
chapitre traitant de la Géométrie Euclidienne) qui se confondent si et seulement si la masse du corps étudié
est homogène.

Il n'est pas évident de calculer le centre de masse d'un corps donné relativement simple. Ce n'est pas que les
outils mathématiques à manipuler soient complexes loin de là (simple intégrale, Pythagore et quelques
multiplications et intégrations par parties) mais il faut aborder le problème d'une façon élégante et si nous
n'avons pas tout de suite la bonne approche nous nous casserons très vide les dents. Nous conseillons donc
aux professeurs qui abordent ce sujet et les exercices y relatifs, de les faire avec les élèves (donc en classe)
mais en laissant ces derniers débattre de la façon dont le professeur doit attaquer le problème au tableau noir
(cela marche très bien).

THÉORÈME DU CENTRE DE MASSE

Sous l'action des forces extérieures , agissant en chaque point du solide, chacun de ces points
prend l'accélération correspondant à la force appliquée . En utilisant la loi de Newton (voir la définition
de cette loi plus loin) pour chaque point et en sommant les effets nous aurons (dans un cas non relativiste) :

(30.19)

en vertu de la position du centre de masse donnée par la relation :

(30.20)

il vient si le référentiel est posé sur le centre de masse :

où (30.21)

soit:

(30.22)

C'est le théorème du centre de masse, que nous pouvons énoncer ainsi:

Le centre de masse d'un solide se meut comme un point matériel de masse égale à celle du solide et auquel
serait appliqué la somme des forces extérieures. Un exemple simple est celui d'un projectile explosif
décrivant en absence de pesanteur une trajectoire courbe. Si le projectile explose et se fragmente, le centre
de masse des éclats continue à décrire la trajectoire courbe qu'il avait entamée.

Remarque: Dans le cas particulier du solide (ensemble de points) soumis au champ de la pesanteur, est
le poids du solide et G s'appelle alors "centre de gravité" (d'où l'origine de cette appellation).
Reprenons l'équation :

(30.23)

donnant la position du centre de masse. Sa vitesse vaut:

(30.24)

en posant :

(30.25)

où est la quantité de mouvement du système, il vient:

(30.26)

Cette relation montre que si la somme des forces extérieures est nulle alors:

(30.27)

Donc la quantité de mouvement du système entier est conservée et le mouvement du centre de masse du
système est inaltéré. Ceci justifie les remarques faites lors de l'étude de la conservation de la quantité de
mouvement.

Dans l'étude des interactions entre particules, il est souvent commode d'utiliser un système de référence lié
au centre de masse de l'ensemble des particules. Ce centre de masse étant au repos dans ce référentiel sa
vitesse y est nul ainsi que la quantité de mouvement totale, comme le montrent les équations ci-dessus. Cette
propriété constitue le puissant avantage de cette description.

Remarque: En mécanique, l'usage du centre de masse (point matériel) est particulièrement aisé car le
système de forces est régi seulement par la loi de Newton. Avec des particules électrisées (charges), il en va
tout autrement. Les effets électromagnétiques sont dominants lors de leurs accélérations, ce qui induit
des phénomènes ondulatoires interactifs nettement plus complexes. C'est la raison pour laquelle nous ne
verrons jamais une étude sur ce site du "centre de charge" lorsque nous aborderons l'électrostatique dans le
chapitre d'Électrodynamique...

THÉORÈME DE GULDIN

Le théorème de Guldin permet dans certains cas, de simplifier le calcul du centre de masse de certains corps.

Premier théorème : Soit une plaque plane, homogène, d'épaisseur constante e, de masse volumique placé
dans un plan cartésien xOy. Nous avons alors par rapport à l'axe y:
(30.28)

(30.29)

Envisageons une rotation autour de l'axe x. Le volume décrit par un élément de surface dS lors de cette
rotation vaut :

(30.30)

et, par conséquent, le volume total décrit par la surface S complète est :

(30.31)

Ainsi, en procédant de même pour , nous obtenons finalement :

(30.32)

Deuxième théorème :soit une tige courbe, homogène, de longueur l, de section constante, de masse linéique
. Nous avons :

(30.33)
Envisageons une rotation autour de l'axe x. La surface décrite par un élément de longueur dl lors de cette
rotation vaut :

(30.34)

et, par conséquent, la surface totale décrit par la tige de longueur L est :

(30.35)

Ainsi, en procédant de même pour , nous obtenons finalement :

(30.36)

CINÉMATIQUE

Un phénomène est évolutif si, en l'observant, nous constatons un glissement de la valeur concrète d'une ou
plusieurs grandeurs. Ces grandeurs ne sont pas des constantes mais des variables. Une évolution implique
qu'il y a un début, une infinité d'états intermédiaires et une fin. Un "état" est la description d'un instantané
d'un phénomène évolutif (pas forcément au sens temporel du terme).

La relation fonctionnelle entre grandeurs pour un état donné peut être décrite par une équation. Pour un
phénomène évolutif, il peut y avoir une infinité d'états que nous pouvons décrire par autant d'équations. Sous
cette forme, cela n'a pas d'intérêt. Nous cherchons alors à trouver une équation unique qui met en relation les
différentes grandeurs vérifiant tous les états que le phénomène évolutif considéré peut admettre. Par cette
équation, nous pouvons ensuite calculer n'importe quel état du phénomène évolutif étudié : c'est "l'équation
d'état" (notion tirée de la thermodynamique).

La "cinématique" est donc la partie de la mécanique qui traite des mouvements sans s'occuper de ses causes.

POSITION

Définition: La position d'un objet est définie par son vecteur position dans le cas particulier d'un espace
tridimensionnel :

(30.37)

or chaque coordonnée d'un objet en mouvement peut varie fonction du temps comme:

(30.38)

Plutôt que cette notation un peu lourde en parenthèses... les physiciens notent fréquemment le vecteur
position (ou vecteur d'espace) sous la forme d'un vecteur de 4 dimensions:

- 3 dimensions spatiales

- 1 dimension temporelle

et nous écrivons alors :

(30.39)
et nous appelons alors ce vecteur un "quadrivecteur d'espace-temps" dont les composantes sont les
coordonnées généralisées du système.

VITESSE

Définition: La vitesse, notée v, est par définition la distance parcourue par un objet pendant une certaine
quantité de temps :

(30.40)

Lorsqu'un corps est en mouvement uniforme rectiligne, c'est-à-dire qu'il parcourt une distance donnée selon
une dimension avec en un temps toujours égal, le rapport précédent est constant dans le temps:

(30.41)

La vitesse moyenne arithmétique est définie comme étant le rapport de la distance parcourue entre un point
de départ donné à un instant et un point d'arrivée à un instant :

(30.42)

Remarque: Il faut prendre garde lors de calculs de vitesses moyennes car il existe plusieurs types de
moyennes en mathématique... (cf. chapitre de Statistique)!

Ceci représente donc une moyenne (car nous ne nous intéressons pas comment le chemin entre et a
été parcouru) mais nullement la vitesse instantanée du véhicule à un moment donné.

Si nous désirons connaître la vitesse dite "vitesse instantanée" du véhicule en un point de sa trajectoire il faut
faire passer le delta du temps à un différentiel (cf. chapitre de Calcul Différentiel Et Intégral) tel que :

(30.43)

avec qui tend vers zéro.

Mathématiquement, nous notons cela correctement de la façon suivante:

(30.44)

Ainsi, pendant une différence de temps infiniment petite, la distance parcourue sera également infiniment
petite. Nous aurons donc :

(30.45)

et finalement :

(30.46)
Si le corps étudié n'est pas en mouvement rectiligne dans un repère cartésien à trois dimensions alors sa
position sera donnée par le vecteur et nous noterons sa vitesse dès lors par:

(30.47)

Remarque: Si toutes les parties d'un corps se déplacent à la même vitesse et dans la même direction, nous
avons alors un "mouvement de translation". Par contre, dans un "mouvement de rotation", les vitesses des
diverses parties du corps ne sont pas les mêmes, en module et en direction (nous le démontrerons plus loin)
et peuvent varier avec le temps.

Attention ! Un mouvement ne peut être décrit que par rapport à un repère fixe : le mouvement absolu
n'existe pas. Galilée avait déjà compris que : "Le mouvement est comme rien". Le mouvement n'existe pas
en soi, mais relativement à autre chose.

ACCÉLÉRATION

Définition: L'accélération, notée a, est par définition, la variation de la vitesse pendant un une certaine
quantité de temps tel que (nous passons directement à la limite) :

(30.48)

À nouveau, si le corps n'est pas en mouvement uniforme rectiligne nous aurons :

(30.49)

Si le corps est en mouvement rectiligne et uniforme (nous pouvons toujours généraliser à un mouvement non
rectiligne) nous avons alors:

(30.50)

La constante est à déterminer en fonction des conditions initiales. Si la distance initiale parcourue au temps
zéro est nulle la constante sera nulle. Dans le cas contraire nous écrivons :

(30.51)

ce qui nous donne la distance parcourue par un corps pendant un laps de temps donné.

Si le corps est en mouvement rectiligne et accélère constamment nous avons alors:


(30.52)

La constante est à déterminer en fonction des conditions initiales. Si la distance initiale parcourue au temps
zéro est nulle la constante sera nulle. Dans le cas contraire nous écrivons :

(30.53)

Nous voyons plus fréquemment cette relation sous la forme :

ou (30.54)

mais nous avons :

(30.55)

si nous intégrons cette relation, nous obtenons :

(30.56)

que nous retrouvons dans les écoles le plus fréquemment sous la forme :

(30.57)

Cette relation donne la position d'un mobile en mouvement rectiligne et uniformément accéléré. De cette
dernière, nous déduisons une énorme quantité de relations qui sont très intéressantes en physique aussi bien
en considérant des cas idéaux que des cas réels.

Le premier cas que nous considérons comme le plus connu, est la vitesse de chute à accélération constante
d'un corps dans un milieu exempt de tout frottement (cas traité plus loin lors de notre étude de la tribologie).

Comme nous l'avons déjà démontré précédemment, nous avons:

et (30.58)

Les deux relations combinées donnent:

(30.59)
Nous pouvons tirer de cette relation la vitesse de libération d'un astre (relation pratique quand nous
étudierons le chapitre d'Astrophysique et intéressant pour comparaison lorsque nous étudierons la relativité
générale):

Supposons que vous savez déjà que deux corps s'attirent mutuellement avec une accélération selon le
modèle classique de Newton (que nous démontrerons plus loin):

(30.60)

Mis dans la relation de chute d'un corps , nous obtenons :

(30.61)

à la surface du corps attracteur principal nous avons donc la "vitesse de libération" :

(30.62)

Nous pouvons répondre à partir de cette équation, pourquoi certaines planètes du système solaire ont un
atmoshpère et d'autres pas (il faut prendre en compte l'agitation moléculaire) comme nous le verrons dans le
chapitre d'Astronomie.

Ce qui est aussi intéressant dans cette relation c'est que nous pouvons calculer quelle doit être le rayon R
d'un corps de masse m pour que sa vitesse de libération soit égale à celle de la lumière (allusion aux Trous
Noirs).

Nous avons dès lors:

(30.63)

Nous verrons lors de notre étude de le relativité générale qu'après de relativement longs calculs dans un
champ gravitationnel isotrope (métrique de Schwarzschild) nous retomberons sur cette relation.

PLAN OSCULATEUR

Les vecteurs et liés à un point P en mouvement forment, à chaque instant t un plan appelé "plan
osculateur" de la trajectoire (généralement curviligne sinon quoi le plan se réduit à une droite).

Il est souvent utile de décomposer le vecteur accélération dans le plan osculateur suivant respectivement la
tangente et la normale à la trajectoire :

(30.64)

où le premier terme du membre de droite est un vecteur parallèle à la vitesse et le deuxième un vecteur
perpendiculaire à la vitesse et situé du côté concave de la trajectoire.

Exprimons ces deux vecteurs (un exemple plus général est donné dans le chapitre de Géométrie
Différentielle) :
Nous pouvons écrire que :

(30.65)

où ds est un élément courbe (l'abscisse curviligne) de la trajectoire et un vecteur unité tangent à la


trajectoire lié au point P.

L'accélération s'écrit alors:

(30.66)

Le premier terme à droite de l'égalité est l'accélération tangentielle quand au second terme, même si la
vitesse est constante ce dernier apparaît dans l'expression de l'accélération pour exprimer le changement de
direction de la vitesse.

Décomposons le vecteur dans la base orthonormée euclidienne générée par la famille de vecteur :

(30.67)

Ensuite, en dérivant par rapport au temps:

(30.68)

En comparant avec l'expression initiale du vecteur , nous voyons que les termes entre crochets ci-dessus
sont les composantes d'un nouveau vecteur unité perpendiculaire au vecteur , donc perpendiculaire à la
trajectoire et dirigé vers le centre de courbure.

De plus par la définition du radian, nous avons :

(30.69)

où R est le rayon de courbure de la trajectoire.

L'expression devient alors:

(30.70)

et le second terme de l'expression générale de l'accélération devient alors:

(30.71)
Nous avons donc finalement (relation démontrée avec une autre approche dans le chapitre de Géométrie
Différentielle):

(30.72)

où "l'accélération tangentielle" donnée par :

(30.73)

est un terme qui exprime la modification de l'intensité de la vitesse sur la trajectoire du point P et où
"l'accélération normale" :

(30.74)

est un terme qui exprime le changement de direction du point P sans que nécessairement ce dernier change
donc de vitesse! Communément cette dernière relation est assimilée à la "force centrifuge"!!

Remarque: La force centrifuge est considérée en physique comme une force fictive car au fait il ne s'agit pas
d'une force qui tend à nous éloigner d'un centre de rotation mais c'est juste qu'il une force qui n'est plus
suffisante ( la force de frottement dans le cadre d'un manège ou gravitationnelle pour des planètes) pour
nous empêcher de suivre une trajectoire en ligne droite par simple inertie. Raison pour laquelle lorsque nous
sommes éjectés d'un manège nous partons tangentiellement à sa rotation et non pas perdendiculairement à
celle-ci.

Nous constatons immédiatement que si le mouvement est forcément rectiligne, accéléré ou non,
tandis que si la trajectoire est nécessairement incurvée.

PRINCIPE DE RELATIVITÉ GALILÉEN

Définition: Il est impossible pour un observateur animé d'un mouvement uniforme de savoir s'il se meut par
rapport à son environnement ou bien à l'inverse si l'environnement se déplace par rapport à lui (nous ne
pouvons pas distinguer le repos et le mouvement à vitesse et direction constantes). Dès lors, il ne peut
exister de référentiel absolu (ou privilégié) qui puisse être considéré comme fixe vis-à-vis de toutes les
autres repères galiléens ce qui signifie clairement que tous les repères galiléens doivent jouir du même statut
en mécanique puisqu'ils ne peuvent être distingués les uns des autres. Ce principe est nommé le "principe de
relativité galiléen".

Ce principe, (à ne pas confondre avec le principe de relativité restreinte car les hypothèses de départ
diffèrent un tant soit peu...) découle directement de l'étude de ce que nous nommons la "transformation de
Galilée".

Définition: Une "transformation de Galilée" est une suite d'opérations mathématiques sur une loi physique
qui permet de déterminer les propriétés d'un ou plusieurs "observables" (vitesse, force quantité de
mouvement, etc.) lorsque nous passons lors de l'étude d'un phénomène physique d'un référentiel à un autre
référentiel : l'un supposé au repos, et l'autre en mouvement uniforme.

La question à l'origine historique était de répondre s'il est plus légitime d'étudier un phénomène dans un
référentiel ou un autre. Plus exactement, nous souhaitons déterminer si la forme des lois physiques gardent
les mêmes formes algébrique quelque soient les référentiels dans lequel nous les étudions.
Voyons cela d'un peu plus près :

Soient deux référentiels en mouvements l'un par rapport à l'autre à une vitesse constante . Pour
un certain référentiel cartésien au repos (ou supposé tel quel) nous allons poser le deuxième
référentiel de façon à ce qu'il soit aligné avec l'axe des afin de simplifier les calculs avec
:

(30.75)

Nous allons également mettre dans le deuxième référentiel en mouvement, un point matériel de
coordonnées .

Remarque: Nous supposerons connu le concept de "quantité de mouvement" p défini plus loin avec rigueur.
Rappelons donc dès lors que la quantité de mouvement du point P animé d'une vitesse v (norme) dans
est alors donné par :

(30.76)

Nous avons alors en appliquant les relations classiques de la cinématique :

(30.77)

d'où et donc (nous supposons connu le concept de "force" défini plus loin avec rigueur) :

(30.78)

Le résultat obtenu est donc fort intéressant puisque la deuxième loi de Newton garde exactement la même
forme, et la même valeur dans les deux référentiels. Le fait que nous nous déplacions ou pas à vitesse
constante ou pas n'a donc aucune influence sur notre vision du monde qui reste exactement la même.
Conséquence : Puisque les forces sont identiques, aucune expérience de mécanique ne peut déterminer si un
référentiel galiléen est le repère absolu (autrement dit deux observateurs, dans deux référentiels galiléens
différents, ne peuvent à l'aide d'une expérience de mécanique déterminer lequel se meut par rapport à
l'autre).

Donc, en mécanique classique, il n'existe pas de référentiel galiléen absolu!

Toutefois notons bien que ce résultat est obtenu en supposant que :

(30.79)

c'est-à-dire que nous imposons que la vitesse relative est uniforme (constante) et la masse constante et
surtout, que .

Mais au fait, cette transformation est fondamentalement fausse comme nous le verrons plus en détail lors de
notre étude de la relativité restreinte (cf. chapitre de Relativité Restreinte). Effectivement, soit un objet se
déplaçant le long de l'axe avec une vitesse v mesurée dans le repère primé :

(30.80)

quel sera alors sa vitesse w dans le repère non primé? Si la transformation de Galilée est fondamentalement
vraie, il suffit de remplacer dans la relation précédente x' et t' par leurs expressions en fonction de t :

ou (30.81)

soit (loi d'addition des vitesses) :

(30.82)

Seul petit hic... une expérience simple impliquant des rayons de lumière fut réalisée au début du siècle, et
montra que cette loi était fausse. Cette expérience dite de "expérience Michelson-Morley" bouleversa à tout
jamais notre vision du monde... et amena Albert Einstein à développer la théorie de la relativité restreinte en
imposant que la vitesse de la lumière quelque soit le référentiel est toujours constante (cf. chapitre de
Relativité Restreinte) :

(30.83)

Remarque: Si nous mesurons les vitesses et autres grandeurs vectorielles, nous trouvons que les résultats de
mesures des composantes x', y', z', t' ne sont pas identiques à celle obtenues sur x, y, z, t. Elles sont varié avec
le système d'axe. Connaissant ces valeurs dans un repère, nous pouvons passer aux valeurs dans l'autre
repère : il s'agit de la "covariance" (co-variance : variance avec les coordonnées), ici pour les expressions
vectorielles.

Les lois sont des relations entre des observables, relations déduites d'observations nombreuses.
La recherche des lois est régie par ce que nous pourrions appeler un "principe de simplicité" : lois en nombre
le plus petit possible, d'expressions les plus simples possibles entre grandeurs en nombre minimal.

Mais la caractéristique d'une bonne loi est la covariance lors d'un changement de repère. Cette invariance
lors d'un changement de repère, cette invariance de la forme (de l'expression littérale) de la loi va permettre
d'objectiviser au maximum et, en principe totalement, la physique.
La physique (dans le sens de la théorie qui décrit la réalité) ne sera plus liée à l'observateur ni à son espace-
temps galiléen associé. Bien sûr cette covariance sera recherchée pour les transformations de référentiels en
mouvement les uns par rapport aux autres.

Un contre-exemple simple cependant : la force entre deux charges électriques immobiles dans un référentiel
ne fait appel dans ce référentiel qu'à la seule théorie de l'électrostatique. Si ce même système est observé
d'un référentiel en mouvement par rapport au premier, il faudra décrire l'ensemble à l'aide de la théorie de
l'électromagnétisme.

Par construction même la mécanique classique se trouve être covariante par transformation de Galilée
(changement de repères galiléens) : le postulat de la dynamique (force) prend en effet la même forme dans
les différents référentiels galiléens comme nous venons de le voir.

MOMENT CINÉTIQUE

Définition: Le "moment cinétique" ou "moment angulaire" par rapport à un point O d'une particule de
masse m se déplaçant à la vitesse en est défini par :

(30.84)

avec étant la quantité de mouvement (voir la définition plus loin) donnée par :

(30.85)

Par sa définition, le moment cinétique est un vecteur perpendiculaire au plan contenant les vecteurs et
et si la particule se déplace dans un plan, la direction de est constante mais pas nécessairement de
même direction.

Un cas particulier mais important en mécanique et astronomie du calcul du moment cinétique est le
mouvement circulaire (plan) de rayon r. Dans cette situation, le "rayon-vecteur" est alors toujours
perpendiculaire à la direction du vecteur-vitesse et donc:

(30.86)

Nous voyons apparaître ici la définition du "vecteur rotation" également noté parfois (à tort) .

Pour un mouvement plan mais non circulaire (comme une conique par exemple!), nous introduisons les
composantes normale et tangentielle de la vitesse:

(30.87)

pour obtenir (de par les propriétés du produit vectoriel):

(30.88)

et sous forme scalaire:

(30.89)
où r est dès lors appelé le "rayon de courbure" de la trajectoire.

Etudions maintenant la dérivée du moment cinétique:

(30.90)

Dans le membre de droite, nous avons de par la définition du produit vectoriel:

(30.91)

et d'autre part:

(30.92)

Ce qui nous donne finalement:

(30.93)

La dérivée par rapport au temps du moment cinétique d'un mobile ponctuel est donc égal à ce que nous
définissons par le "moment de force" sur lequel nous reviendrons plus loin et qui a comme unités celle de
l'énergie et est un vecteur perpendiculaire au plan formé par et (par construction du produit vectoriel!).

Remarques:

R1. Cette dernière relation fait que nous appelons parfois le moment cinétique aussi "moment de la quantité
de mouvement".

R2. Il faut bien sûr prendre garde au fait que (cf. chapitre de Calcul Vectoriel) .

Ce qui est fortement impressionnant dans ce résultat (variation instantanée du moment cinétique), est que
tout corps ayant un moment cinétique non nul et soumis à aucun moment de force, conserve l'orientation et
la norme de dans l'espace et le temps. Ce résultat nous permet de comprendre la dynamique du gyroscope
et tous les autres corps ayant des propriétés similaires (comme la Terre qui tourne sur elle-même et qui
pointe toujours sur l'étoile polaire ce qui est à l'origine des saisons!). Nous étudierons plus loin le gyroscope
et ses propriétés, car son comportement est fascinant et les résultats théoriques en découlant trouvent des
applications en astrophysique et physique atomique.

Nous avons également :

(30.94)

où l'intégrale s'appelle "l'impulsion de rotation" et la relation précédente porte quelquefois le nom de


"théorème du moment cinétique" (nous verrons une généralisation de ce théorème lors de la démonstration
du théorème de König). Il s'énonce ainsi :
L'impulsion de rotation fournie par un moment de force entre les instants et est égale à la variation du
moment cinétique durant cet intervalle de temps.

En dynamique du solide ce théorème joue un rôle fondamental, analogue à l'équation de Newton en


dynamique du point.

L'utilisation du moment cinétique permet de montrer facilement la loi des aires (deuxième loi de Kepler),
qui joue un rôle important dans la compréhension du mouvement des planètes (cf. chapitre d'Astronomie) ou
encore de montrer que dans un système Terre-Lune isolé, le moment cinétique totale devant être conservé, si
la Terre ralenti sa rotation et la lune la garde constante, cela oblige la Lune à augmenter sa distance par
rapport à la Terre.

Voyons cela:

Imaginons une particule en mouvement sous l'action d'une force constamment parallèle à . Nous dirons
que cette force est une "force centrale" si sa direction passe constamment par un même point fixe, appelé le
"centre de force". La grandeur de la force ne peut donc plus dépendre que de la distance au centre de la force
(dans le cas d'un champ de force).

Dès lors:

(30.95)

Donc le moment cinétique par rapport au centre de force est constant si la force est centrale. La réciproque
est aussi vraie: si le moment cinétique est constant, sa dérivée par rapport au temps est nulle et la direction
de la force est toujours colinéaire à donc la force est centrale.

Par exemple, dans le cadre du mouvement d'une planète autour du Soleil ou d'un électron autour du noyau
de l'atome (dans le cadre du modèle de Bohr) le moment de cette force par rapport au centre est évidemment
nul puisque qu'aucun élément extérieur n'agit sur le système, c'est-à-dire en se basant sur le schéma ci-
dessous :

(30.96)

nous avons alors :

(30.97)
donc:

(30.98)

D'autre part, l'élément de surface décrit par le mouvement du rayon vaut (selon la figure ci-dessus et
la propriété du produit vectoriel):

(30.99)

donc:

(30.100)

En utilisant la relation nous obtenons:

(30.101)

Conséquences:

1. La vitesse aréolaire est constante, c'est-à-dire que les aires balayées en des temps égaux sont égales. C'est
la loi des aires de Kepler (cf. chapitre d'Astronomie)!

2. Le plan est fixe car . Donc la trajectoire, d'une planète dans un cadre idéal par exemple,
est plane.

MOMENT DE FORCE

Nous venons de voir que le "moment de force" se définissait par la relation (variation temporelle du moment
cinétique) :

(30.102)

où est donc le moment de la force par rapport au point d'origine du vecteur . Il est important de
remarquer que le moment de force à les unités d'une énergie est donc perpendiculaire à et par
construction!

Il faut aussi remarquer qu'augmenter le rayon d'application en diminuant ainsi la force pour garder un
moment de force constant dans un système mécanique permet certes de diminuer l'effort (la force) mais au
final pas l'énergie dépensée puisque la distance parcourue est alors plus grande.

Si nous exprimons le module de , de part la définition du produit vectoriel, nous obtenons :

(30.103)

Il apparaît une grandeur :


(30.104)

qui est par définition le "bras de levier" de la force et dont l'emplacement est donné par l'axe de rotation
du corps du au moment de force résultant.

Exemples:

(30.105)

Pour qu'un point matériel, soumis à des forces soit en équilibre, il faut ainsi que la résultante de
ces forces soit nulle (pas de translation) et que la résultante des moments soit nul aussi (pas de rotation). Soit
:

et (30.106)

Par définition, un "couple" est défini comme un ensemble de deux forces de grandeur égale mais de
direction opposée, agissant suivant deux droites parallèles sur un même corps étendu. La résultante des
forces est bien évidemment nulle, indique que le couple ne produit aucun effet de translation. Mais la
somme des moments étant non nulle, le corps subit une rotation tel que :

(30.107)

Maintenant que nous avons convenablement défini ce qu'était une force et un moment de force, nous
pouvons aborder l'étude de la statique des forces de suite :

STATIQUE DES FORCES

La statique des forces est un domaine difficile à généraliser. La plupart des ouvrages se servent de nombreux
exemples (comme les systèmes de poulies, les leviers, les équilibres, les frottements, etc.) afin d'amener le
lecteur à assimiler la méthode d'analyse qu'il faut pour résoudre les problèmes relatifs à ce domaine de la
mécanique classique. Loin d'être contre cette méthode, nous n'avons pas souhaité nous restreindre ou nous
étendre (suivant les points de vue) à des exemples particuliers, mais à proposer une méthode d'analyse qui
fonctionnerait à coup sûr.

Définitions:

D1. La "statique des forces" est le domaine de la physique qui étudie l'effet de la résultante de forces (ou
moments de force) constantes au cours du temps, appliquées sur un corps ponctuel ou étendu.

D2. Quand la somme vectorielle de toutes les forces et moments de force est nul, il n'y a aucun mouvement.
Nous parlons alors d'un "équilibre statique" (mais les forces existent tout de même à l'intérieur du système)
tel que les forces et moments de forces se compensent mutuellement :
ou/et (30.108)

Remarque: Les relations précédentes, nous montrent bien que ce n'est pas parce qu'un système est à
l'équilibre statique qu'il n'est soumis à aucune force (la somme vectorielle des forces peut s'annuler mais les
forces sont non nulles).

Corollaires :

C1. Lors de l'analyse d'un système de statique des forces, il faut toujours (!!!) travailler avec les
composantes vectorielles des forces et moments de forces (de par la première loi de Newton).

C2. Il faut donc s'imposer un repère par rapport auquel seront exprimés toutes les composantes de forces :

- Dans le cas d'un corps ponctuel sur lequel sont appliqué des forces, il faut assimiler l'origine du repère à la
position du point.

- Si les lignes de prolongement de toutes les forces sur un corps étendu sont toutes concurrentes en un point
donné, le système peut être considéré comme un corps ponctuel ramené à ce point

- Si le corps est étendu et plongé dans un champ de forces (gravitationnel, électrostatique, magnétique...)
isotrope, coplanaire et constant dans le temps, l'ensemble des forces imprimées peut se rapporter au centre
de gravité

Démonstration:

Nous avons vu lors de l'étude du calcul vectoriel (cf. chapitre de Calcul Vectoriel) que la somme des
vecteurs d'un même ensemble, mis bout à bout (au niveau de la représentation imagée) ou additionnés
algébriquement constitue ce que nous appelons la "résultante" du système de forces ou de moments de force
:

ou/et (30.109)

Il est clair qu'un point matériel est donc par définition à l'état statique si la résultante des forces concurrentes
est nulle. Ainsi, un corps ponctuel est au repos (vitesse constante nulle) si la grandeur est nulle (voir les
lois de Newton plus loin).

Cette condition ne suffit cependant pas pour un corps étendu (non ponctuel) : celui-ci peut ne pas se déplacer
(pas de mouvement par translation), mais tourner sur lui même par application de forces en dehors de son
centre de gravité (les forces sont alors des moments de forces agissant sur des points du corps en question).

Imaginons maintenant un ensemble de forces , chacune d'elles appliquée en un point de vecteur-position


d'un mobile étendu et toutes parallèles à une direction commune donnée, repérée par un vecteur unitaire
. La résultante des ces forces est alors :

(30.110)

Remarque: La norme de la résultante est donc :


(30.111)

De manière analogue, la somme vectorielle des moments parallèles s'écrit :

(30.112)

Recherchons maintenant, la position d'un point fictif C, appelé le "centre des forces" tel que le moment
de la résultante appliquée au point C soit égal au moment total . En d'autres termes, doit être la
solution de l'équation vectorielle :

(30.113)

S'il est possible de trouver un tel point C, nous ne devons donc plus, en principe, calculer le moment
individuel de chaque force et en faire la somme vectorielle. Il suffit plutôt, de déterminer la résultante et
d'évaluer son moment résultant appliqué au point fictif C.

En combinant les relations précédentes, nous avons :

(30.114)

À son tour, le vecteur peut être substitué tel que :

(30.115)

d'où nous tirons finalement :

(30.116)

comme (deuxième loi de newton) supposons maintenant (car particulier) que nous
pouvons alors écrire ce résultat très important :

(30.117)

C.Q.F.D.
C3. De par la troisième loi de Newton, tout corps solide rigide en équilibre stable, en contact avec un
ensemble de corps solides rigides en équilibre stable eux aussi, subissent tous une force égale identique en
chaque point de contact (identiquement répartie) mais opposée par ces derniers (assimilable et passant par
leur centre de gravité lorsque c'est un champ de vecteurs isotrope et constant qui est à l'origine du contact).
Ainsi :

- les repères des forces d'action/réaction doivent être placés sur les différents points de contact lorsque ce
sont une quantité dénombrable de forces qui en sont à l'origine.

- les repères des forces d'action/réaction doivent être placés le centre de masse ou de gravité si les forces à
l'origine du contact (in extenso : de l'accélération) sont à l'origine d'un champ vectoriel gravifique,
respectivement électrostatique/magnétique.

BALISTIQUE

Le mouvement parabolique est le mouvement d'un mobile animé, dans le champ de la pesanteur, d'une
vitesse de translation non parallèle à l'accélération de la pesanteur . Par exemple un projectile
possédant au départ une vitesse inclinée d'un angle par rapport à l'horizontale.

(30.118)

En l'absence de pesanteur et de frottement le mobile P suivrait la ligne de visée indéfiniment. L'action

de la pesanteur est de le redescendre, au temps t, de la valeur connue

Nous posons la projection sur les axes :

(30.119)

combinaison d'un déplacement régulier selon x et d'un mouvement de chute avec vitesse initiale selon y.
Ce qui correspond aux équations suivantes:

et (30.120)

en éliminant le temps entre ces deux équations nous obtenons la trajectoire


(30.121)

Nous calculons ainsi la portée du projectile en posant dans l'équation ci-dessus et nous obtenons
facilement:

(30.122)

la solution n'a aucun intérêt.

L'hauteur maximale peut être calculée en annulant la dérivée de l'équation de la trajectoire. Ainsi nous
obtenons facilement :

(30.123)

Nous remarquons pour la portée maximale que pour une vitesse initiale donnée, nous obtient pour :

A) aucune valeur si . Nous nous sommes donné une portée inaccessible.

B) Deux valeurs et complémentaires pour atteindre la même portée.

C) Une seule valeur donnant la portée maximale possible

La courbe enveloppant toutes les paraboles, tracée pour une vitesse donnée dans toutes les directions
possibles, est encore une parabole, appelée "parabole de sûreté". Sa rotation autour de l'axe y engendre un
paraboloïde qui circonscrit (contient) la région de l'espace seule accessible aux projectiles.

(30.124)

Ainsi, il n'est pas trop difficile de trouver l'équation de cette parabole de sûreté:

Le tir à la verticale nous est connu et est donné par


(30.125)

La portée maximale est quant à elle donnée par:

(30.126)

Donc quant tel que:

(30.127)

qui est l'équation de la parabole de sûreté.

MOUVEMENTS CIRCULAIRES

De tels mouvements décrivent la rotation d'un objet autour d'un axe. L'usage veut qu'on le définisse par les
données suivantes:

- la direction de l'axe dans l'espace

- le sens de rotation autour de cet axe

- la vitesse de rotation

Nous résumons ces trois indications par la donnée d'un vecteur "vitesse angulaire" instantanée:

(30.128)

Le sens de rotation est dit positif lorsque, le pouce dressé dans la direction de , nous saisissons l'axe de la
main droit et voit tourner l'objet dans le sens des quatre autres doigts.

La norme de la vitesse angulaire instantanée, représente l'angle parcouru par unité de temps, par l'objet qui
se déplace dans le plan perpendiculaire à :

(30.129)

Remarques:

R1 Dans le cas général du mouvement circulaire, la vitesse angulaire de l'objet étudié varie au cours du
temps:

R2. Lorsque la direction de l'axe change, les composantes du vecteur unitaire sont également des
fonctions du temps. C'est le cas d'une roue de moto dans un virage.

En tournant d'un angle , un point de l'objet situé à une distance R de l'axe de rotation décrit un arc de
cercle de longueur:
(30.130)

Donc dans le cas des petits angles:

(30.131)

Si dt est le temps nécessaire à ce mouvement, la vitesse curviligne du point est:

(30.132)

Si nous nous donnons un repère euclidien orthonormé tel que:

(30.133)

Nous voyons bien sur cette figure que :

(30.134)

Donc finalement nous avons :

(30.135)

Nous voyons alors que nous avons affaire à un produit vectoriel et tel que:

(30.136)

Nous avons donc:

(30.137)
que nous écrivons également:

(30.138)

L'accélération du mouvement circulaire est formée dans le cas général, de deux termes, le premier étant
"l'accélération tangentielle" exprimant toujours la variation de la vitesse sur la trajectoire et le deuxième
l'accélération perpendiculaire le long du rayon appelée également "accélération centripète" (centripète
signifiant: "qui tend à rapprocher du centre").

Remarque: Si nous exprimons le mouvement circulaire du point P à partir d'un système d'axes situés dans le
plan de la trajectoire, pour simplifier, alors, la position du point P est donnée par:

(30.139)

Ce qui montre que le mouvement circulaire peut être considéré comme la superposition de deux
mouvements sinusoïdaux déphasés de .

Si l'on écrit: (30.140)

ce qui est tout à fait envisageable pour une trajectoire imparfaitement circulaire et que l'on regarde les
différentes caractéristiques paramétriques:

(30.141)

en faisant varier le déphasage et le rapport nous obtenons des courbes que nous appelons des
"figures de Lissajous" :
(30.142)

TRAVAIL ET ÉNERGIE

Si un point de masse m subit un déplacement élémentaire sous l'effet d'une force , cette force effectue
un travail élémentaire valant par définition:

(30.143)

Si cette masse m est déplacée d'un endroit A à un endroit B, le travail total est:

(30.144)

Pour les unités, nous avons : (Joules)

Remarques:

R1. Si W est positif le travail est dit "travail moteur". Dans le cas contraire il est dit "travail résistant"
(exemple: le freinage).

R2. Si la force est constante en grandeur et en direction (cas de la pesanteur au voisinage de la surface
terrestre), l'intégrale du calcul de W prend une forme plus simple:

(30.145)
Ce résultat montre que le travail ne dépend alors que des positions initiale et finale et pas du chemin
parcouru. Le travail de la pesanteur est un cas particulier de ce type.

ÉNERGIE CINÉTIQUE

La loi de Newton est applicable le long du chemin A-B. En l'utilisant dans l'expression du travail il
vient:

(30.146)

et, en développant le produit scalaire au moyen des composantes, nous aurons :

(30.147)

Lorsqu'un corps se déplace sous l'action d'une force résultante quelconque, le travail de cette force
d'accélération sur un chemin quelconque A, B est égal à la variation d'énergie cinétique du corps:

Par définition, la relation :

(30.148)

est appelée "l'énergie cinétique" et elle se mesure en "Joules" (ou d'autres unités dérivées exotiques dont les
physiciens théoriciens abusent parfois un petit peu trop...) et est toujours positive en mécanique ou n'importe
quel autre domaine de la physique.

L'équation :

(30.149)

porte quelquefois le nom de "théorème de l'énergie cinétique".

MOMENT D'INERTIE

Pour un solide rigide tournant autour d'un axe à la vitesse angulaire . L'énergie cinétique élémentaire d'un
point quelconque de masse dm, situé hors de l'axe, vaut:

(30.150)

puisque et sont perpendiculaires. L'énergie cinétique totale est alors :

(30.151)

Nous avons pris l'habitude en physique de noter cette dernière relation:


(30.152)

où par définition, le "moment d'inertie" est:

(30.153)

Exemple:

Calculons la vitesse d'une boule finale d'une boule chutant sur un plan incliné de frottement non nul (elle va
donc tourner) dans un champ de potentiel gravifique.

La réponse du néophyte en physique sera souvent obtenue en considérant que l'énergie cinétique mais pas la
vitesse de rotation de la boule. Or, nous devons prendre celle-ci en compte via son moment d'inertie.

Nous avons donc l'énergie cinétique totale étant l'énergie cinétique de translation de centre de masse plus
l'énergie de rotation autour de ce même centre de masse:

(30.154)

en égalant cette valeur à l'énergie potentielle gravifique et en supposant une vitesse initiale nulle de la chute,
nous avons:

(30.155)

Soit la vitesse acquise au bas du plan (frottement de roulement non-compris...):

(30.156)

et nous avons démontré dans le chapitre sur les Formes Géométriques que le moment d'inertie d'une boule
pleine était:

(30.157)

Il vient alors:

(30.158)

Nous voyons dans le cas particulier de la boule, que la vitesse finale de chute est (sans frottements de l'air ni
de roulement) indépendante de sa masse et de son rayon (qu'elle soit creuse ou pleine) ce qui est
relativement contre intuitif.
Remarque: Dans un solide, la répartition de la matière autour d'un axe sera évidemment différente selon
l'axe choisi. Le moment d'inertie correspondant sera aussi différent. Il est donc indispensable de préciser
l'axe par rapport auquel nous souhaitons déterminer ce moment d'inerte. Nous observons dans la pratique
que les ingénieurs placent souvent l'axe de façon à ce qu'il passe par le centre de masse. Dans les tables,
nous trouvons fréquemment les expressions des moments d'inerties de formes courantes (selon un axe
donné) telles que le cylindre, le cône, la sphère, la barre, le tube (cf. chapitre sur les Formes Géométriques).

Nous avons vu lors de notre étude du moment cinétique que:

(30.159)

et le moment d'inertie étant donné par:

(30.160)

Nous avons donc:

(30.161)

d'où:

(30.162)

Nous obtenons finalement:

(30.163)

c'est l'expression donnant le moment cinétique d'un corps tournant sur lui-même (sur un de ses axes
possibles de rotation).

Etant donné que nous avons démontré lors de notre étude du moment cinétique que:

(30.164)

il vient alors dans l'hypothèse que la masse et la géométrie du solide restent constantes... que le moment de
force est alors:

(30.165)

et bien évidemment, si nous étudions un système dans lequel le moment cinétique est conservatif, il va de
soi que:

(30.166)

Cette conservation du moment cinétique trouve une application dans une multitude d'expériences telle que
celle connue qui consiste à se faire tourner sur une chaise et à écarter les mains ou les jambes ce qui fera
diminuer la vitesse de rotation (et inversement).
Une autre expérience curieuse (mais mathématiquement correcte) consiste à se poser sur un plateau tournant
avec une roue en rotation tenue à l'horizontale (le moment cinétique vertical est donc nul) et de mettre celle-
ci ensuite à la verticale. Comme le moment cinétique vertical doit rester nul, pour contrecarrer cela, le
plateau sur lequel est posé l'expérimentateur se mettra à tourner dans le sens inverse de rotation de la roue.

Les déplacements de masses importantes à la surface de la Terre (icebergs, crues des fleuves, plaques
tectoniques, etc.) provoquent des variations du moment d'inertie de la Terre. Il s'ensuit des fluctuations de la
vitesse angulaire donc une imperfection de l'étalon astronomique de temps (quelques millièmes par jour).

Revenons maintenant aux méthodes de calcul des moments d'inertie. L'énergie cinétique d'un corps étant la
somme de l'énergie cinétique de chaque élément de ce corps, nous avons :

(30.167)

Dans le cadre d'un corps solide rigide en rotation autour d'un axe, nous avons :

(30.168)

Ainsi, pour un corps composé d'un ensemble de corps de géométrie différentes, le moment d'inertie total est
la somme des moments d'inertie par rapport à l'axe de rotation tel que :

(30.169)

Lorsque nous calculons le moment d'inertie d'un corps par rapport à un axe donné, il peut être intéressant
de savoir qu'elle est la distance à l'axe où nous pouvons placer fictivement toute la masse de ce corps pour
avoir le même moment d'inertie. Par définition, cette distance notée k et appelée le "rayon de giration" est
trivialement donnée par :

(30.170)

où est le moment d'inertie connu du corps de masse M par rapport à une axe .

Par définition, le "moment d'inertie polaire" (ou également "moment d'inertie quadratique") est le moment
d'inertie défini par rapport à un point (le pôle) et non plus par rapport à un axe et noté :

(30.171)

Cette grandeur n'intervient en fait que pour les rotations libres et n'a d'intérêt, pour les rotations autour d'un
axe fixe, que parce qu'elle facilite quelquefois le calcul des moments d'inertie axiaux en vertu de la relation
suivante (en coordonnées cartésiennes) :

(30.172)

Démonstration:

Lemme 1 : Le moment d'inertie par rapport à un plan xOy est donné trivialement par :
(30.173)

Lemme 2 : Le moment d'inertie par rapport à un axe est donné par :

(30.174)

En sommant ces relations, nous en déduisons :

(30.175)

Le moment d'inertie polaire est alors donnée par :

(30.176)

En comparant avec le lemme 2 il vient :


(30.177)

C.Q.F.D.

Si le corps en question à une symétrie sphérique, il vient de suite puisque que :

(30.178)

Un exemple est donné avec la boule (sphère pleine) dans le chapitre traitant des Formes Géométriques dans
la section de géométrie.

Supposons maintenant connaître le moment d'inertie d'un corps solide rigide quelconque par rapport à un
axe (cet axe n'étant pas nécessairement uniquement assimilé à l'axe z commun) passant par le centre
de masse G. Calculons ensuite le moment d'inertie , par rapport à un autre axe z ', parallèle à z et distant
de a , et faisons apparaître la liaison existant entre ces deux moment d'inertie différents :

Dans un référentiel cartésien, nous avons pour tout point (x,y) :

et (30.179)

Nous avons alors :

(30.180)

Le terme :

(30.181)

est nul car si le moment d'inertie est calculé par rapport au centre de masse G comme nous l'avons imposé
dès le début, alors :

(30.182)

En définitive, nous obtenons finalement le théorème d'Huygens-Steiner :

(30.183)

Comme nous le verrons dans le chapitre des Formes Géométriques dans la section de géométrie du site, il
devient alors facile de pouvoir calculer le moment d'inertie d'un triangle équilatéral en connaissant celui d'un
plaque carrée et en déplaçant l'axe d'inertie au point où se situe le centre de gravité du triangle (soit au tiers
de la médiane située entre le centre du rectangle et un des sommets du rectangle).
Comme il existe autant de moment d'inertie que d'axe de rotation et que ces derniers sont souvent dans les
cas d'études assimilés aux axes principaux d'inertie (axe assimilés aux axes de révolutions ou aux plans de
symétrie - voir plus loin), il peut être utile d'introduire un être mathématique utile dans le cadre de
représentation des moments d'inertie qui n'est autre que la "matrice d'inertie" ou appelé encore (formulation
plus moderne) "tenseur d'inertie".

La démarche pour déterminer rigoureusement l'expression de ce tenseur est la suivante : soit un point
donné d'un solide dont nous cherchons à calculer le moment d'inertie et l'axe d'origine O et de vecteur
unité par rapport auquel nous souhaitons calculer le moment d'inertie. Tout point du solide peut être
projeté (projection orthogonale) sur un point à partir de la connaissance de l'angle entre et tel
que :

(30.184)

Dès lors :

(30.185)

D'après les propriétés du produit mixte (cf. chapitre de Calcul Vectoriel) et du produit scalaire :

et (30.186)

nous avons :

(30.187)

et donc :

(30.188)

Comme est un vecteur de direction constante quelque soit le point d'intégration, nous pouvons le sortir de
l'intégrale tel que :

(30.189)

Nous pouvons vérifier que si nous remplaçons par , nous obtiendrons un résultat de par
la propriété de linéarité du produit vectoriel (cf. le chapitre de Calcul Vectoriel). Ainsi, l'application qui à
associe est donc une application linéaire qui peut être représentée, dans une base B donne, par une
matrice :

(30.190)

La matrice est le donc "tenseur d'inertie" du système par rapport au point O, dans la base B.

Le moment d'inertie d'un système par rapport à un axe quelconque de vecteur unitaire est donné par :
(30.191)

Le problème est donc maintenant de pouvoir calculer les éléments du tenseur , pour une base B donnée.

Soit un repère tel que . Nous posons :

et (30.192)

En utilisant le fait qu'un produit vectoriel puisse être représente par une matrice antisymétrique (vérifiez c'est
facile) :

(30.193)

nous avons :

(30.194)

et donc :

(30.195)

Dans l'expression ci-dessus de la matrice d'inertie, nous reconnaissons les éléments diagonaux : il s'agit tout
simplement des moments d'inertie du système par rapport aux différents axes de la base. Nous appelons
"produit d'inertie" les éléments non-diagonaux de la matrice et nous les notons :

(30.196)

Nous avons donc :

(30.197)
Si O est assimilé au centre de masse du solide considéré, nous notons simplement :

(30.198)

Nous pouvons également généraliser le théorème d'Huygens en faisant usage de ce tenseur de symétrie. Pour
ce faire, appelons (x', y', z') les coordonnées d'un point A quelconque dans R' et (x, y, z) ses coordonnées dans
R. Nous appelons (a,b,c) les coordonnes de l'origine O' de R' dans R:

(30.199)

puisque :

(30.200)

Nous avons alors :

(30.201)

Or, si O' coïncide avec le centre de masse G, alors selon la définition du centre de masse :

(30.202)

Nous en déduisons alors :

(30.203)

et de même :

, (30.204)

avec :

(30.205)

Nous retombons sur le théorème d'Huyghens classique puisque n'est d'autre que la distance au carré
entre l'axe Oz et Gz et de même pour qui est la distance au carré entre Ox et Gx et qui est la
distance entre Oy et Gy.

Si nous nous intéressons maintenant aux produits d'inertie, il vient :


(30.206)

d'où, si O' coïncide avec G :

(30.207)

En résumé, le théorème d'Huygens généralisé, s'écrit :

(30.208)

Le tenseur d'inertie étant réel et symétrique, nous avons dans le chapitre d'Algèbre Linéaire (théorème
spectral) qu'il est toujours possible de trouver trois directions perpendiculaires de vecteurs telles que
le tenseur (matrice) symétrique soit diagonalisable :

(30.209)

Le trièdre formée par les vecteurs est appelé "trièdre principal d'inertie" et ses axes sont appelés
"axes principaux d'inertie". Dans ce repère prend le nom de "tenseur principal d'inertie". Si de plus O
est assimilé à G, nous parlons de "tenseur central d'inertie".

En fait, pour trouver les moments d'inertie relativement aux axes principaux il n'est pratiquement jamais
nécessaire de diagonaliser le tenseur d'inertie, car il suffit souvent de se laisser guider par la symétrie du
système. Nous allons voir avec les théorèmes suivants que s'il existe des axes ou des plans de symétrie pour
la distribution de masse, les axes d'inertie sont faciles à trouver. De plus, le système est en général
suffisamment simple (ou décomposable en éléments suffisamment simples...) pour que ces axes soient
évident.

Premier théorème : Si le système possède un plan de symétrie matérielle (in extenso : si A


symétrique de A' par rapport au plan) alors tout axe perpendiculaire à ce plan est axe principal d'inertie.

Démonstration:

Choisissons un repère xOy dans le plan par rapport auquel le système a une distribution de masse symétrique

et un axe Oz perpendiculaire à ce plan. Pour calculer ou , groupons les points par deux,
symétriques par rapport à xOy. c'est-à-dire tels que . Nous aurons alors:

(30.210)

et de même :

(30.211)
c'est-à-dire, puis (symétrie matérielle!) :

(30.212)

que toutes les contributions de paires de points symétriques sont nulles, ce qui implique : ,
c'est-à-dire que l'axe des z est direction principale d'inertie.

C.Q.F.D.

Deuxième théorème : Choisissons comme axe Oz l'axe de symétrie. De même que ci-dessus, nous avons :

(30.213)

Démonstration:

Effectivement, car si nous groupons les points par paire A' et A' symétriques par rapport à Oz, nous avons :

(30.214)

mais donc toujours :

(30.215)

et de même :

(30.216)

C.Q.F.D.

Remarque: Lorsque nous avons déterminé deux axes principaux d'inertie grâce aux symétries précédentes,
les troisième est tout simplement celui qu'il faut pour compléter un trièdre orthogonal.

Troisième théorème : Si un système admet un axe de révolution pour sa distribution de masse, alors tout
trièdre orthogonal incluant l'axe de révolution, est trièdre principal d'inertie. Le système matériel est alors dit
"système cylindrique" et dans le trièdre principal d'inertie son tenseur prend la forme (en supposant que l'axe
de révolution est le 3ème axe du trièdre) :

(30.217)

Démonstration:

Si Oz est un axe de révolution, tout plan comprenant Oz est plan de symétrie et toute droite perpendiculaire à
Oz est donc axe principal d'inertie (premier théorème). De plus, toutes ces droites perpendiculaires à Oz sont
équivalentes.

C.Q.F.D.
Définition: Si la matrice d'inertie en O d'un système matériel est du type :

(30.218)

nous disons alors que le système est un "système sphérique" (ou un "système à symétrie sphérique").

Remarque: Le choix systématique d'un trièdre principal d'inertie permet de ramener le tenseur d'inertie de 6
à 3 composantes, calculées une fois pour tout. Cependant, ce choix implique l'utilisation d'une base qui sera
le plus souvent en mouvement par rapport au référentiel utilisé, ce qui pourra poser des problèmes de
dérivations par rapport au temps des vecteurs de la base. Nous pouvons alors, si c'est plus faciles, obtenir les
composantes du tenseur de symétrie dans une base quelconque à l'aide d'une matrice de passage entre la base
principale et le base utilisée pour le calcul du trièdre principal d'inertie.

Lorsque les moments d'inertie d'un solide sont connus dans les directions des axes principaux d'inertie, nous
pouvons facilement déterminer le moment d'inertie J par rapport à n'importe quel autre axe passant par le
centre de gravité en utilisant que ce nous nommons un "ellipsoïde d'inertie" (à ne pas confondre avec le
moment d'inertie d'une ellipsoïde - démontré dans le chapitre traitant des Formes Géométriques).

Démonstration:

Soient trois axes, centrés sur G, parallèles aux axes principaux. Dans leurs directions, portons des longueurs
proportionnelles à :

(30.219)

Dans cet espace des phases des moments d'inertie, tout point désigne un moment d'inertie J tel
que :

(30.220)
Pour déterminer J en fonction des , sans devoir calculer x, y, z, nous identifions les cosinus
directeurs (cf. chapitre de Calcul Vectoriel) de l'axe de rotation à ceux de la droite .

Ainsi, nous avons :

(30.221)

Soit :

(30.222)

Nous pouvons maintenant calculer les conditions de normalisation de cette relation. Ainsi, si et
, nous avons :

(30.223)

Respectivement nous aurons :

(30.224)

Puisque :

et (30.225)

Ce qui nous amène à écrire :

(30.226)

Par substitution, nous obtenons :

(30.227)

Donc finalement :

(30.228)
Ainsi, en connaissant les moment d'inertie d'un corps par rapport à ses axes principaux nous
pouvons connaître son moment d'inertie par rapport à n'importe quel axe ayant un angle par rapport
aux axes principaux.

C.Q.F.D.

GYROSCOPE

Un solide (de révolution pour simplifier...), pouvant s'orienter librement autour d'un point fixe et tournant
rapidement sur lui-même forme par définition un "gyroscope".

Outre leur usage ludique... car ils permettent d'avoir des configurations considérées comme
pédagogiquement exceptionnelles... les gyroscopes constituent une part importante des systèmes de
navigation par inertie (avant l'apparition des GPS...) dans l'aviation, l'aérospatiale et la marine. Les
instruments de guidage par inertie de ces systèmes sont constitués de gyroscopes et d'accéléromètres, qui
calculent à tout instant la vitesse exacte et la direction de l'appareil en mouvement. Les signaux recueillis
sont communiqués à un ordinateur qui les enregistre et qui corrige alors les aberrations éventuelles de la
trajectoire.

Les planètes constituent un autre exemple fameux de gyroscopes. L'exemple le plus connu étant notre Terre
qui tournant relativement vite autour d'elle-même et étant très massive son moment cinétique fait que son
pôle Nord est toujours (à l'échelle du temps d'un humain ...) orientée vers l'étoile Polaire quelque soit sa
position sur son orbite.

La figure suivante est un exemple de gyroscope connu dans les laboratoires des écoles et appelé "gyroscope
symétrique pesant". Il s'agit bien évidemment d'un cas particulier et simplifié mais qui permet de
comprendre le principe de base du gyroscope:

(30.229)

Se composant d'un moteur électrique dont le rotor, le volant principal, forme la masse principale en rotation
angulaire rapide. Le stator du moteur est fixé à une tige sur laquelle est positionné un contrepoids à l'opposé.
L'ensemble est posé sur un pied de support à l'extrémité duquel se trouve un cardan monté sur un roulement
horizontal qui autorise les orientations du gyroscope presque sans limitations dans toutes les directions.

Dans ce schéma nous avons qui est la vitesse angulaire instantanée du disque amovible de rayon R, est
la vitesse de précession du gyroscope (rotation autour du pied de support), est la force de la masse m
complémentaire attachée au contrepoids et qui déséquilibre le gyroscope, r est la distance du cardan du
gyroscope au contrepoids et finalement a est l'angle d'inclinaison que prend l'axe du gyroscope lorsqu'on le
déséquilibre en attachant le poids supplémentaire au contrepoids.
Pour débuter l'étude théorique de ce système, rappelons que avons démontré plus haut que le moment
cinétique pour un solide ayant un moment d'inertie J s'exprime par la relation suivante:

(30.230)

et nous avons vu que tout solide en rotation autour d'un axe quelconque a aussi un moment cinétique qu'il est
alors d'usage de noter conformément avec ce que nous avons vu plus haut:

(30.231)

Nous avons aussi démontré plus haut que le rotor, comme toute masse en rotation rapide, produit alors un
moment de force donné par:

(30.232)

qui est vectoriellement colinéaire à et passe donc par son axe de symétrie. Comme nous le savons déjà,
c'est cette dernière relation qui met le mieux en évidence que le gyroscope maintient toujours une direction
identique dans l'espace même lorsque nous déplaçons son support.

En d'autres termes un gyroscope libre animé d'une grande vitesse de rotation a pour propriété fondamentale
de conserver son axe de rotation selon une orientation fixe par rapport à l'espace absolu. C'est ce que nous
appelons la "première loi gyroscopique" ou "loi de fixité".

Typiquement le "gyroscope de Foucault" représenté ci-dessous, excellent exemple pratique de la loi de


fixité, garde son orientation quelque soit la manière dont nous manipulons le socle sur lequel il est posé:

(30.233)

Si nous posons le gyroscope de Foucault toute une journée sur une table avec un moteur qui maintient la
rotation du disque massif central constante, nous observons alors la rotation de la Terre car le gyroscope
tourne alors très lentement sur lui-même en 24 heures!

Pour revenir à nos considérations mathématiques... intéressons nous maintenant au moment de force du
contrepoids qui déséquilibre notre gyroscope symétrique alors que le disque est en rotation et qui génère une
rotation générale du gyroscope comme le permet de constater l'expérience. Nous avons alors pour le
moment de force faisant tourner le gyroscope autour de son axe (tige de soutient) :

(30.234)
Puisque le gyroscope ne précesse pas lorsque le système est équilibré c'est que le moment de force du poids
supplémentaire qui déséquilibre le gyroscope génère un moment cinétique selon la relation démontrée plus
haut tel que:

(30.235)

Ce qui schématiquement peut être représenté de la manière suivante (il s'agit de notre gyroscope vu d'en
haut):

(30.236)

Nous avons alors dès que le gyroscope se met à tourner (dans un mouvement circulaire):

(30.237)

En prenant l'approximation de Taylor au premier ordre de la tangente pour les petits angles:

(30.238)

Faisons l'hypothèse, pour simplifier l'étude du problème, que la variation du moment cinétique total par
rapport à l'axe de rotation du gyroscope (la tige de soutien donc!) peut être assimilée au moment cinétique
du rotor seuil si ce dernier tourne suffisamment vite et que sa masse est suffisamment grande. C'est-à-dire
que:

(30.239)

nous avons alors:

(30.240)

et dès lors puisque de par cette approximation tout le moment de force est assigné à la variation du moment
cinétique du rotor seul:
(30.241)

Il vient enfin:

(30.242)

Donc lorsque le gyroscope symétrique pesant est équilibré (lorsque M est nul au numérateur de la fraction),
son moment cinétique garde donc une orientation fixe quelque soit la valeur du dénominateur puisque
sera alors toujours nul.

Le mouvement de rotation résultant d'un déséquilibrage du gyroscope est donc dit "mouvement de
précession" lorsqu'il est provoqué volontairement, et "dérive" lorsqu'il est dû à un élément perturbateur.

Indiquons pour finir les gyroscopes ludiques pour petits enfants comme la toupie ci-dessous:

(30.243)

Nous pouvons grossièrement la représenter ainsi (vue de côté et vu du dessus) pour en faire une analyse
mathématique:

(30.244)
où nous faisons l'hypothèse que l'extrémité de l'axe de la toupie est posée sur le sol sans possibilité de
glissement et que celle-ci à une vitesse angulaire constante et suffisamment grande pour ne pas avoir son
inclinaison qui varie dans le temps.

En utilisant la même technique que pour le gyroscope symétrique pesant nous avons (bon nous aurions pu
utiliser plus simplement la relation vue dans le chapitre de Trigonométrie...):

(30.245)

Nous avons aussi pour le moment de force:

(30.246)

Par contre le moment cinétique change! Effectivement, nous avons donc dans ce cas particulier:

(30.247)

il s'ensuite que sous les mêmes hypothèses que le gyroscope pesant que:

(30.248)

d'où sous forme vectorielle:

(30.249)

et nous savons que cette dernière relation (démonstration faite plus haut) peut être complétée en écrivant:

(30.250)

Il vient alors:

(30.251)

Soit:

(30.252)

Nous voyons que la différence avec le gyroscope symétrique pesant est que la vitesse de précession est alors
indépendante de l'angle.

Remarques:

R1. Un cycliste roulante en ligne droite est stabilisé (loi de fixité oblige!) par le moment cinétique de ses
roues qui est perpendiculaire au sens de roulement.
R2. Sans probablement s'en rendre compte, on se penche en bicyclette dans un virage pour produire une
précession dans les roues et tourner plus facilement. Effectivement le mouvement de précession fait pivoter
la roue de la bicyclette dans la direction où on se penche sans qu'un ait besoin de tourner le guidon.

ÉNERGIE POTENTIELLE GRAVIFIQUE

Si le travail de la force entre les points A et B ne dépend pas du chemin suivi, nous disons que cette force
dérive d'une énergie potentielle ou bien que le champ de force est un "champ conservatif" (contre-exemple:
dans un mouvement avec frottement le travail dépend nécessairement de la voie choisie). Cette
indépendance par rapport au chemin suivi implique que:

Soit deux points A et B de l'espace. Il y a plusieurs chemins possibles pour joindre ces deux points. Si nous
en choisissons deux au hasard nous avons :

Sur le 1er chemin :

Sur le 2ème chemin :

(30.253)

Si le champ est conservatif nous avons :

(30.254)

ou encore que le travail total sur un chemin fermé (aller et retour) est nul. Nous notons cela (cf. chapitre de
Calcul Différentiel Et Intégral) :

(30.255)

Le travail en jeu est donc une fonction du lieu seul ( ) c'est-à-dire dépendant uniquement du point de
départ et du point d'arrivée. En effet, si le travail dépendait du chemin, il serait possible de choisir la voie la
plus généreuse quand le système fournit du travail et la voie la plus économique quand nous la ramenons à
l'état initial. Ce serait donc un mouvement perpétuel et le principe de conservation de l'énergie l'interdit (cf.
chapitre de Thermodynamique).

Attachons alors à chaque point du champ de force une valeur de la fonction (un nombre réel)
correspondant au travail effectué par le champ de force lorsque le mobile passe d'un point P à 0, 0 étant un
point de référence choisi arbitrairement. Donc par définition:

avec
(30.256)

En généralisant cette définition, nous dirons que le travail effectué par une force conservative lorsque le
mobile passe de A à B est égal à la diminution d'énergie potentielle entre A et B :

(30.257)

Par définition est l'énergie potentielle et se mesure en Joules.

L'équation précédente s'utilise très souvent sous forme différentielle soit :

(30.258)

Il existe aussi rappelons-le une relation entre l'énergie est le gradient de la force donnée qui découle
simplement de la définition du travail :

(30.259)

Application: Travail de la pesanteur et énergie potentielle gravifique au voisinage de la surface de la Terre.


C'est donc un cas particulier où la force est constante...
(30.260)

Soit un point de masse m se déplaçant selon une trajectoire quelconque AB. Le poids effectue le travail:

(30.261)

En exprimant les différents vecteurs en composantes :

, , (30.262)

et en calculant le produit scalaire au moyen de ces composantes nous obtenons :

(30.263)

La différence représente la différence d'altitude entre les points A et B. Nous constatons bien que le
travail ne dépend pas du chemin suivi mais seulement des points de départ et d'arrivée. Si, en sens inverse,
nous voulons faire passer le point de B à A, le travail, fourni alors par un agent extérieur vaut:

(30.264)

ce qui montre bien que le travail total sur un chemin fermé est nul:

(30.265)

En comparant les relations:

et (30.266)

et en identifiant, nous obtenons ainsi :

(30.267)

qui est l'énergie potentielle gravifique, z étant l'altitude de la masse m. Nous notons plus simplement la
plupart du temps cette relation sous la forme :
(30.268)

Remarque: Le choix de zéro de l'énergie potentielle est souvent arbitraire; nous le fixons par commodité.
Seules les différences d'énergie potentielle sont généralement intéressantes comme nous allons le voir de
suite.

La relation précédente est au fait une expression utile à proximité de la surface terrestre. A distance
où R est le rayon de la terre, la force de gravitation faiblit et l'approximation n'est plus valable (si
aussi, d'ailleurs...).

Pour déterminer la relation correcte, considérons deux masses . La première est supposée au repos et
fixe la deuxième est amenée de l'infinie à une distance donnée de (le même raisonnement est applicable
pour le champ électrique). Le travail dW de la force gravitationnelle en un point quelconque étant donc :

(30.269)

et l'énergie potentielle du système :

(30.270)

Alors :

(30.271)

d'où simplement (l'énergie potentielle en un point) :

(30.272)

Voyons si cela est cohérent avec ...

A hauteur nulle de la surface terrestre, , nous avons :

(30.273)

Nous élevons l'objet de :

(30.274)

Nous utilisons l'approximation grossière :

(30.275)

valable quand d'où :


(30.276)

Comme à la surface de la terre nous avons l'habitude de poser en laboratoire , nous obtenons bien
finalement :

(30.277)

et nous voyons qu'il s'agit effectivement d'une grossière approximation.

Remarque: Nous pourrions appliquer le même développement dans l'étude de la force de Coulomb et du
champ électrique mais jusqu'à maintenant nous n'avons jamais mis de laboratoire à la surface d'une charge...
(sic!)

ÉNERGIE POTENTIELLE D'UNE SPHÈRE DE MATIÈRE

Nous allons calculer ici l'énergie potentielle d'une sphère de matière. Cet exercice de style va nous être très
utile en astrophysique pour déterminer la température interne des étoiles et dans la chapitre de Cosmologie
pour le départ du modèle de Friedmann.

L'expression d'une énergie potentielle d'un système de deux masses mises en présence est donnée par:

(30.278)

Soit une sphère de masse M, de densité massique et de rayon r et entourée d'un anneau sphérique de
rayon intérieur r, de même densité massique et d'épaisseur dr

L'énergie potentielle de l'anneau sphérique de rayon interne r et d'épaisseur dr se calcule comme suit:

La masse de la sphère de rayon r et de densité massique est:

(30.279)

La masse de l'anneau entourant la sphère de rayon r, d'épaisseur dr et de densité massique est:

(30.280)

En introduisant les deux dernières expressions dans celle de l'énergie potentielle:

(30.281)

En intégrant l'expression précédente entre 0 et R, cela revient à ajouter successivement une suite d'anneaux
d'épaisseur dr pour obtenir la sphère entière de rayon R et donc l'énergie potentielle de la sphère entière.

(30.282)
Ce qui s'écrit encore:

(30.283)

Soit finalement:

(30.284)

CONSERVATION DE L'ÉNERGIE MÉCANIQUE TOTALE

Comparons maintenant les équations:

(30.285)

puisqu'il s'agit du même travail.

Ce qui entraîne:

(30.286)

somme des deux formes d'énergie en chaque point ou encore, les lieux A et B. étant quelconques, en écrivant
l'équation sous une forme générale:

(30.287)

Remarque: Nous nommons souvent l'énergie totale d'un système "l'hamiltonien du système" comme nous
l'avons déjà mentionné dans le chapitre de Mécanique Analytique.

En l'absence de frottement s'il s'agit d'énergie mécanique, nous écrivons aussi la variation tel que :

(30.288)

Une augmentation d'énergie cinétique entraîne donc une diminution d'énergie potentielle (et
réciproquement) puisque la somme des deux reste constante.

Contre-exemple: S'il y a frottement, donc dégagement de chaleur, l'énergie mécanique totale n'est plus
constante! (l'énergie mécanique seulement).

Par ailleurs reprenons la relation :

(30.289)

et donc:

(30.290)
D'autre part, étant une fonction scalaire dépendant des coordonnées d'espace formons sa différentielle
totale:

(30.291)

en comparant avec l'équation précédente et en identifiant terme à terme, nous avons :

(30.292)

d'où l'expression affirmant que la force dérive d'une énergie potentielle si le travail en jeu est indépendant du
chemin suivi. Si nous exprimons la force en termes de vecteurs-unités, nous obtenons :

(30.293)

En définitive, l'affirmation que la force dérive d'une énergie potentielle peut se résumer ainsi:

(30.294)

Dans le cas de la gravitation :

(30.295)

Le champ de gravitation est donc caractérisé par l'ensemble des vecteurs .

CONSERVATION DE LA QUANTITÉ DE MOUVEMENT

Un mobile, lors d'une interaction avec un autre point matériel, peut transmettre tout ou partie de son
mouvement (énergie cinétique ou/et potentielle). C'est le cas lors d'un choc, par exemple (ceci dit le calcul
de la force d'un choc est extrêmement difficile à calculer sans de nombreuses simplifications). La grandeur
ainsi échangée est la quantité de mouvement . Elle vaut par définition (nous l'avons déjà vu lorsque nous
avons parlé de la deuxième loi de Newton):

(30.296)

Evidemment, nous avons :

(30.297)

La quantité :
est parfois appelée "impulsion", et l'équation précédente porte quelque fois le nom de "théorème de la
quantité de mouvement".

Il s'énonce ainsi: L'impulsion fournie par une force entre les instants et est égale à la variation de la
quantité de mouvement durant cet intervalle de temps.

Mais revenons en à notre conservation de la quantité de mouvement (et donc de l'énergie et


réciproquement...). L'intérêt de la grandeur de quantité de mouvement résulte du fait qu'elle est conservée
dans les interactions (en première approximation..). En effet, soient deux mobiles en collision, en vertu de
l'égalité de l'action et de la réaction (3ème loi de Newton) nous avons :

(30.298)

et en utilisant le théorème de la quantité de mouvement nous pouvons écrire:

(30.299)

En additionnant membre à membre ces deux équations, nous déduisons :

car (30.300)

et donc:

(30.301)

La quantité de mouvement totale est constante, elle se conserve donc.

LOI DE NEWTON GENERALISÉE

Revenons maintenant un petit peu à notre principe de moindre action dont nous avons parlé au tout début de
cette section:

Prenons le cas d'un objet lancé en l'air et repérons deux points de sa trajectoire en deux instants quelconques.
Une infinité de courbes passent entre ces deux points et pourtant la nature n'en choisit qu'une seule. Qu'est-
ce qui distingue cette courbe - la trajectoire physique - de toutes les autres? A cette question nous pourrions,
très justement, répondre que cette courbe se distingue des autres par le fait qu'elle est solution de l'équation
différentielle de la trajectoire ... avec les conditions initiales appropriées. Mais dans le cas où nous ignorons
les conditions initiales ou lorsque le problème ne peut être ramené à une équation différentielle, par quel
moyen pouvons-nous alors distinguer la trajectoire physique de tous les chemins possibles?

Le principe de moindre action s'exprime dans ce contexte par un minimum de vitesse pour un minimum de
chemin parcouru.

En fait de vitesse, il convient mieux en mécanique de considérer la quantité de mouvement car cette dernière
grandeur est directement liée aux propriétés inertielles des corps. Mathématiquement Maupertuis traduisit le
principe de moindre action comme suit.
Si nous considérons le mouvement d'un corps entre deux points A en et B en , pour une énergie totale E
donnée, la trajectoire sélectionnée par la nature est celle pour laquelle la grandeur suivante est
minimale:

(30.302)

La trajectoire physique entre deux points A et B aux instants et est celle pour laquelle l'action est
minimale.

En sachant que :

(30.303)

nous obtenons alors:

(30.304)

où T est l'énergie cinétique du corps.

Nous le voyons, l'action prend une forme étonnamment simple et s'exprime directement en fonction de
l'énergie cinétique. Quelques années plus tard, à partir d'une intuition semblable à celle de Maupertuis, Euler
parvint à un énoncé très similaire de l'action mais en partant du constat que les corps tendent à adopter un
état où l'énergie potentielle est minimale. L'action d'Euler s'exprimait en fonction de l'énergie potentielle au
lieu de l'énergie cinétique. Qui de Maupertuis ou d'Euler avait tort et raison?

En fait, leurs énoncés respectifs de l'action étaient équivalents. Nous savons que dans un champ conservatif,
si nous appelons U l'énergie potentielle alors l'énergie totale E vaut T + U et cette énergie est une constante.
Nous en tirons que T = E - U et que donc :

2T = T + E - U (30.305)

D'où:

(30.306)
Cette relation est vraie quel que soit le chemin d'énergie totale initiale E. Nous en concluons que la valeur de
la constante E ne permet pas de discriminer les différentes trajectoires et peut donc être éliminée de la
formulation de l'action. L'action de Maupertuis peut alors se réduire à une nouvelle grandeur notée S:

(30.307)

Cette nouvelle formulation de l'action fut donnée par Lagrange en 1788. S s'appelle "l'action lagrangienne"
ou "action hamiltonienne" et la fonction :

(30.308)

porte le nom de "lagrangien mécanique". Ainsi formulé, le principe de moindre action devint l'un des outils
les plus puissants de la mécanique.

Nous avons déjà vu comment nous exprimons le principe de moindre action mathématiquement. Dans le cas
qui nous intéresse, l'action n'est pas une fonction de variables analytiques mais de trajectoires!

Considérons le cas très simple d'un corps de masse m se mouvant sur une seule dimension (que nous
représenterons par un axe Ox) d'un point d'abscisse à l'instant à un point de coordonnée à l'instant
. Supposons qu'il est soumis à un potentiel U qui ne varie pas avec le temps c'est-à-dire .
L'action de ce corps sur un chemin C quelconque menant de à est alors:

(30.309)

Soit le chemin physique et l'action sur ce chemin. Notons par les valeurs de la position x sur le
chemin physique. Considérons maintenant un chemin C très proche de tel que les positions le long de C
aient les valeurs que nous écrirons, pour alléger les écritures .

Calculons l'action pour ce chemin:

(30.310)

Comme est infiniment petit, il est possible de développer le potentiel en développement limité:

(30.311)

Quant au premier terme, il se ramène à:

(30.312)

Comme nous ne considérons que les variations du premier ordre, le dernier terme peut être négligé, ce qui
donne pour l'action sur le chemin C :
(30.313)

Posons maintenant que la variation de l'action entre le chemin physique et C est nulle :

(30.314)

et ainsi:

(30.315)

Le premier terme dans l'intégrale peut s'intégrer par parties comme suit:

(30.316)

Or, tous les chemins partent de à l'instant et arrivent à à l'instant . Ceci implique qu'en et la
variation est nulle ce que nous écrivons . Donc le premier terme de l'intégration par
parties est nul. La variation de l'action prend alors la forme:

(30.317)

Cette intégrale doit être nulle pour tous les chemins très proches du chemin physique , donc quelle que
soit la valeur de . Pour qu'une telle condition soit remplie il faut que le terme devant soit nul, c'est-à-
dire:

(30.318)

Or nous connaissons au fait cette équation: le premier terme n'est rien d'autre que où a est
l'accélération du corps, et le second - l'opposé du gradient du potentiel - est l'intensité de la force en un point
donné. Celle-ci se réduit donc à l'équation:

(30.319)

qui n'est autre que la seconde loi de Newton généralisée! Le principe de moindre action contient donc
implicitement la mécanique newtonienne. Ainsi, il est possible de reconstruire toute la mécanique de
Newton avec le seul principe de moindre action!!!
Cet échafaudage de calculs peut paraître bien compliqué pour aboutir à un résultat que nous connaissions
déjà mais tout l'intérêt du principe de moindre action réside dans le fait qu'il permet de tirer des lois
fondamentales à partir de la seule connaissance du lagrangien d'un système.

Les théories les plus récentes comme la théorie quantique des champs, les théories de jauge ou la théorie des
supercordes ont toutes pour point de départ l'expression de l'action du système. Les physiciens en dégagent
ensuite des lois fondamentales qui régissent le comportement des particules élémentaires.

PUISSANCE

Définition: La puissance est le taux instantané de variation du travail (énergie sous forme quelconque).
Nous avons donc la "puissance instantanée" donnée par :

(30.320)

Si le travail est fourni de façon régulière, constant, nous avons alors la "puissance moyenne", constante :

(30.321)

Remarques:

R1. L'unité de la puissance est le "Watt" et se note [W] mais en technique, certains utilisent encore souvent
le "cheval" [ch] défini comme suite :

R2. En exprimant le travail (énergie) à partir de l'équation , où la puissance est donné en [kW] et le
temps en heures, il apparaît alors l'unité d'énergie [kWh] (kilowattheure), très utilisée en pratique.

PUISSANCE D'UNE MACHINE TOURNANTE

Le travail élémentaire dW effectué par la force faisant tourner le solide (un cylindre dans la cas présenté
de suite) autour de son axe d'une angle vaut :

(30.322)

La puissance instantanée est alors :

(30.323)

Or, moment de la force (supposée dans ce cas particulier perpendiculaire à ), donc "moment
de rotation". La puissance est alors donnée par :

(30.324)

RENDEMENT

A cause des frottements, la puissance restituée par une machine appelée aussi "puissance utile", est toujours
inférieure à la puissance absorbée. Nous tenons compte de cet effet au moyen du rendement défini par :
(30.325)

Nous y reviendrons beaucoup plus en détail lors de notre étude de la thermodynamique.


30. MÉCANIQUE CLASSIQUE RATIONNELLE (2/2)

MOUVEMENTS RELATIFS ET FORCES D'INERTIES

Voyons maintenant des développements qui vous nous permette d'introduite un élément très important et
utile en mécanique des fluides (cf. chapitre de Mécanique Statistique) et en météorologie (cf. chapitre de
Génie Marin & Météo).

Considérons un référentiel fixe X, Y, Z et un référentiel mobile x, y, z. Ils sont donc en mouvement relatif et
nous envisageons une rotation possible du référentiel mobile. Il s'agit d'exprimer, la vitesse, l'accélération
d'un point P de l'espace au moyen des coordonnées du référentiel fixe (coordonnées absolues) à partir de
celles attachées au référentiel mobile (coordonnées relatives) et du mouvement d'entraînement du référentiel
mobile.

Nous définissons dans notre étude:

vecteur de position de P par rapport au référentiel mobile

vecteur de position de P par rapport au référentiel fixe

vecteur de position de P par rapport à l'origine du référentiel fixe

vitesse absolue de P par rapport au référentiel fixe (supposé inconnu)

accélération absolue de P par rapport au référentiel fixe (supposé inconnu)

vitesse relative de P par rapport au référentiel mobile (supposé connu)

accélération relative de P par rapport au référentiel mobile (supposé connu)

vitesse d'entraînement au point P du mouvement relatif du référentiel mobile par rapport au


référentiel fixe (supposé connu)

accélération d'entraînement du référentiel mobile (supposé connu)

vitesse angulaire du référentiel mobile


(30.1)

la position du point P est donc donnée par la "relation de composition des positions":

(30.2)

La vitesse absolue se calcule comme:

(30.3)

Le dernier terme est la contribution due à la rotation du référentiel mobile. Il s'agit maintenant d'exprimer la
valeur de cette contribution en envisageant des rotations d'angle autour de chacun des axes,
successivement:
(30.4)

Nous obtenons ainsi les vecteurs élémentaires figurant les déplacements des extrémités des
vecteurs-unités . Nous les introduisons dans l'expression ci-dessous qui devient, après réarrangement
des termes:

(30.5)

par définition du produit vectoriel. La vitesse absolue du point P s'exprime donc selon la "loi de composition
des vitesses":

(30.6)

nous constatons que dans le cas particulier où le référentiel mobile ne subit qu'une translation , nous
trouvons l'équation caractéristique de la transformation de Galilée et nous disons alors que les
référentiels sont en "translation relatives".

Remarque: Si nous nous concentrons uniquement sur les termes de vitesse d'entraînement et de rotation du
référentiel mobile nous obtenons alors ce que nous appelons la "formule de Bour".

En procédant de la même façon que pour la recherche de la vitesse absolue il vient, en dérivant la relation
précédente nous avons :

(30.7)

avec :

(30.8)

Si nous regroupons les termes:

(30.9)

Si nous regroupons les termes:

(30.10)
Si nous regroupons les termes:

(30.11)

et nous avons :

(30.12)

Donc:

(30.13)

Finalement:

(30.14)

mais (!) rappelons-nous que :

(30.15)

ainsi:

(30.16)

L'accélération absolue ou la "loi de composition des accélérations" s'exprime alors comme:

(30.17)
Le terme:

(30.18)

est appelé "accélération de Coriolis" et le terme est simplement l'expression de l'accélération


centripète dans ce cas particulier.

La loi de Newton doit comporter tous les termes contenus dans l'équation générale ci-dessus. Pour
un observateur situé dans le système fixe, cette loi s'écrit alors:

(30.19)

où l'on a en premier terme à droite de l'égalité la force d'entraînement, en troisième la force de Coriolis et en
dernier la force centripète.

Si le point P est lié rigidement au référentiel mobile, un observateur dans ce système ne perçoit aucun
mouvement, par conséquent aucune accélération . Nous avons donc affaire à un système de forces en
équilibre. Le problème de dynamique est alors ramené à un problème de statique. C'est le "principe
d'Alembert".

Exemple:

Etant donné que pratiquement toutes nos observations sont faites sur Terre, c'est-à-dire dans un référentiel
mobile dans l'Univers, la force de Coriolis peut y être mise en évidence.

L'étude du mouvement d'un corps par rapport à la Terre est l'une des applications les plus intéressantes de
l'équation démontrée précédemment. La Terre a une vitesse angulaire (supposée constante!) dont la direction
est celle de l'axe de rotation de la Terre. Appelons l'accélération de la pesanteur mesurée en un point A à
la surface de la Terre si celle-ci ne tournait pas. correspond alors à . En tirant l'accélération
d'entraînement et relative nous obtenons l'accélération mesurée par un observateur en mouvement avec la
Terre:

(30.20)

où est négligé dans le cas de la rotation de la Terre.

Nous considérons d'abord le cas d'un corps initialement au repos, ou se déplaçant très lentement de sorte que
le terme de Coriolis est nul ou négligeable comparé au dernier terme. L'accélération que nous mesurons dans
ce cas est appelée "accélération effective" de la pesanteur, et nous la désigne par .

Par suite:

(30.21)
En supposant que la Terre est une sphère (en fait sa forme s'en écarte légèrement) et qu'il n'y a pas
d'anomalies locales, nous pouvons estimer que est dirigé vers le centre de la Terre. Le deuxième terme
étant l'accélération centrifuge elle est dirigée vers l'extérieur.

Puisque est la somme de et de l'accélération centrifuge, la direction de , appelée la "direction


verticale", s'écarte légèrement de la direction radiale; elle est expérimentalement déterminée par un fil à
plomb. Les liquides se maintiennent toujours en équilibre avec leur surface perpendiculaire à .

L'ordre de grandeur de l'accélération centrifuge est:

(30.22)

où r est le rayon de la Terre. L'accélération centrifuge décroît de l'équateur aux pôles car le rayon de la Terre
n'est pas constante (la Terre est aplatie aux pôles). Cette variation de l'accélération est toujours très petite
quand nous la comparons avec la pesanteur mais elle explique cependant la plupart des
variations observées de la valeur de la pesanteur avec la latitude.

Le gradient de l'accélération centrifuge a pour effet de déplacer légèrement la direction radiale d'un corps
qui tombe en chute libre: le déplacement est vers le Sud dans l'hémisphère Nord et vers le Nord dans
l'hémisphère Sud.

Considérons ensuite le terme de Coriolis. Dans le cas de la chute d'un corps, la vitesse est dirigée vers le
bas. D'autre part, comme se trouve le long de l'axe de la Terre , est dirigé vers l'Ouest. Le terme de
Coriolis est donc dirigé vers l'Est; le corps qui tombe sera dévié dans cette direction.

Pour un corps tombant dans un plan parallèle et tangent à la surface de la Terre, nous avons :

(30.23)

C'est exactement ce phénomène que l'on observe dans le cas des cyclones (nous y reviendrons plus en détail
dans notre étude de la météorologie dans le chapitre de Génie Météo). Une zone atmosphérique
dépressionnaire (de faible pression relative) donnerait des courants atmosphériques (vents) convergents vers
la dépression si la Terre ne tournait pas autour de son axe.
(30.24)

La force de Coriolis due à la rotation de la Terre dévie donc les vents Nord-Sud en direction de l'Ouest et les
vents Sud-Nord vers l'Est pour un observateur se situant au Pôle Nord. Nous observons dès lors la formation
de cyclones tournants dans le sens contraires des aiguilles d'une montre dans l'hémisphère Nord et
inversement dans l'hémisphère Sud (à cause de la direction du vecteur dans cette partie de l'hémisphère).

Comme second exemple, considérons les oscillations d'un pendule. Pour des oscillations de faible
amplitude, nous pouvons supposer que le mouvement du pendule se fait selon une trajectoire horizontale. Si
l'on fait osciller le pendule initialement dans la direction Nord-Sud, la force de Coriolis va dévier le
mouvement du pendule vers la droite pour un observateur situé au Pôle Nord. En d'autres termes, le pendule
tourne dans le sens des aiguilles d'une montre dans l'hémisphère Nord et dans le sens contraire dans
l'hémisphère Sud. Cet effet observable est nul dans à l'équateur (parallélisme parfait entre et ) et
maximale aux Pôles.

Cet effet fut démontré de façon spectaculaire par le physicien français Jean Léon Foucault, quand en 1851 il
suspendit un pendule de 67 mètres de long à l'intérieur du Dôme des Invalides. A chaque oscillation, le
pendule faisait tomber du sable sur un cercle, ce qui démontrait expérimentalement que son plan
d'oscillation de par heure. L'expérience de Foucault est une preuve frappante de la rotation de la
Terre. Même si la Terre était toujours couverte de nuages, cette expérience aurait montré aux physiciens que
la Terre tournait.

Comme troisième exemple parlons des tourbillons que l'on peut observer dans la baignoire ou le lavabo. Ce
n'est qu'une légende que ce dernier tourne différemment en fonction des hémisphères. Car la vitesse et la
masse mises en jeu sont beaucoup trop faibles pour êtres observables dans de tels objets. Au fait, le sens de
rotation est dû aux imperfections (aspérités) du siphon. Par contre, si vous allez en équateur, il y a des
étudiants qui se font un plaisir de vous montrer que l'effet existe avec une petite expérience mise en place
avec une allumette. En se déplaçant de dix mètres, ils vous montreront le sens de rotation du siphon change
en fonction de l'hémisphère dans laquelle on se trouve!

THÉORÈMES DE KÖNIG

Nous avons vu jusqu'à maintenant, comment calculer le moment cinétique ou l'énergie cinétique d'un
système dynamique par rapport à un unique référentiel (soit galiléen, soit barycentrique)

Les théorèmes de König donnent eux les moments cinétiques et l'énergie cinétique totale d'un système
dynamique par rapport à un référentiel galiléen et barycentrique

PREMIER THÉORÈME DE KÖNIG

Utilisons pour démontrer ce théorème le moment cinétique d'un corps de masse M (l'exemple étant toujours
facilement extensible un système dynamique discret ou continu de matière).
Exprimons le moment cinétique d'un élément du corps solide par rapport à l'origine O du référentiel
galiléen (noté : par la suite) :

(30.25)

Exprimons le moment cinétique dans par rapport à son centre de masse G (noté : ):

(30.26)

Le référentiel étant en translation par rapport à , nous avons :

(30.27)

Sans oublier que :

(30.28)

que nous insérons dans l'expression du moment cinétique :

(30.29)

De par la propriété du produit vectoriel, nous avons :

(30.30)

Étudions maintenant la valeur que prend chacun des quatre termes de la relation précédente. Nous savons
que par la définition du centre de masse que (dans un cadre non relativiste) :

(30.31)

d'où :

(30.32)

et également :

(30.33)

Finalement, il vient :
(30.34)

Donc finalement :

(30.35)

Ce théorème qui se rapporte à un point fixe permet l'application plus aisée du théorème du moment
cinétique.

DEUXIÈME THÉORÈME DE KÖNIG

Utilisons pour démontrer ce théorème l'énergie cinétique d'un corps de masse M (l'exemple étant toujours
facilement extensible un système dynamique discret ou continu de matière).

Exprimons le moment cinétique d'un élément du corps solide par rapport à l'origine O du référentiel
galiléen (noté : par la suite) :

(30.36)

Exprimons l'énergie cinétique dans par rapport à son centre de masse G (noté : ):

(30.37)

Avec de même que précédemment :

(30.38)

Il vient dès lors :

(30.39)

et donc :

(30.40)

et comme pour le moment cinétique, de par la définition du centre de masse, nous avons :

(30.41)

d'où le deuxième théorème de König :


(30.42)

MOUVEMENTS OSCILLATOIRES

Le mouvement oscillatoire est le mouvement d'un corps qui va et vient de part et d'autre de sa position
d'équilibre. Il existe une quantité incroyable de phénomènes physiques de ce genre. Nous allons traiter dans
cette section les grands classiques à partir desquels les développements sur des phénomènes plus complexes
s'inspirent.

Nous étudierons dans l'ordre les pendules des plus simples aux plus complexes et utiliserons souvent des
résultats antérieurs pour en déterminer de nouveaux.

Nous retreindrons notre étude des mouvements oscillatoires aux pendules. Les autres viendront au fur et à
mesure dans leurs chapitres respectifs.

Il existe neufs pendules très connus qui sont les suivants (ordre dans lequel nous les étudierons): pendule de
Newton, pendule simple, pendule physique, pendule élastique, pendule conique, pendule de torsion, pendule
de Foucault, pendule de Huygens.

PENDULE DE NEWTON

Nous n'allons pas trop nous étendre à décrire le pendule de newton. Une photo suffira:

(30.43)

Le principe de fonctionnement est le suivant:

Si vous lancez une bille, à l'extrémité une seule et unique bille se déplacera. Cela semble logique et cohérent
d'après la conservation de la quantité de mouvement qui découle de la conservation de l'énergie comme nous
l'avons déjà vu.

Un peu plus curieux, lorsque vous lancez initialement deux billes, ce sont deux billes qui se déplacement à
l'autre extrémité!

La démonstration est simple et le fonctionnement se base sur une condition très simple que nous allons
déterminer pour le cas particulier de deux billes (c'est toujours le même principe pour un nombre de billes
supérieur) :

Soit les quantités de mouvement des deux billes initiales et les deux billes se situant à
l'autre extrémité. Nous avons donc:
(30.44)

Nous avons pour l'énergie cinétique:

(30.45)

après regroupement et simplification:

(30.46)

Ensuite après division de la deuxième relation ci-dessus par la première, nous déduisons l'expression des
vitesses après le choc:

(30.47)

Hypothèse: supposons maintenant qu'en prenant une seule des billes ( ), il y en ait deux qui partent à
l'autre extrémité tel que:

(30.48)

Prenons le cas où toutes les billes du pendule de Newton ont la même masse (cas correspondant à celui que
l'on trouve dans le commerce). Alors:

(30.49)

Nous voyons que notre hypothèse initiale impossible: si à masses égales, une seule bille est lancée alors, à
l'autre extrémité, une seule bille partira.

Par contre, si nous lançons deux billes dans un pendule de Newton composé de masses identiques nous
avons après simplification des équations:

(30.50)

deux billes qui partent à l'autre extrémité.

Il suffit de procéder à des raisonnements identiques pour 3, 4, 5, ... billes.

C.Q.F.D.

PENDULE SIMPLE

Soit, T la période de temps nécessaire pour qu'un pendule simple (voir figure ci-dessous) parcoure un cycle
complet et que l'on peut écrire:
(30.51)

qui est donc l'inverse de la "fréquence propre" du système en l'absence de frottement.

(30.52)

La variation de l'énergie potentielle du système étant:

(30.53)

Nous savons que et que la conservation de l'énergie nous permet de poser:

(30.54)

Après simplification nous obtenons:

(30.55)

Nous pouvons exprimer par rapport à la distance parcourue par le pendule:

(30.56)

Si nous dérivons cette expression par rapport au temps... Nous obtenons alors:

(30.57)

Si nous revenons à:

(30.58)

et que nous le dérivons, nous obtenons:


(30.59)

Si l'angle est petit, nous pouvons remplacer avec l'aide de la série de Taylor et sans erreur trop grave,
par le premier terme de son développement en série:

(30.60)

et comme nous obtenons:

(30.61)

Etant donné que dans un cadre périodique:

(30.62)

nous pouvons alors écrire que:

(30.63)

d'où:

(30.64)

Comme nous pouvons poser:

(30.65)

Donc la période de balancement est indépendante de l'amplitude ce qui explique pourquoi le nombre de
balancements par minute d'un pendule simple est constant, quelle que soit l'ardeur que nous mettions à le
faire balancer...

Si:

(30.66)

où est la position du centre de masse de l'objet et P le nombre éventuels de maillons que l'on aurait pris
pour la longueur L de la chaîne et P étant le pas de la chaîne.

Ce qui nous donne finalement:


(30.67)

PENDULE PHYSIQUE

Nous appelons "pendule physique" un solide quelconque pouvant osciller librement dans la pesanteur,
autour d'un axe A, avec une petite amplitude ( ).

Son mouvement est déterminé par l'équation suivante:

(30.68)

où M est le moment de rappel et le moment d'inertie du pendule par rapport à son axe d'appui A.

En faisant une analyse des forces sur notre pendule nous obtenons une autre relation pour M:

(30.69)

pour et où d est la distance de l'axe d'appui du pendule à son centre de masse. Le terme négatif
apparaît ici pour exprimer le fait que la période diminue avec le temps. Comme l'angle est petit, nous
avons remplacé et sans erreur trop grave par le premier terme de son développement en série de
Taylor:

(30.70)

Donc le moment de rappel peut s'écrire:

(30.71)

d'où l'équation différentielle du mouvement:

(30.72)

Nous avons vu dans les mouvements harmoniques oscillants que nous obtenions la position angulaire d'une
masse par la relation:

(30.73)

ce qui nous permet d'écrire:

(30.74)

et par simplification nous obtenons:


(30.75)

d'où:

(30.76)

En exprimant le moment d'inertie au moyen du théorème de Steiner en déduisons que:

(30.77)

et en introduisant encore le rayon de giration k:

(30.78)

d'où:

(30.79)

Soit x la position de l'axe de rotation A mesurée par rapport à une origine quelconque et a la position du
centre de gravité par rapport à la même origine nous avons:

(30.80)

tel que représenté ci-dessous:

(30.81)

d'où:

(30.82)

ce qui nous donne aussi pour la période:


(30.83)

comme la racine nous gêne nous élevons le tout au carré, ce qui nous donne finalement

(30.84)

Comme nous connaissons x et T, cette relation nous permettrait à partir du tracer un graphique permettant de
déterminer la position de G et k.

Ainsi, en portant sur un graphique en fonction de x:

(30.85)

La courbe obtenue présente une asymptote verticale ( ) pour et deux minima.

En dérivant par rapport à x et en annulant les dérivées, nous trouvons la position des minima :

(30.86)

PENDULE ÉLASTIQUE

Étudions maintenant les oscillations propres d'un solide suspendu à un ressort élastique tel qu'il oscille.
Après l'écart du solide de la position d'équilibre, il accomplira des oscillations harmoniques dans le sens
vertical, si le ressort élastique subit des déformations proportionnelles à l'allongement du ressort.

Nous aurons souvent dans ce site à faire avec de petits mouvements autour d'une position d'équilibre. Ce
type de mouvement caractéristique de ce que nous appelons un "oscillateur harmonique" est très fréquent. Il
se généralise à toutes sortes de situations physiques, telles que les circuits RLC (cf. chapitre de Génie
Électrique), le modèle quantique corpusculaire et ondulatoire de l'atome, les résonateurs à quartz ou toute
autre structure vibrante faiblement autour de son point d'équilibre.

Nous savons que la force de rappel d'un ressort est proportionnelle et opposée à la déformation telle que
(voir le chapitre de Génie Civil pour la démonstration):

(30.87)

L'équation différentielle de l'oscillateur harmonique peut donc s'écrire:

(30.88)
Nous prendrons la démarche très simple qui consiste à essayer une solution, en l'occurrence:

(30.89)

C'est une solution, car en effet:

(30.90)

pour autant que nous prenions la fréquence propre:

(30.91)

Nous avons aussi le "mode propre":

(30.92)

comme solution.

Une solution générale est donc:

(30.93)

Pour trouver A et B, il faut spécifier les conditions initiales. Prenons par exemple:

(30.94)

à .

Nous avons alors:

(30.95)

Calculons maintenant le travail (énergie) nécessaire pour déformer l'oscillateur harmonique. Nous avons :

(30.96)

Ainsi, l'énergie potentielle élastique dans un ressort de constante k, ayant subi une déformation x est donc
donnée par :

(30.97)
Pour une description plus réaliste, une meilleure modélisation, nous allons supposer que l'oscillateur est
soumis à une force supplémentaire représentant les frottements. Il arrive souvent que l'approximation par
laquelle la force de frottement est proportionnelle à la vitesse, et opposée à la vitesse, soit une bonne
approximation. Ce n'est pas la seule possible, et ce n'est pas toujours la meilleure. Nous parlerons des forces
de frottement plus tard.

Ainsi nous considérons une force de friction de la forme (ne pas confondre avec la notation du moment
cinétique qui n'a absolument aucun rapport):

(30.98)

Pour notre système de coordonnées:

(30.99)

La deuxième loi de Newton impose:

(30.100)

Pour se conformer à une notation usuelle dans le cadre de l'oscillateur, nous notons:

(30.101)

d'où l'équation différentielle:

(30.102)

Nous prenons la fonction d'essai:

(30.103)

En substituant, nous trouvons:

(30.104)

Comme nous cherchons des solutions non nulles ( ) il faut que:

(30.105)

d'où:

(30.106)

et la solution générale est:


(30.107)

où deux constantes sont déterminées par les conditions initiales.

Nous verrons qu'il correspond à un amortissement faible. En effet, nous pouvons écrire avec des racines
carrées réelles:

(30.108)

et la solution générale peut alors s'écrire:

(30.109)

En utilisant les propriétés complexes des exponentielles et en particulier la "formule d'Euler" (cf. chapitre
sur les Nombres) :

(30.110)

Choisissons et rappelons que (cf. chapitre de Trigonométrie). Ainsi :

(30.111)

et comme nous avons aussi . Alors :

(30.112)

posons et comme la fonction trigonométrique est périodique à avec alors :

(30.113)

L'allure générale de la normalisée à l'unité est la suivante:

(30.114)
Quand nous disons qu'il y a "amortissement critique", quand , qu'il y a "amortissement sur-
critique".

Le rapport :

(30.115)

est quant à lui appelé "facteur de qualité".

PENDULE CONIQUE

Le pendule conique consiste à prendre une masse m considérée comme ponctuelle et suspendue en A d'un fil
fixé en O.

La masse étant écartée d'un angle de la verticale, l'objectif de ce pendue est fréquemment (car c'est le cas
le plus simple) de déterminer la dépendance entre l'angle et la vitesse si l'on considère que les trajectoires
sont circulaires.

(30.116)

La masse m se déplace autour de la verticale OC, en décrivant un cercle de rayon:

(30.117)

Les forces suivantes agissent sur la masse m:

(30.118)

D'après la figure, nous voyons que:

(30.119)

ou, comme:
(30.120)

alors:

(30.121)

L'angle est donc d'autant plus grand que la vitesse angulaire est élevée, ce que confirme l'expérience.
Pour cette raison, le pendule conique fut longtemps utilisé comme régulateur de vitesse sur les machines à
vapeur (il ferme l'arrivée de vapeur quand la vitesse dépasse une limite fixée à l'avance et l'ouvre quand elle
tombe au-dessous de cette valeur).

Nous avons aussi:

(30.122)

d'où après simplification:

(30.123)

PENDULE DE TORSION

Le pendule de torsion est un système qui fut utilisé par Coulomb pour mesure de la charge électrique
élémentaire et par Cavendish pour la mesure de la constante gravitationnelle G.

Le pendule de torsions consiste en un solide rigide suspendu à fil de torsion vertical. Lors des oscillations le
fil exerce un moment de rappel que l'on supposera proportionnel à l'angle de torsion :

(30.124)

où k est la "constante de torsion" de ce fil particulier (cf. chapitre de Génie Mécanique).

Nous avons donc:

(30.125)

soit l'équation différentielle:

(30.126)

Par analogie avec le pendule physique où nous avions une équation différentielle identique à un facteur près,
il vient:
(30.127)

PENDULE DE FOUCAULT

Le pendule de Foucault est une expérience formidable pour rendre compte de la rotation de la Terre. Il existe
plusieurs méthodes mathématiques pour analyser le comportement du pendule de Foucault. Nous avons
choisi de présenter la plus simple qui ne nécessite que peu de pages de calcul.

D'abord un petit texte explicatif peut s'avérer pertinent tellement cette expérience est importante.

L'expérience de Foucault a pour but de démontrer que la Terre tourne sur elle-même. Vous lancez un
balancier (ne bille de plomb au bout d'un fil). Il a un mouvement de va-et-vient régulier dans la même
direction. Si vous l'emportez dans une voiture et que vous ne tournez pas trop brusquement, le pendule se
moque des virages : il continue à battre dans la même direction. C'est qu'un pendule reste toujours dans le
même plan, malgré les mouvements de son support.

C'est pourquoi le physicien français Léon Foucault eut l'idée d'attacher un lourd balancier de 67 mètres de
long sous le dôme du Panthéon, en présence de Napoléon III et de quelques savants. A chacune de ses allées
et venues, le pendule venait écorner un tas de sable où il laissait une marque. Or, la trace n'était jamais à la
même place: il y avait 3 à 4 millimètres d'écart entre un balancement et le suivant, 16 secondes plus tard. Le
pendule restait dans le même plan, mais le Panthéon, Paris, la Terre tournaient!

Soit la figure ci-dessous:

(30.128)

Nous considérons que c'est la vue d'un référentiel géocentrique (la Terre) vu en coupe selon un plan qui
contient l'axe de rotation.

La taille du pendule est bien évidemment exagérée sur la figure. Il oscille cependant quand même dans un
plan méridien, entre A et B (un observateur terrestre voit la droite AB tourner par rapport au sol terrestre
selon le cercle vert, vu en perspective, dans le sens rétrograde).

Soit T la période de rotation de A (ou B).

La vitesse de A ( ) , sur ce cercle, est due au fait que, dans le référentiel géocentrique, le point M, à la
verticale du point de suspension, et le point du sol Terrestre coïncidant avec A à un instant donné, n'ont pas
la même vitesse dans le référentiel géocentrique: le point M étant plus éloigné de l'axe de rotation Terrestre:
la distance MM' étant plus grande que B (de même la vitesse de B étant supérieure à la vitesse de M).

La différence de ces vitesses se calcule aisément en supposant que la rotation terrestre est uniforme en
raisonnant sur une période d'une journée (sidérale) .

Nous savons que:

(30.129)

De ceci il découle facilement que:

(30.130)

étant donné que dans le triangle AHM :

(30.131)

alors:

(30.132)

Or, n'est autre que:

(30.133)

Donc:

(30.134)

Nous avons donc obtenu l'expression de la période du pendule de Foucault.

Exemple:

La période du pendule du Panthéon (aller et retour) est de 16.5 secondes, l'amplitude maximale de 6 mètres
et le temps d'amortissement de 6 heures. Nous pouvons ainsi observer un déplacement de plusieurs
millimètres par aller et retour du pendule.

Remarque: Le sens de la rotation est celui des aiguilles d'une montre, pour un observateur placé au dessus
du pendule, dans l'hémisphère Nord ; et dans le sens contraire du sens de rotation des aiguilles d'une montre
dans l'hémisphère Sud.

Aux pôles (où l'angle est de 90° et le sinus unitaire), la période du pendule égale celle de la Terre et est donc
de 24h. A l'équateur (où l'angle est de 0° et le sinus nul), la période de rotation du plan d'oscillation est
infinie : le plan d'oscillation est fixe par rapport à la Terre. A Paris (où l'angle est de 48°52' et le sinus 0.75),
la période de rotation est de 31 heures et 57 minutes.
Cependant, l'importance du pendule de Foucault est autre...

Le plan d'oscillation du pendule est en réalité fixe et c'est la rotation de la Terre sur elle-même qui donne
lieu à une rotation apparente. Mais finalement... que est le système de référence ?

En effet, tout mouvement est relatif. Si la Terre est en rotation, elle l'est par rapport à quelque chose. Nous
ne pouvons pas parler d'un mouvement sans définir un cadre de référence. La question qui se pose donc est
de savoir par rapport à quel système de référence le plan d'oscillation du pendule est fixe.

La première idée qui vient à l'esprit consiste à dire que le plan du pendule est fixe par rapport au Soleil.
Mais, si Foucault avait réussi à construire un pendule capable d'osciller suffisamment longtemps, disons
pendant un mois, il se serait aperçu que le plan d'oscillation dérivait également par rapport à la position du
Soleil. Notre étoile ne fait donc pas partie du système de référence en question.

Peut-être faut-il alors considérer les étoiles proches du Soleil ? Mais là aussi, si l'expérience pouvait durer
suffisamment longtemps, elle montrerait que le plan des oscillations se déplace nettement par rapport aux
étoiles après quelques années. Quel objet choisir dans ce cas ? Le centre galactique, la galaxie d'Andromède,
le Groupe Local, le superamas local ? Chacun de ces objets donnerait l'illusion d'être fixe par rapport au plan
des oscillations, mais finirait, après un temps de plus en plus long, par révéler une dérive.

Finalement, en dernier recours, nous pouvons considérer les objets les plus lointains, les galaxies ou quasars
situés à des milliards d'années-lumière. Avec ce système de référence, et si l'expérience de Foucault était
réalisable, le plan des oscillations serait enfin fixe et il n'y aurait plus de dérive. Ce n'est donc qu'en
considérant les objets les plus lointains, en fait l'Univers observable dans son ensemble, que nous pouvons
obtenir un cadre par rapport auquel le plan des oscillations se stabilise.

Le pendule de Foucault se moque donc de la présence de la Terre, du Soleil ou de la Galaxie. Son


mouvement lui est directement dicté par l'Univers dans son ensemble. Cette expérience met en évidence une
sorte de lien mystérieux entre chaque point et l'Univers tout entier. Jusqu'à nouvel ordre, la nature de ce lien
reste inconnue.

Une conclusion similaire fut tirée par le physicien autrichien Ernst Mach à la fin du XIXe siècle (nous
retrouverons le "principe de Mach" dans le chapitre de Relativité Restreinte).

D'après la physique de Newton, le produit de la masse d'un corps par son accélération est égal à la force qui
s'exerce sur lui. Par conséquent, pour une force donnée, plus un objet est massif, plus son accélération est
faible. De ce point de vue, la masse est donc une mesure de l'inertie du corps, c'est-à-dire de sa faculté à
résister à une force.

Supposons maintenant que toute la matière de l'Univers disparaisse, excepté pour ce corps. Ce dernier est
alors complètement isolé et plus aucune force ne s'exerce sur lui. Cela signifie, d'après la physique de
Newton, que le produit de sa masse par son accélération est égal à zéro. Or l'accélération ne peut pas être
nulle. En effet, comme toute la matière de l'Univers a disparu, il n'y a plus de système de référence par
rapport auquel on pourrait définir la vitesse ou l'accélération. Cette dernière est donc indéfinie et non pas
nulle. D'un point de vue mathématique, il ne reste qu'une seule possibilité, que la masse du corps soit nulle.

Ce raisonnement montre que la masse et l'inertie d'un corps ne sont pas vraiment des propriétés de l'objet
lui-même, mais plutôt le résultat d'une interaction avec le reste de l'Univers. Tout comme le pendule de
Foucault, le principe de Mach nous montre qu'il doit exister une sorte de connexion entre les propriétés
locales d'un corps et les propriétés globales de l'Univers. Comme dans le cas précédent, la nature de cette
connexion mystérieuse reste à déterminer.

PENDULE DE HUYGENS
Nous cherchons à construire un pendule dont la période soit indépendante de l'amplitude. Pour cela nous
disposons deux lamelles de forme cycloïdale à des positions symétriques et déterminées telles que
représentées sur la figure ci-dessous:

(30.135)

Le choix de la cycloïde est du au fait qu'il s'agit d'une courbe "brachistochrone" (voir la définition plus bas)
et depuis les travaux de Huygens en 1659, nous savons aussi qu'il s'agit d'une courbe "tautochrone" (les
balanciers dans les montres modernes ont par tradition cette forme). C'est-à-dire que les corps qui tombent
dans une cycloïde renversée arrivent au point le plus bas dans le même temps, de quelque hauteur qu'ils
commencent à tomber.

Donc contrairement à une idée reçue, le chemin le plus rapide pour un corps en mouvement non horizontal
tombant sur un support solide n'est pas la ligne droite.

En effet, l'un des problèmes les plus connus de l'histoire des mathématiques est le problème du
brachistochrone qui consiste donc à trouver la courbe le long de laquelle une particule glisserait d'un point à
un autre en un minimum de temps en étant soumis à un champ uniforme de pesanteur. Ce problème a été
posé par Jean Bernoulli en 1696 comme un challenge pour les mathématiciens de son époque (et s'en fut un
!!!). La solution fut trouvée par Jean Bernoulli lui-même ainsi que par son frère Jacques Bernoulli, Newton,
Leibniz et le marquis de l'Hospital. Le problème brachistochrone est important dans le développement des
mathématiques et s'avère être une des applications principales de la méthode du calcul des variations.

Nous considérons dans le champ de la pesanteur deux points a et b et un point matériel m se déplaçant sans
frottement sur une courbe d'extrémités a et b. Déterminer la courbe, appelée brachistochrone, pour laquelle
le temps de parcours est minimal lorsque le point m part du point avec une vitesse nulle.

Considérons le schéma ci-dessous:

(30.136)

A l'abscisse x sur le graphe, l'énergie potentielle perdue est , équivalente à l'énergie cinétique
acquise par le point matériel depuis le départ telle que:

(30.137)
D'où sans trop de surprises:

(30.138)

La vitesse v est mesurée le long de la courbe si bien que nous devons réécrire l'expression en composantes
horizontales et verticales:

Nous allons poser que s représente l'abscisse curviligne et ds l'accroissement de cette distance le long de la
courbe. dx et dy représentent les composantes horizontales et verticales de ds.

Ainsi:

- ds/dt représente la vitesse le long de la courbe

- dx/dt représente la composante x de la vitesse

- dx et dy sont données par le théorème de Pythagore exactement de la même façon que nous l'avions fait
dans notre cadre d'étude du formalisme lagrangien.

(30.139)

En insérant l'équation obtenue d'après les principes de la dynamique:

(30.140)

Une simple intégration nous donne alors l'expression de t à minimiser:

(30.141)

Nous nous retrouvons avec une fonction similaire à celle que nous avions lors de notre étude d'un cas
pratique du formalisme lagrangien.

Il s'agit maintenant de trouver le minimum atteint par t parmi toutes les fonctions y(x) satisfaisant:

(30.142)

Le problème fondamental dit du "calcul des variations" consiste à chercher, parmi les fonctions
continûment dérivables sur un intervalle donné [a,b] et pour lesquelles les fonctions f(a) et
f(b) sont des valeurs données, celles qui rendent maximum ou minimum l'intégrale précédente.

Pour appliquer cette méthode, nous partons de l'équation d'Euler-Lagrange (cf. chapitre de Mécanique
Analytique) :

(30.143)

qui donne les extremums de l'intégrale.


Identiquement à ce que nous avons vu dans notre exemple dans le cadre de notre étude du formalisme
lagrangien (cf. chapitre de Mécanique Analytique) nous avons dans notre cas:

(30.144)

Donc:

(30.145)

En remplaçant dans l'équation différentielle d'Euler-Lagrange, nous trouvons:

(30.146)

ou autrement écrit:

(30.147)

Il faut donc résoudre cette équation différentielle pour trouver la fonction qui donne le chemin le plus rapide.

Il existe une fonction paramétrique qui satisfait cette équation différentielle (dont je ne possède pas la
démonstration formelle mais uniquement avec Maple...). C'est l'équation paramétrique de la cycloïde
justement ! Donnée par:

(30.148)

En posant nous avons dans Maple:

>plot([theta-sin(theta),1-cos(theta),theta=0..6*Pi]);
(30.149)

Soit les dérivées:

(30.150)

Ainsi:

(30.151)

La conservation de l'énergie:

(30.152)

s'écrit donc:

(30.153)

d'où:

(30.154)

Donc le temps requis pour aller du haut au bas de la cycloïde que décrit le pendule de Huygens est :

(30.155)

Cette durée ne dépend donc que de paramètres fixes.


L'énoncé en 1696 du problème brachistochrone peut être considéré comme l'authentique acte de naissance
du calcul des variations, car c'est ce problème qui suscite la recherche de méthodes générales
progressivement élaborées au cours d'une véritable compétition.

Remarque: Une ligne brachistochrone d'une surface est une courbe sur laquelle doit glisser sans frottement
un point matériel pesant placé dans un champ de pesanteur uniforme de sorte que le temps de parcours soit
minimal parmi toutes les courbes joignant deux points fixés. Autrement dit, ce sont les lignes les plus
courtes en temps, alors que les géodésiques (cf. chapitre de Relativité Restreinte) sont les lignes les plus
courtes en distance.

TRIBOLOGIE

Définition: La "tribologie" est la science des frottements (notion très intuitive à tout un chacun car nous
pouvons ressentir ses effets dans la vie quotidienne) qui interviennent lorsque deux surfaces en contact sont
mises en mouvement l'une par rapport à l'autre, produisant une force qui s'oppose au mouvement.

La plupart de ces phénomènes relatifs aux frottements peuvent se comprendre en première approximation
sur la base des lois phénoménologiques du frottement énoncées dès le 18ème siècle par Amontons et
Coulomb (mais déjà mises en évidence par Léonard de Vinci 200 ans auparavant), à partir de la notion de
coefficient de frottement.

Ceux-ci observèrent déjà deux types de frottements à priori distincts:

1. Le "frottement statique" est celui qui oppose une résistance lorsqu'un objet posé sur un plan est à la limite
du glissement pas alors qu'on lui impose une force de traction (tangentielle au plan). Cette opposition à
la force de traction est par ailleurs expérimentalement proportionnelle au poids de l'objet.

Mais intervient une valeur limite de la force tangentielle de traction à partir de laquelle l'objet commence à
glisser. C'est ce que nous notons:

(30.156)

où est donc la force limite de traction permettant de faire bouger l'objet initialement statique, est
le "coefficient de frottement statique" sans dimensions et exprime la proportionnalité de la force limite de
frottement avec le poids de l'objet.

Remarque: Dans la pratique, il est infiniment facile de déterminer ce coefficient avec un simple
dynamomètre pour connaître la force limite et une balance pour connaître le poids de l'objet étudié.

Nous observons expérimentalement que contrairement à l'intuition, la force limite de traction est en première
approximation indépendante de la surface de contact entre l'objet et le sol (dans les limites des cas physiques
courants évidemment car plus la surface est petite, plus la pression est grande et alors la surface de contact
peut devenir plastique aux hautes pressions).

Autrement dit, si un kilo de sucre est posé sur une table. Pour déplacer cet objet, de poids (la masse
multipliée par la constante de gravité), il faut exercer une force parallèlement à la surface de la table.
Mais l'expérience montre que cet objet ne déplacera pas tant que la force est inférieure à une force
minimale . Et Amontons et Coulomb ont montré que cette force minimale est directement
proportionnelle via un coefficient de frottement statique au poids.
Nous pouvons détailler l'approche de la relation précédente en s'imaginant deux surfaces présentant des
rugosités en dents de scie d'un angle et imbriquées:

(30.157)

Si nous appliquons une force normale correspondant au poids et une force horizontale nous avons à
cause des dents de scie dans le cas limite la situation suivante:

(30.158)

nous voyons alors bien que la pièce mobile commencera à bouger que quand il y aura début de glissement
soit lorsque:

(30.159)

Pour simpliste qu'elle soit, cette approche permet de lier le frottement (statique) aux caractéristiques de la
rugosité. De plus les valeurs expérimentales typiques des coefficients de frottement statique, de l'ordre de
0.3, correspondent à des pentes de la rugosité de surface de l'ordre de 15-20 degrés, ce qui est tout à fait
compatible avec les caractéristiques typiques que l'on peut mesurer pour les rugosités de surfaces!

Cet argument repose cependant sur une hypothèse implicite : l'emboitement parfait entre les rugosités des
deux surfaces. Nous parlons dans ce cas de "surfaces commensurables". Ce n'est bien sûr pas le cas en
général dans la nature : même à l'échelle atomique, deux surfaces idéales, présentent des légères différences
de distance interatomique qui empêchent l'emboîtement. Une légère disparité suffit à rendre très irrégulière
la répartition des points de contact entre les deux surfaces contrairement au cas commensurable. Nous
parlons alors de "surfaces incommensurables".

Autrement dit, nous aboutissons très vite à la conclusion que le frottement entre deux surfaces
commensurables en tout point est non-nul, tandis qu'il s'annule exactement si ces deux surfaces sont en tout
point incommensurables.

2. Le "frottement dynamique" est celui qui oppose une résistance lorsqu'un objet posé sur un plan est déjà en
glissement. Cette opposition à la traction est par ailleurs expérimentalement proportionnelle encore une fois
au poids de l'objet tel que:
(30.160)

mais avec le "coefficient de frottement dynamique" (qui existe en plusieurs sous-familles: coefficient de
roulement, de glissement, ....) qui est en général beaucoup plus petit que le coefficient de frottement statique:

(30.161)

Donc le frottement n'est pas le même au départ de notre objet que lors de son glissement. Cela correspond
très bien à notre expérience quotidienne du frottement (lors de déplacements de meubles dans nos
habitations par exemples).

A nouveau, nous remarquons expérimentalement que contrairement à l'intuition, la force de traction est
indépendante de la surface de contact entre l'objet et le sol.

Ainsi, que l'on pose le kilo de sucre bien à plat ou sur la tranche, la force de frottement est la même (si la
qualité de surface est la même de tous les côtés du paquet de sucre)!

Un autre fait étonnant concerne la valeur typique de ces coefficients de frottement, qui s'écarte assez peu de
, pour des surfaces très différentes les unes des autres. La technologie permet toutefois de
concevoir des surfaces avec des coefficients de frottement soit bien plus petits ( ) soit plus
grand ( ).

Ces deux lois, sont appelées "lois de Coulomb":

(30.162)

L'origine simpliste du frottement entre deux solides est donc dû au fait que:

- Tout solide n'est jamais lisse mais possède des aspérités qui rendent la surface de contact rugueuse (les
aspérités s'imbriquent partiellement ou non et provoquent plus ou moins de frottement).

- Les impuretés entre les deux surfaces de contact sont souvent plus importantes au niveau des sources de
frottement que les imbrications des aspérités de surface.

- Le frottement est faiblement dépendant de la surface car la rugosité à l'échelle atomique est telle que
seulement un très faible pourcentage de la surface totale des deux objets sont réellement en contacts (surface
de contact réelle est donc beaucoup plus petite que la surface de contacta apparente) ce qui explique que la
force de traction tangentielle soit proportionnelle au poids car cela force la surface de contact réelle à
augmenter.

La complexité sous-jacente du frottement est donc extrême. L'origine du frottement fait dans la réalité
intervenir une multitude d'ingrédients, couvrant un spectre très large de phénomènes physiques : rugosité des
surfaces, élasticité, plasticité, adhésion, lubrification, thermique, usure, chimie des surfaces, humidité, etc.

Nous allons ici faire une analyse scolaire des quelques frottements courants dans les cas d'études simples de
la physique cinétique (du mouvement). Il faut bien prendre garde que ces modèles sont simplifiés à l'extrême
afin de montrer seulement la démarche intellectuelle.

FROTTEMENT VISQUEUX HORIZONTAL


Nous avons donc vu qu'en première approximation, la force de frottement dans le cas de glissement est
proportionnelle au poids d'un corps par un coefficient de frottement dont la valeur dépend de la nature et de
l'état des surfaces de contact mais indépendant de l'aire de contact. Cependant nous n'avons pas dit que
l'expérience montre que dans des cas réels typiques la force de frottement est aussi indépendante de la
vitesse communiquée au corps.

En lubrifiant par un fluide visqueux les surfaces en contact, la force de frottement est réduite et dépend de la
vitesse (c'est typiquement le cas des pneus de voiture qui sont visqueux).

Remarque: Pour rappel, le terme "visqueux" ne signifie par forcément que ça coule et que ça bave. Cela
signifie que la loi de comportement dépend de la vitesse de déformation (cf. chapitre de Mécanique Des
Milieux Continus).

Considérons alors un mobile en contact avec un sol plan via un fluide ou matériau visqueux. Nous savons
qu'il y aura frottement et supposons que celui-ci soit proportionnel à la vitesse:

(30.163)

où k est le "coefficient de frottement visqueux".

Nous avons alors en appliquant la première loi de Newton:

(30.164)

Dès lors il vient:

(30.165)

En intégrant il vient:

(30.166)

Soit:

(30.167)

En prenant l'exponentielle:

(30.168)

Ainsi, la vitesse décroit exponentiellement de vitesse initiale jusqu'à une valeur nulle asymptotique sous
l'hypothèse de proportionnalité du frottement avec la vitesse.

C'est une relation très souvent utilisée dans les animations faites par ordinateur représentant des objets qui
semblent s'arrêter de manière naturelle. Il faut simplement bien choisir la valeur de k.
Nous observons une chose intéressante c'est qu'un corps mobile lourd décélère moins vite à cause des forces
de frottement qu'un corps mobile léger!

Montrons comment nous calculons la puissance perdue par frottement. Nous savons que:

(30.169)

si la variation de la force est négligeable par rapport à la variation de vitesse nous avons alors:

(30.170)

et donc dans le cas du frottement (en valeur absolue):

(30.171)

Ainsi, la puissance dissipée lors d'un mouvement est proportionnelle à la vitesse en cas de frottement
coulombien et proportionnelle au carré de la vitesse en cas de frottement visqueux.

FROTTEMENT VISQUEUX VERTICAL

Soit un solide indéformable chutant à la verticale dans un champ de gravité. Nous assumons que la forme de
la résistance de l'air est proportionnelle à la vitesse (comportement visqueux aux faibles vitesses):

(30.172)

et utilisant le principe fondamental de la dynamique:

(30.173)

Soit autrement écrit (plus traditionnel):

(30.174)

La solution de cette équation différentielle linéaire du 1er ordre est (cf. chapitre de Calcul Différentiel Et
Intégral):

(30.175)

que nous pouvons détailler si besoin (sur demande).

En posant qu'à l'instant nul nous avions une vitesse initiale donnée il vient:

(30.176)

Ainsi:
(30.177)

Ainsi, nous voyons que lorsque le temps tend vers l'infini (suffisamment grand quoi...) alors la vitesse tend
vers:

(30.178)

donc k peut être déterminé expérimentalement!

C'est une relation très souvent utilisée dans les animations faites par ordinateur représentant des objets qui
semblent freiner jusqu'à une vitesse constante de manière naturelle.

FROTTEMENT VISQUEUX DE STOKES VERTICAL

C'est typiquement le cas du parachutiste effectuant une chute libre. Nous avons vu dans le chapitre de
Mécanique Des Milieux Continus que la force visqueuse de Stokes était donnée par (comportement
visqueux aux vitesses moyennes et élevées):

(30.179)

lorsque la vitesse est subsonique (modeste en d'autres termes...).

L'équation différentielle est la même qu'avant dans le cas de la présence du champ de gravitation à la
différence que la vitesse est cette fois-ci au carré:

(30.180)

Soit:

(30.181)

mais nous n'allons pas chercher à la résoudre, seulement à déterminer la valeur limite de la vitesse et
justement vitesse limite est atteinte lorsque celle-ci.... ne varie plus (ben oui forcément...). Donc à ce
moment:

(30.182)

et l'équation différentielle devient:

(30.183)

Ainsi, il est possible de changer sa vitesse de chute limite en fonction de son facteur de forme, et de sa
surface d'exposition apparente et de sa masse (dans le cas d'étude ci-dessus nous négligeons la force
d'Archimède qui s'applique sur la parachutiste et qui freine aussi sa chute).
Exemple:

Considérons une sphère de rayon R, de masse volumique lâchée sans vitesse dans un liquide de masse
volumique , de viscosité . La sphère est soumise à son propre poids, à une force de frottement
visqueux et à la poussée d'Archimède.

Nous avons donc globalement selon la première loi de Newton:

(30.184)

où les deux derniers termes (force visqueuse de Stokes aux faibles vitesses et force d'Archimède) ont été
démontrés dans le chapitre de Mécanique Des Milieux Continus.

En réarrangeant, nous avons:

(30.185)

et encore:

(30.186)

Il nous reste donc:

(30.187)

Nous posons:

(30.188)

qui sera assimilée à une constante de temps. Nous avons alors:

(30.189)

Or lorsque la vitesse de chute deviendra constante, nous aurons:

(30.190)
ce qui donne:

(30.191)

Résolvons ceci dit l'équation différentielle en commençant par celle sans second membre (cf. chapitre de
Calcul Différentiel et Intégral):

(30.192)

Nous avons alors vu dans le chapitre de Calcul Différentiel Et Intégral que la solution homogène était alors
donnée par:

(30.193)

Nous pouvons ajouter la solution particulière qui est logiquement lorsque t tend vers l'infini:

(30.194)

Nous avons alors:

(30.195)

Il nous reste à déterminer C qui s'obtient lors t tend vers 0 car nous avons alors:

(30.196)

Donc:

(30.197)

Nous avons alors:

(30.198)

FROTTEMENT VISQUEUX DE STOKES HORIZONTAL

C'est une première approximation où l'on s'intéresse par exemple à la distance d'arrêt sans freinage d'un
mobile sans prendre en compte le coefficient de frottement avec le sol mais seulement avec l'air ambiant
(vitesse subsonique toujours...).

Nous avons alors selon la première loi de Newton:


(30.199)

Supposons que nous souhaitions savoir en quel temps T le mobile qui avait une vitesse initiale aura
décéléré à une vitesse donnée .

Nous avons alors:

(30.200)

Donc:

(30.201)

où nous observons déjà un premier problème avec ce modèle c'est que à l'arrêt, la vitesse finale étant nulle, il
faudra un temps infini pour y arriver... mais continuons, nous reviendrons plus loin sur ce constat.

La loi d'évolution de la vitesse de détermine de façon analogue puisque:

(30.202)

Alors:

(30.203)

Notons la constante de temps:

(30.204)

Alors:

(30.205)

soit:

(30.206)

La distance parcourue à l'instant t en laissant le mobile ralentir que par les forces de frottement donc:
(30.207)

Le résultat est joli mais on se rend bien compte que c'est pas vraiment juste car à un temps infini, la voiture
aura parcourue une distance infinie ce qui est manifestement irréaliste. Cela provient du modèle qui est trop
simpliste donc améliorons-le.

L'idéal, objectivement parlant, serait de prendre en compte le frottement visqueux pneu/sol plus le
frottement de l'air. Nous aurions alors:

(30.208)

mais le problème avec cette équation différentielle, c'est qu'elle va nous amener à une singularité si nous
continuons les calculs. Elle n'est donc pas exploitable...

Nous essayons alors avec la forme suivante:

(30.209)

qui exprime donc qu'il y a une force de frottement proportionnelle au poids du véhicule ce qui est
simplement la forme suivante de la deuxième loi de Coulomb:

(30.210)

et le deuxième terme étant le frottement visqueux de Stokes dont nous avons sorti le terme de masse compris
dans la densité se trouvant implicitement dans la constante k de .

Nous avons alors en simplifiant les termes de masse:

(30.211)

Donc on voit déjà que dans ce modèle nous allons perdre l'effet de la masse qui a normalement pour
implication de rallonger le trajet d'arrêt (dans la réalité!). Mais continuons quand même...

Nous avons donc à intégrer:

(30.212)

Nous avons démontré dans le chapitre de Calcul Différentiel Et Intégral que:

(30.213)

Donc en posant:
(30.214)

Soit:

(30.215)

Un peu réarrangé cela donne:

(30.216)

Donc on tombe maintenant déjà sur un temps fini... ce qui est plus rassurant comme résultat.

Cherchons maintenant la distance d'arrêt. Nous avons en utilisant le fait que:

(30.217)

la possibilité d'écrire:

(30.218)

Soit:

(30.219)

Ce qui nous amène à:

(30.220)

Ce qui donne déjà:

(30.221)

Nous avons donc:

(30.222)
Soit:

(30.223)

Nous avons donc notre résultat final. Meilleur que le précédent mais indépendant de la masse... mais en
attendant c'est mieux que rien...

Remarque: Avec un freinage sec l'essieu avant d'une petite voiture à une force de freinage de 2.8 [kN].
31. MÉCANIQUE ONDULATOIRE

N ous nous intéresserons ici à l'étude des propriétés mathématiques des cordes vibrantes que nous
pouvons également par extension et dans un souci de généralisation à des cas immatériels assimiler au
concept des "ondes". Cette étude est très importante car nous aurons besoin de certains des résultats obtenus
ici en thermodynamique, physique quantique, astrophysique, électrodynamique et théorie des cordes (pour
ne citer que les plus importants).

Définitions:

D1. Une "onde" est un transport d'énergie sans transport de matière. Elle est concrétisée par la propagation
d'une perturbation d'un milieu d'où l'appellation "d'ondes progressives". La vitesse avec laquelle l'onde
progresse dépend des propriétés physiques du milieu.

D2. Dans le cas où la perturbation du milieu (déformation de l'onde) se fait de façon perpendiculaire à la
direction de propagation de l'onde, nous parlons "d'onde transversale" ou de "perturbation transversale"
(typique des ondes dans les cordes par exemple).

D3. Dans le cas où la perturbation du milieu se fait parallèlement à la direction de propagation de l'onde,
nous parlons "d'onde longitudinale" ou de "perturbation longitudinale" (typique des ressorts).

FONCTION D'ONDE

Soit une perturbation définie dans une région donnée de l'espace. Si nous remplaçons x par x-b,
nous définissons dans cette même région, une perturbation f(x-b) identique à f(x) mais translatée d'un
distance b dans la direction des X positifs (à droite donc si l'on adopte le système de représentation
conventionnel vu en analyse fonctionnelle).

Si t représente un temps et si l'on pose , alors v peut désigner la vitesse de translation de la


perturbation.

Ainsi, nous appelons "fonction d'onde", la relation mathématique :

(31.1)

qui décrit la progression d'une perturbation y(x,t) dans l'espace :

- décrivant une onde qui progresse vers +X

- décrivant une onde qui progresse vers -X

v est par définition appelée "vitesse de phase de l'onde". Elle est constante un milieu homogène.
"L'amplitude de l'onde" est la valeur maximale de la perturbation :

(31.2)

En l'absence d'amortissement, elle conserver la même valeur en chacun des points x où l'onde passe.

EQUATION D'ONDE
Toute fonction f dont l'argument est jouit de la propriété :

(31.3)

Démonstration:

(31.4)

Cependant, en dérivant une seconde fois, nous obtenons une autre forme de l'équation d'onde que nous
retrouverons aussi fréquemment :

(31.5)

Ce qui nous amène à écrire l'une des relations les plus importantes en physique appelée "équation de
propagation" ou "équation de d'Alembert" et que nous retrouverons dans de nombreux autres chapitres du
site (Électrodynamique, Physique Quantique Ondulatoire, Relativité Générale, Acoustique):

(31.6)

C.Q.F.D.

Remarque: Lorsque deux ou plusieurs ondes se propagent dans un milieu, la fonction d'onde qui en résulte
est la somme algébrique des fonctions d'onde de chaque onde. Nous disons alors que les ondes "interfèrent"
et nommons cette considération le "principe de superposition des ondes".

Considérons maintenant une corde de longueur L attaché l'une de ses extrémités à une terminaison fixe.
Supposons maintenant qu'une perturbation se propage sur cette corde. Lorsque la perturbation arrive à la
terminaison, nous observons que celle-ci change de signe en même temps que sa vitesse de propagation
s'inverse : l'onde subit ainsi une réflexion avec inversion.

Pour décrire le phénomène, il faut imposer :

(31.7)

Une fonction d'onde quelconque, qui progresse vers la terminaison, ne peut pas vérifier la
condition :

(31.8)

pour toutes les valeurs du temps !

L'astuce consiste à la remplacer par une autre fonction d'onde y(x,t) dont la forme est semblable à f à grande
distance de l'origine de la perturbation, et qui s'annule au point de terminaison pour toutes les valeurs du
temps. Pour cela, nous pouvons imaginer au point de la terminaison, un miroir qui donne de la corde une
image de même longueur dans laquelle nous inventons une onde virtuelle :

(31.9)

symétrique de , mais de signe opposé.

Nous décidons ainsi :

- que les deux ondes progressent l'une vers l'autre pour s'annuler au point de terminaison

- toute partie de l'onde réelle qui dépasse le point de terminaison devient virtuelle

- toute partie de l'onde virtuelle qui pénètre dans la corde devient réelle

A leur intersection, les deux ondes réalisent une interférence destructive au point de terminaison. La somme
algébrique de ces deux fonctions d'onde est aussi une fonction d'onde :

(31.10)

qui a la propriété voulue en x=L :

(31.11)

Si nous considérons maintenant une terminaison libre, sans frottements avec son support d'attache, nous
nous retrouvons dans un cas similaire au précédent à la différence que l'interférence est constructive au point
de terminaison plutôt que destructive telle que la fonction d'onde s'écrive :

(31.12)

Remarques:

R1. Lorsque l'onde arrive sur une terminaison libre ou fixe, l'énergie transportée est intégralement renvoyée
en arrière.

R2. Lorsqu'une terminaison n'est pas exactement adaptée, seule une partie de l'énergie est absorbée par le
point Q, le reste est réfléchi.

TYPE D'ONDES

En physique théorique (et dans la pratique), nous restreignons fréquemment l'étude de certains phénomènes
à des cas particuliers d'ondes. Principalement, nous en distinguons trois que nous allons brièvement mais
soigneusement développer :

ONDES PÉRIODIQUES

Si un événement produit une onde qui ne transporte qu'une seule perturbation produite en un point donné, il
existe de nombreuses qui sont capables d'exciter un milieu de manière répétitive.

Le point spatial de la source subit alors périodiquement la même perturbation. La durée d'un cycle complet
est appelée identiquement à l'étude des pendules : "la période" T.
Si la perturbation peut se propager sous forme d'onde, à vitesse v, elle est décrite par la fonction d'onde que
nous connaissons :

(31.13)

En chaque point du milieu perturbé, l'onde périodique impose une "périodicité temporelle" de la perturbation
qui nous impose d'écrire :

(31.14)

Après plusieurs cycles d'excitations de la source, plusieurs perturbations sont distribuées dans l'espace. La
distance entre deux perturbations successives est appelée "longueur d'onde" .

La "périodicité spatiale" impose ainsi aussi :

(31.15)

est le chemin parcouru par l'onde pendant le temps T :

(31.16)

Si une fonction d'onde est périodique dans le temps, elle l'est aussi dans l'espace, pour autant que l'impulsion
ne se déforme pas lors de la progression.

Démonstration:

(31.17)

En posant , nous avons bien :

(31.18)

C.Q.F.D.

ONDES HARMONIQUES

Pour ces ondes, la fonction d'onde est une fonction trigonométrique de type sinus ou cosinus :

ou (31.19)

La présence de k appelé "nombre d'onde" est exigée pour 2 raisons :

- k s'exprime en pour la cohérence des unités des fonctions trigonométriques

- la valeur de k doit assurer la périodicité de la fonction d'onde :

1. périodicité angulaire de la fonction mathématique :


2. périodicité spatiale de la fonction d'onde :

En égalant ces deux expressions :

(31.20)

ce qui implique :

(31.21)

Introduisons :

(31.22)

dans l'expression de k :

(31.23)

d'où autre relation importante :

(31.24)

La fonction d'onde de l'onde harmonique peut alors s'écrire sous la forme :

ou progressive selon +X

ou progressive selon -X
(31.25)

ONDES STATIONNAIRES

Imaginons une corde excitée de manière harmonique. Au lieu d'adapter sa terminaison pour extraire de
l'énergie de la corde, imposons que cette terminaison soit fixe. L'onde est alors réfléchie.

Une nouvelle fonction d'onde doit être définie pour décrire la superposition de l'onde incidente :

(31.26)

et de l'onde réfléchie :

(31.27)

en analogie avec le résultat que nous avions trouvé lors de notre étude des terminaisons :

(31.28)
La relation trigonométrique :

(31.29)

nous donne :

(31.30)

Ce n'est plus une onde progressive car x et t ne se combinent plus comme . Certains points de la
corde ne bougent jamais. Ils satisfont :

(31.31)

et sont situés en :

(31.32)

Pour des raisons évidentes, nous ne conservons que les valeurs de n pour lesquelles .

Remarque: Chacun de ces points est appelé "noeud de la vibration".

Nous observons dans un tel système, des fuseaux de vibration, de longueur , dans lesquels la corde
vibre transversalement dans une zone de hauteur (deux vers le haut, deux vers le bas).

Remarque: Les points où l'amplitude de vibration est maximale sont des "ventres de la vibration".

Puisque , les ventres sont distants de et situés à des noeuds.

Si nous imposons maintenant une terminaison fixe aux deux extrémités d'une corde en vibration, nous nous
retrouvons avec une "mise en résonance".

Le plus souvent, nous n'observons pas grand chose jusqu'à ce que nous trouvions la fréquence d'excitation
qui place les noeuds de vibrations sur les deux points de terminaison fixe.

Dès lors pour une corde de longueur L :

(31.33)

implique :

(31.34)

La corde est alors le siège d'une onde stationnaire dont l'amplitude de vibration est considérablement plus
grande que l'amplitude d'excitation (quatre fois).

Nous disons alors que la corde est rentrée en "résonance" avec l'excitateur.
La relation :

(31.35)

montre qu'il y a plusieurs longueurs d'onde possible dont la plus grande correspondant à n=1 est appelée
"longueur d'onde fondamentale" et vaut bien évidemment .

MODES DE VIBRATION TRANSVERSAL DANS UN FIL TENDU

Nous avons vu comment une onde peut progresser dans une corde. Montrons maintenant pourquoi c'est
possible et établissons la relation y(x,t), donnant la forme de la corde en fonction du temps.

Soit un fil de diamètre , longueur L et masse m, la masse linéique du fil (supposée constante le long de
celui-ci) est alors :

(31.36)

Par un léger choc, créons une petite perturbation (afin de ne pas déformer le câble et maintenir constant sa
masse linéique) transversale. Isolons, dans la zone perturbée, un élément de fil, de longueur .

Approximations :

A1. Chaque élément de la corde peut être découpé de façon infinitésimale de façon à être presque parallèle à
l'axe x. Les angles sont donc considérés comme petits

A2. La corde est considérée comme déformable mais non allongeable donc la norme des forces dans la
corde est constante en tout point quelque soit la déformation.

Pour la suite du raisonnement, nous nous servons de la figure ci-dessous :

(31.37)

Si les angles sont petits, le bilan des forces donne :

(31.38)

ce qui signifie qu'il n'y pas de déplacements selon x :

(31.39)
Si les angles sont vraiment petits, nous avons le premier terme du développement qui donne :

(31.40)

Donc :

(31.41)

accélération selon y.

La loi de Newton appliquée à la masse donne (nous considérons que chaque point de masse se
déplace seulement selon y car il n'y a pas allongement) :

(31.42)

Les tangentes sont données par les dérivées partielles de la fonction y(x) :

(31.43)

Qui s'égalise avec l'avant-dernière relation :

(31.44)

et donc :

(31.45)

Si , les deux tangentes tendent vers la même valeur, mais la fraction du membre de droite tend vers
une valeur finie :

(31.46)

Il en résulte l'équation différentielle :

(31.47)

Cette dernière relation s'écrit plus souvent sous la forme suivante :


(31.48)

et se nomme "équation des cordes vibrantes".

Remarque: Dans certains ouvrages, la densité linéique est notée et la force de tension dans la corde ce
qui donne :

(31.49)

Si nous vérifions les unités de sont celles du carré d'une vitesse , comme l'exige l'analyse
dimensionnelle. Pour simplifier l'écriture, nous posons :

(31.50)

Nous allons maintenant considérer un cas particulier très intéressant dans le cadre de la musicologie qui est
celui de la corde tendue (la plupart des instruments à corde fonctionnant ainsi).

CONDITIONS DE DIRICHLET

L'objectif est dans le cadre de l'équation différentielle obtenue précédemment (petites déformations dans les
cadres des instruments de musique) de trouver une fonction y(x,t) solution de cette dernière avec les
conditions initiales suivantes, typiques à un instrument de musique :

C.I.1. (les extrémités A et B sont fixes - il s'agit des "conditions de Dirichlet")

C.I.2. (forme initiale du fil à l'excitation)

C.I.3. (vitesse initiale nulle en tout point)

Les deux dernières conditions sont appelées "conditions de Cauchy".

Pour résoudre cette équation différentielle linéaire, nous allons faire usage de la méthode de séparation de
variables en posant :

(31.51)

L'équation différentielle devient dès lors :

(31.52)
Le membre de gauche de la dernière relation ne contient pas la variable t et celui de droite ne contient pas la
variable x. La seule et unique façon d'égaler ces deux expressions est de les considérer chacune comme
constante, que nous noterons :

(31.53)

Ainsi, nous avons deux équations différentielles :

et (31.54)

Ces deux équations étant similaires, résolvons-les de manière générale (cf. la chapitre de Calcul Différentiel
Et Intégral) :

avec (31.55)

L'équation caractéristique est donc :

(31.56)

d'où :

(31.57)

Nous savons que la solution générale si les racines de l'équation caractéristique sont complexes, est de la
forme :

(31.58)

Pour nos deux équations différentielles, nous avons donc par similitude :

et (31.59)

Cela donne pour la solution de notre équation d'onde :

(31.60)

Déterminons les constantes en tenant compte des conditions initiales.

(31.61)

Il ne reste que :

(31.62)
Posons :

(31.63)

La condition initiale impose :

(31.64)

Pour tenir compte de la vitesse initiale nulle, dérivons par rapport au temps :

(31.65)

Il ne reste :

(31.66)

La constante b représente donc l'amplitude du déplacement transversal du fil. Cette amplitude ne pouvant
être la même partout en un temps donné et un position donné pour tout type d'excitation satisfaisant les
conditions initiales, il doit existe autant de valeur que nous choisissons de valeurs n dans .

Le principe de superposition des solutions des équations différentielles linéaires (cf. chapitre de Calcul
Différentiel Et Intégral) permet d'écrire que la combinaison linéaire de toutes les solutions pour la corde est
finalement :

(31.67)

Les doivent être choisis de manière à satisfaire la condition initiale qui donne la forme de la perturbation :

(31.68)

Cette expression pour f(x) suggère de la comparer au développement en série de Fourier (cf. chapitre des
Suites Et Séries):

(31.69)

Dans laquelle et . Le théorème de Fourier impose alors que les sont donnés par :
(31.70)

Imaginons maintenant une corde de longueur L fixée en ses extrémités et tendue. Choisissons la perturbation
la plus simple possible : nous grattons la corde en son milieu de manière très sec, pour l'écarter d'une petite
distance H de sa position d'équilibre.

La perturbation initiale y(x,0) est alors :

pour et pour (31.71)

Calculons les coefficients de Fourier :

(31.72)

L'intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral) donne :

(31.73)

La fonction d'onde devient :

(31.74)

À cause du , les termes pour lesquels n est pair sont tous nuls. Il reste :

(31.75)

Si nous retenons que le terme en n=1, nous aurions :

(31.76)

Nous avons :

(31.77)

qui est le nombre d'onde correspondant à une longueur d'onde :


(31.78)

et :

(31.79)

qui serait la fréquence de vibration du fil de la première harmonique.

Ainsi, pour une valeur n quelconque, il est facile de démontrer que le n-ème "mode propre" est donnée par :

(31.80)

avec :

(31.81)

relations appelées "lois de Mersenne" (1644-1648).

où le mode de plus basse fréquence avec n valant 1 est appelé le "mode fondamental" associée à sa
"fréquence fondamentale".

Ainsi, après avoir été gratté sec au milieu de sa longueur L, un fil maintenu rigidement à ses deux extrémités
peut osciller suivant plusieurs modes. Le mode fondamental (harmonique fondamentale) correspond à
la plus petite fréquence possible. Il lui correspond la longueur d'onde .

Les fréquences d'ordre n supérieures sont appelées "fréquences harmoniques". Pour un même déplacement
initial H, l'amplitude maximale de la vibration diminue selon comme nous le voyons dans l'expression de
notre fonction.

Une autre manière d'exciter la corde est de la faire osciller de manière sinusoïdale, ce qui signifie dès lors
que y(x,t) est de la forme :

(31.82)

En substituant cette relation dans l'équation d'onde de la corde, nous obtenons :

(31.83)

La solution se réduit alors à :

ou (31.84)

La valeur n=0 ne peut pas être incluse car elle donne une corde sans excitation. En mettant cette fonction
dans l'équation d'onde précédente et en simplifiant, nous obtenons trivialement :
(31.85)

Ce sont les "fréquences d'oscillations de Dirichlet" pour une corde. Les cordes d'un violon par exemple sont
des cordes de Dirichlet.

(31.86)

Les mêmes analogies, raisonnements et développements pourront être faits avec les conditions de Neumann
ci-dessous .

Remarques:

R1. La théorie prédit que la vibration peut être une combinaison linéaire de plusieurs modes. Ce phénomène
porte le nom de "vibration simultanée". Il se produit abondamment dans un piano.

R2. Les instruments de musique sont conçus pour émettre des sons à des fréquences conventionnelles, étant
admis que la hauteur d'une note perçue par l'oreille est définie par la fréquence fondamental, par exemple le :
Do (264 Hertz), La (440 Hertz)

R3. Lors de la construction de l'instrument, nous décidons de la valeur de (en choisissant le diamètre et de
la nature de la corde) et nous déterminons la longueur L en cherchant le compromis entre l'intensité sonore
que nous voulons émettre et la résistance mécanique de l'instrument qui doit supporter les forces F de
tension.

CONDITIONS DE NEUMANN

Alternativement aux conditions de Dirichlet où les extrémités sont fixes et à hauteur égales, les conditions
de Neumann supposent que les extrémités sont de petites boucles autorisées à glisser le long de deux barres
sans frottements.
Pour notre corde, les conditions de Neumann spécifient les valeurs aux extrémités. Mais tant que les
boucles sont supposées sans masse et sans frottements, la dérivée doit s'annuler aux extrémités
. Si tel n'était pas le cas, alors de par la nullité de la masse de l'extrémité, le changement de vitesse
sera du à une accélération infinie, ce qui ne peut être autorisé ! C'est ainsi que nous imposons au lieu de la
condition de Dirichlet, la condition de Neumann définie par :

C.I.1.

les conditions C.I.2. et C.I.3. restant identiques.

Ce changement de condition n'empêche pas que la méthode de résolution par séparation de variables est la
même que précédemment et que nous tomberons identiquement sur la relation suivant auquel il faudra
appliquer la nouvelle condition initiale :

(31.87)

sur laquelle nous appliquons donc la condition de Neumann :

(31.88)

Il reste donc :

(31.89)

en posant la fonction se simplifie en :

(31.90)

La condition initiale, impose :

(31.91)

Les mêmes développements pour la C.I.2. que nous avions fait avec la C.I.1. de Dirichlet s'appliquent
ensuite de manière identique :

(31.92)
ensuite, l'analogie avec les séries de Fourier s'applique de manière similaire mais avec les cosinus au lieu des
sinus.

Les fréquences de Neumann d'une corde sont les mêmes que pour celle de Dirichlet soit :

(31.93)

La particularité réside cependant dans la valeur de la fonction spatiale qui vaut cette fois trivialement :

ou (31.94)

Effectivement, pour n=0 nous avons cette fois une amplitude identique qui est transmise tout le long de la
corde sans que celle-ci ne vibre cependant !

Par ailleurs, faisons remarquer, que la fonction satisfait aussi pleinement les trois conditions
initiales incluant celle de Neumann.

Effectivement, nous avons bien :

(31.95)

et de plus, vérifie aussi l'équation d'onde :

(31.96)

LAGRANGIEN D'UNE CORDE

Nous allons maintenant déterminer le lagrangien d'une corde, calcul qui nous sera en partie utile lors de
l'étude de la théorie des cordes.

Nous gardons donc notre corde ayant une densité linéique et tension constante dont les extrémités sont
situées en et dont la vitesse de la perturbation transversale est non relativiste.

L'énergie cinétique est alors simplement la somme des énergies cinétiques de chaque élément infinitésimal
de la corde. Nous pouvons alors écrire en notation Lagrangienne :

(31.97)

L'énergie potentielle intervient dans l'élongation de la corde dont une portion infinitésimale peut être vue
comme variant de (x,0) à quand la corde est à l'équilibre. Quand une corde est momentanément
mise sous tension de (x, y) à alors la variation de la longueur dl d'un élément infinitésimal de
la corde est donnée trivialement par :

(31.98)

Nous avons utilisé ci-dessus pour approximation le développement limité au deuxième terme en série de
Taylor (cf. chapitre sur les Suites Et Séries), qui nous donne :

(31.99)

Le travail effectué pour étirer chaque élément infinitésimal étant , l'énergie pontentielle totale est alors
exprimée par :

(31.100)

La lagrangien étant défini par (cf. chapitre de Mécanique Analytique), nous avons alors :

(31.101)

où est défini, très justement, comme étant la "densité lagrangienne" :

(31.102)

L'action pour notre corde est alors :

(31.103)

Dans cette action, le chemin d'action est la fonction y(x,t). Pour trouver les équations du mouvement, nous
devons examiner la variation de l'action quand nous varions :

(31.104)

Ce qui donne :
(31.105)

Car :

(31.106)

et ce identiquement pour le second terme.

Nous ne devons pas avoir de dérivées temporelles agissant sur les variations. Alors en utilisant la relation
triviale suivante sur le premier terme :

(31.107)

et identiquement sur le deuxième, nous pouvons récrire l'action :

(31.108)

Comme nous l'avons vu en mécanique analytique, le bon chemin est donné par . Dès lors, nous
devons avoir :

(31.109)
Ainsi, notre expression contient trois termes. Chacun de ces trois termes doit s'annuler indépendamment
comme nous allons le voir :

1. L'annulation du troisième terme se fait selon une condition triviale qui nous est déjà bien connue
(heureusement...) :

(31.110)

et donc :

(31.111)

nous retrouvons donc l'équation différentielle d'une onde transversale telle que nous l'avions démontré plus
haut. Notre hypothèse sur le troisième terme ne peut donc être que juste ainsi que l'expression de notre
action.

2. Le premier terme est déterminé par la configuration de la corde aux temps :

(31.112)

Or, si nous imposons la connaissance de ces configurations dans le temps, nous aurons par définition:

(31.113)

(connaissance totale du chemin d'action car connaissance des conditions initiales, donc pas de variation).
Cela valide encore une fois l'expression de notre action et la valeur nulle du terme comme attendu.

3. Le second terme est un peu plus intéressant :

(31.114)

D'abord, ce n'est que parce que nous connaissons les positions des extrémités de la corde que nous pouvons
connaître ces modes de vibrations, nous le savons bien! Il nous faut donc savoir comment se comportement
les extrémités. Pour cela nous allons revenir sur des choses qui nous sont connues: les conditions de
Dirichlet et de Neumann d'une corde.

Supposons que nous imposions les conditions de Dirichlet (voir plus haut), les extrémités sont alors fixes et
nous aurons forcément à ces mêmes extrémités:

(31.115)

et donc le deuxième terme disparaît bien (ouf!).

Si, dans à l'opposé, nous choisissons que les extrémités se meuvent librement, alors les variations:
(31.116)

sont non contraintes et dès lors, seulement les conditions de Neumann:

(voir plus haut pour plus de détails) nous permettront d'avoir le deuxième terme de l'action nul.

Pour prendre pleinement conscience de l'importance des ces conditions initiales, considérons la quantité de
mouvement portée par la corde (il n'y pas d'autres composantes du mouvement car nous avons supposé
implicitement une excitation transversale dès le début seulement dans cette direction y).

La quantité de mouvement est simplement la somme des quantités de mouvement de chaque élément
infinitésimal le long de la corde :

(31.117)

Vérifions juste par curiosité (c'est une curiosité anticipée...) si la quantité de mouvement est bien conservée :

(31.118)

où nous avons utilisé l'équation d'onde transversale pour la substitution.

Nous voyons par le résultat de ce petit calcul que la quantité de mouvement est trivialement conservée si
nous imposons les conditions de Neumann, alors que pour les conditions de Dirichlet, la plupart du temps la
conservation n'est pas respectée! Effectivement, c'est trivial (il n'y pas besoin de calculs pour s'en rendre
compte), lorsque les extrémités sont attachées au mur, le mur exerce constamment une force sur la corde.

MODES DE VIBRATION DANS UNE MEMBRANE TENDUE

Nous dérivons le phénomène de la même manière que la vibration transversale de la corde. Toutefois, la
masse linéique du fil doit être remplacée par la masse surfacique de la membrane.

De plus, nous remplaçons la force F de tension unidirectionnelle du fil par une force de tension appliquée
sur le pourtour de la membrane. Cette force s'exerce dans toutes les directions du plan et se décrit par unité
de longueur :

(31.119)

Nous avons (analyse dimensionnelle) :

(31.120)

Il est d'abord évident que :


(31.121)

et comme :

(31.122)

L'analyse dimensionnelle (eh oui ... à nouveau...) donne :

(31.123)

Nous avons donc :

(31.124)

L'analyse dimensionnelle donne :

(31.125)

Donc finalement nous obtenons pour équation d'onde en coordonnées cartésiennes (exprimé avec le
laplacien) :

(31.126)

Nous cherchons la solution particulière de cette équation qui vérifie les conditions suivantes :

C.I.1. La membrane est fixée sur son pourtour R (conditions aux limites)

C.I.2. La position et la vitesse initiales sont données (conditions initiales)

La symétrie du problème suggère d'utiliser le laplacien en coordonnées polaires (cf. chapitre de Calcul
Vectoriel) :

(31.127)

Remarque: Nous avons changé de notation en posant

Et les conditions fixées :

C1. (conditions aux limites)


C2. (conditions initiales)

où les fonctions sont données.

Á nouveau, pour chercher la solution, nous allons utiliser la méthode de séparation des variables tel que :

(31.128)

et de même que pour la corde :

(31.129)

et identiquement que pour la corde, nous obtenons pour T une solution du type :

(31.130)

Pour la méthode change car nous avons maintenant une équation différentielle à deux variables tel
que :

(31.131)

Pour intégrer cette équation, nous cherchons les solutions de la forme , nous obtenons
en reportant :

(31.132)

En se rappelant qu'en coordonnes polaires :

(31.133)

D'où, en séparant les variables :

(31.134)

Le membre de gauche de la dernière relation ne contient pas la variable r et celui de droite ne contient pas la
variable . La seule et unique façon d'égaler ces deux expressions est de les considérer chacune comme
constante, que nous noterons . Les équations différentielles vérifiées par R et sont alors :

(31.135)
La fonction est périodique de période , il existe donc un entier naturel n tel que et donc
manière identique à la corde, nous obtenons :

(31.136)

Dans la première équation différentielle :

(31.137)

Pour simplifier, nous effectuons le changement de variable . L'équation différentielle devient :

(31.138)

Nous reconnaissons ici l'équation différentielle de Bessel d'ordre n telle que nous l'avons avec sa solution
présentée dans le chapitre des Suites Et Séries. Dès lors, la solution générale est du type :

(31.139)

Ce qui nous donne finalement :

(31.140)

Parmi les solutions à cette équation, cherchons celles qui vérifient les conditions aux limites en posant
:

(31.141)

À moins que ou T soit la fonction nulle, ce qui donne pour solution la position d'équilibre... (qui ne vérifie
sans doute pas les conditions initiales), nous devons avoir , c'est-à-dire :

(31.142)

La fonction Bessel d'ordre a une infinité de zéros positifs (il suffit de tracer cette fonction avec
un ordinateur pour le voir tel qu'avec Maple en mettant la commande : plot(BesselJ(2,x),x=0...100) où vous
pouvez changer la valeur 2 par une autre valeure) qui fournissent une infinité de valeurs convenables de b
telle que :

(31.143)

Ce qui correspond finalement à une infinité de solutions de l'équation différentielle initiale que nous
pouvons écrire :

(31.144)
En ayant modifié le nom des constantes d'intégration en ayant posé (ce qui vérifie l'analyse
dimensionnelle). Maintenant que cette solution satisfait les conditions aux limites, nous devons nous
attaquer aux conditions initiales.

D'abord pour les mêmes raisons que la corde, la solution finale est la superposition linéaire des solutions
telle que :

(31.145)

Nous allons déterminer les coefficients de façon à ce que la solution y donné précédemment
vérifie également les conditions initiales, à savoir :

(31.146)

Ces deux relations sont similaires, étudions la première. Elle peut s'écrire :

(31.147)

qui est le développement en série de Fourier de la fonction . Nous avons donc (cf. chapitre sur les
Suites Et Séries) :

(31.148)

En utilisant l'orthogonalité des fonctions de Bessel nous pouvons déduire de ces relations les coefficients
(et de même pour les autres).

Pour cela, supposons n fixé et posons . Montrons où le produit


scalaire est défini par :

(31.149)

Puisque vérifient l'équation différentielle en R(r), nous avons :


(31.150)

En combinant ces deux relations nous obtenons :

(31.151)

En intégrant membre à membre entre 0 et L et en tenant compte de :

et (31.152)

Nous obtenons :

(31.153)

D'où le résultat énoncé puisque .

La relation :

(31.154)

Peut donc s'écrire :

(31.155)

Utilisant l'orthogonalité de pour nous en déduisons :

(31.156)

Les coefficients sont donc donnés par :

(31.157)

Ce qui n'est pas aisé à calculer à la main....

Nous procédons de la même façon pour les autres coefficients.

PHASEURS
Il existe plusieurs façons d'exprimer les fonctions d'ondes que nous avons vues précédemment. Les
physiciens (ainsi que les électrotechniciens) utilisent une formulation, appelée "phaseur" ou "représentation
de Fresnel", permettant d'économiser avantageusement le poids des écritures et ainsi de simplifier
considérablement l'étude des problèmes complexes (ou simples). Les phaseurs font usage des propriétés des
nombres complexes pour exprimer les fonctions d'onde trigonométriques sous une forme simplifiée dans
tous les phénomènes ou apparaissent des oscillations.

Ce que nous appelons "phaseur", est une fonction f dont la valeur est complexe et qui, dans un espace à 1
dimension, s'écrit:

(31.158)

Dans toutes les applications en physique, t est la variable du temps.

Comme cette fonction est complexe, elle a une partie réelle que nous appelons ici g et une partie imaginaire
que nous appelons h. Leur identification est facile puisque comme nous l'avons déjà démontré lors de notre
étude des nombres complexes (cf. chapitre sur les Nombres) :

(31.159)

Ainsi, les parties réelles et imaginaires sont simplement:

(31.160)

Le module de f se calcule aisément en calculant:

(31.161)

Les parties réelles et imaginaires varient lorsque la position ou le temps varient. Le module ne change donc
pas, il est toujours égal à 1. Le changement se manifeste simplement par la simple variation d'angle que fait
le vecteur représentant f dans son plan complexe. C'est là une raison suffisante pour parler de phaseur,
puisque la variation de f peut être visualisée comme un simple changement d'angle ou de phase.

Si nous sommes dans un espace physique à plus d'une dimension, disons 3, alors l'expression pour f devient:

(31.162)

La situation est un peu plus difficile à visualiser (...). Elle est la même qu'en une dimension, mais là tout se
passe le long d'une direction définie dans l'espace 3D par le vecteur . Plus précisément, nous aurons:

(31.163)

La variation dans le temps reste la même qu'en une dimension spatiale mais un déplacement dans l'espace
est un peu plus compliqué qu'en une dimension. Ici tout déplacement spatial dans une direction qui n'est pas
orthonormale à fera que le produit scalaire changera de telle sorte que l'argument f variera. Ici ce n'est pas
seulement la grandeur ou la norme du vecteur qui donne le taux de variation de f sous un déplacement
spatial mais aussi l'angle que fait ce déplacement par rapport à la direction de puisque nous avons un
argument qui varie comme et donc qui dépend de cet angle noté ici . En effet, nous avons:
(31.164)

La quantité est souvent appelée le "vecteur d'onde". Physiquement il est relié le plus souvent à l'équivalent
du moment (linéaire) de l'onde pour laquelle il est évident que la définition usuelle de la quantité de
mouvement ( ) n'a plus de sens.

Une partie importante des systèmes étudiés en physique ne peuvent êtres caractérisés par un point et donc
décrits par une trajectoire. Une vague, une onde, une bande élastique qui oscillent n'ont pas une unique
position définie, ce sont des "milieux continus" sur un certain intervalle. La question que nous nous posons
dans notre tentative de les décrire est plutôt la suivante: comment décrire le déplacement de ce milieu dans
l'espace et dans le temps. Par exemple, pour une vague, si nous figeons le temps, comment l'amplitude A, de
cette vague varie-t-elle d'un endroit à l'autre de l'espace? Nous pouvons aussi figer l'espace en regardant un
seul endroit et demander comment l'amplitude varie avec le temps?

Les coordonnées et le temps jouent maintenant un rôle similaire de paramètres indépendants. Nous
mesurons l'amplitude du phénomène en tout temps et en tout lieu. Nous chercherons donc à obtenir une
expression du type:

ou (31.165)

en une ou trois dimensions.

Le point important est que nous cherchons à exprimer A, dont le nom correct est un "champ", comme une
fonction des coordonnées du temps. Par exemple, si la vague est très régulière peut-être est-elle décrite
adéquatement par si je regarde à un seul endroit et par lors d'une fixation
imaginaire du temps ?

La quantité va caractériser la fréquence de la variation du même phénomène.

Le nom de "fréquence angulaire" est facile à comprendre puisque la fonction cosinus ou sinus fait un cycle
si son argument change de sur une de temps d'un période .

Rappelons que :

(31.166)

Dans la description des systèmes harmoniques, la notation phaseur peut être très utile comme nous l'avons
déjà dit. L'équation la plus souvent rencontrée est l'équation d'onde (que nous avons démontré au début de ce
chapitre). En une dimension, elle s'écrit :

(31.167)

Nous vérifions par simple substitution que la solution est du type:

ou (31.168)

ou une combinaison linéaire dont la forme la plus générale est:

(31.169)
Une manière rapide et efficace d'écrire toutes ces relations de façon condensée et utilement imagée, est
d'écrire:

(31.170)

Dans les trois cas, la substitution permet de le vérifier. Prenons, par exemple, la solution sinus. Alors:

(31.171)

Le remplacement dans l'équation donne:

(31.172)

qui sera satisfait si et seulement si:

(31.173)

La substitution du phaseur comme solution de l'équation d'onde transforme cette dernière équation
différentielle à une simple équation algébrique appelée "relation de dispersion".

Elle est évidemment caractéristique de l'équation qui la génère. Celle qui apparaît ci-dessus est
particulièrement simple et caractérise une onde libre dans un milieu non-dispersif, tel que décrit par
l'équation d'onde que nous avons écrite.

La solution phaseur:

(31.174)

satisfait donc aussi l'équation, avec la même relation de dispersion. Elle est donc aussi la description d'une
onde ? La réponse est oui, et même deux fois plutôt qu'une, comme nous allons le voir ci-dessous.

Une onde physique n'est évidemment pas complexe. La solution phaseur est complexe et a donc une partie
réelle et une partie imaginaire. Nous montrons ici que chacune des deux parties peut représenter une onde
réelle générale. Utilisons même un point de départ un peu plus général. Imaginons que l'amplitude est
elle-même complexe. Nous pouvons donc l'écrire:

(31.175)

Nous avons donc:

(31.176)

Nous étudions d'abord la partie réelle de cette expression:


(31.177)

Cette partie réelle est donc de la forme la plus générale (et réelle) de la solution monochromatique pour
l'équation d'onde, soit:

(31.178)

Clairement, il suffit d'identifier:

(31.179)

qui relient deux paramètres à deux autres. La partie réelle du phaseur est donc suffisante pour décrire
entièrement l'onde monochromatique.

Nous pouvons refaire exactement la même chose avec la partie imaginaire du phaseur et démontrer de façon
identique qu'elle est suffisante pour décrire entièrement l'onde monochromatique.

Conclusion: il est donc possible d'utiliser le phaseur pour faire toutes les manipulations mathématiques
demandées après le problème physique et à la fin, ne garder que la partie réelle ou imaginaire, selon ce qui a
été convenu dès le début.

Comme nous l'avons déjà dit, la forme réelle la plus générale de la solution est:

(31.180)

Cette fonction a le comportement d'un sinus (ou d'un cosinus) dont l'amplitude est donnée par:

(31.181)

De plus les conditions initiales ajustent de telle sorte qu'à et (initialement), le champ
a la valeur donc. Ces deux conditions fixent ces deux paramètres. Nous aurions pu utiliser la
forme toute aussi générale:

(31.182)

Ici l'amplitude connu est et les conditions initiales sont telles qu'à et , le champ a la valeur:

(31.183)

Encore une fois, deux conditions fixent deux paramètres.

L'amplitude est une chose évidente, la phase un peu moins. Pour qu'une fonction du type:

(31.184)
ait n'importe quelle valeur que l'on veut lorsque son arg (argument) est, disons nul, il suffit d'ajuster la
valeur de la phase . C'est comme faire glisser la fonction sinusoïdale le long de l'axe, de façon à satisfaire
des conditions initiales physiques imposées par le système étudié.

De deux fonctions de type sinus ou cosinus qui ne commencent par au même point de leur cycle, nous
disons qu'elles sont "déphasées". Ceci devient vital lorsqu'il y a plus d'une onde en présence. Imaginons le
cas le plus simple de deux ondes de même amplitude:

(31.185)

Ici l'argument est une variable et les phases des paramètres constants. Nous considérons le résultat physique
de l'onde résultant de l'addition de ces deux ondes.

Si l'onde résultante sera une onde sinusoïdale d'amplitude 2 fois . Cependant, si


, l'onde résultante sera identiquement nulle partout. La différence est donc considérable
et nous trouvons toutes les situations intermédiaires. Il est donc important de garder en tête la phase à
l'origine de l'onde ou mieux, sa phase relative par rapport à d'autres ondes de notre système physique.

Dans le phaseur, soit la partie réelle, soit la partie imaginaire, est suffisante pour donner une description
générale de l'onde (toujours monochromatique jusqu'à maintenant). Elles sont respectivement composées
d'un cosinus et d'un sinus et donc déphasées de l'une par rapport à l'autre !

Il est souhaitable de revenir la "relation de dispersion" que nous avions obtenue. Nous avons vu que, pour
l'onde monochromatique libre, celle qui est solution de l'équation homogène, cette relation s'écrit pour que la
phase de la solution corresponde à cette réalité (attention il s'agit de ne pas confondre le symbole de la
vitesse et de la fréquence!):

(31.186)

Toujours dans le cas libre, nous pouvons avoir une situation physique qui correspond à l'addition de
plusieurs ondes monochromatiques libres. Le résultat n'est pas monochromatique et s'écrit évidemment
comme une somme:

(31.187)

Nous lui donnons souvent le nom de "paquet d'onde" pour des raisons évidentes. Puisque tout est libre,
chaque composante satisfera:

(31.188)

Nous noterons ici deux choses pour des ondes libres:

- D'abord, même pour des ondes libres, elle est quadratique, nous pouvons donc changer le signe du vecteur
d'onde et/ou de la pulsation sans affecter l'équation. Nous observons trivialement que pour une ou plusieurs
composantes du vecteur d'onde positives l'onde se propage vers les x croissants pour ces composantes
positives et qu'inversement, pour une ou plusieurs composantes négatives l'onde se propage vers les x
décroissants. De même, pour une pulsation négative ou positive signifie que le temps varie vers le passé,
respectivement le futur.
- D'autre part, certains types d'ondes n'obéissent pas à une équation aussi simple que l'équation homogène.
C'est le cas des vagues, par exemple, tant du fait de la nature du liquide dans lequel elles se propagent que de
la force de rappel gravitationnel. Parfois aussi, une onde qui serait totalement libre, ou à peu près, cherche à
se propager dans un milieu où les conditions de propagation sont sérieusement affectées. Par exemple une
onde sonore qui tente de se propager dans le mastic ou une onde électromagnétique qui cherche à se
propager dans un conducteur (un métal). Dans ce cas, une partie importante de la différence entre onde libre
et onde modifiée par le milieu peut se décrire par un changement de la dispersion.
32. MÉCANIQUE STATISTIQUE

L a mécanique statistique, appelée aussi "thermodynamique statistique", a pour but d'expliquer le


comportement des systèmes macroscopiques (constitués d'un grand nombre d'objets en interaction) à partir
de leurs caractéristiques microscopiques. C'est de façon beaucoup plus générale, la physique quantique qui
décrit les propriétés et l'évolution des systèmes physiques à l'échelle microscopique. La mécanique
statistique est donc construite sur cette description quantique comme nous le verrons sur les développements
mathématiques qui suivront.

La démarche présentée ici est d'aborder la mécanique statistique élémentaire pour en déduire ensuite la
thermodynamique. La mécanique statistique constitue en effet, avec la physique quantique et la relativité,
l'un des piliers de la physique moderne dans l'explication de phénomènes à partir de leurs constituants. Il est
important de la percevoir d'emblée comme une théorie fondamentale, et non pas comme une simple tentative
pour justifier à posteriori la thermodynamique. La thermodynamique elle-même y gagne en retour
compréhension plus juste et plus profonde de ses principes et de ses méthodes.

THÉORIE STATISTIQUE DE L'INFORMATION

Le mot "information" est utilisé dans des contextes très variés, dans des sens totalement différents suivants
les disciplines scientifiques : nous pouvons à titre d'exemple citer la thermodynamique avec le concept
d'entropie, la physique appliquée avec la théorie du signal, la biologie avec la théorie du génome et la
physique quantique avec la probabilité d'obtenir de l'information.

Se pose alors la question, s'il est possible de construire une théorie de l'information et si elle est unique?
Notre démarche ici, ne vise non pas l'information en tant que telle, mais la quantité d'information. Lorsque
nous parlons de quantité et de mesure, nous pensons à la notion de contenu ou de valeur de l'information. La
science de l'information de par son objet doit se sentir concernée par ce questionnement. Si nous définissons
"l'infométrie" comme l'ensemble des techniques de mesures mathématiques et statistiques de l'information,
nous souhaiterions avoir une définition suffisamment claire du concept de quantité d'informations qui puisse
nous amener à définir une mesure, c'est-à-dire un ensemble d'opérations parfaitement définies, nous amenant
à des axiomes clairs et dont le résultat est un nombre. La synthèse que nous développons ici n'est pas
ambitieuse.

Nous nous intéressons donc ici aux fondements la théorie statistique de l'information connue également sous
le nom de "théorie de Shannon". La formule de Shannon qui en ressort est certainement un des concepts
fondamentaux de toute la physique puisqu'elle touche la brique irréductible de la physique : l'information !!

Nous montrerons (plus bas) qu'un système physique isolé a pour état le plus probable, celui qui contient le
plus d'états et qui est donc à fortiori le plus imprévisible. Or, l'état le plus improbable est donc celui qui est
le plus prévisible. Dès lors, puisque l'imprévisibilité apparaît comme un attribut essentiel de l'information,
nous identifions la mesure quantitative de l'information à son improbabilité.

Ainsi, la quantité d'information h(x) apportée par la réalisation d'un événement x de probabilité p(x) sera une
fonction croissante f de son improbabilité 1/p(x) :

(32.1)

De plus, la réalisation de deux événements indépendants x et y apporte intuitivement une quantité


d'information qui est la somme de leurs quantités d'informations respectives, soit :
(32.2)

La fonction logarithme est donc par ses propriétés une candidate naturelle pour f telle que:

(32.3)

où est bien évidemment un nombre positif.

Remarque: Le choix de la base du logarithme définit l'unité d'information qui est complètement arbitraire.
Par la suite, et sauf précision contraire, "log" désignera le logarithme en base .

Ainsi, la "quantité d'information intrinsèque" d'un événement x est donc de par les propriétés du logarithme:

(32.4)

Elle peut être considérée, comme nous l'avons fait, comme une mesure d'incertitude sur l'événement, ou
comme celle de l'information nécessaire pour résoudre cette incertitude.

Définitions:

D1. Nous définissons "l'information intrinsèque par paire" de deux événements x et y de probabilité
conjointe p(x,y) (cf. chapitre de Probabilités) par:

(32.5)

D2. Nous définissons de même "l'information conditionnelle" de x sachant y par (cf. chapitre de
Probabilités) :

(32.6)

Il s'agit de la quantité d'information restant sur x après l'observation de y. La formule de Bayes (cf. chapitre
de Probabilités) nous permet de remarquer immédiatement que si x et y sont indépendants:

(32.7)

ce qui concorde avec le sens commun.

Nous souhaitons aussi mesurer la quantité d'information que la donnée d'une variable, par exemple y,
apporte sur l'autre, x. C'est le cas en particulier lorsque nous identifions x au choix d'un signal appliqué à
l'entrée d'un canal et y au signal correspondant observé en sa sortie. p(x) est alors la probabilité à fortiori que
x soit émis et la probabilité à fortiori que x ait été émis, sachant que y a été reçu.

Une mesure de cette quantité d'information, nommée "information mutuelle" est :

(32.8)
il s'agit de la mesure logarithmique de l'accroissement de la probabilité de x (donc la baisse de sa quantité
d'information) dû à son conditionnement sur y. Si la donnée de y est équivalente à celle de x (cas d'un canal
parfait), elle est égale à l'information intrinsèque h(x). Elle est nulle si, à l'inverse, x et y sont indépendants.

Nous avons bien évidemment:

(32.9)

et de par les propriétés des logarithmes:

(32.10)

cette dernière égalité justifiant le terme "mutuelle". Alors que les informations intrinsèques étaient positives,
l'information mutuelle peut être négative. Nous verrons que sa moyenne, beaucoup plus importante dans la
pratique, ne peut l'être.

Les événements individuels étant généralement moins importants que les moyennes, nous considérerons par
la suite une source aléatoire, discrète, finie, stationnaire, et blanche (i.e. de réalisations successives
indépendantes). Les événements sont donc interprétés comme le choix d'un symbole dans l'alphabet de la
source. Soit n la taille de cet alphabet, et ses symboles. La source est donc décrite par la variable
aléatoire x, qui prend ses valeurs dans l'alphabet, avec des probabilités respectives , telles que:

(32.11)

La quantité d'information moyenne de cette source est l'espérance de l'information intrinsèque de chaque
symbole de l'alphabet de la source (cf. chapitre de Statistiques). Elle est appelée "entropie" (par la notation)
de X et vaut donc :

(32.12)

Cette relation étant appelée la "formule de Shannon".

Cette écriture constitue un abus de notation: en effet, l'espérance mathématique a un sens si h(x) est une
fonction de x. Or h(x) ne dépend pas des valeurs de x, mais seulement des probabilités associées. Nous
noterons parfois plus rigoureusement l'entropie d'une distribution .

Les "entropies conjointes et conditionnelles" sont définies de manières similaires avec les notations idoines :

(32.13)

et:

(32.14)
Il faut noter dans la dernière expression que l'espérance est effectuée dans l'espace produit, et que donc le
coefficient est la probabilité conjointe.

"L'information mutuelle moyenne", appelée par abus de langage "information mutuelle" se définit elle aussi
de manière directe:

(32.15)

Remarque: Il est à noter que la définition de la quantité d'information, par une mesure logarithmique peut
paraître arbitraire, quoique raisonnable, compte tenu des propriétés attendues d'une telle mesure. Shannon, et
plus tard Khintchine ont montré que compte tenues de certaines propriétés posées en axiomes, la fonction
logarithmique est la seule à convenir.

Exemple:

Soit une variable aléatoire binaire, valant 1 avec une probabilité p (et donc 0 avec une probabilité 1-p). Son
entropie vaut :

(32.16)

avec et avec un logarithme en base 2 tel que pour un événement à deux états équiprobables,
l'entropie d'obtention d'un des deux états soit égale à l'unité. Ceci dit, il vient naturellement que .

Elle est représentée à la figure ci-dessous, en "Shannon" (unité correspondant à l'utilisation du logarithme à
base 2). Nous remarquerons sa symétrie par rapport à ½, valeur pour laquelle elle atteint son maximum, égal
à 1.

Entropie d'une variable binaire


(32.17)
Il convient maintenant de faire la liaison entre la théorie statistique de l'information et la mécanique
statistique :

LOI DE BOLTZMANN

Nous allons d'abord démontrer par l'intermédiaire d'un cas simple, que pour tout système, l'état le plus
probable est l'état d'équilibre !

Considérons un système isolé (un système est dit "isolé" lorsqu'il est imperméable à tout flux - chaleur
(adiabatique), matière, champs, ...) peuplé de N particules discernables. Ce système est partagé en deux
compartiments (ou niveaux) identiques et séparés d'une paroi imperméable. Chaque compartiment est
supposé contenir un nombre de particules.

Pour une configuration donnée du système, nous parlons de "macro-état" dans le sens où il est possible de
par la quantité de particules de mesurer une grandeur dite macroscopique tel que l'énergie, la masse, la
pression, etc.

Si nous fixons ce système particulier, il est bien sûr possible pour un nombre N de particules de concevoir un
nombre donné de macro-états. Tel que :

- 1 particule : 2 macro-états (1 configuration par macro-état)

- 2 particules : 3 macro-états (4 configurations possibles par permutation des compartiments)

- 3 particules : 4 macro-états (8 configurations possibles par permutations des compartiments)

- 4 particules : 5 macro-états (16 configurations possibles par permutations des compartiments)

etc.

Définition: Nous appelons "micro-état", une configuration de permutation du macro-état.

Remarque: Parfois au lieu de "micro-état" nous trouvons dans la littérature "probabilité thermodynamique"
ou "complexions".

Déterminons maintenant à l'aide de l'analyse combinatoire (cf. chapitre de Probabilités) le nombre de micro-
états possibles pour chaque macro-état. Par analogie, ceci correspond à s'imaginer que le système est une
tige par laquelle sont enfilées des boules (particules) et que la tige est séparée par une frontière imaginaire en
un des ses points (boulier chinois). Pour une telle situation, nous avons :

(32.18)

Ceci nous donne tous les arrangements possibles des "particules gauches" avec les "particules droites" (de la
frontière) pour un macro-état donné (le nombre de manières dont les particules peuvent se partager entre les
deux compartiments). Mais nous avons aussi dans ce cas particulier :

(32.19)

Or cela correspond à la combinatoire tel que :


(32.20)

et donc :

(32.21)

Nous avons finalement pour tous les macro-états d'un système de N particules, un total de :

(32.22)

micro-états (configurations) possibles. Or, nous avons bien vu dans l'exemple initial que :

(32.23)

Ainsi, la probabilité d'existence d'un micro-état donné est de et elle est équiprobable !!

Nous pouvons maintenant énoncer le premier postulat de la mécanique statistique (postulat de Gibbs) : tous
les micro-états discernables et accessibles d'un système isolé sont équiprobables.

Revenons-en maintenant à notre question initiale sur l'équilibre :

La notion d'équilibre associé à un macro-état nous est fournie par la thermodynamique classique. Nous y
voyons qu'un système est dit à l'équilibre lorsque son état est caractérisé par l'indépendance temporelle des
grandeurs macroscopiques (masse, énergie, pression, ...) et de la constance des potentiels thermodynamiques
(énergie interne, enthalpie, énergie de Gibbs, ...).

Pour savoir pourquoi l'équilibre est l'état le plus probable, il nous suffit de chercher quel est le couple
qui maximise :

(32.24)

puisque tous les micro-états sont de toute façon équiprobables. Il est facile de contrôler que ce maximum est
donné pour :

(32.25)

Nous pouvons dès lors énoncer le deuxième postulat de la mécanique statistique : l'état d'équilibre est l'état
qui correspond au plus grand nombre de configurations (micro-états) et est l'état le plus probable!!

Ou en d'autres termes: Un système atteint l'équilibre lorsque son entropie devient maximale!!

Soit maintenant à considérer le système suivant :


(32.26)

La fonction de distribution P(x) qui décrit la position des particules selon l'axe x à l'équilibre va
évoluer vers une autre fonction de distribution correspondant au nouvel équilibre . À l'équilibre P(x) est
constante. Mais entre les deux équilibres, elle évolue, et devient de plus en plus large. Nous perdons donc de
l'information sur la position des particules. Nous pouvons donc ré-énoncer le deuxième postulat en disant
qu'un système hors d'équilibre évolue toujours dans le sens d'une perte d'informations (d'un élargissement de
la fonction de distribution caractéristique).

Parallèlement, le deuxième principe de la thermodynamique classique nous indique que cette toute évolution
naturelle doit nécessairement correspondre à un accroissement d'entropie . Il doit donc exister un
lien étroit entre l'information que nous possédons sur l'état de chacune des particules et l'entropie du
système.

Le cas que nous venons de décrire montre clairement que les paramètres ou concepts : nombre de
configurations, désordre, équilibre, quantité d'information et entropie d'un système isolé servent à
représenter l'état d'un système. Ces paramètres jouent le même rôle. Des relations mathématiques doivent
donc les relies les unes aux autres.

Rappelons que nous avons démontré que l'entropie statistique infométrique d'un système est donnée par :

(32.27)

Si nous appliquons cette relation au cas d'un système physique en équilibre pour lequel nous souhaitons
calculer l'entropie, nous avons démontré :

(32.28)

Il nous faut encore savoir à quoi correspond cette probabilité constante. Nous avons démontré
précédemment qu'à l'équilibre, nous avions :
(32.29)

qui est donc le nombre de micro-états à l'équilibre. Ainsi, la probabilité de tirer un micro-état parmi tous est
de :

(32.30)

que nous notons, dangereusement par tradition simplement :

(32.31)

Nous avons ainsi :

(32.32)

Comme les probabilités des micro-états sont équiprobables et que nous sommons sur l'ensemble de ces
derniers, il vient :

(32.33)

et donc :

(32.34)

Puisque l'équilibre est liée au désordre maximum, et que le désordre est lié à l'information manquante, il
paraît raisonnable de relier l'entropie statistique de l'information à l'entropie statistique thermodynamique en
physique. Pour cela, il faut que la constante nous permette d'obtenir les bonnes unités et il vient
naturellement de choisir cette constante telle qu'elle soit égale à la constante de Boltzmann k qui a les
mêmes unités que l'entropie thermodynamique. Ainsi :

(32.35)

Il nous faut encore choisir la base du logarithme. L'expérience montre qu'il faut choisir le logarithme
népérien qui permet de retrouver des résultats de la mécanique classique après développements.

Ainsi, nous obtenons finalement la "loi de Boltzmann" :

(32.36)

Qui nous donne l'entropie thermodynamique d'un système à l'équilibre!

De par les propriétés mathématiques de l'écart-type, nous avons pour un ensemble N de sous-systèmes :
(32.37)

Par analogie, avec une approche statistique de l'énergie interne de l'ensemble du système étant alors:

(32.38)

Par analogie, avec une approche statistique de l'énergie interne de l'ensemble du système étant alors:

(32.39)

Soit en différenciant:

(32.40)

ce qui est l'expression statistique intuitive du premier principe de la thermodynamique. Effectivement, le


travail est une variation d'énergie mécanique déterministe de micro-états, alors que la chaleur comme nous le
verrons plus bas se décrit à l'aide de fonctions de distributions d'où le fait que nous intégrons sur les
probabilités.

Nous y reviendrons un peu plus en détails dans le chapitre de Thermodynamique!

DISTRIBUTIONS STATISTIQUES PHYSIQUES

Nous distinguerons quatre différentes statistiques qui proviennent ou non d'effets quantiques et qui
conduiront à quatre distributions distinctes connues. Ce sont les distributions de Maxwell, Maxwell-
Boltzmann, Fermi-Dirac et de Bose-Einstein. Elles trouvent de nombreuses applications en physique comme
le rayonnement du corps noir qui sera démontré dans le chapitre de Thermodynamique.

DISTRIBUTION DE MAXWELL (DISTRIBUTION DES VITESSES)

Pour un gaz en état d'équilibre, posons la question suivante :Quelle probabilité existe qu'une molécule ait ses
composantes de vitesse comprise entre et , et , et dans un repère cartésien
habituel ?

Cette probabilité dépend de (c'est-à-dire : ) et de . Elle ne dépend pas de la


position de la molécule puisque le gaz est supposé à l'équilibre par rapport à son centre de masse.

Nous postulons dans un premier temps que est proportionnelle à chacun des intervalles tel
que :

(32.41)

et qu'il n'y a pas de directions privilégiées. Nous pouvons faire une rotation circulaire des axes cartésiens, la
probabilité sera inchangée (isotropie de l'espace).

L'isotropie amène que la fonction ne dépend pas du vecteur , au mieux elle dépend de la norme de
cette vitesse, tel que :
(32.42)

Soit la probabilité pour une molécule d'avoir sa composante suivant l'axe Ox comprise entre et
alors :

(32.43)

de même :

(32.44)

L'isotropie de l'espace impose :

(32.45)

La loi des probabilités composées implique :

(32.46)

Déterminer les fonctions f et relève de la méthodologie mathématique suivante :

(32.47)

Puisque :

(32.48)

Ce qui nous donne finalement :

(32.49)

Le membre de gauche de la dernière égalité dépend uniquement de v , celui de droite uniquement de . Le


résultat ne peut être qu'une constante que nous noterons . Il suit que :

(32.50)

En intégrant :

(32.51)
Donc :

(32.52)

et posons . Il vient donc :

(32.53)

Donc identique :

(32.54)

La loi des probabilités composées impliquant :

(32.55)

Nous avons finalement :

(32.56)

Remarquons que est nécessairement négatif sinon la probabilité pour une molécule d'avoir une
composante de vitesse infinie serait infinie ce qui voudrait dire que toutes les molécules seraient à vitesse
infinie et que l'énergie serait infinie !!!

Nous posons :

avec (32.57)

Finalement, il vient que :

(32.58)

Il nous reste à normaliser A. La probabilité pour une molécule d'avoir une composante de vitesse comprise
entre ou une intensité de vitesse comprise entre est égale à (100% de chances).

Ainsi en utilisant exactement la même méthode calcul que celle vue dans le chapitre de Statistique pour la
loi Normale, nous avons:

(32.59)

Nous avons jusqu'ici parlé en terme de probabilités. Un langage équivalent consiste à chercher, dans une
enceinte contenant N molécules, le nombre dN de molécules ayant certaines caractéristiques, à savoir par
exemple, le nombre de molécules ayant une composante de vitesse comprise entre et . Ce
nombre étant bien évidemment égal dans une dimension à :

(32.60)

Plus généralement :

(32.61)

Pour obtenir dP nous nous plaçons dans l'espace des vitesses c'est-à-dire un repère cartésien de coordonnées
. Les composantes ne sont pas indépendantes puisque liées par la relation :

(32.62)

L'extrémité des vecteurs vitesse ayant une intensité de vitesse v, c'est à dire des composantes de vitesse
liée par la relation ci-dessus, se trouve dans l'espace des vitesses sur la sphère de rayon v. Il en sera de même
pour l'extrémité des vecteurs vitesse ayant une intensité .

Dans l'espace des vitesses, nous délimitons une portion d'espace comprise entre la sphère de rayon v et la
sphère de rayon , de volume égale à .

La probabilité est proportionnelle à c'est-à-dire au volume élémentaire dans l'espace des


vitesses. Pour obtenir dP(v), nous devons intégrer à tous les vecteurs vitesse possibles c'est à dire ayant
leur extrémité entre les deux sphères. Cette intégration est particulièrement simple puisque l'intensité v de la
vitesse dans cette espace (inter-volume) est constante. Nous obtenons donc :

(32.63)

et ainsi, dans une enceinte contenant N molécules, le nombre de molécules dN(v) ayant un module de vitesse
compris entre v et est :

(32.64)

Rappelon maintenant que conformément à ce que nous avons longuement étudié dans le chapitre de
Statistique, la valeur moyenne d'une grandeur G est le produit de G multipliée (pondérée) par la
probabilité d'obtenir G intégré à toutes les valeurs possibles de cette grandeur telle que :

(32.65)

où l'intégrale a été calculée en faisant un changement de variable et où nous avons ensuite utilisé une
intégration par parties.

Nous avons respectivement:


(32.66)

où l'intégrale a été calculée de la même manière.

Donc :

ou (32.67)

La thermodynamique, ou la mécanique des fluides (voir théorème du Viriel) nous donne pour un gaz parfait
monoatomique (cf. chapitres de Mécanique Des Milieux Continus et de Thermodynamique), de capacité
calorifique et volume constant :

(32.68)

Si nous formulons l'hypothèse que la partie de l'énergie liée à la température est due à l'agitation cinétique
des molécules, nous pouvons écrire :

(32.69)

Nous définissons alors la vitesse thermique moyenne par:

(32.70)

Une application pour l'électron dans le cas des semi-conducteurs (où nous approximons certaines relations
par une distribution de Maxwell-Boltzmann) donne une vitesse thermique à température ambiante de
120'000 [m/s].

Mais pour en revenir à notre distribution.... Nous avons donc :

(32.71)

Ainsi, nous avons finalement :

(32.72)

Qui est donc la distribution des vitesses dans un gaz monoatomique dont voici un exemple de tracé (les
unités des axes en ordonnées sont arbitraires) :
(32.73)

La relation précédente donne donc la proportion des molécules de gaz ayant à un instant t donné une vitesse
v. Nous avons alors pour une direction spatiale (en adoptant les développements précédents on tombe
relativement facilement sur ce résultat):

(32.74)

Cette fonction de distribution correspond donc à une répartition gaussienne (cf. chapitre de Statistiques) et
permet donc de définir la vitesse la plus probable (le "mode" comme on dirait en statistiques) notée , qui
correspond au maximum de la courbe f(v), soit la où la dérivée première est nulle :

(32.75)

Dès lors :

(32.76)

d'où :

(32.77)
et la vitesse moyenne (l'espérance) est alors donnée par :

(32.78)

Nous avons donc une intégrale du type :

(32.79)

Le mieux est de décomposer en et on intègre par parties. Nous avons alors :

(32.80)

La dernière intégrale est facilement calculable. C'est la même que dans le chapitre de Statistiques pour la loi
de Gauss-Laplace. Donc :

(32.81)

Il vient finalement :

(32.82)

DISTRIBUTION DE MAXWELL-BOLTZMANN (NON CORRIGEE)

En physique quantique corpusculaire, nous apprenons que l'énergie d'une particule est quantifiée, c'est à dire
que les valeurs possibles pour l'énergie forment un spectre discret. Même si, dans un certain nombre de
situations courantes, pour une particule et encore plus pour un système constitué d'un grand nombre de
particules, les niveaux d'énergie sont si serrés que nous pouvons traiter, sur le plan mathématique, ce spectre
comme continu (approximation du continuum), il n'empêche qu'en toute rigueur ils sont quantifiés. Cette
approche quantifiée de distributions physique au niveau corpusculaire de la matière est souvent désignée
sous le nom de "statistique quantique".

Une particule, ayant un niveau d'énergie , peut être dans différents sous-états.

Nous savons (nous n'avons pas utilisé l'équation de Schrödinger dans le chapitre de Physique Quantique
Corpusculaire pour le montrer strictement) que, pour décrire un atome, nous introduisons quatre nombres
quantiques, à savoir :
- le nombre quantique principal qui quantifie l'énergie

- le nombre quantique secondaire qui quantifie le moment cinétique

- le nombre quantique magnétique qui quantifie le moment magnétique

- le spin qui quantifie la rotation propre des électrons de l'atome

Ainsi pour une même énergie (pour une valeur particulière du nombre quantique principal), un atome ou un
électron peuvent posséder différentes valeurs des nombres quantiques secondaire, magnétique ou de spin.

Pour qualifier la possibilité de sous-états correspondant à une même énergie, nous employons l'expression
"dégénérescence" et nous traduisons par la variable le nombre de dégénérescences correspondant à un
même niveau d'énergie .

Nous allons considérer un système composé de N particules qui se placent sur K différents niveaux d'énergie
. Nous trouvons particules sur le niveau d'énergie . Nous avons les relations suivantes pour l'énergie
totale (que nous notons par la même lettre que celle utilisée en thermodynamique) et pour le nombre de
particules (même remarque que pour l'énergie totale) :

(32.83)

Nous supposerons (c'est important) ces quantités constantes. Le système est entièrement déterminé par la
distribution des particules sur les K niveaux.

Il existe un grand nombre de configurations microscopiques possibles qui sont compatibles avec la
distribution . Il y en a (voir les permutations avec répétition dans le chapitre de Probabilités) :

(32.84)

Mis nous avons négligé la dégénérescence possible des niveaux i. S'il existe sous-niveaux dont l'énergie
est , nous avons alors :

(32.85)

Remarque: est donc la dégénérescence de l'état d'énergie , à savoir le nombre d'états possédant cette
énergie.

En prenant le logarithme, il vient :

(32.86)
et en utilisant la formule de Stirling (cf. chapitre de Méthodes Numériques) :

(32.87)

Nous avons :

(32.88)

Nous recherchons maintenant la distribution la plus probable, c'est-à-dire celle qui maximise . Pour
trouver l'extremum, nous allons différencier cette expression tel que :

(32.89)

Or, comme :

(32.90)

où sont des constantes qui permettent de s'assurer de la cohérence de l'analyse dimensionnelle (des
unités quoi...).

Il est donc équivalent et nécessaire d'écrire pour prendre en compte également ses paramètres intrinsèques
(le fait d'ajouter ainsi des termes nuls est nommé "méthode des multiplicateurs de Lagrange"):

(32.91)

Donc :

(32.92)

ce qui donne après une première simplification (élimination simple de la dérivée des constantes):

(32.93)

Ce qui nous amène à écrire :

(32.94)

Ce qui nous donne finalement :


(32.95)

Mais cela équivaut aussi à rechercher :

(32.96)

d'où :

(32.97)

Rappelons que nous avons pour l'entropie de ce système :

(32.98)

et donc :

(32.99)

et comme :

(32.100)

Nous avons donc :

(32.101)

La thermodynamique nous conduit à (cf. chapitre de Thermodynamique) :

(32.102)
Or, si toutes les particules sont identiques donc :

(32.103)

Ce qui finalement conduit à :

(32.104)

et nous amène à :

(32.105)

et donc :

et (32.106)

Nous pouvons donc récrire la relation de Maxwell-Boltzmann :

(32.107)

Que nous retrouvons plus fréquemment dans la littérature sous la formes suivante:

(32.108)

et particulièrement sous cette forme:

(32.109)

Nous retrouverons cette relations dans le domaine de la théorie des semi-conducteurs (cf. chapitre
d'Électrocinétique) dans le cadre de l'approximation à .

Comme , nous avons :

(32.110)

Nous pouvons alors calculer et nous obtenons ainsi la "formulation discrète" de la "statistique de
Maxwell-Boltzmann":
(32.111)

Cette relation donne donc le rapport entre le nombre de particules qui n'interagissant pas entre elles (par
hypothèse) et pouvant prendre les différents états d'énergie discrets et le nombre de particules dans un état
d'énergie donné . Ainsi, connaissant N, il est possible à l'aide de cette relation de connaître le nombre de
particules dans un état d'énergie particulier.

Remarque: La statistique de Maxwell-Boltzmann s'applique en l'absence d'interaction entre particules et est


donc valable pour un gaz parfait mais ne s'applique pas, par exemple, à un liquide. De plus, elle s'applique
aux hautes températures lorsque les effets quantiques sont négligeables. À basse température sont utilisées la
statistique de Bose-Einstein pour les bosons et la statistique de Fermi-Dirac pour les fermions (voir plus
loin).

Nous appelons le terme au dénominateur, la "fonction de partition canonique". Elle est le plus souvent notée
tel que :

(32.112)

DISTRIBUTION DE FERMI-DIRAC

Le principe d'indiscernabilité peut avoir des conséquences très importantes sur la statistique. Nous
distinguons deux types de particules indiscernables : les bosons (comme le photon) et les fermions (comme
l'électron).

Rappels :

R1. Les premiers correspondent à des particules dont la fonction d'onde représentative est toujours
symétrique alors que celles des fermions est antisymétrique.

R2. Le principe d'exclusion de Pauli impose que 2 fermions ne peuvent pas se trouver dans le même état
quantique. Les bosons, eux le peuvent !

Leurs propriétés respectives ont pour conséquence importante que l'énergie minimale d'un ensemble de N
bosons est égale à N fois l'énergie minimale de chaque boson. Alors que pour un ensemble de fermions,
l'énergie minimale est égale à la somme des N énergies les plus faibles.

Ces deux types de particules entraînent deux types de statistiques : la statistique de Fermi-Dirac pour les
fermions (que nous allons démontrer en premier) et la statistique de Bose-Einstein pour les bosons (qui
suivra).

Il n'existe donc qu'une seule manière de répartir N fermions sur les états d'énergies accessibles (au lieu des
N! pour les particules discernables). Il ne peut pas y avoir plus de particules dans un niveau d'énergie
qu'il existe de dégénérescence . Donc . Le nombre de combinaisons possible pour un
niveau , dégénéré fois et comportant particules est donc la combinatoire . Le nombre total de
configurations est donc :
(32.113)

La statistique est donc bien différente du cas classique de Maxwell-Boltzmann. En prenant le logarithme du
nombre de micro-états et en faisant usage de la formule de Stirling comme plus haut, il vient :

(32.114)

Que nous pouvons déjà simplifier une première fois :

(32.115)

et en différenciant cette expression pour trouver le maximum, nous obtenons :

(32.116)

Terme à terme :

(32.117)

Or, nous avons par conservation et par symétrie :

(32.118)

Donc finalement :

(32.119)

Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore une fois la
méthode des multiplicateurs de Lagrange :

(32.120)

Ce qui nous amène à la distribution de Fermi-Dirac :

(32.121)
Les paramètres et jouent le même rôle que dans la distribution de Maxwell-Boltzmann. Nous avons
ainsi :

et (32.122)

Nous avons alors :

(32.123)

Ainsi, en physique quantique, la statistique de Fermi-Dirac désigne le nombre de fermions indiscernables sur
les états d'énergie d'un système à l'équilibre thermodynamique dégénéré (donc le nombre de fermions
occupant le niveau d'énergie donné!).

Pour les systèmes macroscopiques, les niveaux d'énergie sont si serrés (ou tellement nombreux) que nous
pouvons considérer le spectre d'énergies comme continu (approximation du continuum).

Nous raisonnerons donc dans ce contexte de continuum, ce qui nous permet d'écrire en normant aux
nombres de particules mises en jeu (tout ce que l'on demande à la fonction c'est de nous dire comment sont
réparties les N particules) :

(32.124)

ou:

(32.125)

pour la fonction de Fermi-Dirac avec le tracé correspondant plus bas de la distribution.

Cette relation est très importante par exemple dans la théorie de semi-conducteurs (cf. chapitre
d'Electrocinétique) qui est à la base de l'électronique du 20ème et 21ème siècles.

De manière numérique, nous pouvons simuler l'évolution de l'allure de la distribution (qui n'est pas une
distribution dans le sens mathématique du terme) en fonction de l'énergie et de la température. Pour cela,
nous supposons pour simplifier que la constante de Boltzmann vaut 1 et que le potentiel chimique mu vaut 2
(nous notons que celui-ci est en toute rigueur fonction de la température). Ainsi, nous pouvons écrire le petit
programme suivant sous Matlab :

clear all;kb=1; % Constante de Boltzmann


mu=2; % Potentiel Chimique
T=0.001:0.1:1; % " Gradient " de température pour le programme
for j=1:length(T)
beta(j)=1/(kb*T(j));
epsilon=0.1:0.1:4; % L'énergie avec le pas
for i=1:length(epsilon)
Nf(i,j)=1/(exp(beta(j)*(epsilon(i)-mu))+1); % Nb(epsilon,beta) moyen de fermions au
end % niveau d'énergie epsilon
hold on %
plot(epsilon,Nf(:,j));
pause(0)
end

(32.126)

Au zéro absolu nous voyons que nous avons une marche. A cette température, les niveaux d'énergie
dégénéres sont occupés à bloc en partant du niveau d'énergie le plus bas jusqu'à un certain niveau
représentant la chute de la marche. Nous disons alors que le gaz de fermions est "complétement dégenéré".

La fonction de Fermi-Dirac, au zéro absolu, vaut donc 1 si E est inférieur à et 0 pour les valeurs
supérieures (le système choisit sont état d'énergie minimale où les N particules occupent les N états de plus
basse énergie).

Evidemment, dans les hautes énergies d'excitation (ou hautes températures) la probabilité (rapport)
d'occupation d'un état est très faible et donc il n'est pas important d'appliquer le principe de Pauli (la
probabilité que deux électrons veuillent occuper le même niveau d'énergie est très faible). Pour ces raisons,
ce régime limite entre le comportement quantique et classique est appelé parfois "régime classique" et la
haute température correspondante à l'excitation énergétique est appelée "température de Fermi".

Le potentiel chimique est quant à lui par définition le dernier niveau énergétique occupé au zéro absolu (la
fameuse marche d'escalier!). Nous le notons en physique (et à l'opposé en chimie...) et nous l'appelons
"niveau de Fermi". Nous voyons alors immédiatement que quelque soit la température:

(32.127)

la probabilité d'occupation par les électrons est donc de 1/2 dans ce niveau. La définition du niveau de Fermi
peut alors être donnée par:

(32.128)

La principale application aux solides de cette statistique est la modélisation des phénomènes de transport
électronique (gaz d'électrons) : théorie des métaux, des semi-conducteurs, population des niveaux d'énergie
et propriétés de conduction (cf. chapitre d'Electrocinétique).
DISTRIBUTION DE BOSE-EINSTEIN

Les bosons sont d'autres particules quantiques qui peuvent indistinctement se placer sur tous les niveaux
d'énergie. Le principe de Pauli ne s'y applique donc pas! Dans ce cas, le nombre d'objet à permuter est
(les particules et les intervalles entre les niveaux). Parce que les particules sont
indiscernables et les niveaux et sous niveaux permutables, il faut diviser par puis aussi par Le
nombre de configurations sur un niveau , fois dégénéré qui contient particules indiscernables est
ainsi égal à :

(32.129)

Son logarithme avec usage de la formule de Stirling et après simplification est donné par :

(32.130)

Le maximum de correspond à annuler , soit :

(32.131)

Pour respecter les contraintes sur l'énergie et le nombre de particules, nous utilisons encore une fois la
méthode des multiplicateurs de Lagrange :

(32.132)

et donc :

(32.133)

qui est la distribution statistique de Bose-Einstein. Cette distribution diverge lorsque:

(32.134)

C'est la "condensation de Bose-Einstein". Dans cet état, tous les bosons se retrouvent dans le même état.

Les paramètres et jouent le même rôle que dans la distribution de Maxwell-Boltzmann et Fermi-Dirac.
Nous avons ainsi :

et (32.135)

Le nombre de bosons est alors donné par:

(32.136)
à comparer avec le nombre de fermions au même niveau d'énergie (fonction de Fermi-Dirac):

(32.137)

Ainsi, en mécanique quantique, la statistique de Bose-Einstein désigne la distribution statistique de bosons


indiscernables (tous similaires) sur les états d'énergie d'un système à l'équilibre thermodynamique.

Pour les systèmes macroscopiques, les niveaux d'énergie sont si serrés (ou tellement nombreux) que nous
pouvons considérer le spectre d'énergies comme continu (approximation du continuum).

Nous raisonnerons donc dans ce contexte, ce qui nous permet d'écrire en normant aux nombres de particules
mises en jeu (tout ce que l'on demande à la fonction c'est de nous dire comment sont réparties les N
particules):

(32.138)

pour la fonction de Bose-Einstein. Elle n'est donc définie que pour les énergies supérieures au potentiel
chimique (sinon quoi elle est négative!).

De manière numérique, nous pouvons simuler l'évolution de l'allure de la distribution en fonction de


l'énergie et de la température. Pour cela, nous supposons pour simplifier que la constante de Boltzmann vaut
1 et que le potentiel chimique m2 (nous notons que celui-ci est dans l'absolu fonction de la température).
Ainsi, nous pouvons écrire le petit programme suivant sous Matlab :

clear all;kb=1; % Constante de Boltzmann


mu=2; % Potentiel Chimique
T=0.001:0.1:1; % " Gradient " de température pour le programme
for j=1:length(T)
beta(j)=1/(kb*T(j));
epsilon=0.1:0.1:4;
for i=1:length(epsilon)
Nf(i,j)=1/(exp(beta(j)*(epsilon(i)-mu))-1); % Nb(epsilon,beta) moyen de fermions au
end % niveau d'énergie epsilon
hold on %
plot(epsilon,Nf(:,j));
pause(0)
end
(32.139)

À haute température, lorsque les effets quantiques ne se font plus sentir, la statistique de Bose-Einstein,
comme la statistique de Fermi-Dirac qui régit les fermions, tend vers la statistique de Maxwell-Boltzmann.
Aux basses températures, cependant, les statistiques de Bose-Einstein et de Fermi-Dirac en diffèrent et
diffèrent entre elles. Nous nous plaçons, par exemple, à température nulle : dans la première, nous attendons
alors que le niveau de plus basse énergie contienne tous les bosons, tandis que dans la seconde, les niveaux
de plus basse énergie contiennent fermions.

Par ailleurs, à température nulle (273.15 [°K]), la statistique de Bose-Einstein montre de manière évidente
que toutes les particules doivent occuper le même état quantique : celui de plus basse énergie. Ce
phénomène est observable à l'échelle macroscopique et constitue un "condensat de Bose-Einstein".

La statistique de Bose-Einstein est utile à la compréhension des phénomènes électromagnétiques ondulatoire


car les photons sont des Bosons (rayonnement du corps noir, interaction matière/rayonnement). Elle est très
largement utile à l'étude des phénomènes vibrationnels dans les solides (les phonons suivent la statistique de
Bose-Einstein). Elle a aussi été utilisée pour expliquer les transitions de phase dans l'Hélium (phénomène à
très basse température).

Remarque: La statistique de Bose-Einstein a été introduite par Satyendranath Bose en 1920 pour les photons
et généralisée aux atomes par Albert Einstein en 1924.

LOI DE FICK

Nous avons vu dans le chapitre de Thermodynamique la démonstration de l'équation de propagation de la


chaleur proposée par Fourier en 1822 obtenue à partir de l'équation de continuité. Nous avions obtenu (il est
très recommandé au lecteur de s'y référer à nouveau ne serait-ce que pour lire les remarques relatives à la
démonstration):

(32.140)

En sa basant sur les mêmes hypothèses que Fourier, Fick proposa en 1855 qu'un flux de particules pourrait
se diffuser à travers un matériau selon une loi similaire, la "deuxième loi de Fick", de la forme:

(32.141)

où la constante de proportionnalité est le "coefficient de diffusion de la matière" et la densité de


particules par unité de volume (et non la densité de masse!).
Remarque: En pratique, la diffusion joue un rôle essentiel dans la fabrication de céramique, de semi-
conducteurs (dopage), de cellules-solaires et dans la solidification des métaux (traitement au carbone et à la
chaleur). Car lorsque deux matériaux chauffés sont mis en contact, leurs atomes diffusent l'un dans l'autre.

Il faut comprendre que tout diffuse dans tout! Donc pensez aux pesticides sur les fruits et légumes, à la
pollution dans les nappes phréatiques, au PET dans les boissons...

Dès lors, la relation du flux surfacique de chaleur que nous avions utilisée en thermodynamique (voir
chapitre du même nom) pour obtenir la loi de Fourier et qui était:

(32.142)

peut alors s'écrire certainement aussi (nous allons le démontrer) dans la cas de la masse sous la forme d'un
flux surfacique de particules appelé "première loi de Fick":

(32.143)

où D est le coefficient de transport de la matière (à déterminer...).

Remarque: Au fait, Fick démontra d'abord la première loi et en procédant en tous points de manière
identique à l'équation de la chaleur il obtint la deuxième loi qui porte son nom.

Les coefficients sont appelés globalement "coefficients de transports" et respectivement "coefficient de


diffusion thermique" dans le domaine de la chaleur et "coefficient de diffusion" dans le domaine de la
matière.

Nous pouvons estimer les valeurs de ces coefficients à l'aide d'un modèle microscopique simple.

Considérons pour cela une tranche de fluide (flux de chaleur et flux de masse sont considérés comme un
fluide) perpendiculaire à l'axe des x et d'épaisseur où correspond au libre parcours moyen (projeté
selon x), dans laquelle existe un gradient de concentration dirigé selon l'axe x. Déterminons le courant de ce
gradient à travers la section S d'abscisse x.

Pour faire simple, nous pouvons considérer que, parmi toutes les particules se trouvant entre l'abscisse
et x, un tiers, ont leur vitesse dirigée selon x (les deux autres tiers étant sur y et z), et parmi ces
dernières, la moitié a une vitesse positive (finalement nous devons considérer le 1/6 par direction).

Comme est le libre parcours moyen, ces dernières particules franchiront la section S sans avoir subi de
collision: elles participeront donc au courant de diffusion.

Notant la concentration volumique à l'abscisse (et considérant que cette concentration est
constante entre et x, ce qui, vu l'ordre de grandeur de , est à peu près vérifié). Le nombre de
particules se trouvant entre les abscisses et x et traversant effectivement la section s vaut alors:

(32.144)
Cette traversée prend un temps égal à , où est la vitesse moyenne d'agitation thermique. Par
conséquent, la densité de courant circulant de la gauche vers la droite vaut:

(32.145)

En procédant de la même manière pour les particules se trouvant à droite de x, nous obtenons pour la densité
de courant circulant de droite à gauche:

(32.146)

La densité de courant totale circulant à travers S vaut donc:

(32.147)

Or, nous pouvons aussi écrire cela sous la forme:

(32.148)

Si est très petit, nous pouvons écrire:

(32.149)

Vu les simplifications apportées au modèle, le facteur 3 a toutes les chances d'être peu réaliste. En revanche,
la relation de proportionnalité entre gradient de concentration et courant de diffusion est tout à fait crédible,
Nous écrirons finalement en généralisant à l'espace:

(32.150)

où D est alors donné par:

(32.151)

est la constante de diffusion massique. Comme D est positive, nous constatons que le mouvement de
diffusion des particules a lieu dans le sens opposé au gradient, ce qui tend bien à homogénéiser les
concentrations.

Remarque: Si nous souhaitons obtenir le flux de charge, il suffit de multiplier la relation obtenue à
gauche et à droite par la charge élémentaire.

Nous pouvons également estimer le flux d'énergie thermique transporté par ces mêmes particules selon x. En
effet, dans chaque tranche de fluide, n particules transportent chacune une énergie E correspond à une
quantité de chaleur Q donnée (selon la loi de Joule). Nous avons donc un flux surfacique d'énergie dont
la première composante est donnée par le même type de bilan que les développements précédents:
(32.152)

Nous y trouvons immédiatement la définition de la capacité calorifique (si nous divisons par la masse nous
aurions la capacité calorifique massique selon ce que nous avons vu dans le chapitre de Thermodynamique).
Ainsi, dans le cas unidimensionnel:

(32.153)

Il y a donc un simple rapport de proportionnalité entre et C.

Remarque: Selon les auteurs le flux est noté avec le symbole de la densité de courant, soit .

Faisons un petit tableau récapitulatif pour les quelques lois de diffusion démontrées jusqu'à maintenant sur
ce site (dans leurs chapitres respectifs) en utilisant la notation la plus courante en physique (et non celle des
thermodynamiciens...):

Loi de Fourier Loi de Fick Loi d'Ohm


Thermodynamique Mécanique Statistique Électrocinétique

Densité de courant thermique Densité de courant Densité de courant électrique


T : température particulaire : concentration U: potentiel électrique
: conductivité thermique D: coefficient de diffusion : conductivité électrique
flux thermique: flux de particules: flux de courant électrique:

Tableau: 321 - Similitudes des différentes lois de diffusion en physique

MOUVEMENT BROWNIEN

Le mouvement brownien est une description mathématique du mouvement aléatoire d'une petite impureté
organique ou non immergée dans un fluide et qui n'est soumise à aucune autre interaction que des chocs
avec les petites molécules du fluide environnant. Il en résulte un mouvement très irrégulier de la grosse
particule, qui a été décrit pour la première fois en 1827 par le botaniste Robert Brown en observant des
mouvements de particules à l'intérieur de grains de pollen:
(32.154) Source: Wikipedia

L'origine du mouvement dû aux molécules n'était pas du tout évident au début du 19ème siècle car:

1. Il n'était pas encore communément admis que la matière était simplement discontinue et donc composée
de molécules.

2. On ne comprenait pas même en admettant l'aspect moléculaire de la matière que quelques molécules
soient capables de déplacer des impuretés plusieurs millions de fois plus grande que celles des molécules du
fluide.

3. Même si on admettait l'aspect moléculaire, on ne comprenait pas qu'une très grande quantité de chocs de
milliards de molécules ne s'annulent pas entre eux et que l'impureté soit finalement immobile (on verra que
cela est dû au fait que la matière n'est pas continue).

Le traitement mathématique du problème utilisant l'aspect moléculaire et statistique de la matière a été une
affirmation pour les scientifiques partisans de l'aspect atomique de la matière et ouvrit encore une fois la
porte au nouveau domaine de la mécanique statistique déjà un peu utilisée à l'époque par Maxwell dans le
cadre des gaz.

Comme toujours il existe plusieurs modèles mathématiques et suivant la tradition du site web nous avons
choisie la plus simple et... ce n'est pas celle d'Einstein mais de Langevin (effectuée deux ans après dans un
souci de simplification).

Le point de départ est le théorème d'équipartition de l'énergie cinétique (cf. chapitre de Mécanique des
Milieux Continus):

(32.155)

soit pour une particule:


(32.156)

avec pour rappel v qui est la vitesse moyenne! Si nous simplifions l'analyse que dans un axe de translation
possible la relation devient (nous spécifions maintenant qu'il s'agit de la moyenne afin de ne pas nous
mélanger les pinceaux avec la suite):

(32.157)

En écrivant ceci nous stipulons donc qu'une particule en suspension dans un fluide en équilibre thermique
possède, dans la direction x par exemple une énergie cinétique moyenne égale à celle d'une molécule
gazeuse de nature quelconque, dans une direction donnée, à la même température. Il s'agit donc à nouveau
d'une identité forte entre les solutions diluées et le gaz parfaits.

Une particule comme celle que nous considérons, grande par rapport aux molécules du liquide, et se
mouvant à la vitesse v par rapport à celui-ci subit comme nous l'avons pseudo-démontré dans le chapitre de
Mécanique Des Milieux Continus (loi de Stokes) une résistance de:

(32.158)

où sera appelé "coefficient de friction" (correspondant donc à la viscosité).

Maintenant, écrivons selon l'équation de la dynamique de Newton (on ne spécifie plus que la vitesse est
selon x dans la notation qui suit):

(32.159)

la force complémentaire , introduite par Langevin, est aléatoire (stochastique). On sait à priori peu de
choses d'elle, si ce n'est qu'elle semble à priori indifféremment positive ou négative, et que sa grandeur est
telle qu'elle maintient l'agitation de la particule, qui, sans elle, finirait par s'arrêter sous l'effet de la résistance
visqueuse.

L'équation précédente multipliée par x, peut s'écrire encore:

(32.160)

Or, rappelons que (cf. chapitre de Calcul Différentiel Et Intégral):

(32.161)

d'où:

(32.162)
En établissant cette dernière relation, nous avons aussi montré que:

(32.163)

Nous pouvons alors écrire:

(32.164)

et aussi:

(32.165)

Si nous prenons la moyenne (nous changeons de notation pour la moyenne car la barre n'est pas très adaptée
esthétiquement parlant lorsqu'il y a des puissances):

(32.166)

Nous posons maintenant que:

(32.167)

en d'autres termes nous pouvons voir cela comme le travail moyen la force aléatoire est nulle.

Il reste alors:

(32.168)

Posons:

(32.169)

Nous avons alors:

(32.170)

Et comme:

(32.171)

Donc:
(32.172)

Soit autrement écrit:

(32.173)

Il s'agit donc d'une équation différentielle à coefficient constants d'ordre 1. Nous avons démontré dans le
chapitre de Calcul Différentiel Et Intégral la solution homogène était:

(32.174)

où la valeur de C nous importe peu car ce terme va de toute façon disparaître dans les développements qui
vont suivre. La solution particulière peut être déterminée simplement par la contrainte au temps zéro:

(32.175)

Soit après dérivation et avoir posé donne:

(32.176)

Une solution triviale simple est alors:

(32.177)

Nous avons alors:

(32.178)

Or après très peu de temps le terme en exponentielle devient quasiment nul. Nous avons donc en régiment
permanent:

(32.179)

Soit:

(32.180)
où D est appelé "coefficient de diffusion" (comme en thermodynamique). Nous remarquons dès lors que la
position moyenne de la distance x parcourue est in extenso proportionnelle à la racine carrée du temps.

La relation:

(32.181)

est parfois appelée "relation de Sutherland-Einstein" (car William Sutherland l'a découvert en Australie
pratiquement au moment où Einstein écrivait cette même relation dans sa thèse).

La méthode de Langevin redonne le même résultat que le premier modèle proposé par Einstein deux ans
plus tôt et que le deuxième modèle deux ans plus tard.

On peut se demander jusqu'à quel point la relation de Sutherland-Einstein prouve l'existence de molécules.
Autrement dit, que serait la limite du coefficient de diffusion D si la nature était continue, c'est-à-dire si le
nombre d'Avogadro était infini?

Nous pressentons bien évidemment alors que D s'annulerait, et que le déplacement de diffusion brownien
disparaîtrait tout simplement dans cette limite. Autrement dit, le mouvement brownien cesserait
immédiatement si la Nature était continue! Ce qui est un résultat remarquable de preuve de l'aspect discret
de la nature!
33. THERMODYNAMIQUE

L a "thermodynamique" est la partie de la physique qui traite des relations permettant de déterminer
formellement les échanges (variations) d'énergie sous forme de travail mécanique et de chaleur dans le cadre
de l'étude de transformations des 4 états de la matière (mais principalement des gaz parfaits dans le cadre
scolaire) sous la base d'hypothèses simplificatrices entre un système (isolé, ouvert ou fermé) et son
environnement extérieur.

Les objectifs principaux de la thermodynamique sont:

1. Avec un minimum de variables de pouvoir déterminer l'état et les échanges énergétiques d'un système
sous des contraintes prédéfinies et souvent considérées comme idéales... (il y a peu près une différence de
5% entre les valeurs théoriques et celles mesurées)

2. De trouver les "variables d'état", telles que ces différentes informations puissent être obtenues en ne
connaissant dans l'idéal que l'état final et initial du système.

3. De se débrouiller à ramener les équations toujours à une forme mettant en évidence des variables
(variations) facilement mesurables dans la pratique.

Nous verrons plus loin que tout système peut au point de vue énergétique être décrit par:

- Son volume, sa masse, sa pression, sa température,...

- Son énergie potentielle, son énergie cinétique, son potentiel chimique,...

- Ses propriétés physiques comme la capacité à absorber la chaleur, à irradier, ...

VARIABLES THERMODYNAMIQUES

En thermodynamique il existe plusieurs concepts majeurs très utiles suivant le type de système maintenu ou
laissé en libre évolution étudié et les moyens de mesure à disposition.

Nous souhaitons ici donner les définitions des plus importantes et nous démontrerons si possible leur
provenance plus tard sachant qu'il est très difficile d'avoir une présentation purement linéaire de la
thermodynamique.

Définitions:

D1. Un "système" est un corps ou un groupe de corps subissant ou non des évolutions et qui constitue un
ensemble bien défini et bien délimité dans l'espace et entouré par le milieu extérieur. L'ensemble
système/milieu extérieur est dénommé "univers".

D2. Le "travail", noté W , est l'énergie associée à la valeur ou au changement de la dynamique d'un système
par l'agissement de forces mécaniques diverses (d'où le choix du terme "travail"...).

D3. La "chaleur", notée Q, est l'énergie associée à la valeur ou au changement de la dynamique d'un système
dû à l'agitation moyenne des molécules (énergie cinétique moyenne).

D4. "L'énergie totale" d'un système, notée E, est la somme de toutes les énergies qui spécifient ce système
par rapport à son centre de masse (moment d'inertie, de masse, énergie cinétique interne,...) et aussi (!) par
rapport à un référentiel extérieur (énergie cinétique, énergie potentielle, rayonnement entrant).
D5. "L'énergie interne" d'un système, notée U, est la somme de toutes les types d'énergies internes qui le
distinguent uniquement par rapport à son centre de masse tel que le travail W échangé avec l'extérieur, la
chaleur Q échangée (énergie cinétique moyenne interne), l'énergie de masse (relativiste, nucléaire), le
moment d'inertie...

D6. "L'entropie", notée S, permet de quantifier la qualité et le sens d'évolution de l'énergie d'un système.
Nous démontrerons que l'entropie d'un système isolé ne peut que croître.

D7. "L'enthalpie", notée H, est la quantité de chaleur, reçue par un système qui évolue à pression constante
(isobare). En chimie ce concept est très utile car dans une transformation chimique une partie de l'énergie
injectée aura juste servie à repousser l'atmosphère ambiante lors du changement de volume dans la
transformation. Ainsi, l'enthalpie rajoute à l'énergie interne U un terme correctif prenant en compte l'énergie
emmagasinée/perdue par la pression environnante qui compresse le système (s'il est compressible...).

D8. "L'énergie libre" ou "énergie de Helmholtz", notée F, caractérise la fraction d'énergie interne utilisable.
Elle est simplement la différence entre l'énergie interne et l'énergie calorique dissipée à cause de l'entropie à
une température donnée.

D9. "L'enthalpie libre" ou "énergie libre de Gibbs", notée G, caractérise la fraction d'enthalpie disponible.
Elle est simplement la différence entre l'enthalpie et l'énergie calorifique dissipée à cause de l'entropie à une
température donnée.

Pour résumer, dans l'ordre d'apparition et d'importance nous avons les types d'énergie suivant:

Symbole Légende
W travail
Q chaleur
P pression
T température absolue
V volume
E énergie totale
U énergie interne
S entropie
H enthalpie
F énergie libre
G enthalpie libre
Tableau: 331 - Différentes grandeurs thermodynamiques

Indiquons que nous ne reviendrons pas sur le concepte de température T qui est comme nous l'avons vu en
Mécanique Des Milieux Continus (théorème du Viriel) et en Mécanique Statistique (rayonnement du corps
noir), un paramètre qui permet de relier avantageusement le mouvement moyen de différents corps avec leur
énergie cinétique moyenne (sous-entendu leur "excitation" ou "désordre") ou respectivement le rayonnement
de certains corps avec leur énergie d'émission. Mais rappelons quand même l'origine du zéro Kelvin car c'est
une question redondante sur le web:

Nous avons démontré dans le chapitre de Mécanique des Milieux Continus qu'à pression P constante
(système "isobare"), le volume d'une quantité fixée de gaz parfait est proportionnel à la température absolue.
C'est la "loi de Gay-Lussac" (dans le cas des gaz parfaits...!):

(33.1)
et nous y avons alors mentionné que les mesures expérimentales donnent alors une droite, qui extrapolée (un
peu brutalement...) dans les valeurs négatives de la température en Celsius donne un volume nul pour un gaz
parfait (en négligeant les aspect quantique à cette frontière...) à une température systèmatiquement de -
273.15 [°C] :

(33.2)

d'où le choix confortable de poser le 0 [°K] à cette valeur et de redéfinir une nouvelle échelle de
température.

Par ailleurs, une difficulté est de parler de variation de température lorsque par exemple nous étudions la
sensibilité de l'eau a passer de la phase gazeuse à la phase liquide. Nous observons effectivement
expérimentale qu'il suffit dans des conditions idéales de laboratoire de passer de -0.1 °C à +0.1 °C pour
observer le passage de changement qualitatif de l'eau de l'état solide à liquide. Parler alors de sensibilité en
% de température est difficile avec l'échelle traditionelle dans le cas présent. Mais si nous parlons en échelle
absolue alors cela correspond au passe d'une température de 273.05 à 273.25 [°K], soit une sensibilité de
transitiation de phase pour l'eau de 0.1% en température autout de sont point de fusion.

SYSTÈMES THERMODYNAMIQUES

D'une manière générale, un système thermodynamique est l'ensemble des corps situés à l'intérieur d'une
surface fermée imaginaire et souvent considérée comme extensible sans perdition d'énergie que nous
appelons "frontière".

La frontière peut aussi sous indication de ses caractéristiques être matérielle!

Signalons que la frontière peut se limiter à une surface élémentaire dS associée avec son vecteur normal
enveloppant une particule fluide (voir le chapitre de Génie Météo pour un bon exemple!). Nous l'appelons
dans ce cas "frontière particulaire".

Il est souvent intéressant en thermodynamique, de faire le bilan des énergies qui sont transférées entre le
système thermodynamique et le milieu extérieur, c'est-à-dire de considérer tout ce qui traverse la frontière.

Les principaux transferts (mais pas les seuls!) susceptibles d'être opérés sont:

1. Le "transfert-travail" W : Travail (mécanique) macroscopique ordonné effectué par une force sur une
distance. Quand aucun transfert-travail (énergie) n'est opéré à l'échelle macroscopique, le système est dit
"système sans travail".
2. Le "transfert-chaleur" Q : Énergie provenant de la variation du nombre de micro-états à l'échelle
microscopique. Quand aucun transfert-chaleur (énergie) n'est opéré à l'échelle microscopique, le système est
dit "système adiabate".

3. Le "transfert de masse" M : Masse injectée dans de le système. Quand aucun transfert de masse n'est
opéré, le système est dit "système fermé".

Définitions:

D1. Un "système isolé" ne peut échanger ni travail, ni chaleur, ni masse avec le milieu extérieur.

D2. Un "système ouvert" peut échanger du travail, de la chaleur et de la masse avec le milieu extérieur.

D3. Un "système fermé" peut échanger du travail et de la chaleur mais pas de matière avec le milieu
extérieur.

Remarques:

R1. Certains systèmes voient le bilan des actions extérieures qui leurs sont appliquées nul. Ils sont alors dit
"pseudo-isolés".

R2. Nous parlons de "système homogène" si la nature de des constituants est égale en tout point, alors qu'il
est un "système uniforme" ou "système isotrope" si ses caractéristiques sont égales en tout point.

TRANSFORMATIONS THERMODYNAMIQUES

Une "transformation thermodynamique" est l'opération au cours de laquelle l'état du système se modifie en
passant d'un état initial à un état final.

Nous en distinguons au moins de deux types:

1. La "transformation thermodynamique quasistatique" qui amène un système d'un état initial à un état final
à travers une succession d'états qui sont exclusivement des états d'équilibre.

2.. Les transformations où toutes les variables d'état changent simultanément appelées "transformations
polytropiques".

Il est possible que certaines variables restent constantes lors d'une transformation thermodynamique, dans ce
cas nous utilisons une dénomination bien spécifique:

Symbole Légende Dénomination


P pression isobare
T température isotherme
V volume isochore
U énergie interne isoénergétique
S entropie isentropique
H enthalpie isenthalpique
Q chaleur adiabatique
G enthalpie libre extensive
Tableau: 332 - Dénomination des grandeurs constantes
Remarque: Les études isobares sont d'un intérêt pratique important puisque tous les systèmes en contact
avec l'atmosphère sont souvent, à l'équilibre, naturellement ou de manière forcée à pression constante (c'est-
à-dire à la même pression que l'atmosphère environnante!) dans les laboratoires.

Nous distinguons également deux cycles de transformations thermodynamiques principaux qui sont:

1. Le "cycle thermodynamique fermé" : le système décrit une suite de transformations telle que l'état final et
l'état initial de la transformation est identique et que la quantité et les propriétés des éléments participants au
cycle sont toujours les mêmes.

2. Le "cycle thermodynamique ouvert" : le système décrit une suite de transformations telle que l'état final et
l'état initial de la transformation est identique et que la quantité et les propriétés des éléments participants au
cycle ne sont pas toujours les mêmes

VARIABLES THERMODYNAMIQUES

Définition: "L'état thermodynamique" d'un système est l'ensemble des propriétés qui le caractérisent,
indépendamment de la forme de sa frontière. Les variables qui décrivent l'état du système en ne connaissant
que l'état final et initial de celui-ci sont appelées principalement "fonctions d'état" ou fréquemment
"variables d'état" et encore parfois "grandeurs d'état"....

Remarque: Certaines fonctions d'état jouent un rôle particulier dans la définition des états d'équilibre d'un
système. Ce sont des grandeurs accessibles, à l'échelle macroscopique, directement ou indirectement grâce à
des instruments de mesure. Ces fonctions d'état particulières (comme la pression, la température, le volume,
etc.) sont appelées "variables d'état d'équilibre d'un système thermodynamique".

La définition précédente suppose implicitement l'existence d'un état et des variables d'état, c'est-à-dire que
les grandeurs caractéristiques du système sont définies (ou théoriquement accessibles dans le sens de la
mesure) à tout instant et en tout point du système. Ceci est loin d'être évident si nous considérons des
évolutions rapides telles que chose ou explosions.

Cette difficulté peut être éludée en se retranchant sur "l'hypothèse de l'état local" : Nous supposons qu'à tout
instant, les grandeurs caractéristiques ont localement les mêmes expressions que dans une configuration
stationnaire, ce qui sous entend que les temps nécessaires aux changements d'état sont négligeables devant
les durées caractéristiques de l'évolution.

Le choix des variables d'état dépend de la nature du problème traité. Nous pouvons néanmoins séparer
l'ensemble de ces variables d'état en :

1. Des variables d'état dites "grandeurs extensives", proportionnelles à la quantité de matière et donc du
nombre d'atomes/molécules du système servant à les définir (donc elles sont additives). C'est typiquement le
cas de la masse, le volume, l'entropie,...

2. Des variables d'état dites "grandeurs intensives", indépendantes de la quantité de matière (donc par
extension, non additives). C'est typiquement le cas de la pression, la température, ...

D'une manière générale, une variable intensive dépend du point envisagé dans le système étudié
(température, concentrations, peuvent varier d'un point à l'autre) alors que la grandeur extensive est définie
sur la globalité du système.

Montrons maintenant avec un exemple particulier que le rapport de deux variables extensives est une
grandeur intensive. Pour cela, rappelons la loi des gaz parfaits (cf. chapitre de Mécanique Des Milieux
Continus):

(33.3)
Nous pouvons calculer la concentration C (à ne pas confondre avec la notation de la capacité calorifique que
nous verrons plus loin!), qui est donc une grandeur intensive, par le rapport de deux grandeurs extensives n,
V:

(33.4)

Les variables d'état possèdent par ailleurs une propriété particulière : leurs variations ne dépendent pas de la
nature de la transformation qui affecte le système mais uniquement de l'état final et initial du système à
l'équilibre (ce qui est très utile en pratique...!). Il s'agit du concept d'intégrale de chemin que nous avons déjà
traité en détails dans le chapitre de Mécanique Classique et de Calcul Différentiel et Intégral.

Citons les grandeurs extensives et intensives les plus courantes en thermodynamique:

Symbole Légende Grandeur


P pression intensive
T température intensive
V volume extensive
E énergie totale extensive
U énergie interne extensive
S entropie extensive
H enthalpie extensive
F énergie libre extensive
G enthalpie libre extensive
Tableau: 333 - Grandeurs extensives et intensives courantes

A l'opposée, le travail W et la chaleur Q ne sont pas des variables d'état car elles dépendent de la nature de la
transformation. Néanmoins il existe des cas particuliers où la chaleur et le travail ne dépendent plus du
chemin suivi lorsque les transformations s'effectuent soit à pression constante, soit à volume constant (nous
verrons cela plus loin).

PHASES

Définition: Un système dans lequel les différentes grandeurs intensives varient de façon continue constitue
une "phase".

Nous pouvons donc considérer que toute grandeur intensive dépend des coordonnées du point envisagé : le
système est constitué par une seule phase si la grandeur intensive est continue dans tout le système. C'est le
cas des gaz, des liquides et de certains solides constituant des solutions solides.

Si la grandeur intensive présente une discontinuité (ou plusieurs), le système est dit "polyphasique".
Cependant, si les grandeurs intensives ont même valeur en tout point du système, la phase est dite "phase
uniforme" : le système a alors même température, pression, composition en chacun de ses points.

Pour un système homogène, il peut être commode de ramener les variables extensives à l'unité de masse.
Nous parlons alors de "grandeurs massiques" (ou "spécifiques"), généralement notées en minuscules.

Nous utilisons si possible pour éviter toute confusion les règles de notation suivantes :

- Toute grandeur non massique est représentée par une lettre latine majuscule
- Toute grandeur massique (très utilisée en chimie!) est représentée par une lettre latine minuscule

Dans le cas contraire nous spécifierons de quel type de variable il s'agit.

PRINCIPES DE LA THERMODYNAMIQUE

Les principes de la thermodynamique sont les briques de la mécanique énergétique ou thermique. Chaque
principe implique une grande quantité de concepts que nous essaierons de présenter et définir au mieux.
C'est la partie "sensible" de ce domaine de la physique.

La thermodynamique est basée sur quatre principes fondamentaux (dont certains sont démontrables):

P0. Le "principe zéro de la thermodynamique" ou "principe de l'équilibre thermique" est définie par le fait
que si deux systèmes thermodynamiques 1 et 2 sont en équilibre thermodynamique avec un troisième 3, ils
sont eux-mêmes en équilibre thermodynamique (il s'agit d'une assertion dans le langage de la théorie de la
démonstration).

Donc si deux corps en contact sont en équilibre thermique, ils ont la même température. Deux corps à même
température en contact sont en équilibre thermique.

Remarque: Nous avons utilisé ce principe implicitement (lorsque nous avons énoncé que l'état d'équilibre
était le plus probable) dans le chapitre de Mécanique Statistique pour démontrer la loi de Boltzmann.

P1. Le "premier principe de la thermodynamique" ou "principe de conservation" concerne le caractère


conservatif de l'énergie et énonce qu'au cours d'une transformation quelconque d'un système, la variation de
son énergie totale est à la somme des variations de tous les types d'énergie le définissant:

(33.5)

Si le système est isolé la varition d'énergie totale sera bien évidement toujours nulle!

Bien évidemment, lorsque le système étudié (le conteneur et son contenu) considéré est dans le même
référentiel que l'observateur il ne nous reste plus que le terme de variation d'énergie interne:

(33.6)

reste à déterminer l'expression exacte de la variation d'énergie interne U et des variables dont elle dépend
(développements que nous ferons un peu plus loin).

Remarque: Ce principe est démontrable si nous acceptons le théorème de Noether (cf. chapitre Principes)
d'invariance dans le temps dans des lois de la physique comme un principe supérieur.

P2. Le "deuxième principe de la thermodynamique" appelé aussi "principe de Carnot-Clausius" ou encore


"principe d'évolution" concerne le caractère d'irréversibilité et est associée au concept d'entropie. Ce
principe énonce que la chaleur ne peut passer d'elle-même que d'un corps chaud à un corps moins chaud (ou
qu'un corps va inexorablement refroidir). L'opération inverse nécessitant l'apport de travail mécanique pris
sur le système extérieur ce qui est donné par la relation (démontrée un peu plus loin):

(33.7)

Le terme à gauche de l'égalité nous dit que l'entropie de peut qu'augmenter et que pour cela, l'échange de
quantité chaleur avec le système extérieur est toujours positife (numérateur du terme de droite de l'égalité).
Donc le corps fournit de la chaleur au système extérieur et refroidit inexorablement.
Remarque: Nous démontrerons à peu près.... cette relation plus loin en utilisant la loi de Boltzmann sur
l'accès à l'information dans un système vue dans le chapitre de Mécanique Statistique.

P3. Le "troisième principe de la thermodynamique" ou "principe de Nernst" concerne les propriétés de la


matière dans le voisinage du zéro absolu et énonce qu'à la limite du zéro absolu, température qui ne saurait
être atteinte (cf. chapitre de Physique Quantique Ondulatoire), l'entropie d'équilibre d'un système tend vers
une constante indépendante des autres paramètres intensifs, constante qui est prise nulle.

Démonstration: Il s'agit du "théorème de Nernst" dont le résultat formel est simplement basé sur le
deuxième principe donnant l'entropie (cf. chapitre de Mécanique Statistique):

(33.8)

Nous voyons que si nous considérons un cristal à la température du zéro absolu, la position des particules,
les unes par rapport aux autres est parfaitement définie de façon unique. Par conséquent, il n'y a qu'une seule
complexion possible pour un cristal au zéro absolu. Le nombre de complexions est donc égal à 1. Ce qui
entraine que:

(33.9).

Rappelons que le "zéro absolu" est la température la plus basse accessible théoriquement en physique. A
cette température, une substance ne contient plus à l'échelle macroscopique, l'énergie thermique (ou chaleur)
nécessaire à l'occupation de plusieurs niveaux énergétiques microscopiques (cf. chapitre de Mécanique
Statistique). Les particules qui la composent (atomes, molécules) sont tous dans le même état d'énergie
minimale (état fondamental). Cela se traduit par une entropie nulle due à l'indiscernabilité de ces particules
dans ce même niveau d'énergie fondamentale (selon le troisième principe de la thermodynamique) et par une
totale immobilité au sens classique selon le théorème du Viriel.

Cependant, au sens quantique, nous avons vu dans le chapitre de Physique Quantique Ondulatoire que les
particules possèdent toujours une quantité de mouvement non nulle d'après les relations d'incertitudes de
Heisenberg et que selon les distributions de Fermi-Dirac et de Bose-Einstein (cf. chapitre de Mécanique
Statistique), qu'il y a quand même différents niveaux d'énergie lorsque nous prenons en compte le principe
d'exclusion de Pauli. D'où l'émergence de la thermodynamique quantique.

CAPACITÉS CALORIFIQUES

Dans une transformation donnée, un apport de chaleur se traduit en général par une élévation de la
température du système.

Définition: Nous appelons "capacité calorifique" (ou "capacité calorique", ou encore "capacité thermique"
ou enfin "chaleur spécifique"....) C du système, la quantité :

(33.10)

La capacité calorifique est donc de par ses unités, l'énergie qu'il faut apporter à un corps pour augmenter sa
température de 1 degré Kelvin. C'est une grandeur extensive (plus la quantité de matière est importante plus
la capacité thermique est grande).

Dans le cas d'un gaz parfait, nous admettrons que la totalité de la chaleur échangée (énergie) est mise sous
forme d'énergie cinétique des atomes ou molécules (énergie thermique), donc nous pouvons alors écrire:
(33.11)

et nous démontrerons plus loin comment déterminer exactement la valeur de cette capacité pour de tels gaz.

Remarque: Cette capacité n'est pas constante. Elle dépend bien évidemment elle-même de la température et
du matériaux/fluide considéré défini par le nombre de degrés de libertés qui change en fonction des
atomes/molécules (ce qui explique la différence de capacité calorifique entre les gaz monoatomiques et les
autres).

En thermodynamique, il faut aussi toujours préciser quelle est la transformation considérée car dépend
de la nature de la transformation. Nous distinguerons en particulier la capacité calorifique à volume constant
(isochore) notée:

(33.12)

et la capacité calorifique à pression constante (isobare) souvent utilisée en chimie et notée:

(33.13)

La différence entre la chaleur spécifique à pression constante et la chaleur spécifique à volume constant tient
évidemment au travail qui doit être fourni pour dilater le corps en présence d'une pression externe.

Il est alors assez intuitif que la chaleur spécifique à pression constantes est toujours strictement plus grande
que la chaleur spécifique à volume constant. Nous démontrerons d'ailleurs plus bas que nous avons même
précisément pour un gaz parfait:

(33.14)

Si au lieu de considérer le système entier, nous rapportons les mesures à une unité de masse (ce qui est
beaucoup plus utile en pratique!), nous définissons alors la "capacité calorifique massique" à volume
constant (isochore) :

(33.15)

et la capacité calorifique massique à pression constante (isobare) :

(33.16)

Si au lieu de considérer le système entier, nous rapportons les mesures à une mole du corps considéré (ce qui
est beaucoup plus utile en chimie!), nous définissons le "capacité calorifique molaire" à volume constant
(isochore) :

(33.17)
et la capacité calorifique molaire à pression constante (isobare) :

(33.18)

où n est le nombre de moles du système.

Nous avons donc bien évidemment par extension la relation très utile en pratique:

où c est la capacité calorifique polytropique massique.

Exemple:

Nous avons donc dans un système sans échange de travail mécanique mais uniquement de chaleur:

(33.19)

Or, la puissance est l'énergie divisée par le temps (cf. chapitre de Mécanique Classique). Il vient alors:

(33.20)

et si la capacité calorifique est donnée sous forme massique à pression constante:

(33.21)

Ce qui permet déjà de calculer la puissance à fournir pour chauffer une quantité de matière donnée à une
température donnée et un temps donné sans considérer de changement d'état sinon quoi il faut prendre en
compte la chaleur latente.

La fraction précédent peut aussi s'exprimer comme le débit volumique d'un fluide en multiplié
par la densité du fluide:

(33.22)

ce qui permet de savoir la puissance fournie par un débit d'eau entrant dans un radiateur à une certaine
température et sortant de celui-ci avec le même débit mais avec une autre température.

Nous retrouvons aussi cette relation parfois dans la littérature sous la forme suivant:

(33.23)

après avoir bien évidemment multiplié les deux côtés de l'égalité par le temps.

Dans certaines transformations, nous avons un apport ou un retrait de chaleur alors que la température du
système reste constante (par exemple dans les transformations de changement de phase d'un corps). Cela
provient d'un autre phénomène:
Définition: "L'enthalpie de changement d'état" ou "chaleur latente", notée L et donnée en joules par
kilogramme, correspond à la quantité de chaleur nécessaire à l'unité de quantité de matière ou de masse d'un
corps pour qu'il change d'état. C'est une valeur très importante en pratique pour effectuer des calculs.

Nous avons donc bien évidemment par extension la relation très utile en pratique:

(33.24)

qui donne donc la quantité de chaleur à fournir pour faire changer de phase une certaine quantité de masse m
(le signe de Q est alors par convention négatif). Inversement, si la quantité de matière revient à un niveau
d'énergie plus faible, cette quantité de chaleur latente sera donnée à l'environnement et non absorbée et le
signe de Q est alors positif!

Remarque: Pour le passage de l'état liquide à l'état de vapeur nous parlerons "d'enthalpie de vaporisation".

L'enthalpie échangée lors du changement d'état résulte de la modification (rupture ou établissement) de


liaisons interatomiques ou intermoléculaires. Il existe trois états physiques principaux pour tout corps pur:
l'état solide, l'état liquide et l'état gazeux. Les liaisons sont plus fortes dans l'état solide que dans l'état
liquide et ces liaisons sont quasi-absentes dans l'état gazeux. Il existe comme nous le savons déjà un
quatrième état obtenu à très haute température où la matière se trouve sous la forme d'un plasma d'ions et
d'électrons (cf. chapitre de Mécanique des Milieux Continus).

Nous différencions trois modes d'échange de chaleur :

1. La "convection" : fluide venant alternativement au contact d'un corps chaud et d'un corps froid
(phénomène typique des mouvements de l'atmosphère terrestre).

2. Le "rayonnement" : un corps à température donnée émet un rayonnement électromagnétique susceptible


d'être absorbé par un autre corps.

3. La "conduction" : le transfert d'énergie se produit des zones chaudes vers les zones froides par collision
des particules les plus excités (zone chaude) avec les particules voisines moins excitées et ainsi de suite de
proche en proche.

ÉNERGIE INTERNE

Dans le chapitre de Mécanique Classique, nous avons vu (deuxième théorème de König) que l'énergie totale
d'un corps par rapport à un référentiel galiléen extérieur R' au centre de masse était donnée par la somme de
l'énergie cinétique et potentielle par rapport à ce même référentiel, additionné de l'énergie cinétique et
potentielle de ce même corps par rapport au référentiel assimilé à son centre de masse R (référentiel
barycentrique).

Ce que nous écrivons sous la forme :

(33.25)

où U est la grandeur énergétique (énergie interne) propre au centre de masse du corps concerné.

Sous une forme plus simplifiée, la relation précédente s'écrit traditionnellement en thermodynamique :

(33.26)

Le deuxième principe de la thermodynamique s'écrit alors :


(33.27)

Donc l'énergie total est la somme des énergies mécaniques macroscopiques (cinétiques et potentielles) et
microscopiques (énergie interne).

En règle générale, les systèmes étudiés en thermodynamique sont globalement au repos ( ) par rapport
à l'expérimentateur et donc . De même, nous avons en général un champ de potentiel constant et
isotrope dans la chambre d'expérimentation ce qui implique .

En conséquence des ces simplification la loi de conservation de l'énergie, ou premier principe de la


thermodynamique, se réduit comme nous l'avons déjà mentionné à l'énergie interne tel que:

(33.28)

Remarque: L'énergie interne U n'est souvent donnée qu'à une constante additive près, c'est la raison pour
laquelle certains l'appelle à juste titre "surénergie interne". Comme nous l'avons démontré dans le chapitre
de Mécanique Classique, l'énergie totale d'un système, est la somme des énergies élémentaires de celui-ci.
Ainsi, l'énergie interne est une grandeur extensive.

Considérons maintenant un système décrit par les variables d'état thermodynamiques .

Dans une transformation élémentaire le travail élémentaire dW (si nous nous intéressons qu'à
cette forme d'énergie) se mettra sous la forme (cf. chapitre de Calcul Différentiel Et Intégral) :

(33.29)

si nous avons la relation suivante qui est satisfaite (qui sont les coefficients des dx):

(33.30)

Sinon, si cette relation n'est pas satisfaite, ce qui impliquerait:

(33.31)

alors dans ce dernier cas, nous avons une différentielle totale inexacte (la différentielle dépend donc du
chemin parcouru!) ce qui nous amènerait à écrire:

(33.32)

Dans la même transformation, la quantité de chaleur dQ se met sous une forme similaire :

(33.33)

si encore une fois la relation suivante est vérifiée pour les variables d'état:
(33.34)

ou sinon dans le cas contraire :

(33.35)

Selon le premier principe de la thermodynamique, si l'énergie est conservative alors nous avons pour
l'énergie interne d'un système fermé et isolé:

(33.36)

Ce qui implique que quelque soit la transformation, les variations de travail et de chaleur sont données à
l'intérieur de ce système conservatif par:

(33.37)

Donc quelque soient les façons dont les transformations se font à l'intérieur du système, l'état final et initial
sont identiques en termes énergétiques. Ce qui nous impose que les transformations thermodynamiques sont
indépendantes de la manière dont les phénomènes ont lieu à l'intérieur de celui-ci. est alors une
différentielle totale exacte (cf. chapitre de Calcul Différentiel Et Intégral) que nous écrirons dU.

TRAVAIL DES FORCES MÉCANIQUES

Rappelons maintenant que nous avons vu dans le chapitre de Mécanique Classique que par définition, le
travail est donné par une force sur une distance (quelque soit l'origine de cette force : mécanique,
rayonnante, nucléaire, etc.). Il s'ensuite donc la relation très importante en thermodynamique:

(33.38)

qui exprime donc, à pression constante (isobare), la variation de l'énergie dû au travail des forces extérieures
de pression sur un système (généralement un gaz en thermodynamique...) dont le volume a varié (sans être
restreint par une frontière rigide!).

Bien évidemment, si la variation de volume est nulle ou la pression est nulle... la variation de l'énergie dû au
travail des forces de pression sera alors nul....

A l'équilibre, la pression P est prise comme étant celle du système considéré (pression interne) soit celle de
l'atmosphère environnante puisque la pression est alors égale (sinon il n'y aurait pas équilibre...).

De même, la variation de volume est prise comme étant soit celle du système considéré (volume propre) soit
la variation de l'atmophère environnant puisque de toute manière la variation de volume sera la même pour
les deux!

De plus, nous voyons que le chemin intervient dans cette expression du travail et donc celui-ci est une
grandeur qui dépend du chemin parcouru (cf. chapitre de Calcul Différentiel Et Intégral). Ceci implique que
nous devons écrire au lieu de dW. Il existe bien sûr quantité d'autres manières d'exprimer le travail mais
par la définition de celui-ci même, il s'agira toujours d'une différentielle inexacte.

Ce résultat à une implication directe sur l'expression de la variation de chaleur pour laquelle le théorème du
Viriel (cf. chapitre de Mécanique des milieux continus), que celle-ci est donnée par son agitation thermique.
Il convient de rappeler que cette agitation est donnée par l'énergie cinétique moyenne et que l'énergie
cinétique existe de par l'application d'une force sur une distance pour chaque particule. Ainsi, la chaleur est
elle aussi une différentielle inexacte !

Finalement, nous avons dans le cas d'un fluide (liquide ou gazeux) ayant une variation d'énergie interne
polytropique:

(33.39)

Au cours de son évolution, le volume V du système peut donc varier. Si nous considérons une évolution
infiniment petite au cours de laquelle le volume varie de dV et si nous notons la pression extérieure subie
par le système, nous écrirons dans un cadre plus général (le signe négatif devant la pression est une
convention!) :

(33.40)

où est le travail dit de "refoulement extérieur" (si , l'augmentation du volume du système


exprime ainsi la fourniture d'un travail à l'environnement extérieur, ce qui explique le signe - indiquant que
l'énergie interne du système diminue) et où dT (à ne pas confondre avec une variation de température!!) est
une autre forme d'énergie (si le système est réactif au niveau chimique par exemple il peut fournir une
éventuelle énergie chimique aussi).

Sauf systèmes particuliers (piles, accumulateurs,...) la seule énergie échangée est le travail des forces de
pression de sorte que nous ayons plus que:

(33.41)

et alors nous pouvons à loisir écrire dW au lieu d'utiliser la différentielle inexacte puisque ce travail est
dépendant que d'une variable d'état (la notation dW étant souvent utilisée en physique dans ce cas)!

Par ailleurs la plupart des systèmes étudiés sont par hypothèse, à l'équilibre, à la même pression interne que
la pression extérieure (atmosphère environnante). Ce qui nous autorise dans ce cas particulier à écrire:

(33.42)

où P étant donc la pression dans et en dehors du système (le système est alors dit "isobare" comme nous le
savons déjà et plus rarement "monobare").

(33.43)

Dès lors, nous avons dans ce cas particulier:


(33.44)

La quantité de chaleur mise en jeu dans une transformation isochore (à volume constant) se réduit alors
bien évidemment à la variation de l'énergie interne tel que (attention à la notation traditionnelle qui peut
faire oublier que nous avons affaire à une variation de chaleur!):

(33.45)

Si nous considérons un système évoluant d'un état 1 vers un état 2 dans une atmosphère environnante
isobare (à pression constante) et donc que sa propre pression interne est à l'équilibre avec cette atmosphère,
nous avons alors le "travail des forces mécaniques à pression constante":

(33.46)

où si le système évolue d'un état 1 vers un état 2 dans un environnement isotherme. Nous avons alors le
"travail des forces mécaniques à température constante":

(33.47)

ENTHALPIE

Considérons le cas isobare très courant dans les laboratoires de chimie puisque les bechers sont ouverts à
l'atmosphère ambiante. Si nous ne considérons une telle situation, nous avons alors la variation d'énergie
interne :

(33.48)

où donc la pression P et le volume V sont les variables d'état internes au système étudié! Il est important de
remarquer à nouveau que si la variation de chaleur est nulle et que le volume interne augmente alors la
variation d'énergie interne U est alors négative, ce qui sera interprété par l'expérimentateur comme un
emprunt d'énergie au système extérieur et donc il est courant de parler de perte ou de réaction
endothermique!

La quantité de chaleur mise en jeu dans une transformation isobare (l'indice de est indiqué dans ce
sens... peut faire oublier que nous avons affaire à une variation de chaleur) est égale à la variation de deux
termes à forme identique:

(33.49)

où nous définissons donc un nouvelle fonction d'état commode, "l'enthalpie" H (grandeur extensive) dans
une transformation isobare comme donnée par:
(33.50)

où n est le nombre de moles internes au gaz parfait subissant le changement de volume! Nous voyons par
ailleurs que si la pression environnante est nulle, l'enthalpie est égale à l'énergie interne. Le fait qu'il y ait
des forces de pressions extérieures (ou intérieures) rajoute une énergie au système qui définit donc le
concept d'enthalpie!

La relation antéprécédente exprime donc le fait que lorsqu'un système évolue à pression constante, la
chaleure reçue (ou échangée par le système avec le milieu extérieur) est égale à sa variation d'enthalpie.

Il vient également avec cette définition un nouvelle écriture possible pour la capacité calorifique à pression
constante très fréquemment utilisée en chimie:

(33.51)

De manière plus explicite nous avons encore pour la relation antéprécédente en utilisant la loi des gaz
parfaits:

(33.52)

où pour rappel (cf. chapitre de Mécanique de Milieux Continus) le nombre de degrés de liberté ddl pour un
gaz parfait monoatomique est de 3. Le dernier terme de cette relation n'état évidemment pas valable pour les
fluides.

Parfois, nous écrivons évidemment également la définition de l'enthalpie sous la forme d'une variation tel
que:

(33.53)

dans le cas particulier d'application au domaines de validité des gaz parfaits (cf. chapitre de Mécanique Des
Milieux Continus) en ce qui concerne le dernier terme.

Il est important de se souvenir que le terme PV dans les relations précédentes représente le travail des forces
de pression de l'atmosphère environnante sur le système ou, par équivalence, respectivement du système sur
l'atmosphère environnante qui l'entoure. Mais la variable n est toujours le nombre de moles du gaz parfait du
système étudié et non pas de l'atmosphère environnante.

L'enthalpie est un concept énormément utilisée en chimie thermique (voir chapitre de même nom) et nous
l'utiliserons sans cesse lors de son étude.

Dans la pratique il est cependant difficile (voir impossible) de connaître l'énergie interne. Nous calculons
alors plutôt la relation suivante pour une mole (n valant alors 1) de gaz parfait:

(33.54)

qui est donc une valeur strictement positive donnant l'énergie (ou plutôt le surplus d'énergie) disponible dans
le gaz parfait à cause de la pression environnante (il n'y a qu'à poser la pression comme étant nulle pour le
voir!).
Exemple:

Prenons une unité de volume molaire de gaz parfait aux conditions normales de température et de pression
(quelque soit ce gaz parfait, son volume molaire sera dans ces conditions toujours de 24 litres selon la loi des
gaz parfaits!).

Le travail des forces de pression qui ont été nécessaires pour amener ce gaz parfait aux conditions
susmentionnées est alors de:

(33.55)

ou:

(33.56)

qui est donc l'énergie sous forme du travail des forces (mécaniques) de pression que nous pourrions
récuperer d'un volume molaire d'air.

L'énergie interne sous forme de chaleur ET de travail mécanique que nous pourrions en théorie récupérer (le
problème est de trouver comment...) de ce volume molaire est donné, pour un gaz monoatomique (voir plus
bas pour la démonstration), par:

(33.57)

et nous pourrions calculer aussi l'énergie interne de liaisons de électrons, et des noyaux des atomes... et
l'équivalence masse et énergie mais nous sortirions des cas industriel courants...

Pour l'eau, où nous ne pouvons utiliser que la première relation car la deuxième est valable que pour les gaz
parfaits, le volume molaire étant 1'000 fois plus petit, nous pouvons en tirer une énergie que 1'000 fois plus
petite (environ 2 [J]). Raison pour laquelle dans le cas des fluides, nous considérons qu'il n'y a aucune
différence entre l'enthalpie et l'énergie interne.

Voyons maintenant d'autres implications théoriques des quelques éléments vus précédemment qui nous
seront très utiles aussi bien en acoustique (cf. chapitre de Musique Mathématique) ou en mécanique des
milieux continus (voir chapitre du même nom).

ÉQUATION DE LAPLACE

Nous avons démontré dans le chapitre de Mécanique Des Milieux Continus avec le théorème du Viriel que
l'énergie interne (énergie cinétique) d'un gaz parfait monoatomique était donnée par:

(33.58)

Nous avons donc:

(33.59)
Si le processus est à volume constant, nous supposerons qu'il n'y aucun travail mécanique fourni (collisions
inélastiques sur les parois) et alors (nous utilisons les différentielles exactes parce que nous supposons que la
seule variable thermodynamique est la température!):

(33.60)

donc où dW est nul!

Il vient alors:

(33.61)

d'où pour une mole:

(33.62)

de sorte que nous pouvons écrire pour un gaz monoatomique parfait à volume constant:

(33.63)

Si le processus à lieu à pression constante (énergie cinétique constante des atomes du gaz) alors nous avons
(voir théorème du Viriel):

(33.64)

(les collisions qui repoussent la paroi du volume font perdre de l'énergie au système d'où le signe "-").

Ainsi:

(33.65)

Ainsi:

(33.66)

d'où pour une mole:

(33.67)

Des deux résultats précédents, nous obtenons pour un gaz parfait monatomique:
(33.68)

avec la "relation de Mayer":

(33.69)

Si le gaz parfait est diatomique, il y a 5 degrés de liberté (3 pour la position du premier atome +3 pour la
position du deuxième -1 pour la contrainte que la distance entre les deux est fixée) et nous avons alors:

(33.70)

En faisant les mêmes développements nous obtenons (valeur qui nous utiliserons dans le chapitre de
Musique Mathématique mais qui est utile dans de nombreux autres domaines):

(33.71)

Quand un système isolé de gaz parfait subit une transformation adiabatique à pression constante, la variation
d'énergie interne du système sera soutirée par la variation de travail interne. Ce qui traditionnellement se
note par un signe négatif tel que (en utilisant le résultat obtenu plus haut):

(33.72)

Soit:

(33.73)

Prenons maintenant l'équation des gaz parfaits (sans collisions) et différencions. Nous obtenons:

(33.74)

Soit en éliminant dT entre les deux dernières relations, nous obtenons:

(33.75)

Soit après simplification et réarrangement des termes:

(33.76)

ce qui rapporté aux quantités de moles s'écrit (selon l'habitude des chimistes):

(33.77)

bref... et en nous rappelant que:


(33.78)

Nous avons:

(33.79)

En utilisant la définition du "coefficient de Laplace", appelé aussi "coefficient adiabatique":

(33.80)

nous avons l'expression:

(33.81)

En remaniant:

(33.82)

Nous obtenons par intégration:

(33.83)

soit:

(33.84)

qui est équivalent en utilisant les propriétés des logarithmes:

(33.85)

Maintenant si nous dérivons par rapport à la variation de volume:

(33.86)

Si nous divisons par la masse:

(33.87)

il s'agit de "l'équation de Laplace" qui donne la relation entre pression et volume dans une transformation
adiabatique d'un gaz (ce qui ne signifie pas que la température est constante rappelons-le mais seulement
que l'échange de chaleur avec le système extérieur est nul ou négligeable!).

Ainsi nous avons aussi l'information qui peut être utile dans l'industrie:
(33.88)

COEFFICIENTS THERMOELASTIQUES

Si nous différencions V(P,T) nous avons (cf. chapitre de Calcul Différentiel Et Intégral):

(33.89)

ou autrement écrit:

(33.90)

Nous avons introduit de manière naturelle dans le chapitre de Musique Mathématique un coefficient nommé
"coefficient de compressibilité isotherme" :

(33.91)

que nous pouvons réintroduire ici:

(33.92)

De même il serait intéressant d'avoir un autre coefficient pour le premier terme qu'il suffirait de définir par
analogie:

(33.93)

appelé "coefficient de compressibilité isobare".

Ainsi, nous avons:

(33.94)

Soit nous avons le travail mécanique (la différentielle totale est inexacte car nous avons plus d'une variable
d'état) en multipliant par la pression pour avoir les bonnes unités:

(33.95)

Pour une transformation isotherme le premier terme est nul, et pour une transformation isobare, c'est le
second qui est nul.
Les données des coefficients thermoélastiques (mesurés expérimentalement) doivent permettre de remonter
à l'équation d'état par intégration de V(P,T), ce qui est licite, puisque V est une fonction d'état. Dans le cas du
gaz parfait par exemple, nous pouvons écrire par intuition des dimensions des constantes:

(33.96)

Nous avons donc:

(33.97)

et donc en multipliant par la pression:

(33.98)

Ce qui conduit à:

(33.99)

Soit:

(33.100)

Ce qui donne immédiatement après intégration:

(33.101)

Soit:

(33.102)

Ceci dit, nous avons différencié V pour obtenir deux coefficients à tels que:

(33.103)

Nous pourrions faire de même pour la pression et la température et nous avons alors au total trois relations:

(33.104)
mais parmi les 6 facteurs que nous voyons dans ces trois relations, quatre sont déjà définis (certains sont
l'inverse des coefficients définis plus haut). Il manque par contre la définition de un seul coefficient pour les
deux facteurs manquants. Nous choisissons celui qui dans la pratique est le plus souvent utilisé en analogie
avec les autres coefficients:

(33.105)

appelé "coefficient d'augmentation de pression isochore".

Nous avons ainsi les trois coefficients très utilisés dans la pratique:

(33.106)

respectivement et dans l'ordre:

1. Coefficient de compressibilité isotherme.

2. Coefficient de compressibilité (ou de dilatation) isobare

3. Coefficient d'augmentation de pression isochore

Nous retrouverons ces coefficients lors de notre étude des mouvements de convections en météorologie.

CHALEUR

Avant de continuer, il va à tout prix nous falloir éliminer une deux des plus grandes difficultés dans la bonne
compréhension de la thermodynamique (mis à part celle de la différenciation entre les différentielles totales
exactes et inexactes qui a déjà été réglée dans le chapitre de Calcul Différentiel Et Intégral) :

- La différence entre la chaleur et la température

- La différence entre l'énergie-travail et l'énergie-chaleur

Comme nous l'avons vu dans le chapitre de Mécanique Des Milieux Continus, la température caractérise un
état d'équilibre thermodynamique et traduit l'existence d'une agitation thermique (théorème du Viriel) et elle
peut varier lorsque l'extérieur fournit un travail . Cependant, l'expérience nous montre que c'est en
"chauffant" un système que nous augmentons le plus aisément sa température. Mais qu'est-ce donc la
chaleur? :

Considérons un système thermodynamique à l'équilibre, et écrivons son énergie E sous la forme statistique
(espérance de la variable aléatoire de l'énergie d'un micro-état i de probabilité - voir chapitre de
Mécanique Statistique) :

(33.107)

l'énergie étant identifiée avec sa valeur moyenne puisque les fluctuations sont négligeables. Sa variation au
cours d'une transformation infinitésimale (que nous supposons à nombre de particules constant) est
(différentielle totale) :
(33.108)

où est le déplacement de l'énergie du micro-état provoqué par la transformation, et la variation de


la population de cet état i.

Si au cours de cette transformation infinitésimale, le système reçoit le travail et la chaleur , son


énergie interne s'accroît de :

(33.109)

Nous pouvons maintenant comparer cette dernière relation (exprimant le premier principe de la
thermodynamique) avec celle qui la précède (découlant de la mécanique statistique).

Examinons d'abord le cas d'une transformation dans laquelle le système reçoit seulement de la chaleur :

(33.110)

Dans ce cas, aucun des paramètres extérieurs au système ne varie en général dans la transformation de sorte
que . Nous en déduisons :

(33.111)

Ainsi, lorsqu'un système reçoit seulement de la chaleur, son énergie varie par modification des populations
de ses états microscopiques : si la quantité de chaleur reçue est positive, la probabilité des états d'énergie
élevée augmente, au détriment de celle des états de plus basse énergie. Enfin, si nous tenons compte que le
système doit être à l'équilibre (l'état le plus probable comme nous l'avons démontré en mécanique
statistique) dans les états initial et final de la transformation, nous constatons, comme nous pouvions nous y
attendre, que la température du système varie : elle a augmenté si la quantité de chaleur reçu est positive
(cela se démontre en choisissant une distribution canonique pour décrire les états d'équilibre macroscopique
du système).

Cela explique la confusion fréquente entre ces deux concepts très différents que sont température et chaleur.
Cette confusion est accentuée par le décalage entre le langage quotidien et la terminologie scientifique. Dans
le langage quotidien, lorsque nous parlons de chaleur d'un corps, nous affirmons en réalité que sa
température est élevée. La confusion regrettable parce que la notion de chaleur est bien présente en
physique, mais que sa signification est autre.

Ainsi, chauffer un système, c'est lui fournir de la chaleur, c'est augmenter son énergie interne (le nombre de
micro-états de haute énergie) par des moyens qui ne sont pas purement mécaniques. La chaleur est donc une
forme d'énergie particulière!

ENTROPIE

Un système macroscopique isolé tend vers l'équilibre. Il l'atteinte en un temps fini (qui peut être
extrêmement grand). L'état d'équilibre est unique: les exceptions à cette affirmation sont trop spéciales pour
mériter une digression.

L'existence même d'un état d'équilibre est fondamentale pour la thermodynamique. Cependant, le processus
de marche à l'équilibre ne résulte pas d'un dogme: il ne doit pas en exister en physique! Comme toute autre
loi, il est soumis à vérification et doit être analysé. Une question, notamment se pose: quelle est la
contrepartie microscopique de la marche à l'équilibre, processus macroscopique.

Nous avons vu dans le chapitre de Mécanique Statistique que par définition: l'état d'équilibre qui est l'état
qui correspond au plus grand nombre de configurations (micro-états) et est l'état le plus probable.

Ce qui nous avait amené à la relation suivante:

(33.112)

où S représente l'espérance statistique de l'information sur les micro-états et que nous avions appelé
"entropie". Il est évident que S a les unités de qui comme nous l'avions montré est une constante.

La question qui se pose alors en thermodynamique est: quelle est la constante qui permet de caractériser
pour un gaz, fluide ou solide l'espérance mathématique du nombre des états.

Il vient alors en regardant toutes les relations qu'il existe en thermodynamique qu'une seule constante
apparaît systématique dès qu'il s'agit de caractériser un état thermodynamique. Il s'agit de la constante de
Boltzmann. Donc:

(33.113)

Donc S a les unités de correspondant au rapport J/T qui permet donc de mesure le degré de désordre d'un
système au niveau microscopique. Intuitivement: plus l'entropie du système est élevée, moins ses éléments
sont ordonnés et capables de produire des effets mécaniques, et plus grande est la part de l'énergie inutilisée
ou utilisée de façon incohérente.

L'entropie est une grandeur extensive. Effectivement, nous avions montré que le choix du logarithme dans la
loi de Boltzmann venait que l'entropie d'un macro-état était l'espérance sur de l'ensemble des micro-états:

(33.114)

ce qui nous avait amené à:

(33.115)

et montre bien que l'entropie est une grandeur extensive car sommable sur les micro-états (complexions).

Ce qui reste difficile maintenant c'est de savoir si l'énergie dans les unités de l'entropie provient du travail W,
de la chaleur Q ou des deux? Au fait la réponse est simple car dans notre développement de la loi de
Boltzmann, à aucun moment le système (idéal) étudié n'a fourni un travail. Donc la seule énergie mise en
cause est celle de la chaleur.

Ainsi:

(33.116)
Or, l'entropie ne peut pas être donnée par:

(33.117)

car c'est la définition de la chaleur spécifique. Par ailleurs, si le lecteur se rappelle de nos développements en
Mécanique Statistique, l'étude se faisait dans un système isolé avec deux cavités. Donc si le passage d'une
cavité à l'autre se fait très lentement (de façon à ce qu'il n'y ait pas une détente du gaz) la température restera
constante (détente isotherme). Ce qui implique donc la définition:

(33.118)

Pour passer à la forme différentielle il convient de se rappeler que la chaleur Q est une différentielle
inexacte. Donc pour une transformation réversible:

(33.119)

Donc l'entropie est une différentielle totale exacte (la chaleur dépend de la manière dont se fait la
transformation mais S ne dépend que de l'état final et initial de la chaleur Q) et comme:

(33.120)

Nous avons finalement:

(33.121)

Si le système est dans une transformation adiabatique (sans échange de chaleur et de travail avec l'extérieur)
l'entropie est nulle. Sinon, le système prend de l'entropie à l'Univers dans une évolution naturelle.

Ce qui signifie que l'entropie (espérance de l'information intrinsèque) dans un système en contact avec
l'extérieur ne peut qu'augmenter ou rester constante.

Ce qui est important c'est que tout processus (non adiabatique) convertissant de l'énergie d'une forme à une
autre dans un système isolé en perd obligatoirement une partie sous forme de chaleur.

En ce qui concerne l'Univers... toute la question est de savoir si il s'agit d'un système thermodynamique isolé
ou non...

Nous avons alors la relation très utile en mécanique des fluides (et en cosmologie):

(33.122)

qui se nomme "identité thermodynamique" relative à l'énergie interne U ou encore "fonction caractéristique
d'un fluide à l'équilibre".

Cette dernière relation est souvent assimilée au premeir principe de la thermodynamique pour des système
fermés dont la variation d'énergie potentielle et cinétique globale est constante.

RELATIONS DE MAXWELL
Revenons dans un premier temps ce que nous avons déjà rappelé un peu plus haut mais en nous restreignant
à deux variables. C'est-à-dire à la différentielle totale exacte:

(33.123)

Nous avons donc aussi:

(33.124)

En insérant dx dans dy:

(33.125)

ou encore:

(33.126)

comme les termes entre parenthèses sont des fonctions et que dx et dz sont par contre arbitraires, la seule
solution à cette relation est:

(33.127)

Multipliant la deuxième relation par :

(33.128)

Nous avons alors:

(33.129)

Venons en maintenant aux faits. Rappelons la relation:


(33.130)

relation très utile dans les fluides où la pression est constante et la variation de chaleur se fait par celle de
l'entropie. Ainsi que la relation définissant l'enthalpie:

(33.131)

dont nous allons modifier la différentielle:

(33.132)

et y injectant (premier principe):

(33.133)

nous avons:

(33.134)

et en y injectant l'entropie (deuxième principe) nous obtenons:

(33.135)

Nous allons donc utiliser les deux relations suivantes qui vont nous être utiles:

(33.136)

Nous introduisons maintenant une nouvelle quantité que nous appelons "énergie libre" (celle qui est
réellement disponible dans le système) et qui sera donnée par:

(33.137)

et donne simplement la différence entre l'énergie interne et l'énergie calorique dissipée à cause de l'entropie
à une température donnée.

Nous introduisons également une autre nouvelle quantité que nous appelons "enthalpie libre" (celle qui est
réellement disponible dans le système) et qui sera donnée identiquement par:

(33.138)

qui est simplement la différence entre l'enthalpie et l'énergie calorifique dissipée à cause de l'entropie à une
température donnée.

Nous avons donc pour l'énergie libre la forme différentielle:

(33.139)

en y injectant le premier principe et deuxième principe:

(33.140)
et de même pour l'enthalpie libre:

(33.141)

en y injectant:

(33.142)

Nous avons donc quatre relations:

(33.143)

appelées "équations de Gibbs".

Nous remarquons que toutes ces équations sont toutes de la forme:

(33.144)

Or, rappelons que selon le théorème de Schwarz (cf. chapitre de Calcul Différentiel Et Intégral) que si dz est
bien une différentielle totale exacte nous avons alors:

(33.145)

Ce qui nous donne les quatre relations:

(33.146)

Par ailleurs, par la définition même des dérivées partielles et des quatre relations:

(33.147)

nous avons:
(33.148)

Toutes ces relations sont mises à profit pour calculer les variables thermodynamiques non directement
mesurables à partie des données expérimentales.

Maintenant voyons une relation qui nous sera utile en météorologie!:

Nous savons que la chaleur spécifique est donnée par définition à pression constante par:

(33.149)

Or à pression constante, la variation de chaleur peut s'écrire par définition avec la variation d'enthalpie:

(33.150)

Maintenant rappelons que l'enthalpie s'écrit:

(33.151)

comme dS est une différentielle exacte, nous pouvons l'écrire en fonction des paramètres de température et
de pression seuls:

(33.152)

Nous avons donc:

(33.153)

Comme par ailleurs dH est une différentielle exacte, nous pouvons aussi l'écrire en fonction des paramètres
de température et de pression seuls:

(33.154)

Nous avons alors les deux relations à identifier:


(33.155)

Il vient alors:

(33.156)

EQUATION DE CONTINUITE

Considérons de manière générale un système ouvert, limité par une frontière quelconque (déformable ou
non) et animé d'un mouvement quelconque (en déplacement ou immobile) par rapport à un référentiel
considéré comme fixe.

Ce système, qui est représenté sur la figure ci-dessous est susceptible de transférer de l'énergie (ou de la
masse) entre lui-même et l'extérieur. Ce système peut être inertiel ou non.

Soit une grandeur extensive A (comme la masse ou la charge). La grandeur quantitative correspondante est a
(elle peut exprimer par exemple l'isotropie ou l'anisotropie du système).

(33.157)

D'une façon générale, la valeur de A à l'intérieur du système est, à un instant quelconque:

(33.158)

étant la densité de la grandeur quantitative A.

Le taux de variation spatial de A est donné par la dérivée dA/dt. Les causes de variations de A peuvent être
liées à deux phénomènes différents: les flux et les sources ou puits.

En comptant positivement ce qui entre dans le système, le flux de A à travers la frontière est donnée par
l'intégrale de surface:
(33.159)

dans laquelle nous définissons:

- comme le vecteur flux surfacique (ou le vecteur densité de courant) total relatif à A

- comme l'élément de frontière, exprimé par un vecteur normal à la surface et dirigé vers l'extérieur

Remarquons que, contrairement à l'acceptation usuelle en physique, le concept de flux contient déjà la
dérivation par rapport au temps. Par ailleurs, afin d'alléger le texte, l'expression vecteur flux surfacique est
réduite au terme flux dans tout ce qui suit.

Ce flux peut être décomposé en plusieurs flux, selon la relation:

(33.160)

Le terme est un flux par déplacement absolu, caractérisant un flux lié à un écoulement fluide. Nous
avons la relation:

(33.161)

où est la vitesse absolue d'une particule fluide par rapport au référentiel fixe.

Le terme est un flux par déplacement apparent, mis en jeu seulement lorsque la frontière se déplace
(par exemple si le volume V est en révolution). Nous avons la relation:

(33.162)

où est la vitesse absolue de déplacement (dans le sens déformation!) d'un point de la frontière , par
rapport au référentiel fixe.

Le terme est le flux total par conduction, caractérisant un flux lié à un phénomène de transfert de proche
en proche, sans déplacement fluide (par exemple: conduction thermique, conduction électrique, travail
mécanique).

Le terme est un flux par déplacement relatif, résultant à la fois du déplacement du fluide et de celui de la
frontière . Nous avons la relation:

(33.163)

où est la vitesse relative d'une particule fluide par rapport à un point bien défini de la frontière . En
vertu du principe de composition des vitesses (vitesse absolue est la somme la vitesse relative et de sa
vitesse apparente), nous avons:
(33.164)

Lorsque la frontière est traversée par un fluide, le débit-masse élémentaire (c'est la masse qui nous
intéresse le plus souvent en physique donc sera une densité massique) est:

(33.165)

Le flux de A correspondant est alors donné par:

(33.166)

où désigne la portion de frontière traversée par le débit masse (ou fluide).

Si nous comptons positivement l'effet d'une source, le taux d'augmentation de A est donné par:

(33.167)

où est le flux volumique d'une source de A.

En tenant compte à la fois des flux et des sources, nous avons le taux de variation spatial de A:

(33.168)

Le bilan spatial de A est finalement exprimé par la relation:

(33.169)

Dans le cas particulier d'un système en régime permanent (par exemple dans le cas d'un fluide qui s'écoule
ou d'un solide qui est le siège de conduction thermique, de conduction électrique, de réaction nucléaire,...),
toutes les grandeurs locales sont constantes en tout point du système. Si, de plus, nous choisissons une
frontière indéformable, il est possible de raisonner par rapport à un référentiel lié au système. Nous avons
alors, en tout point fixe du système par rapport à ce référentiel:

; ; (33.170)

Il en résulte pour l'ensemble du système:

(33.171)

Donc dans le cas particulier d'un système en régime permanent, avec une frontière indéformable , liée au
système, le taux de variation spatial de toute grandeur extensive scalaire est nul.
Le taux de variation uniquement spatial de A est:

(33.172)

La variation élémentaire du volume V est due au déplacement (au sens de la déformation!) de la frontière ,
de sorte que

(33.173)

Dès lors nous pouvons écrire que:

(33.174)

nous avons donc:

(33.175)

En prenant en compte les flux des sources et des puits nous avons:

(33.176)

Le théorème de Gauss-Ostrogradsky (cf. chapitre de Calcul Vectoriel) va nous permettre d'écrire l'intégrale
de surface en une intégrale de volume, et en groupant tous les termes sous le même signe intégrale, nous
obtenons:

(33.177)

Comme les limites d'intégration (frontière ) sont arbitraires, l'expression entre crochets est identiquement
nulle.

(33.178)

Considérons maintenant que la grandeur extensive scalaire soit la masse M, nous avons alors:

(33.179)

avec .
Comme la masse n'est pas susceptible d'être transférée par un phénomène de conduction (dans un cas
classique (non quantique)), nous avons qui est nul. Comme la masse est conservative, il n'y a ni source,
ni puits de masse de sorte que est également nul.

Nous avons dès lors:

(33.180)

La relation:

(33.181)

est appelée "équation de continuité" ou encore "équation de conservation (de la masse)".

Le signe "-" est ici car nous avons défini le flux entrant comme étant positif. Il est possible que dans la
littérature ainsi que sur ce site vous trouviez un "+" à la place de ce signe.

Il y a une autre forme beaucoup plus fréquente sous laquelle nous trouvons l'équation de continuité. Le
lecteur aura remarqué que le terme a les unités d'une densité de surface de courant massique
ce qui nous amène en analogie avec l'électronique (cf. chapitre d'Electrocinétique) à noter :

(33.182)

Ce qui ramène l'équation de continuité à :

(33.183)

ÉQUATION DE LA CHALEUR

Appliquons maintenant ce résultat à la diffusion de la chaleur.

Comme pour l'équation de conservation de la masse nous pouvons écrire pour la chaleur dans le cas
d'absence de sources:

(33.184)

où q est la quantité de chaleur par unité de volume (ne pas l'oublier sinon nous aurions pris un Q majuscule!)
et le flux de chaleur dont la quantité entrante a été définie comme négative.

Une variation de température entraînant une variation de la quantité de chaleur est définie en première
approximation par la loi physique suivante (cela découle de la définition de la chaleur spécifique massique
aussi...):

(33.185)
où est la densité de matière et est la capacité calorifique massique. Ou de manière équivalent e
(puisqu'en thermodynamique, comme nous l'avons déjà précisé les minuscules sont rapportées à la masse):

Le flux de chaleur étant trivialement induit par une différence spatiale de température nous obtenons alors la
"loi de Fourier" qui exprime le flux de chaleur proportionnellement au gradient spatial de température:

(33.186)

Le signe "-" étant simplement dû au fait que le flux de chaleur va du plus chaud au plus froid et est le
"coefficient de transport de la chaleur" exprimant la "conductivité thermique" du matériau dépendant des
propriétés atomiques de la matière (cf. chapitre de Mécanique Statistique).

En insérant les deux précédentes relations dans l'équation de conservation de la chaleur nous avons :

(33.187)

De façon plus esthétique et générale nous la retrouvons sous la forme condensée de "l'équation de diffusion
de la chaleur" ou appelé plus sobrement "équation de la chaleur" :

(33.188)

où le coefficient de proportionnalité est appelé dans cadre de cadre de la chaleur: "coefficient de diffusion
thermique":

(33.189)

Il est possible de démontrer son origine microscopique comme nous l'avons fait dans le chapitre de
Mécanique Statistique.

Il faut cependant toujours faire attention aux unités de suivant que nous travaillons avec la capacité
calorifique massique ou la capacité calorifique C au dénominateur!

Donc sous forme totalement explicite nous avons en une dimension :

(33.190)

Remarques:

R1. Nous retrouverons cette équation dans le chapitre de Méthodes Numériques pour introduire le lecteur au
concept de résolution d'équations différentielles par la méthode des éléments finis.
R2. C'est en étudiant cette équation que Fourier a introduit les séries et la transformée qui portent son nom,
et qui sont devenues si importantes dans l'étude des phénomènes de propagation/diffusion.

R3. L'équation de diffusion se retrouve dans de nombreux domaines (thermodynamique, fluides, finance,...)
et il existe une littérature considérable sur les différentes solutions de cette équation différentielle du second
ordre.

Insistons sur le fait que toutes les relations du type:

(33.191)

sont appelées "équations de diffusion" du paramètre physique D. Nous allons tout de suite voir comment la
résoudre en prenant comme exemple l'équation de diffusion de la chaleur et cela nous permettra aussi de
comprendre pour Fourier a introduit la fameuse transformée qui porte son nom. Mais rappelons au lecteur
que nous la retrouvons dans de multiples contextes (cf. chapitre de Mécanique Statistique).

Remarque: Cette équation (du moins sa forme et donc l'étude de sa résolution!) se retrouve dans des
domaines inattendus comme dans la diffraction en physique ondulatoire, dans l'équation de Schrödinger en
physique quantique, en finance dans l'équation de Black & Scholes, en électrocinétique dans le domaine des
résistances, dans l'étude de la propagation des champs électromagnétiques dans la matière, dans l'étude des
réactions en chimie, en neutronique nucléaire, etc.

Résolvons donc la forme générale de l'équation de diffusion:

(33.192)

Pour résoudre cette équation différentielle, nous allons procéder avec la méthode de séparation des variables
en supposant que:

(33.193)

ce qui donne:

(33.194)

d'où l'équation de diffusion:

(33.195)

ce qui remanié et condensé s'écrit aussi:

(33.196)

Ce qui peut s'écrire:


(33.197)

donc pour que légalité soit vraie pour tout t et x les fonctions G et F doivent être constantes. Donc nous
avons le droite d'écrire:

(33.198)

Le fait d'écrire la constante négative et à la puissance deux est une simple anticipation du résultat
historiquement déjà connu...

Ce qui nous donne les deux équations simples:

(33.199)

Nous résolvons la deuxième équation différentielle:

(33.200)

Donc :

(33.201)

Pour la première équation différentielle:

(33.202)

Nous avons le polynôme caractéristique:

(33.203)

Soit les racines:

(33.204)

Donc (cf. chapitre de Calcul Différentiel Et Intégral):

(33.205)

Soit:

(33.206)

Alors là... nous sommes ennuyés parce que même si nous pouvons avec des conditions initiales déterminer
l'ensemble des constantes... la solution est dans l'ensemble des complexes.
(33.207)

Mais après une longue réflexion nous pouvons contourner la difficulté. Effectivement le physicien habitué à
travailler dans le domaine de l'analyse harmonique verra dans la relation précédente quelque chose de
similaire aux transformées de Fourier. Effectivement! Puisque pour chaque valeur de possible nous
obtenons une solution, il apparaît donc qu'en faisant la somme de toutes ces solutions, nous obtenons toutes
les solutions (séparables) de l'équation de la chaleur. Nous avons donc:

(33.208)

Mais comme est un paramètre réel, il nous faut intégrer plutôt que de sommer:

(33.209)

Or si nous écrivons cela sous la forme suivante:

(33.210)

Nous y reconnaissons pour un temps t et à une constant près donnée la forme d'une transformée de Fourier
inverse!

Et alors direz-vous? Eh bien comme nous l'avons vu lors de notre étude des transformées de Fourier, la
transformée de Fourier inverse est une somme infinie de fonctions trigonométriques réelles!

Ensuite dans la pratique pour résoudre cette équation sous sa forme, nous allons imposer un spectre de la
température pour un temps donnée et faire la transformée de Fourier (c'est très théorique...).

Mais résolvons dans un cas simpliste mais réel: Lorsque deux extrémités d'un système de taille L sont
maintenues à deux températures différentes et , la solution de l'équation de la chaleur est stationnaires
(indépendante du temps). Nous avons alors:

(33.211)

La solution à cette équation différentielle est très simple (c'est du calcul intégral de base avec conditions
initiales connues):

(33.212)

C'est une situation que nous retrouvons dans la vie de tous les jours...

RAYONNEMENT THERMIQUE

L'étude du corps noir est à la base de la célèbre théorie de la physique quantique ondulatoire, un des piliers
de la physique moderne. En effet, certains résultats expérimentaux ne pouvaient pas être expliqués sans
l'introduction d'une nouvelle constante universelle : la fameuse constante de Planck.
Définition: Un "corps noir" (ou "récepteur intégral") est défini comme un corps ayant un "coefficient
d'absorption énergétique" et un "coefficient d'émissivité" égaux à l'unité (cf. chapitre d'Optique
Géométrique)

Le premier principe de la thermodynamique établit une équivalence entre le travail et chaleur comme modes
de transfert d'énergie entre un système et son environnement (et en fait le bilan au niveau de l'énergie
interne). Nous nous intéressons ici à la chaleur, que nous pouvons définir comme "l'énergie qu'un corps
communique à un autre à cause de leur différence de température".

La chaleur se communique d'un endroit à un autre de trois manières différentes comme nous en avons déjà
fait mention plus haut :

1. Par conduction: c'est un transfert de chaleur dans ensemble de points matériels en contacts qui se fait sans
mouvements macroscopiques, sous l'influence d'un gradient de température. La conduction est donc le
résultat de collisions moléculaires. Nous l'observons principalement dans les solides: dans les métaux, elle
fait intervenir les électrons libres qui les rendent bons conducteurs de chaleur. En revanche, dans les
isolants, la conduction se fait mal. De là la forte correspondance entre les propriétés thermiques et
électriques des solides.

2. Par convection: la convection implique le transport de la chaleur par une partie d'un fluide qui se mélange
avec une autre particule. Elle prend sa source dans un transport macroscopique de matière et ne concerne
donc pas les solides.

3. Par rayonnement: la conduction et la convection supposent la présence de matière. Le rayonnement, lui,


permet un transfert d'énergie qui peut s'effectuer à travers le vide. Il s'agit ici de rayonnement
électromagnétique. Soulignons que le rayonnement n'est pas un mode de transfert de chaleur mais d'énergie,
celle-ci pouvant se transformer en chaleur au contact d'un corps.

Le rayonnement thermique émis par un corps porté à une certaine température résulte d'une conversion de
l'énergie interne du corps en rayonnement. Inversement, l'absorption est la transformation de l'énergie
incidente en énergie interne.

Lorsqu'une surface est soumise à un rayonnement absorbée, nous effectuons le bilan d'énergie selon la loi de
Kirchhoff vue en photométrie :

(33.213)

où rappelons-le quand même, est la fraction du rayonnement absorbée, est la partie réfléchie (diffusée)
et la partie transmise (qui traverse la surface). Ce bilan résulte du principe de la conservation de l'énergie.

Nous allons maintenant nous pencher sur les mécanismes d'absorption et d'émission et établir un lien entre
chaleur et énergie rayonnante avant de nous intéresser directement au corps noir :

LOI DE STEFAN-BOLTZMANN

Nous avions défini lors de notre étude de la photométrie (cf. chapitre d'Optique Géométrique) le concept
d'émittance (énergie irradiée par un corps non ponctuel par unité de surface) pour l'ensemble du spectre.

Ce que nous avions omis de préciser cependant, c'est que pour qu'un corps rayonne (outre le fait qu'il puisse
être lui-même éclairé par un autre corps) il faut qu'il soit chauffé (que l'on fournisse une énergie d'excitation
aux constituants au corps en question - sous-entendu aux électrons).

Donc nous devrions pouvoir établir une relation entre la température d'un corps et son émittance.
En 1879, le physicien autrichien Stefan a pu établir expérimentalement que l'émittance totale du
corps noir à une température T augmentait proportionnellement à la quatrième puissance de la température
tel que :

(33.214)

où M(T) est l'intégration sur toutes les longueurs d'onde (ou les fréquences... peu importe) de :

(33.215)

avec donné par la loi de Planck que nous déterminerons plus tard.

Rappelons également que (ceci sera démontré lors de notre démonstration de la loi de Planck) :

(33.216)

est la "constante de Stefan".

Remarque: En d'autres termes, la loi de Stefan établit que la puissance totale rayonnée par unité de surface
dans le demi-espace libre du corps noir ("exitance énergétique" du corps noir).

En 1884, Boltzmann à démontré indirectement la loi de Stefan en se basant sur l'étude du corps noir à
l'équilibre thermique (où nous considérons que les bords de la paroi du corps noir définissent les
terminaisons des ondes électromagnétiques) à partir de la théorie de l'électromagnétisme et d'un
raisonnement thermodynamique.

Dans un premier temps, Boltzmann a déterminé qu'elle était la pression de radiation du rayonnement dans
une telle enceinte (ou dans un tel corps).

Voici les développements qui l'ont mené à déterminer la pression de radiation P(T) à la température
d'équilibre thermodynamique T pour la densité interne d'énergie correspondante :

Rappelons l'expression de la "relation d'Einstein" que nous avons démontrée lors de notre étude de la
relativité restreinte :

(33.217)

Considérons maintenant une enceinte de volume V dont les parois sont réfléchissantes pour les photons (cas
du corps noir). Nous étudions la variation de la quantité de mouvement avant et après la collision sur une
surface infiniment petite ds (ce qui permet de considérer les trajectoires avant et après le choc comme
rectilignes et symétriques par rapport à l'axe orienté OX perpendiculaire à la surface du corps noir et
coïncidant avec la surface ds).

Ainsi, nous avons avant collision pour la quantité de mouvement :

(33.218)

et après collision :
(33.219)

Si la collision est élastique (ce qui est confortant relativement au photon...) :

et (33.220)

Nous avons alors :

(33.221)

La variation de la quantité de mouvement est alors :

(33.222)

Comme :

(33.223)

nous avons alors :

(33.224)

En ne considérant que la norme de l'expression et qu'il s'agit d'un photon :

(33.225)

Remarque: Nous supposons qu'après son rebond, le photon conserve sa fréquence (ce qui nous amène à
supposer que le corps noir comporte des ondes stationnaires à l'équilibre thermodynamique).

Jusqu'à présent, nous avons raisonné sur un photon mais l'enceinte contient un gaz de photons. L'énergie
interne volumique du rayonnement contient une densité volumique u de photons de fréquence identique
v égale à :

(33.226)

Remarque: Nous précisons les unités car nous avons remarqué que la suite posait parfois quelques
problèmes de compréhension.

Nous considérons que pendant un intervalle de temps dt, le nombre de photons pouvant potentiellement
frapper la surface ds sous un angle d'indice est contenu dans un cylindre de génératrice cdt dont l'axe est
incliné nécessairement d'un angle et ayant comme surface de base ds. Le volume de ce cylindre est par la
projection de la surface de base :

(33.227)

Le nombre de photons pouvant potentiellement heurter la paroi ds par unité de temps est :
(33.228)

Dans cette dernière expression, nous avons supposé que tous les photons de dV avaient une quantité de
mouvement dans la direction sous tendue par . En réalité, les photons arrivant réellement sur ds sont
contenus dans un angle solide entre deux cônes de demi-angle au sommet et (pour des
raisons de géométrie de l'expérience du corps noir qui était, sauf erreur, sphérique et par ailleurs cette
symétrique sphérique facilite les calculs...).

La relation entre et est comme nous l'avons vu en trigonométrie (cf. chapitre de Trigonométrie) :

(33.229)

Sachant que dans le volume entier (rappel), l'angle solide vaut :

(33.230)

Le nombre dn compris dans l'angle solide élémentaire qui parvient sur la surface ds sous un angle
d'incidence compris entre et est alors :

(33.231)

Soit maintenant la définition de la pression P :

(33.232)

en substituant ce qu'il convient :

(33.233)

Ce qui donne après simplification :

(33.234)

La pression totale de radiation dans ce cas particulier étant donnée par :

(33.235)

Ce qui est équivalent à écrire (à l'équilibre thermodynamique pour une température donnée) :
(33.236)

L'énergie totale est la densité d'énergie multipliée par le volume considéré :

(33.237)

Supposons que ce volume puisse varier. Le travail de la pression de radiation lors d'une dilatation dV du
volume est :

(33.238)

La variation d'énergie interne du système en vertu du premier principe de la thermodynamique est :

(33.239)

Or d'après , nous avons :

(33.240)

d'où :

(33.241)

et selon le deuxième principe de la thermodynamique (ne pas confondre la notation avec la surface...) :

(33.242)

Nous avons :

(33.243)

Comme dS est une différentielle totale, nous avons dans ce cas:

(33.244)

Ce qui nous amène à écrire :

(33.245)

En calculant la dérivée du membre de droite :


(33.246)

En simplifiant :

(33.247)

ce qui s'écrit encore :

(33.248)

Soit :

(33.249)

qui devient l'équation :

(33.250)

Ce qui donne après intégration :

(33.251)

Finalement :

(33.252)

avec :

(33.253)

étant la constante de Stefan-Boltzmann dont la valeur avait été donnée à l'époque dans un premier temps
expérimentalement.

Nous voyons ci-dessus la correspondance qu'il y a entre la relation que nous avons posé au début et celle que
nous venons d'obtenir :

et (33.254)

Comme nous n'avons pas encore, à ce point, démontré la loi de Planck, nous pouvons faire un raisonnement
osé mais que nous justifierons par la suite avec démonstration à l'appui.

Remarque: Les deux dernières relations nous donnent une information fondamentale comme quoi tous les
corps qui ne sont pas à zéro kelvin (au zéro absolu) rayonnent!
M(T) et sont différenciées au niveau des unités par les dimensions d'une vitesse. Or, intuitivement et
grossièrement (...), la vitesse qui peut tout de suite nous apparaître comme triviale dans ce cas d'étude est la
vitesse de la lumière c. Ainsi, nous remarquons que :

(33.255)

Ce qui nous donne :

(33.256)

Curieux n'est-ce pas... mais nous le démontrerons plus loin car notre philosophie sur ce site est de ne jamais
(ou le moins possible) laisser place à l'intuition.

Remarque: Lorsque nous étudierons la loi de Planck, sera noté R(T) afin de ne pas confondre la
radiance avec une densité d'énergie (car la notation peu malheureusement porter à confusion)

Considérons maintenant une chambre ou cavité isolée (comme une fournaise) en équilibre thermique à une
certaine température T. Cette cavité sera sûrement remplie de rayonnement électromagnétique de différentes
longueurs d'onde. Supposons qu'il existe une fonction de distribution M(T) dépendant uniquement de la
température.

Logiquement, la quantité totale d'énergie électromagnétique, à toutes les longueurs d'onde, absorbée par les
murs de la cavité doit être égale à celle émise par les murs autrement le corps formant la cavité verrait sa
température changer. Kirchhoff raisonna que si le corps formant la cavité est fait de différents matériaux (se
comportant donc de façon différente avec la température), l'équilibre entre radiation émise et radiation
absorbée doit s'appliquer alors pour chaque longueur d'onde (ou domaine de longueur d'onde).

Nous voyons ainsi que M(T) est une fonction universelle, la même pour toutes les cavités sans égard à leur
composition, leur géométrie ou la couleur de leur paroi. Kirchhoff ne donna pas cette fonction mais il fit
remarquer qu'un corps parfaitement absorbant, c'est-à-dire un corps pour lequel apparaîtra (façon de
dire...) noir.

Il vient alors que le rayonnement emmagasiné en équilibre dans une cavité isolée en équilibre
thermodynamique (comme le sont les étoiles) est à tous égards la même que celle émise par un corps
parfaitement noir à la même température.

Evidemment, si la cavité est fermée, nous ne pouvons pas mesurer le courant d'énergie qui s'en échappe.
Mais pratiquons un tout petit trou dans cette cavité (suffisamment petit pour ne pas perturber l'équilibre du
rayonnement électromagnétique à l'intérieur), alors l'énergie électromagnétique s'échappant de ce petit trou
est la même que celle émise par un corps parfaitement noir.

Cependant, aucun objet n'est réellement un corps noir. Le noir de charbon a un coefficient d'absorption très
près de 1 mais seulement pour certaines fréquences (incluant, bien sûr, le visible). Son coefficient
d'absorption est beaucoup plus petit dans l'infrarouge lointain. Tout de même, la plupart des objets
s'approchent dans certaines gammes de fréquence. Le corps humain, par exemple, est presque un corps noir
dans l'infrarouge (d'où les lunettes de nuit militaires...). Pour traiter les différents corps, appelés "corps gris",
nous introduisons un facteur appelé "émissivité totale", , qui relie l'émittance émise par le corps à celle
émise par un corps noir parfait pour lequel . Nous avons donc :

(33.257)
Remarque: La relation de Stefan-Boltzmann nous donne la puissance émise par un corps par unité de surface
en l'exprimant de façon proportionnelle à la quatrième puissance de la température. Cet exposant nous donne
la raison pour laquelle il devient de plus en plus difficile d'augmenter la température d'un corps en le
chauffant, celui-ci perdant de plus en plus rapidement l'énergie que nous fournissons pour son échauffement.

LOI DE PLANCK

Nous considérons maintenant le corps noir comme un système isolé à l'équilibre thermique, dans lequel le
rayonnement est à l'état stationnaire et réfléchi totalement par les parois. Les photons peuvent être dès lors
considérés comme des particules n'interagissant pas entre elles dans un puits de potentiel à parois rectiligne

Ainsi, identiquement à ce que nous avons vu dans le chapitre de Physique Quantique Ondulatoire, la
résolution du problème est celui d'un puits de potentiel à parois rectilignes pour laquelle nous avions obtenu
pour fonction d'onde :

(33.258)

à propos de laquelle il faut appliquer les conditions aux limites.

Les conditions que nous avions imposées lors de notre étude de ce cas en physique quantique ondulatoire
étaient trop restrictives (c'est la raison pour laquelle elles sont appelées "conditions aux limites strictes").
Effectivement, les atomes de la paroi absorbent et émettent le rayonnement quel que soit la manière dont le
rayonnement est incident. Mais l'équilibre impose au moins qu'elles soient que les conditions aux limites
soient périodiques de par la définition même de l'équilibre. C'est la raison pour laquelle nous imposons ce
que nous appelons les "conditions au limites périodiques" :

- pour et , nous avons :

- la fonction d'onde doit présenter un nombre entier de demi-longueur d'onde sur la longueur

- dans le corps noir, donc

- si aux extrémités ( et ) nous avons l'argument du sinus à la même valeur (à un


facteur multiplicatif réel près) en 0 et en .

Donc nous devons avoir :

(33.259)

et comme , après quelques simplifications élémentaires, nous avons :

(33.260)

L'énergie totale de la particule présente donc une suite discrète de valeurs, les seules permises. La valeur de
L est quant à elle déterminée à l'aide du modèle de Bohr ou de Sommerfeld en fonction des cas.
Puisque les fonctions d'onde correspondantes dans le puits sont , nous avons donc:

(33.261)

Ainsi, l'énergie totale peut s'écrire :

(33.262)

Ainsi, étant donné que la fonction d'onde est une probabilité conditionnelle, nous avons sous forme de
phaseur :

(33.263)

et les énergies discrètes associées sont alors :

(33.264)

Le vecteur étant donc défini par :

(33.265)

Remarque: Nous constatons facilement que les écarts d'énergie entre niveaux consécutifs sont d'autant plus
faibles que les dimensions du corps noir (assimilé à une boîte) sont plus grandes; pour des
dimensions macroscopiques, ces écarts sont alors totalement inappréciables. Ce constat nous permettra un
peu plus loin de faire une petite approximation.

Explication : Pour un électron ( ) enfermé dans une boîte cubique de côté , l'écart
entre deux niveaux consécutif est :

(33.266)

donc environ ...

Les vecteurs qui nous intéressent (puisqu'ils représentent respectivement chacun un micro-état possibles),
plongé dans l'espace des phases des nombre d'onde, ont leur extrémité situées en l'un des noeuds d'un réseau
tridimensionnel constitué de mailles élémentaires dont les arêtes sont parallèles aux axes et qui mesurent
respectivement . Nous voulons évaluer le nombre de vecteurs pour lesquels cette
extrémité tombe dans l'intervalle entre les deux sphères centrées à l'origine et de rayons de norme K et K +
dK. Le volume de la coquille sphérique comprise entre les deux sphères est donc trivialement donnée par :
(33.267)

Le nombre de mailles élémentaires (de micro-états) incluses dans cette région de l'espace des est, à peu de
chose près, égal au nombre de fois que son volume contient celui de la maille élémentaire, qui vaut :

(33.268)

Nous obtenons ainsi le nombre de micro-états dans le volume (donc la densité de micro-états) :

(33.269)

Or, il ne faut pas oublier les relations suivantes (cf. chapitres de Mécanique Ondulatoire, Physique
Quantique Corpusculaire et Relativité Restreinte) :

(33.270)

Donc :

(33.271)

Il vient :

(33.272)

Dans un corps noir à l'équilibre thermodynamique, les photons forment un gaz dont les constituants
n'interagissent pas entre eux chimiquement. Ce type de situation est typiquement décrit par la distribution de
Bose-Einstein que nous avons vu en mécanique statistique. Ainsi, puisque , nous avons dans le cas
d'un spectre discret d'états :

(33.273)

et dans un cas que nous considérons comme continu :

(33.274)

Dans le corps noir, nous avons pour énergie interne :


(33.275)

La radiation d'un corps noir est donc donnée par la "loi de Planck":

(33.276)

et puisque :

et (33.277)

donc :

(33.278)

Or, comme , il convient de prendre la valeur absolue tel que :

(33.279)

Enfin, nous obtenons encore une autre forme de la loi de Planck qui exprime la densité de flux d'énergie
pour une longueur d'onde précise est donnée :

(33.280)

Remarque: Planck a proposé cette loi en 1900 sans connaître la distribution statistique de Bose-Einstein ce
qui est remarquable expérimentalement parlant!

Si (donc dans le domaine des grandes longueurs d'ondes), le développement de Taylor de pour x
petit donne donc :

(33.281)

Ce qui nous donne :

(33.282)
et la loi de Planck devient donc la "loi de Rayleigh-Jeans":

(33.283)

Que nous retrouvons aussi parfois sous la forme :

(33.284)

A l'inverse, nous avons :

Ce qui nous donne :

(33.285)

et la loi de Planck devient donc :

(33.286)

qui n'est rien d'autre que la "première loi de Wien".

Nous pouvons également redémontrer la loi de Stefan (nous l'avons déjà fait en thermodynamique mais avec
une autre démarche) mais en plus démontrer la provenance de la constante de Stefan-Boltzmann .

Rappelons que d'abord que le flux énergétique (cf. chapitre d'Optique Géométrique) est entre autres donné
par :

(33.287)

Comme la luminance dépend de la fréquence et donc de la température du corps émetteur, nous pouvons
ajouter :

(33.288)

L'énergie rayonnée à travers une surface élémentaire donnée est donc dès lors :

(33.289)

Si le volume d'émission est considéré comme un volume élémentaire assimilé à un cylindre d'hauteur cdt et
de sommet ayant pour surface (cf. chapitre d'Optique Géométrique) la densité d'énergie est alors
donnée par :

(33.290)
Compte tenu de l'isotropie du corps noir à l'équilibre, nous avons :

(33.291)

L'analyse dimensionnelle nous donne :

(33.292)

Enfin, il est utile de considérer la puissance totale émise par unité de surface (donc l'émittance) :

(33.293)

Si nous intégrons sur la demi-surface d'une sphère (par rapport au point de surface de l'émetteur) :

(33.294)

Effectivement pour une sphère (cf. chapitre de Trigonométrie) :

(33.295)

Comme la luminance est indépendante de (isotropie du rayonnement du corps noir), l'intégration est
élémentaire, et nous trouvons :

(33.296)

L'émittance totale est alors donnée par :

(33.297)

En posant , nous pouvons simplifier l'intégrande de sorte que :

(33.298)

Donc :

(33.299)

Franchement..., il était difficile de le deviner...

Déterminons pour quelle longueur fréquence, nous avons le maximum de densité d'énergie. En d'autres
termes cela revient à chercher où la dérivée :
(33.300)

s'annule. Donc :

(33.301)

Divisons par :

(33.302)

La dernière relation admet une seule racine positive que nous pouvons déterminer avec Maple
(evalf(solve(exp(-x)-1+1/3*x=0,x));) :

(33.303)

Ce qui nous donne la "deuxième loi de Wien" ou "loi de déplacement de Wien" :

(33.304)

où a est appelée "constante de Wien".

Remarque: Cette relation est aussi parfois donnée dans la littérature non pas par rapport à la fréquence mais
à la longueur d'onde.

Insistons sur le fait que la loi de Planck n'est valable que dans les cas où le rayonnement est à l'équilibre
thermique. Cette restriction est important dans la pratique, car la phénomènes d'émission ou d'absorption de
rayonnement par la matière se produisent le plus souvent dans des conditions hors de l'équilibre : dans le cas
par exemple de l'éclairage par une lampe électrique ou du chauffage électrique par rayonnement infrarouge,
il y a transformation irréversible (et donc hors d'équilibre) d'énergie électrique en énergie de rayonnement;
de même, le rayonnement solaire est produit par les réactions nucléaires qui ont lieur à l'intérieur du soleil et
qui consument peu à peu sa substance; au niveau microscopique également, l'émission d'un photon par un
atome excité est très souvent un retour irréversible de l'atome à son état fondamental (émission spontanée
hors d'équilibre). Dans le cas du corps noir, au contraire, le rayonnement est confiné à l'intérieur d'une
enceint fermée (nous laissons éventuellement une fraction négligeable de ce rayonnement s'échapper à
l'extérieur pour y être soumise aux mesures) et nous pouvons ainsi parvenir à l'équilibre thermique avec les
parois.
La loi de Planck que nous avons démontrée précédemment est parfaitement vérifiée par l'expérience dans
tout le domaine des températures accessibles à ce jour :

(33.305)

Nous remarquons qu'à la lecture du graphique ci-dessus, qu'un coprs chauffé entre 5'000 et 6'000 [K] a un
pic d'émission au milieu du spectre visible. Dans le domaine de la colorimétrie, nous associons une
température à un couleur en cherchant la température du corps noir pour laquelle le pic de radiation à son
maximum dans la longueur d'onde de la couleur donnée.

Il est à noter que beaucoup de sources lumineuses émettent un flux lumineux qui ne suit pas la loi du corps
noir (un filament d'ampoule, par exemple) et que la loi de Wien ne s'applique pas à eux. En revanche, il reste
avéré qu'ils émettent à une longueur d'onde d'autant plus courte qu'ils sont chauds.

Il faut également garder à l'esprit que le flux lumineux provenant d'un objet n'est pas forcément de nature
thermique ; autrement dit sa couleur ne renseigne pas toujours sur sa température. Par exemple, la couleur
du ciel provient de lumière solaire bleue diffusée par l'air et non d'une hypothétique température de 15'000
[K]. De même un arbre est vert, non pas parce qu'il est à 8'000 [K], mais parce qu'il réfléchit la lumière verte
qui compose la lumière du jour.
34. MÉCANIQUE DES MILIEUX CONTINUS (1/2)

A u sens strict du terme, la mécanique des milieux continus (abrégée M.M.C.) est la branche de la
mécanique qui se propose d'étudier l'étude des mouvements, des déformations, des champs de contraintes au
sein de milieux continus.

Définition:

D1. Nous désignons par "milieu", tout fluide (solide, liquide, gaz ou plasma selon ce que nous avons vu en
thermodynamique), déformable ou non, quand nous le considérons d'un point de vue macroscopique, par
opposition à une description corpusculaire.

D2. Nous désignons par "milieu continu", un milieu tel que si M et M' appartiennent à un milieu et si M'
appartient au voisinage M, alors quelle que soit la déformation subie par ce milieu, dM' appartiendra au
voisinage de dM.

Cette branche apparaît souvent comme la science de l'ingénieur qui permet de comprendre et de décrire le
monde matériel qui nous entoure et les phénomènes courants qui s'y déroulent: mouvements de liquides, de
gaz, vol des avions, hélicoptères, fusées, satellites, navigation des bateaux, déformations des corps solides,
structure interne des étoiles, etc. Par ses attaches à la mécanique thermique (thermodynamique), elle s'étend
jusqu'à la thermique, l'énergétique, l'acoustique.

Prenant en compte les comportements des milieux continus, elle englobe l'hydrodynamique, la dynamique
des gaz, l'élasticité, la plasticité et d'autres comportements. Elle est la clé de ce que nous appelons
aujourd'hui la "modélisation", qui n'est autre que l'art d'analyser un phénomène physique et de le décrire en
termes mathématiques, ce qui permet de l'étudier avec la rigueur propre à cette discipline.

Cette section du site est séparée en 4 parties principales: solides, liquides, gaz et plasmas. Dans chaque
partie, nous introduirons les outils mathématiques spécifiques à l'étude de tel ou tel milieu continu avec une
complexité (toute relative) croissante. Cependant, par choix il a été décidé d'exposer les théorèmes avec les
outils mathématiques les plus simples possibles mais tout en arrivant aux mêmes résultats. Ainsi, par
exemple, la démonstration de l'équation de Navier-Stokes qui prendrait 150 pages de développements
mathématiques rigoureux n'en prend plus que 27. Il y a donc un avantage non négligeable aussi bien pour
l'auteur que pour le lecteur à procéder ainsi.

Remarque: Concernant les équations de Navier-Stokes, nous donnerons aussi des exemples pratiques de
celles-ci lors de notre étude de la météorologie.

SOLIDES

Des atomes d'un même élément ou d'éléments différents s'assemblent en des édifices spécifiques. Cela
conditionne la force de leurs interactions électriques, qui définissent la structure finale de la substance. Dans
les conditions normales sur notre planète, la matière existe à l'état solide, liquide, gaz ou plasma. Si les
forces interatomiques sont assez intenses, la collection de particules conserve sa forme et son volume.

Cette propriété de conserver la forme et le volume, ainsi que des propriétés élastiques distinguent les solides.

PRESSIONS

Les notions de "compression" et "contrainte" (que nous pouvons englober dans le terme de "pression") sont
de première importance en mécanique des fluides. Il convient donc de définir ces différents types de
pression avec le plus de rigueur possible.
Définitions:

D1. Nous appelons "pression de compression" et nous notons traditionnellement P le rapport entre la force F
qui s'exerce (s'appuie) sur un élément de surface S. Ainsi, sous forme scalaire:

(34.1)

Remarque: Si une force agit sur une surface finie, nous parlons alors de "force répartie".

D2. Nous appelons "pression de contrainte" et nous notons le rapport entre la force F qui tire sur un élément
de surface S. Ainsi, sous forme vectorielle:

(34.2)

où et sont respectivement les "contraintes normales" et "contraintes tangentielles".

Nous pourrions très bien englober les deux définitions ci-dessus en une seule et travailler avec les signes des
forces. Mais par souci de cohérence avec ce qui est enseigné dans les écoles, nous garderons ces deux
définitions qui s'identifient par définition par le fait que leurs forces sont opposées par rapport à un élément
de surface S.

ÉLASTICITÉ DES SOLIDES

D'une manière ou d'une autre, une contrainte de compression ou de traction peut déformer le triplet hauteur,
largeur, épaisseur d'un corps. S'attaquer directement à l'étude d'un cas qui déforme ces trois paramètres est
un peu long et sera abordée plus bas dans la partie traitant de la détermination de l'expression du module de
Young de cisaillement.

Mais il est utile, ne serait-ce que du point de vue du vocabulaire de donner un exemple à partir du cas le plus
simpliste qui puisse être. Si nous imaginons un corps élastique d'une dimension (ayant ni hauteur, ni largeur
mais juste une longueur) sous l'application de deux forces de contraintes parfaitement colinéaires mais
antagonistes, nous pouvons imager que le corps en considération s'allonge d'un certain facteur.

Définition: La "déformation normale" sous des forces axiales et antagonistes est donnée par le rapport entre
la variation de longueur du corps sur sa longueur initiale tel que:

(34.3)

Cette relation est une forme extrêmement simplifiée de tous les types de déformations qu'il peut exister et
que nous verrons plus loin en détails.
Il y a nécessairement une relation entre les forces de compression et de traction et la variation de dimension
d'un corps. Cette relation est dépendante de la structure atomique du matériau et devrait rigoureusement faire
appel à la physique quantique pour être déterminée (nous nous en abstiendrons cependant dans cette section
du site). Nous observons cependant suivant les matériaux des caractéristiques diverses qui intéressent aux
plus hauts points les ingénieurs:

(34.4)

Les figures ci-dessus représentent la variation de la contrainte de compression en fonction de la déformation


pour certains matériaux (habituellement nous représentons ces caractéristiques en inversant les axes). Les
matériaux ductiles comme l'acier doux (a), cessent d'être linéaires à la limite d'élasticité . Sous traction
les polymères (b) caoutchouteux s'allongent d'abord en dépliant leurs molécules (cf. chapitre de Génie Des
Matériaux) puis en tirant sur les liaisons chimiques (cf. chapitre de Chimie Quantique). La plupart des
matériaux biologiques (c) sont sous contrainte, même lorsqu'ils ne sont pas déformés. La peau, par exemple,
est comme un gant de caoutchouc enveloppant le corps. L'élastine (d) est habituellement renforcée de
collagène dans les systèmes biologiques tels que les artères. Un tendon est fait principalement de collagène.

Dans un cas plus général, les ingénieurs ont pour habitude de définir les points représentés ci-dessous dans
leurs mesures d'essais de traction:

(34.5)
La caractéristique ci-dessus comporte une partie linéaire comme c'est le cas d'une certaine classe de
matériaux. Cela signifie que la pente de la caractéristique est une constante, qui reflète la déformation
élastique du matériau sous l'effet de la contrainte croissante. Cette contrainte élastique par unité de
déformation définit le "module de Young" (il n'y a pas de composante tangentielle dans ce cas d'étude !):

(34.6)

cette relation étant valable aussi bien en contraintes de compression qu'en traction.

Remarques:

R1. La "rhéologie" est une partie de la mécanique qui étudie la plasticité, l'élasticité, la viscosité et la fluidité
caractéristiques des corps déformables. C'est une branche très importante de l'ingénierie industrielle.

R2. Attention les calculs qui vont suivre sont relativement longs et difficiles et ce même si nous avons
essayé de les simplifier aux maximum. Cependant tous les résultats nous seront infiniment utiles que ce soit
pour déterminer l'équation de Navier-Stokes pour l'étude da la résistance des matériaux (cf. chapitre de
Génie Mécanique)!

LOI DE HOOKE

Étant donné les définitions données précédemment, nous obtenons la relation:

(34.7)

qui est par définition la "loi linéaire de Hooke" en contrainte normale.

Il est assez intuitif de supposer que plus la force de liaison des atomes constituant le matériau étudié est
grande, plus grande est la force à appliquer pour éloigner les atomes, donc pour étirer le corps. Les solides
qui ont des grandes forces de liaisons, ont une haute température de fusion (cela est approfondi dans le
chapitre traitant de la Chimie Quantique).

Si nous notons :

(34.8)

Nous nous retrouvons avec la loi que nous connaissons:

(34.9)

qui est la force de rappel des ressorts (cf. chapitre de Mécanique Classique).

Mais il existe plusieurs types de contraintes avec leurs modules respectifs. Ainsi voici la définition des plus
importantes dans la partie linéaire de leur caractéristique:

D1. Nous définissons le "module de cisaillement" ou "module de rigidité":

(34.10)
et le "module d'élasticité de glissement" ou "module de Coulomb" (dont nous démontrerons plus loin la
provenance):

(34.11)

où est "l'angle de déformation" et le "coefficient de Poisson". Généralement cet angle étant petit:

(34.12)

Exemple:

Une chose intéressante (pour la parenthèse...) si nous considérons que les plaques tectoniques sont en
cisaillement entre-elles nous avons alors:

(34.13)

Or pour une plaque tectonique en frottement de longueur sur une hauteur H:

(34.14)

et puisque que l'énergie est une force multipliée par une distance, il vient:

(34.15)

qui est typiquement l'énergie dégagée par le cisaillement de la friction de deux plaques tectoniques dont les
surfaces de contact ont une hauteur moyenne H, une longueur initiale et qui subissent une déformation
de .

Typiquement pour un tremblement de terre du typa Sumatra (2004), nous avions:

(34.16)

Dès lors il vient:


(34.17)

en d'autres termes... mille fois l'énergie de la bombe nucléaire d'Hiroshima.

Soit en notant M la magnitude sur l'échelle de Richter:

(34.18)

alors que les estimations donnent un intervalle de 6.2 à 8.5... donc on est pas trop mauvais dans l'approche
théorique.

Voilà pour un exemple non appliqué à l'industrie...

D2. Nous définissons le "module de compressibilité omnidirectionnel", comme le rapport de la contrainte


volumique à la déformation volumique (nous démontrerons plus loin les développements mathématiques qui
amènent au dernier terme de la relation):

(34.19)

Nous pourrions encore définir beaucoup de modules tels que le module de flexion, de flexion pure, de
flexion composée, de torsion… Nous étudierons certains d'entre eux plus loin.

Pour chacune des différentes définitions de modules que nous pouvons envisager, nous pouvons définir une
loi de Hooke qui lui est adapté. Cependant, tout cela peut paraître assez arbitraire mais au fait il n'en est rien
car toutes les définitions de modules que nous avons vues précédemment sont un cas particulier d'une
relation mathématique généralisée qui sera démontrée sur ce site dans un proche avenir.

MODULE DE GLISSEMENT

La condition nécessaire pour qu'un solide rigide soit en équilibre statique est comme nous l'avons vu dans le
chapitre de Mécanique Classique, que la résultante des forces que l'extérieur exerce sur le corps soit nul:

(34.20)

Cependant, quand un solide subit des contraintes et qu'il peut en subir, il peut y avoir déformation qui peut
être suivie d'une rupture ou d'une modification similaire. Plus, précisément, il y a "déformation" d'un corps
(non nécessairement solide) quand les distances entre certains points du corps ont changé.

Lorsque dans l'étude théorique de l'élasticité, nous excluons les modifications du corps étudié telles que les
ruptures, nous disons que nous nous restreignons aux "déformations élastiques".

La géométrie et la physique des déformations peuvent être complexes. Leur description se déduit de celle
d'un certain nombre de déformations élémentaires dont nous préciserons plus loin les caractéristiques.
(34.21)

Les forces scalaires de contraintes de traction engendrent sur leurs faces respectives des tensions
"normales" (perpendiculaires donc!):

(34.22)

En admettant que la force agit seule, la déformation unitaire est par définition :

(34.23)

Lorsqu'un parallélépipède est soumis à un effort de traction , il y a intuitivement contraction des


dimensions dans la direction x. Contraction observable de façon tout aussi intuitive pour .

Nous avons alors si agit seul:

(34.24)

où le signe "-" indique une contraction et où est un coefficient appelé "coefficient de Poisson".

Si agit seule:

(34.25)

En acceptant le principe de superposition des forces, l'effet produit par plusieurs forces agissant
simultanément est égal à la somme des effets produits par chacune des forces superposées agissant
séparément.
Ceci est admissible, étant donné la linéarité des équations unissant la déformation unitaire et la tension
normale. Nous obtenons alors:

(34.26)

En ayant procédé de manière identique pour les deux autres directions OY et OZ.

A partir des relations précédentes, il est aisé de trouver les équations unissant à :

(34.27)

Soit un matériau soumis à des contraintes diverses. A l'intérieur de celui-ci, nous opérons, par la pensée,
l'extraction d'un parallélépipède rectangle. Les faces de celui-ci sont sollicitées par des contraintes normales
et tangentielles (sur le schéma ci-dessous le solide est en équilibre statique).

(34.28)

Les contraintes normales et de tangentielles représentent les actions du parallélépipède de matériau ôté
mentalement sur les faces de l'élément examiné.

Il est intéressant (dans le sens que cela facilite l'analyse) de rechercher les contraintes qui existent dans un
plan faisant un angle avec l'axe des x. Pour ce faire, nous imaginons un triangle de matière ayant un angle
au sommet enlevé hors de la matière mentalement. Nous négligerons l'effet de la pesanteur.
Soit :

(34.29)

Posons:

(34.30)

et dz étant l'épaisseur du solide (non représenté sur le schéma précédent).

Sur la longueur ds, des contraintes apparaissent et se décomposent en contraintes normale et tangentielles
(dites de "contraintes cisaillement" ou de "contraintes flexion" également) .

Le problème consiste à établir les relations entre et et .

Les conventions de signes sont :

- Les contraintes exerçant une traction sont positives alors que les tensions exerçant une compression
sont négatives.

- Les contraintes ayant tendance à faire tourner le parallélépipède dans le sens des aiguilles d'une montre,
sont positives. Dans le sens antihoraire, elles seront négatives.

L'équation d'équilibre de projection sur la direction ON est :

(34.31)

Rappelons que:

(34.32)

Comme et nous avons :


(34.33)

comme :

et (34.34)

alors :

(34.35)

Finalement :

(34.36)

Conclusion : En fonction de et , il est possible de calculer la tension normale qui existe sur une
surface plane quelconque d'angle .

L'équation d'équilibre de projection sur la direction de OT est:

(34.37)

comme alors finalement :

(34.38)

Conclusion : En fonction de et , il est possible de calculer la tension tangentielle qui existe sur
une surface plane quelconque d'angle .

Soit, à présent, la situation suivante:


(34.39)

Il s'agit d'un bloc de matière dont l'on extrait virtuellement un plan de forme carré que l'on va étudier en
prenant en première partie qu'un des triangles rectangle le composant pour ensuite étudier l'ensemble.

Avant la sollicitation, nous considérons donc le losange abcd qui est en fait un carré à suivant la
direction OX.

Pendant la sollicitation, ce losange se déforme sous l'action des contraintes tangentielles décomposées de
contraintes de cisaillement pur et devient le losange a'b'c'd'. La diagonale bd est alors étendue et la diagonale
ac est comprimée. L'angle en a qui valait vaut après déformation (en a'). De même, l'angle en
b qui valait vaut à présent (Fig. A).

Remarque: L'angle est appelé "angle de glissement" et nous le considérerons comme faible.

Nous pouvons nous rendre compte de l'effet de la déformation en isolant le losange et en lui faisant subir
une rotation de . Après déformation, nous avons la forme indiquée par les lignes en pointillées (Fig. B).

L'angle de glissement étant petit, nous avons :

(34.40)

Donc représente le glissement du coté ab par rapport à dc divisé par la distance entre les deux plans ab et
dc. L'analyse qui vient d'être effectuée reste valable quel que soit le corps solide ou liquide considéré.

Soit, à présent, le cas d'un solide élastique obéissant à la loi de Hooke. Le problème va consister à établir la
relation entre l'angle de glissement et les contraintes tangentielles agissant sur les cotés du losange.

Soit le triangle rectangle oab. L'allongement du coté et le raccourcissement du coté oa pendant la


déformation s'obtiennent à partir des équations suivantes :
(34.41)

Comme:

(34.42)

Nous avons :

et (34.43)

Donc :

(34.44)

donc la longueur oa' diminue si augmente .

(34.45)

donc ob' augmente si augmente.

Pour l'angle triangle rectangle oa'b', nous avons :

(34.46)

Or:

(34.47)

Comme ( est petit) nous avons :


(34.48)

Soit:

(34.49)

Finalement nous avons la relation donnant le "module de glissement" que nous avions donné plus haut sans
démonstration :

(34.50)

MODULE DE COMPRESSIBILITÉ

Nous reste encore à voir la provenance mathématique de l'expression d'un autre module tout aussi important
que le module en cisaillement: le module de compressibilité .

Soit les équations déterminées dans l'étude précédente:

(34.51)

Si les forces appliquées sur le cube sont égales en intensité nous avons:

(34.52)

Ce qui nous donne:

(34.53)

En sommant les termes selon le principe de superposition linéaire des forces:

(34.54)

Or:
(34.55)

Finalement:

(34.56)

ce que nous notons également:

(34.57)

ou encore:

(34.58)

avec étant par définition le "coefficient de compressibilité".

MODULE DE FLEXION

Pour l'étude du module de flexion considérons la situation ci-dessous:

(34.59)

La figure de gauche ci-dessus représente un matériau à l'état statique. La figure de droite représente le même
matériau mais soumis à un moment de force couplé M.

Comme le matériau subit à sa surface à la fois une compression et à l'opposé une tension, il doit donc exister
une frontière (une ligne ou un plan) ou aucune contrainte n'existe. Cette ligne ou ce plan (c'est rare que nous
ayons affaire à un matériau ayant uniquement deux dimensions…) est appelé "plan neutre". Ce plan neutre
va nous servir de référence pour définir la contrainte de flexion.

Maintenant que ce plan est défini, considérons les figures ci-dessous:


(34.60)

Soir R le rayon de courbure de la barre (cylindre, plaque, parallélépipède, …). La déformation sur le
segment est définie par la relation:

(34.61)

Les longueurs mn et ij sont définies par:

(34.62)

et la longueur par:

(34.63)

ainsi l'expression de la déformation devient:

(34.64)

ce qui indique que la déformation varie de façon linéaire avec y.

Nous pouvons définir le module de flexion par:

(34.65)

Considérons l'état statique de la barre. La somme des contraintes de traction et compression sont alors
nulles. Effectivement, nous le voyons bien si nous considérons le schéma ci-dessous:

(34.66)
Considérons la force agissante sur un élément de surface dS. Nous pouvons considérer l'équilibre des
forces à l'état statique tel que:

(34.67)

En substituant l'expression de la contrainte obtenue précédemment:

(34.68)

En supposant linéaire la caractéristique de contrainte en première approximation donc .

En simplifiant un tant soit peu:

(34.69)

Si nous multiplions l'intégrale par alors la relation doit être égale au moment de force appliqué tel que:

(34.70)

En substituant par l'expression de la contrainte obtenue précédemment:

(34.71)

Ce qui nous amène à définir le terme:

(34.72)

que les ingénieurs nomment le "moment d'inertie de la barre par rapport au plan neutral" ou encore "moment
d'inertie statique". Ce terme représente une mesure de la rigidité de la section transversale de la barre d'un
point de vue géométrique, sans considérations des propriétés matérielles.

Substituant cette relation dans l'équation de contrainte de flexion, nous obtenons le "module de flexion":

(34.73)

La difficulté pour l'ingénieur consiste souvent à localiser mathématiquement le plan neutral...

LIQUIDES

Les fluides usuels sont de deux types: les liquides et le gaz (les solides sont aussi parfois considérés comme
des fluides...ce n'est qu'une question d'opinion..). Etymologiquement, un fluide est susceptible de s'écouler.
Le liquide adopte la forme du récipient qui le contient tout en conservant un volume propre à peu près
invariable. Le gaz n'a pas de volume propre: il envahit uniformément (mécanique statistique de Boltzmann)
le récipient dans lequel il est maintenu. Une atmosphère en constitue un cas spécial, du fait qu'elle est
maintenue par la gravité à la périphérie d'un astre, ce qui exclut l'uniformité de la densité ou pression.

La distinction entre liquide et gaz est subtile. Nous pouvons cependant dire que le volume propre des
liquides manifeste l'existence d'une cohésion liée à une densité assez grande (liaisons de Van der Waals);
cette cohésion disparaît avec le volume propre chez les gaz.

Si nous comparons les fluides avec les solides, la première remarque qui s'impose concerne l'isotropie (les
propriétés sont les mêmes dans toutes les directions spatiales) des fluides usuels qui est toujours réalisée (si
nous n'agissons pas sur le fluide en tout cas!).

Nous allons aborder la théorie de la mécanique des fluides en difficulté croissante et par redondance.
D'abord il va être démontré que les propriétés d'un fluide statique sont isotropes (théorème de Pascal). A
l'aide de ce résultat, il va être plus simple de comprendre le théorème de Bernoulli qui va nous permettre,
entre autres, de définir le concept de "pression hydrostatique". Ensuite, nous construirons un modèle très
important de la dynamique des fluides, connus sous le nom de "équations de Navier-Stokes", que l'on dans
tous les domaines possibles (astrophysique, mécanique quantique, météorologie,..). Ce modèle de
dynamique des fluides est conséquent en développements théoriques et résultats expérimentaux et peut être
considéré comme un terrain difficile. Cependant, pour faciliter la lecture, nous avons choisi de ne pas
aborder celui-ci directement par usage du calcul tensoriel. Nous avons ainsi fait en sorte que les variables
tensorielles apparaissent d'elles-mêmes d'écoulant des résultats simples de l'analyse vectorielle que nous
obtiendrons. Une fois les équations de Navier-Stokes déterminées et démontrées, nous verrons que nous
pouvons retrouver l'expression du théorème de Bernoulli à partir de ces mêmes équations.

La dynamique des fluides, ou "hydrodynamique", est de loin, le domaine de la mécanique classique le moins
aisé en ce qui concerne la description et la prédiction. C'est pourquoi le théorème de Bernoulli s'utilise
fréquemment, non pour expliquer en détail le comportement d'un fluide, mais pour en faire une description
qualitative.

THÉORÈME DE PASCAL

Le résultat qui va suivre est de la plus haute importance pour comprendre l'ensemble de la mécanique des
fluides. Il faut prendre le temps de comprendre !

(34.74)

Si nous considérons les forces s'exerçant, en l'absence de mouvement, sur un tétraèdre élémentaire OABC
de volume élémentaire V. Il est toujours possible d'adopter un volume suffisamment petit pour avoir une
pression uniforme s'exerçant sur les faces du tétraèdre.
Soient , les pressions de réaction du fluide dues aux contraintes extérieures sollicitant les faces
respectives OBC, OAB, OAC et ABC de surface . Soient également les cosinus directeurs
(cf. chapitre de Calcul Vectoriel) du vecteur unitaire normal à la surface ABC.

Le système étant en équilibre, la résultante des forces de réaction du système est nulle. Nous avons donc
les équations suivantes résultant de la projection suivant les trois axes de coordonnées:

(34.75)

Par simplification élémentaire il vient:

(34.76)

Nous obtenons alors la relation suivante:

(34.77)

Conclusion importante: en un point quelconque d'un fluide, la pression est indépendante de la direction de la
normale à la surface élémentaire sur laquelle elle s'exerce.

Par le principe de l'action et de réaction de Newton, nous sommes amenés à énoncer le "théorème de
Pascal":

Les fluides incompressibles transmettent intégralement et dans toutes les directions, les pressions qui leur
sont appliquées.

Ce théorème est fondamental aussi bien en mécanique des fluides qu'en mécanique des gaz et les
implications pratiques sont énormes (ce théorème explique entre autres, que la pression est indépendant de la
géométrie du contenant du liquide) !

VISCOSITÉ

En mécanique des fluides, il est utile de considérer plusieurs types fluides ayant des caractéristiques qui les
différent. Ceci s'avère particulièrement pratique pour les simulations tout en restant conforme à l'observation
expérimentale (cf. chapitre de Génie Météo Et Marin).

Nous définissons la "viscosité" par les forces internes s'opposant au déplacement des diverses couches
composant le fluide. Nous distinguons la "viscosité dynamique" et la "viscosité cinématique" .

1. La viscosité dynamique :

(34.78)
avec étant le coefficient de viscosité dynamique (l'unité étant le Poiseuille [PI]), dF variation de la force
de frottement entre deux couches infiniment voisines, variation de la vitesse par la distance entre deux
couches infiniment voisines et dS étant la surface considérée .

Conclusion: le Poiseuille est la viscosité d'un fluide nécessitant 1 Newton pour faire glisser à la vitesse de 1
mètre pas seconde, deux couches fluides de 1 mètre carré distantes de 1 mètre.

Remarque: Anciennement, l'unité employée était la "poise" :

2. La viscosité cinématique est définie par:

(34.79)

Une transformation de la définition de la viscosité dynamique donne (il faut se rappeler de cette relation
pour plus tard !!):

(34.80)

Soit:

(34.81)

Par définition les fluides ayant les caractéristiques suivantes:

(34.82)

sont nommés respectivement:

- Fluides pseudo-plastique (1)


- Fluides newtoniens (2)
- Fluides dilatant (3)

Il existe encore un 3 autres types de fluide non représenté sur le schéma et dont la viscosité est supposée
nulle (cf. chapitre de Thermodynamique):
- Fluides parfaits (4)
- Fluides semi-parfaits (5)
- Fluides réels (6)

Remarques:

R1. Le comportement d'un fluide parfait est très différent de celui d'un fluide réel aussi petit soit la viscosité
de ce dernier. En effet, le fluide parfait, parce qu'il n'a pas de viscosité, ne dissipe jamais l'énergie cinétique.
Alors qu'un fluide réel très peu visqueux la dissipe efficacement grâce à la turbulence, et au phénomène de
cascade qui l'accompagne.

R2. Nous reviendrons sur les propriétés de la viscosité dynamique et cinématique lors de la démonstration
des équations de Navier-Stokes-(Reynolds).

R3. Les fluides qui ne sont pas newtoniens sont appelés en tout généralité dans la littérature "fluides non-
newtoniens"... et nous ne traiterons pas les ferrofluides ici car trop complexes théoriquement à analyser.

Les fluides non-newtonien ont donc une déformation dépend de la force que nous leur appliquons. Le
meilleur exemple est celui du sable mouillé en bord de mer : quand nous frappons le sable, il a la viscosité
élevée d'un solide, alors que lorsque nous appuyons doucement dessus, il se comporte comme une pâte. Par
ailleurs certains non-newtoniens ont des propriétés telles qu'il est possible pour un individu de courir dessus
sans couler ou de couler en restant en position...

LOI DE POISEUILLE

En 1835 un médecin français, Jean Léonard Marie Poiseuille fit une série d'expériences soignées, pour
déterminer comment un fluide visqueux s'écoule dans un tuyau étroit. Son but était de comprendre la
dynamique de la circulation sanguine chez l'homme. Le plasma du sang se comporte comme un fluide
newtonien, tandis que le sang entier ne l'est pas. Presque la moitié du volume normal du sang est faite de
cellules assez grandes pour perturber l'écoulement laminaire, surtout quand elles entrent en contact avec les
parois des vaisseaux, un phénomène qui prend de l'importance dans les capillaires très étroits. Néanmoins,
l'analyse de Poiseuille s'applique à l'écoulement dans les veines et les plus grosses artères et elle a une
grande valeur, bien qu'elle soit un peu simpliste.

Le résultat de Poiseuille peut être établi en considérant le fluide dans un tuyau comme formé de couches
cylindriques orienté selon un axe x de rayon r concentriques qui se déplacent à des vitesses qui vont en
décroissant à parti du centre (symétrique circulaire supposée).

Alors la relation définissant la viscosité s'écrit :

(34.83)

Ce qui nous donne la force de viscosité sur le cylindre. La surface de contact de chaque couche cylindrique
de longueur l est donnée par et donc :

(34.84)

L'origine de l'accélération (in extenso de la force) ne peut se faire que par une différence de pression telle
que :

(34.85)
ce qui nous amène à écrire :

(34.86)

En intégrant membre à membre, nous obtenons :

(34.87)

Soit :

(34.88)

La courbe représentative de la vitesse en fonction de r est une parabole dont le sommet se situe sur l'axe
centre du cylindre ( ). Le débit volumique transporté par une couche cylindrique entre r et est
. Ainsi, le débit total est :

(34.89)

et nous obtenons la "loi de Poiseuille" pour le débit laminaire visqueux :

(34.90)

Nous trouvons donc le résultat logique que le débit augmente avec le gradient de pression et le rayon
du tube, et diminue avec la viscosité.

Nous trouvons par ailleurs une relation analogue à la loi d'Ohm (cf. chapitre d'Électrocinétique) où la
différence de potentiel est donnée par la résistance multipliée par le courant alors que la différence de
pression est donnée par la résistance visqueuse multipliée par le débit.

THÉORÈME DE BERNOULLI

Quand nous discutons du mouvement d'un fluide, l'équation de continuité (cf. chapitre Thermodynamique),
qui exprime la conservation de la masse (volumique) du fluide est une notion importante.

(34.91)

Considérons cette équation dans le cas particulier qui nous intéresse ici un fluide non visqueux en
écoulement laminaire se déplaçant à l'intérieur d'un tube de lignes de courants parallèles (le mouvement du
fluide est de type irrotationnel - voir chapitre de Calcul Vectoriel du site), délimité par la surface :
(34.92)

Nous sommes en régime stationnaire (l'aspect du mouvement est indépendant du temps) et la masse n'est ni
apportée par une source ni enlevée par un puits à l'intérieur de la région considérée. Le volume de fluide qui
traverse dans l'intervalle correspond à un cylindre de base , de longueur et donc de volume
. La masse de fluide qui a traversé pendant le temps est donc:

(34.93)

De même:

(34.94)

est la masse de fluide qui a traversé:

(34.95)

pendant le même intervalle de temps. Avec les hypothèses faites, l'équation de conservation de la masse
exige que les deux masses soient les mêmes, ou que exprimé autrement:

(34.96)

D'où:

(34.97)

Ceci est la forme de l'équation de continuité dans le contexte qui nous intéresse. De plus, si le fluide est
incompressible, la densité est partout la même et l'équation précédente se réduit à:

(34.98)

Considérons maintenant une région dans un fluide où il y a un flux stationnaire comme l'indique la figure ci-
dessous:
(34.99)

Pendant un court intervalle de temps , le fluide qui, initialement, traversait a progressé jusqu'à une
surface à la distance tandis que le fluide qui traversait se retrouve en à une distance
. Puisque le reste du volume entre les surfaces et reste inchangé, nous allons porter notre attention
sur les deux volumes (égaux) hachurés sur la figure.

Ces deux volumes sont égaux car le fluide est incompressible et l'équation de continuité est valable. Soient
et les forces exercées sur les surfaces et en raison de la pression existant dans le fluide. A
cause de ces forces, le fluide produit ou reçoit du travail en déplaçant les deux volumes. En , la surface est
poussée par le fluide et le travail exercé sur le fluide alors qu'en le fluide pousse la surface et le
travail effectué par le fluide est . Le travail total exercé sur le volume de fluide situé entre et est
donc:

(34.100)

en appelant et les pressions respectives en et et en écrivant:

(34.101)

d'après la définition de la pression. Comme:

(34.102)

d'après l'équation de continuité et l'hypothèse d'incompressibilité, nous pouvons écrire que:

(34.103)

Le travail extérieur exercé sur le système change son énergie propre comme l'établit la thermodynamique
( ). Pour le volume de fluide considéré, l'énergie propre des volumes mis en évidence comprend
l'énergie cinétique et l'énergie potentielle de gravitation. Le fluide entre et gagne de l'énergie dans le
volume . Supposons que les deux volumes aient une masse égale m, de nouveau à cause de
l'équation de continuité. Alors le gain net d'énergie est:

(34.104)
Puisque nous avons déjà supposé le fluide incompressible, la densité est la même partout et m peut être
remplacé par aux deux extrémités. D'où:

(34.105)

En combinant cette relation avec nous obtenons :

(34.106)

ou:

(34.107)

Comme l'équation ci-dessus concerne des grandeurs prises en deux points arbitraires le long d'une ligne de
courant, nous pouvons généraliser et écrire:

(34.108)

Ce résultat, connu sous le nom de "théorème de Bernoulli", exprime la constance de la pression le long d'une
ligne de courant dans un fluide incompressible, irrotationnel et non visqueux et où les forces volumiques
extérieures dérivent d'une énergie potentielle (nous reviendrons là-dessus après avoir déterminé les
équations de Navier-Stokes).

Signalons aussi une manière élégante et simple de retrouver cette relation. La conservation de l'énergie nous
donne le long d'une ligne de courant:

(34.109)

avec respectivement et dans l'ordre la somme de l'énergie cinétique, de l'énergie potentielle et de l'énergie de
pression. Soit:

(34.110)

et si nous divisons tout cela par le volume nous obtenons alors:

(34.111)

voilà....

Remarques:

R1. D'une ligne de courant à l'autre, c'est la valeur de la constante qui change. De plus, l'utilisation du
théorème de Bernoulli exige de connaître la forme des lignes de courant.
R2. La conservation de la quantité de gauche exprime la conservation de l'énergie le long d'une ligne de
courant et nous y trouvons respectivement l'énergie cinétique volumique, l'énergie potentielle volumique de
pesanteur et la pression.

Considérons maintenant deux applications importantes du théorème de Bernoulli.

Si le fluide se déplace dans un plan horizontal, l'énergie potentielle de gravitation reste constante et
l'équation de Bernoulli se réduit alors à:

(34.112)

Donc, dans un tuyau horizontal, la vitesse est d'autant plus grande que la pression est plus faible et
réciproquement. Nous utilisons aussi cet effet pour créer participer à la poussée d'un avion (attention ce
paramètre est mineur car ce n'est pas ce qui contribue le plus au vol d'un avion, c'est l'effet Magnus dont la
démonstration sera donnée plus loin).

(34.113)

Le profil d'une aile est construit de telle sorte que l'air a une vitesse plus grande au-dessus de la surface de
l'aile qu'au dessous qu'au dessus, ce qui produit une pression plus forte au-dessous qu'au dessus. Il en résulte
donc une force résultant vers le haut.

Autrement dit, une spécialiste dans l'aérodynamique (pour les avions) ou en hydrodynamique (pour les
stabilisateurs de roulis des gros bateaux) dirait:

- A l'extrados : Par effet de courbure, les particules d'air (d'eau) sont contraintes de parcourir une distance
plus grande. Leur vitesse va donc d'abord s'accroître fortement pour diminuer ensuite afin de retrouver au
bord de fuite la vitesse initiale de l'écoulement. Tout l'extrados est donc le siège d'une dépression locale
généralisée. La couche limite, d'abord laminaire, devient peu à peu turbulente, voire tourbillonnaire
lorsqu'on approche du bord de fuite.

- A l'intrados : le profil constituant un obstacle à l'écoulement, l'air (l'eau) va se trouver freiné : nous voyons
donc apparaître une surpression localisée sur l'intrados. En fait, avec la forme des ailes d'avion actuelle, en
position horizontale, l'effet Bernoulli serait négligeable. Pour qu'un avion décolle, il faudrait que l'extrados
ait une surface beaucoup plus grande.

C'est bien mieux ainsi non ?

Autre chose encore, si le fluide n'est pas en mouvement, nous avons l'équation de Bernoulli qui s'écrit:

(34.114)
Il s'agit de "'équation de Laplace" en hydrostatique (utilisée dans les vases communicants).

THÉORÈME DE TORRICELLI

Le théorème de Torricelli permet de déterminer la vitesse d'écoulement d'un liquide. C'est un cas classique
d'étude dans les petites écoles.

Considérons un volume fermé contenant un liquide de masse volumique et muni d'un orifice de surface
, duquel le liquide coule vers l'extérieur. Nous voulons déterminer la vitesse d'écoulement du liquide de
cet orifice. Le volume est supposé être assez grand pour que ni le niveau du liquide, ni la pression P au-
dessus de sa surface ne varient de façon appréciable pendant l'écoulement. Comme le tube d'échappement
de liquide va de la région de la surface du liquide à l'orifice ouvert à l'air libre, nous avons . Un
liquide coulant à l'air libre est à la pression atmosphérique, , car le liquide est entouré d'air libre et
rien ne peut maintenir une différence de pression. D'après l'équation de Bernoulli, avec , nous
trouvons sur une ligne de courant :

(34.115)

d'où :

(34.116)

De l'équation de continuité ( ), nous déduisons que si alors et est alors


négligeable devant . Dans le cas particulier, mais fréquent, où le réservoir est ouvert à l'air libre ( ),
la densité d'énergie de pression disparaît. Le fluide coule sous l'effet de la gravité, sans être poussé par une
différence de pression. Nous trouvons alors (en multipliant par la surface de l'orifice, nous obtenons le
débit):

(34.117)

Cette relation constitue le "théorème de Torricelli". Chose curieuse, nous avons déjà vu cette relation en
mécanique classique pour la vitesse de chute libre d'un corps. Il en retourne l'observation faite par Torricelli
: si le jet est dirigé directement vers le haut, il atteint presque le niveau de la surface du liquide dans le
volume. La raison pour laquelle le jet n'atteint pas effectivement ce niveau est une certaine perte d'énergie à
cause du frottement.

EFFET VENTURI

Certaines applications pratiques de la mécanique des fluides résultent de l'interdépendance de la pression et


la vitesse. Il y a une catégorie de situations dans lesquelles la variation d'énergie potentielle gravitationnelle
est négligeable. L'équation de Bernoulli relie alors la différence de pression à la différence d'énergie
cinétique donc la variation du carré de la vitesse.

Nous considérons un fluide incompressible (!), non visqueux et de masse volumique . Le fluide s'écoule en
régime permanent dans une canalisation cylindrique de rayon et de section suivie par un tube
cylindrique de rayon et de section . Le raccordement est fait par une canalisation conique assez
longue pour que l'on reste en régime laminaire.
Nous savons (équation de continuité) que :

(34.118)

qui veut dire, comme nous l'avons vu, qu'une diminution de la section traversée par le fluide se traduit par
une augmentation de sa vitesse.

Dans toute situation où le flux entrant est environ au même niveau que le rétrécissement , l'équation
de Bernoulli s'emploie pour exprimer la différence de pression :

(34.119)

devient :

(34.120)

Utilisant l'équation de continuité, pour éliminer , nous obtenons :

(34.121)

Comme le second membre de la relation est positif et : il y a donc une chute de pression dans
la région étroite. En arrivant à la région divergente à nouveau en , la pression du fluide augmente de
nouveau et la vitesse reprend sa valeur initiale. Cette diminution de la pression qui accompagne
l'augmentation de la vitesse est appelée "effet Bernoulli" ou "effet Venturi".

Ainsi, la vitesse du fluide augmente dans un goulot d'étranglement pour satisfaire l'équation de continuité
(conservation du flux/masse) et le fait qu'il soit incompressible (sinon il y aurait une sorte de bouchon...).

Remarque: Paradoxalement l'effet Venturi se produit aussi lors du franchissement d'un sommet ou d'une
crête par l'air atmosphérique ou également dans les rues des villes. En effet l'air qui arrive sur la montagne
ou la crête à tendance à "s'écraser" dessus. La section d'écoulement de l'air au sommet est donc plus faible
qu'à la base. Il se produit donc également un effet Venturi : la vitesse du vent est plus élevée sur les sommets
et les crêtes qu'en bas (les professionnels du planeur en savent quelque chose...).

TUBE DE PITOT

Le tube de Pitot permet la mesure de la vitesse d'écoulement d'un gaz subsonique. Le tube de Pitot consiste à
pratiquer dans un tube, un orifice de prise de pression en A et en B:

(34.122)
Le point A est un point d'arrêt car la vitesse est nulle (il n'y pas d'écoulement dans l'orifice, c'est juste une
prise de pression). Loin de l'obstacle (le tube de Pitot) l'écoulement est supposé uniforme de vitesse v et de
pression .

En A (point d'arrêt), en utilisant la relation de Bernoulli le long de la ligne de courant et en considérant la


variation de hauteur entre A et B négligeable, la pression vaut:

(34.123)

Nous avons donc:

(34.124)

Donc pour les avions à partir de la différence d'une mesure de pression et de la connaissance de la densité du
gaz il est possible de connaître la vitesse.

Remarque: En aéronautique, la pression dynamique s'ajoute à la pression statique pour donner la pression
totale qui peut être mesurée au point de vitesse nulle du tube Pitot. En enlevant la pression statique, on
trouve la "pression dynamique".

PERTE DE CHARGE (PRESSION)

Lorsque, dans un écoulement d'un fluide parfait, il n'y a aucune machine (ni pompe ni turbine) entre les
points (1) et (2) d'une même ligne de courant, la relation de Bernoulli peut s'écrire sous la forme suivante :

(34.125)

Lorsque le fluide traverse une machine hydraulique, il échange de l'énergie avec cette machine sous forme
de travail pendant une durée donnée. La puissance P échangée est alors (cf. chapitre de Mécanique
Classique):

(34.126)

où par convention, si l'énergie est reçue par le fluide (pompe) sinon, si l'énergie est fournie par
le fluide (turbine).

Si le débit-volume est , la relation de Bernoulli s'écrit alors logiquement:

(34.127)

où:

(34.128)
Un fluide parfait n'existe pas. Lors d'un écoulement dans une conduite, les forces de frottement dissipent une
partie de l'énergie cinétique et potentielle ce qui se traduite par l'existence de pertes de charges dont il s'agit
de tenir compte.

Considérons un écoulement cylindrique horizontal stationnaire et incompressible. Si nous appliquons la


relation de Bernoulli entre l'entrée et la sortie nous obtenons:

(34.129)

Or, expérimentalement, nous observons qu'il faut imposer une pression plus importante en entrée pour
entretenir le régime permanent. En effet, les forces de viscosité résistent à l'écoulement. Il faut donc imposer
une suppression que nous appelons "perte de charge en pression" et qui est due à l'existence de forces
de frottements (viscosité) ou de pertes singulières (géométrie des circuits de distributions).

L'équation de Bernoulli généralisée s'écrit alors dans ce cas d'étude qui fait partie de l'ingénierie des
procédés:

(34.130)

Cette relation est souvent utilisée dans l'étude théorique (...) des problèmes de conduite.

ÉQUATIONS DE NAVIER-STOKES

Soit un parallélépipède élémentaire extrait d'un fluide statique à l'équilibre de dimensions dx, dy,
dz représenté à la figure ci-dessous. La matière à l'équilibre composant le parallélépipède est en général
soumise à des forces de volume dans toutes les directions (théorème de Pascal) dont les composantes sur les
trois axes orthogonaux sont représentées sur la figure ci-dessous (ces forces peuvent être de nature
gravitationnelles, électromagnétiques ou inertielles...).

(34.131)

Remarques:

R1. Il est important de remarquer que les composantes des tous les vecteurs visibles sur la figure ci-dessus
sont exprimés en newton par unité de surface, soit en d'autres termes par unité de pression (qui est l'unité de
la contrainte pour rappel...).
R2. Il est important d'être attentif au plus haut point sachant à ce qui va suivre car certaines des résultats que
nous obtiendrons ici seront réutilisés dans le chapitre de Relativité Générale pour comprendre le tenseur
d'énergie-impulsion!!

Nous pouvons, comme nous l'avons représenté ci-dessus, décomposer et translater l'ensemble des forces
auxquelles est soumis le parallélépipède aux centres des faces de ce dernier. Nous représentons bien
évidemment chacune des contraintes sur chacune des faces comme la somme des contraintes normales et
tangentielles telles que nous l'avions fait pour l'étude des solides sous contrainte (selon les trois axes
toujours, d'où la somme de trois composantes!).

Au total, nous nous retrouvons avec 18 composantes de contraintes normales et tangentielles:

(34.132)

Nous cherchons à minimiser le nombre de composantes normales afin de déterminer quelles sont les
contraintes suffisantes sur chacun des axes. Ainsi nous poserons:

(34.133)

Donc trois composantes suffisent pour connaître les forces de contraintes normales aux surfaces selon
chaque axe.

Si nous effectuons la somme des moments de forces par rapport aux centres de gravité pour chaque axe de
symétrie du parallélépipède (XX',YY',ZZ') il est évident que sur les 12 composantes tangentielles, 6 suffisent
pour décrire l'ensemble du système.

Ainsi pour le plan XOY passant par le centre de gravité nous avons:

(34.134)

Pour le plan XOZ:

(34.135)

Pour le plan ZOY:


(34.136)

Donc pour chaque plan (XOY, ZOY, ZOX), une composante suffit pour décrire l'ensemble de moments de
forces.

Ainsi, par souci de simplification d'écriture, nous poserons (il est plus conforme de faire les développements
avec des indices en minuscules):

et (34.137)

Au total, cela nous fait donc 3 composant tangentielle plus 3 composantes normales qui sont suffisantes et
nécessaires pour décrire les contraintes sur le parallélépipède selon chaque axe du plan de symétrie de ce
dernier:

(34.138)

Nous pouvons obtenir les mêmes composantes d'équilibre en considérant cette fois un tétraèdre régulier
élémentaire (extrait du cube ci-dessus) statique. Le but étant de démontrer que nous retrouvons bien les 6
composantes déterminées précédemment.

(34.139)

Remarque: Il est important d'observer à nouveau que les composantes des tous les vecteurs visibles sur la
figure ci-dessus sont exprimés en newton par unité de surface, soit en d'autres termes par unité de pression
(qui est l'unité de la contrainte pour rappel...).

Pour connaître l'aire des faces OAC, OBC, OAB , nous multiplions la surface ABC (notée ci-après: S) par le
cosinus de l'angle que forment les vecteurs et .
Effectivement, soit les surfaces:

et (34.140)

Cependant, nous cherchons à exprimer les en fonction de S. Le schéma ci-dessous (coupe du tétraèdre)
devrait aider à comprendre le raisonnement:

(34.141)

et donc:

(34.142)

Finalement:

(34.143)

Le rapport:

(34.144)

d'où:

(34.145)

Le principe d'analyse étant le même pour toutes les autres surfaces telles que:

(34.146)

Nous écrirons donc:

(34.147)
tel que:

(34.148)

Remarque: Nous pouvons facilement connaître les valeurs des à l'aide de l'analyse vectorielle.
Effectivement, le plan ABC étant d'équation:

(34.149)

en simplifiant par :

(34.150)

Le vecteur normal au plan étant bien:

(34.151)

pour connaître les cosinus de l'angle du vecteur normal avec les , il suffit d'assimiler ces derniers au
vecteurs de base tel que (trigonométrie élémentaire):

(34.152)

et en procédant de même pour tous les autres .

L'équilibre des forces nous donne:

(34.153)

Après simplification:

(34.154)

Suivant les autres axes:

(34.155)

Soit en résumé:

(34.156)

En utilisant la représentation matricielle, nous obtenons:


(34.157)

Soit en notation indicielle les forces normales sont données par la relation :

(34.158)

avec ( , si )

Nous voyons apparaître une grandeur mathématique ayant 9 composantes, alors qu'un vecteur dans le
même espace en possède 3. Nous connaissons ce genre d'être mathématique que nous avons déjà étudié
en algèbre dans le chapitre de Calcul Tensoriel. La grandeur est appelée "tenseur des contraintes du
second ordre". En outre, certaines composantes peuvent êtres égales ( , si ) , ce qui le rendrait
symétrique. Il ne possède alors plus que les 6 composantes distinctes, relativement aux nombres de
composantes suffisantes pour d'écrire totalement un système à l'équilibre.

Pour étudier les déformations d'un milieu continu tel qu'un fluide, nous considèrerons d'abord le cas de très
faibles déformations. Les petits déplacements d'un point seront représentés par u, v, w parallèles aux axes
d'un référentiel OXYZ. Nous admettons que ces composantes sont des quantités très faibles variant d'une
façon continue dans le volume du corps considéré.

Soit un segment linéaire OP situé dans un solide avant déformation. Dans un référentiel OXYZ, nous
noterons et les coordonnées de O et P.

Pendant la déformation, la ligne OP devient O'P' tel que représenté ci-dessous:

(34.159)

Soient les déplacements du point O parallèlement aux axes OX, OY, OZ et

les déplacements du point P parallèlement aux mêmes axes.

Les coordonnées des points O' et P' sont alors :

et (34.160)

Avant déformation, soit L la longueur OP :


(34.161)

Après déformation, nous avons une longueur L' valant :

(34.162)

Si est l'allongement de l'élément OP pendant la déformation, nous avons:

(34.163)

En effectuant les quelques transformations suivantes:

(34.164)

En développant:

(34.165)

Soit:

(34.166)

En négligeant les termes de déplacement d'ordre supérieur et en tenant compte de la relation:

(34.167)

il vient que disparaît avec ainsi que les termes au carré, nous avons:

(34.168)
Or, la géométrie analytique (trigonométrie élémentaire; rapport des côtés opposés et adjacents à
l'hypoténuse) donne les relations suivantes :

(34.169)

qui sont les cosinus directeurs de la droite L.

Nous pouvons alors écrire:

(34.170)

La variation étant un déplacement faible, nous avons recours à un développement en série de Taylor (cf.
chapitres Suites Et Séries) dont nous négligeons les termes d'ordre supérieur (linéarisation des équations) :

(34.171)

Nous avons également:

(34.172)

La différence donne:

(34.173)

Donc nous pouvons maintenant écrire :

(34.174)

Finalement:

(34.175)

En groupant, nous avons :

(34.176)

Cette expression permet en un point quelconque le calcul de la déformation dans une direction ayant
comme cosinus directeur l, m, n en fonction des déplacements u, v, w en ce point !
Soit le cas où la ligne L coïncide avec l'axe OX, nous avons , l'équation précédente devient
alors:

(34.177)

Nous avons, si L coïncide avec l'axe OY ou avec l'axe OZ :

(34.178)

Les grandeurs sont appelées "déformations normales" et non pas d'unités.

Pour l'interprétation des termes , nous nous référerons à la figure


suivante:

(34.179)

Soient deux segments de droite OR et OQ situés dans le plan XOY. Avant déformation OR et OQ
coïncidaient avec le référentiel orthonormé YOX. Après déformation, ils peuvent prendre la position O'R' et
O'Q'. Les composantes du déplacement de O sont u, v .

- La composante du déplacement de R' est calculée comme suit:

avec (34.180)

car l'angle est faible .

En toute généralité comme , nous écrirons:

(34.181)
- La composante du déplacement de Q' est elle:

(34.182)

Comme avant déformation, l'angle QOR est de , après déformation, l'angle droit est réduit de .
Cette réduction est appelée "déformation de cisaillement" ou "déformation tangentielle" et est notée
par .

Nous procéderons de la même façon pour les autres termes, d'où :

(34.183)

Compte tenu du quadruplet de groupes d'équations démontrés précédemment dans cette section (voir les
déformations des solides):

(34.184)

Nous pouvons résumer:


(34.185)

Généralement, nous posons pour simplifier les notations (il faut cependant ne pas croire que la déformation
en cisaillement devient une déformation normale ! ce n'est qu'une convention d'écriture dont le physicien
doit se rappeler !):

(34.186)

De même, nous posons:

(34.187)

Soit finalement:

(34.188)

En tenant compte que:

(34.189)

Nous obtenons les tensions de cisaillement comme suit:


(34.190)

Considérons maintenant, pour exemple, un fluide circulant dans la direction de OY avec un gradient de
vitesse dans la direction de x :

(34.191)

En se plaçant au niveau de y et au point 1 d'abscisse x, nous avons une vitesse et au point 2 d'abscisse
x+dx, une vitesse:

(avec ) (34.192)

Dans la direction de x, il n'y a pas de composante de vitesse donc:

(avec ) (34.193)

Nous supposons maintenant que les tensions de cisaillement sont proportionnelles à à un facteur près
tel que:

(34.194)

avec:

(34.195)

Il donc possible de considérer des déplacements par unité de temps en posant:

(34.196)

En rapprochant cette dernière relation de:


(34.197)

nous pouvons dire alors que G initialement valable dans un milieu élastique solide considéré par ses
déplacements est l'analogue de dans le cas d'un fluide visqueux considéré par les déplacements par unité
de temps. Ainsi, nous voyons que les unités sont conservées.

En considérant également les déformations par unité de temps pour les contraintes normales (nous y
reviendrons en détail un peu plus loin), nous avons alors le système d'équations:

(34.198)

Ainsi, nous obtenons une écriture condensée:

(34.199)

où est le symbole de Kronecker :

= (34.200)

Le tenseur décrit ainsi en partie l'ensemble de contraintes d'un fluide visqueux dans lequel nous avons
supposé dans le cadre de l'hypothèse d'un fluide newtonien qu'il y a des relations linéaires entre les tensions
et les déformations normales.

Nous posons maintenant la somme des contraintes dynamiques sous une forme générale que nous allons
justifier:

(34.201)

où le terme se justifie par le fait que dans le cas statique, une pression dynamique constante p existe
toujours en un point d'un fluide que l'on a pas dans le cas d'un solide. Pour justifier le signe négatif, nous
observerons que dans l'expression de , les deux premiers termes du membre de droite correspondent,
dans ''étude précédente ,à des contraintes d'extension, alors que la pression p correspond à une compression
du fluide

Il nous reste à présent, à déterminer le coefficient . Soit , nous avons alors . Il vient
successivement et par addition:

(34.202)

Cette expression doit répondre à un fluide qui est également dans une situation statique tel que:

(34.203)

Il vient alors que dans le cas statique:

(34.204)

Puisque:

(34.205)

Nous avons alors:

(34.206)

L'expression générale des contraintes s'écrit alors pour un fluide newtonien:

(34.207)

Présentement, nous allons introduire les opérateurs de l'analyse vectorielle afin de disposer d'une expression
plus générale. De cette façon, nous pourrons adapter la formulation à n'importe quel système de coordonnées
(cartésiennes, cylindriques, sphériques,...) ce qui facilitera la résolution de problèmes pratiques.

Nous avons vu que pour un solide, nous avions:

(34.208)

Nous allons déterminer les équations sous la forme indicielle en considérant toujours les déplacements par
unité de temps (vitesses).
(34.209)

tel que et que

Pour nous avons ainsi:

ou (34.210)

Pour nous avons:

ou (34.211)

Nous pouvons dès lors écrire:

(34.212)

En effectuant la somme des termes de:

(34.213)

Or, les outils de l'analyse vectorielle nous permettent d'écrire:

(34.214)

Pour le fluide, nous aurons ainsi:

(34.215)

L'équation dynamique des contraintes générale s'écrira alors sous la forme suivante pour un fluide
newtonien:

(34.216)

Tenseurs des contraintes que certains auteurs notent (l'écriture est un peu dangereuse mais elle a une
justification dans un cadre d'étude plus approfondi des fluides!):

(34.217)

ou encore pour différencier vecteur et tenseur:


(34.218)

Si les contraintes normales (fluide incompressible) sont négligeables le deuxième terme se simplifie et nous
avons alors (relation que nous retrouverons dans le chapitre de Génie Marin Et Météo):

(34.219)

Il est, à présent, utile de repasser sous une forme développée pour l'équation précédente, en se rappelant que
(voir plus haut):

(34.220)

Écrivons maintenant le système d'équations de Newton (sommes des contraintes dynamiques internes et
externes à un élément de volume d'un fluide) qui est:

(34.221)

où:

- est la somme des forces externes par unité de volume

- est l'accélération massique

- est la densité du fluide

et qui peut s'écrire sous forme condensée:

(34.222)

avec:

(34.223)

Nous avons:
(34.224)

En introduisant les expressions de obtenues dans la relation ci-dessus, nous aboutissons aux équations:

(34.225)

Ce sont les "équations de Navier-Stokes de la dynamique des fluides newtoniens". Il en existe deux formes
condensées que nous allons de suite déterminer:

En reprenant la première équation de Navier-Stokes et en la développant, il vient :

(34.226)

Comme:

(34.227)

et que:

(34.228)

Nous obtenons:

(34.229)

En simplifiant, il vient finalement:

(34.230)
En opérant de la même manière pour les deux autres composantes, nous pouvons réduire le système
d'équations de Navier-Stokes à une seule équation vectorielle :

(34.231)

Comme (cf. chapitre de Calcul Vectoriel):

(34.232)

Nous avons:

(34.233)

Soit en final:

(34.234)

Remarque: Nous trouvons également parfois dans la littérature, une équation contenant une seconde
viscosité , alors que se manifeste rigoureusement que lors du cisaillement pur selon nos hypothèses,
apparaît lors d'une compression omnidirectionnelle s'accompagnant d'une variation de densité.

L'équation précédente s'écrit alors :

(34.235)

C'est "l'équation de Navier-Stokes" ou aussi appelée "équation de mouvement pour un fluide newtonien".

FLUIDE INCOMPRESSIBLE

Dans un fluide incompressible, nous avons par définition . L'équation de conservation qui est (cf.
chapitre de Thermodynamique):

(34.236)

s'écrit alors:

(34.237)

soit:

(34.238)

L'équation de Navier-Stokes:
(34.239)

s'écrit alors:

(34.240)

ou autrement:

(34.241)

Si de plus la viscosité est négligeable, nous avons donc pour un fluide parfait:

(34.242)

C'est équation est appelée "équation d'Euler de 1ère forme" ou encore "équation locale du bilan de
conservation de la quantité de mouvement".

Il existe une deuxième forme de l'équation d'Euler dans le cadre d'un fluide incompressible et à viscosité
négligeable que nous allons de suite déterminer (souvent utilisée dans l'industrie) :

Si , nous pouvons écrire:

(34.243)

Ce qui peut aussi s'écrire:

(34.244)

Ce qui s'écrit encore:

(34.245)

Le premier facteur peut être considéré comme le produit scalaire suivant :

(34.246)

Soit:
(34.247)

La "dérivée particulaire" peut alors prendre la forme condensée suivante :

(34.248)

Remarque: La composante en x de la dérivée particulaire est donc (nous retrouverons cela dans le chapitre
de Génie Marin Et Météo!) :

(34.249)

ce que les spécialistes du domaine notent de manière générale pour toute composante :

(34.250)

L'équation d'Euler de 1ère forme:

(34.251)

devient compte tenu de la dérivée particulaire:

(34.252)

ou encore (forme courante dans la littérature):

(34.253)

Nous avons vu dans le chapitre de Calcul Vectoriel que:

(34.254)

Si nous posons , nous avons:

(34.255)

Soit:

(34.256)

Finalement, nous obtenons une nouvelle équation appelée "équation d'Euler de 2ème forme" et qui s'écrit:

(34.257)
Bien que les deux équations d'Euler soient très importantes, il en existe une forme variée très utile en
météorologie que nous allons de suite déterminer.

Nous nous basons toujours sur l'écoulement d'un fluide incompressible et non visqueux, mais dont les
forces de volume dérivent cette fois-ci d'un potentiel (U étant un potentiel).

Dans ce cas, nous recourons à l'équation d'Euler sous sa 1ère forme:

(34.258)

Puisque les forces volumiques dérivent d'un potentiel U, nous avons:

(34.259)

Nous rappelons la relation:

(34.260)

Soit un vecteur , il vient:

(34.261)

donc:

(34.262)

donc nous pouvons aussi écrire:

(34.263)

En reprenant la relation:

(34.264)

L'équation:

(34.265)

devient:

(34.266)

Donc:

(34.267)
et puisque:

(34.268)

Nous pouvons écrire:

(34.269)

Nous savons que donc:

(34.270)

En écrivant le produit vectoriel sous forme développée, nous avons:

(34.271)

Ce qui donne:

(34.272)

Supposons que soit un vecteur vitesse angulaire constant, nous avons alors:

(34.273)

Définition: Nous disons qu'un "écoulement est tourbillonnaire" si:

(34.274)

partout ou en certains points. Nous définissons aussi de la relation antéprécédente la "vorticité" par:

(34.275)

Exemple d'écoulement partiellement tourbillonnaire (en certains points):


(34.276)

L'équation:

(34.277)

s'écrit alors:

(34.278)

Nous retrouvons dans cette équation, utilisée en météorologie, l'accélération de Coriolis que nous avions
déterminé en mécanique classique du point matériel rigide.

Si l'écoulement s'effectue à vitesse constante et n'est pas rotationnel (non turbulent) , alors
l'équation précédente se réduit à:

(34.279)

En dynamique classique du point matériel rigide, nous avons montré que dans le cas d'un potentiel
gravitationnel Terrestre:

(34.280)

z étant l'altitude d'un point du fluide par rapport à un niveau de référence . Si nous prenons pour le
niveau du sol, l'avant dernière relation devient donc dans le cas d'un écoulement dit alors "écoulement
potentiel":

(34.281)
Le terme entre crochet pour satisfaire cette relation doit être tel que:

(34.282)

Nous retrouvons donc bien le théorème de Bernoulli ce qui conforte notre modèle des fluides newtoniens
selon le modèle de Navier-Stokes.

FLUIDE COMPRESSIBLE

Dans ce cas est une fonction de la pression p (cas des "fluides barotropes"). Nous considérons également
que la viscosité est négligeable. Il vient alors:

(34.283)

L'équation:

(34.284)

s'écrit alors:

(34.285)

FLUIDE STATIQUE

Dans le cas statique et l'équation:

(34.286)

devient simplement:

(34.287)

qui est "l'équation de la statique des fluides" ou la "loi fondamentale de l'hydrostatique".

Remarque: Les viscosités disparaissent. La statique des fluides est la même pour les fluides visqueux ou non
visqueux.

NOMBRE DE REYNOLDS

Considérons d'abord, pour simplifier, le cas incompressible. L'équation de continuité, ou de conservation de


la masse, (cf. chapitre de Thermodynamique) s'écrit alors:

(34.288)
s'écrit alors:

(34.289)

Nous choisissons maintenant plusieurs grandeurs de références notées par un indice r tel que:

et (34.290)

Alors:

(34.291)

donc l'équation des déformations par unité de temps devient:

(34.292)

Nous avons également:

(34.293)

Restreignons-nous à l'étude d'une composante:

(34.294)

En multipliant par la densité :

(34.295)

Ecrivons l'équation de Navier-Stokes pour une composante:

(34.296)

Les termes ou apparaissent les coefficients de viscosité peuvent être réécrits tels que:

(34.297)
Ainsi par correspondance:

(34.298)

En introduisant les variables adimensionnelles:

(34.299)

car comme nous l'avons vu:

(34.300)

d'où:

(34.301)

ou encore:

(34.302)

Nous multiplions la relation:

(34.303)

par et la divisons par tel qu'elle devienne:

(34.304)

Au niveau dimensionnel, nous avons:

et (34.305)

Finalement:
(34.306)

Cette équation différentielle exprimée en variables relatives et sans dimensions est appelé "équation de
Navier-Stokes-Reynolds adimensionnelle"

Le terme , appelé "nombre de Reynolds", représente au niveau symbolique le rapport des forces d'inerties
sur les forces visqueuses :

(34.307)

où est la "viscosité cinématique relative".

La viscosité dynamique est donc un terme inversement proportionnel à la valeur du nombre de Reynolds.

APPROXIMATION DE BOUSSINESQ

Soit la relation déjà démontrée précédemment:

(34.308)

En y remettant le terme contenant la viscosité:

(34.309)

sans oublier qu'au niveau des notations (nous savons… c'est un peu embêtant):

(34.310)

Si le potentiel est de type gravitationnel, il va de soi que:

(34.311)

Donc:

(34.312)

Si l'on peut considérer le contexte de l'expérience tel que la densité volumique est inférieure ou égale à celle
de l'eau et que les vitesses sont petites, alors nous pouvons éliminer les termes de second degré, tel que la
relation précédente s'écrive:

(34.313)
Nous nous plaçons dans le cadre d'un fluide faiblement turbulent, dans lequel la pression et la densité
s'écrivent:

(34.314)

où représentent le terme d'accroissement turbulent par rapport aux valeurs statiques du fluide.

Nous négligeons également les frottements sur les bords et donc la viscosité en supposant que l'effet des
turbulences devient vite prépondérant sur la valeur du frottement.

Donc nous avons le système d'équations:

(34.315)

qui peut s'écrire:

(34.316)

et encore:

(34.317)

ce qui s'écrit aussi:

(34.318)

Mais dans le cas statique:

(34.319)

Il nous reste donc:

(34.320)

En divisant le tout par :

(34.321)

mais encore une fois:

(34.322)

L'approximation de Boussinesq consistant à supposer que le fluide est incompressible et que le système est à
température constante et peu turbulent, nous avons:
(34.323)

Ce qui nous donne:

(34.324)

Cette équation s'appelle "équation de Boussinesq" et va nous permettre d'introduire la théorie du chaos dans
le domaine de la météorologie et des fluides dans le cas particulier des cellules de convection.

LOI DE STOKES

La complexité de l'hydrodynamique est un terrain tout désigné pour l'application de l'analyse dimensionnelle
dont nous avons parlé au tout début de notre étude de la mécanique analytique. L'exemple analysé ici montre
clairement les possibilités, mais aussi les limites de la méthode.

Nous envisageons un solide de forme quelconque plongé dans un fluide incompressible animé d'une vitesse
uniforme à grande distance (le problème est équivalent à celui d'un solide qui se déplace à vitesse constante
dans un fluide au repos). Nous cherchons à exprimer la force F qu'exerce le fluide sur l'obstacle, supposée
immobile (et notamment dépourvu de tout mouvement de rotation).

La solution analytique est trop complexe pour perdre son temps à résoudre ce genre de problème pratique. Il
convient de recourir à l'analyse dimensionnelle.

Les paramètres pertinents sont dans notre étude:

- L la dimension linéaire de l'obstacle

- v la vitesse du fluide à grande distance

- la masse du fluide

- la coefficient de viscosité du fluide

Comme il se doit, tous ces paramètres sont des constantes, bien que la vitesse varie en direction et en norme
au voisinage de l'obstacle: à grande distance, elle es uniforme et sa valeur v est bien un paramètre pertinent.

Nous pourrions nous demander si la pression ne devrait pas compter au nombre de ces paramètres. Ce n'est
pas le cas. La pression est conditionnée par la valeur de la vitesse et par celles des paramètres constants
comme nous l'avons voyons dans le théorème de Bernoulli. Inutile donc de rajouter un terme redondant.

Sans chercher l'unique combinaison sans dimension des quatre premières, nous appliquons la démarche
systématique. Nous voulons déterminer A, B, C, D, tels que:

(34.325)

Comme:

(34.326)

Il vient:
(34.327)

Le système de dimensionnalité s'écrit:

(34.328)

Ainsi:

(34.329)

Dès lors:

(34.330)

et curieusement nous retrouvons ici ce que nous avions vu dans notre développement de l'approximation de
Boussinesq:

(34.331)

Donc la force exercée par le fluide s'écrit:

(34.332)

Dans la littérature nous trouvons la notation:

(34.333)

où C dépend de .

Les limites de la méthode analytique dimensionnelle (et même analytique tout court…) apparaît lorsque l'on
confronte ce modèle à l'expérience (évidemment nous pourrions faire des modèles numériques de l'équation
de Navier-Stokes-Reynolds pour l'ordinateur et ainsi l'honneur serait sauf):

(34.334)
Ce graphique correspond à l'écoulement autour d'un cylindre; la vitesse étant perpendiculaire à l'axe du
cylindre. Les régimes sont signalés en chiffres romains: stationnaire (I), périodique laminaire (II), turbulent
avec superposition d'état périodique (III), turbulent (IV).

La courbe à deux caractéristiques remarquables:

1. Elle a été obtenue en modifiant de manière indépendante les valeurs des quatre paramètres. Nous
constatons que C ne dépend que du seul nombre sans dimension : c'est un succès de l'analyse
dimensionnelle.

2. Il est vain d'espérer trouver une fonction analytique simple qui reproduise la courbe expérimentale. Il faut
donc aller voir de plus près les divers régimes correspondants à cette courbe complexe.

La figure ci-dessous schématise l'écoulement d'un fluide visqueux autour d'un cylindre pour différentes
valeurs du nombre de Reynolds:

(34.335)

Le régime correspondant à la figure (a) est dit "régime stationnaire". Nous pouvons parler d'un déplacement
"quasi-statique" de la part du fluide où en chaque point l'accélération est négligeable. Nous devons donc
nous attendre à ce que l'inertie du fluide n'intervienne pas dans l'expression de la force. Pour cela, il faut et il
suffit que:

(34.336)

où C est indépendant de .

Nous avons donc:

(34.337)

Le paramètre C' sans dimensions ne peut dépendre que de la géométrie de l'obstacle. Dans le cas où
l'obstacle est sphérique (cas très important en physique avec L=R), C' a été déterminé expérimentalement
comme valant tel que:

(34.338)
connue sous le nom de "loi de Stokes" ou "formule de Stokes". Attention.... cette loi ne s'applique bien que
pour les petites vitesses et des petites sphères.

Dans le régime décrit par (b), deux tourbillons s'installent symétriquement derrière le cylindre. Quand
augmente au-delà de 40, nous distinguons l'allée de "tourbillons de von Kármán".

PRESSION HYDROSTATIQUE

Nous avons précédemment démontré sans mal que:

(34.339)

Si la vitesse du fluide est nulle:

(34.340)

Ce qui donne sous forme différentielle:

(34.341)

Si nous mesurons la pression du liquide à partir de sa face supérieur :

(34.342)

Si nous prenons comme référence, nous pouvons poser que:

(34.343)

d'où:

(34.344)

Si nous nous trouvons dans le cas d'un récipient remplis d'un fluide en contacte avec l'atmosphère, pour
calculer la pression dans ce fluide à un hauteur donné, il faudrait prendre en considération la pression
atmosphérique qui "s'appuie" également sur le fluide. Ainsi la "pression hydrostatique" est données par:

(34.345)

Conséquence: dans un liquide au repos, homogène, les équipotentielles gravifiques sont confondues avec les
surface isobares. Sans quoi, il y aurait mouvement transversal.

POUSSÉE D'ARCHIMÈDE
La poussée d'Archimède, phénomène mondialement connu..., est souvent rebelle à l'intuition première. Au
fait, nous avons trop tendance dans les écoles à poser la poussée d'Archimède comme un "principe" et ce à
tort puisqu'une simple analyse mathématique suffit à la démontrer .

Si nous isolons une portion arbitraire d'un fluide en équilibre statique, les conditions de cet équilibre
s'écrivent nécessairement (sinon quoi le volume se dissocie et n'est plus en équilibre statique):

(34.346)

désigne le poids ( en première approximation…) de alors que le terme décrit


la résultante des forces de pression exercées sur la surface de .

Chaque élément de surface dS subit donc une force:

(34.347)

où p est la pression qui s'exerce localement sur dS. Quant à , il s'agit d'un vecteur unité dirigé normalement
(à la perpendiculaire) à dS et vers l'intérieur de . La résultante de toutes ces forces se note historiquement
de la façon suivante:

(34.348)

qui exprime donc, comme vous le devinez, la fameuse "poussée d'Archimède" que le reste du fluide exerce
sur l'élément. L'intégrale porte sur toute la surface (cette surface est fermée, d'où l'intégrale curviligne
correspondante) de l'élément .

La condition d'équilibre impose donc que:

(34.349)

Nous comprenons aisément que soit dirigé vers le haut: sous l'effet du champ gravitationnel et donc p
augmente avec la profondeur.

Si nous remplaçons le fluide contenu dans le volume par un objet fluide ou solide quelconque mais qui
occupe le même volume, la poussée d'Archimède n'est pas modifiée. A cause de la relation nous
avons coutume de dire qu'elle est équivalente au poids du fluide déplacé.

Dans le cas où la direction et l'intensité dans le temps de est uniforme et constant nous pouvons écrire:

(34.350)

et nous retrouvons la relation de la "loi d'Archimède" bien connue de tous les écoliers:

(34.351)

Il existe une autre possibilité pour arriver à cette démonstration qui demande moins d'outils mathématiques
et qui est donc plus abordable:
Considérons un cylindre de volume V plongé dans un liquide à la verticale. Les composant horizontales des
forces de pression s'annulent mais la composante verticale au somment du cylindre (proche de la surface)
est inférieur en intensité (sauf cause extérieure) à celle se trouvant à sa base . Nous pouvons donc écrire:

(34.352)

C'est un peu plus simple et ça tient en une ligne sans intégrales…

Il convient de sa rappeler que la poussée d'archimède est une force qui s'applique à des fluides et donc aussi
à des gaz. C'est ainsi grâce à la poussée d'Archimède qu'une montgolfière ou un dirigeable peuvent s'élever
dans les airs (dans les deux cas, un gaz de masse volumique plus faible que l'air est utilisé, que ce soit de
l'air chauffé ou de l'hélium).

Il est aussi amusant, après démonstration de la loi des gaz parfaits (voir plus loin), de déterminer la pression
que devrait avoir notre atmosphère pour avoir la même densité que l'eau et qu'un humain puisse ensuite
flotter dans l'air....
34. MÉCANIQUE DES MILIEUX CONTINUS (2/2)

GAZ

Les solides ont une forme bien définie et sont difficiles à comprimer. Les liquides peuvent s'écouler
librement et leur écoulement est limité par des surfaces autoformées. Les gaz se dilatent librement pour
occuper le volume du récipient qui les contient, et ont une densité environ mille fois inférieure à celle des
liquides et des solides. Ils conduisent peu la chaleur et l'électricité, sauf si nous les ionisons (formation d'un
plasma). Les molécules d'un gaz neutre se déplacent suivant des trajectoires rectilignes qui changent de
direction à chaque collision avec une autre molécule. Contrairement aux solides et aux liquides, les
interactions entre molécules restent faibles. Les propriétés macroscopiques d'un gaz se déduisent donc
directement des propriétés des molécules qui le composent (ou des atomes dans le cas d'un gaz
monoatomique).

TYPES DE GAZ

En théorie des gaz (nous parlons souvent de "théorie cinétique des gaz") nous considérons toujours deux
types de gaz neutres:

GAZ PARFAIT

Il s'agit d'un modèle dans lequel nous négligeons les interactions moléculaires du gaz, à l'exception des
collisions, et dont le volume propre est négligeable devant le volume du récipient.

Lorsqu'un gaz est à faible pression, les interactions entre ses molécules sont faibles. Ainsi, les propriétés
d'un gaz réel à basse pression se rapprochent de celles d'un gaz parfait. Nous pouvons alors décrire le
comportement du gaz par "l'équation d'état des gaz parfaits" que nous démontrons plus bas lors de notre
étude du théorème du Viriel:

(34.1)

avec n le nombre de moles de gaz, P la pression du gaz, V le volume occupé par les n moles et T la
température absolue du gaz. La constante R étant la constante des gaz parfaits.

Cette équation montre que trivialement:

- A température T constante (système "isotherme"), le volume d'une quantité fixée de gaz est inversement
proportionnel à sa pression. C'est la "loi de Boyle-Mariotte":

(34.2)

- A pression P constante (système "isobare"), le volume d'une quantité fixée de gaz est proportionnel à la
température absolue. C'est la "loi de Gay-Lussac" (dans le cas des gaz parfaits...):
(34.3)

C'est cette relation qui est souvent utilisée dans les labos des petites classes pour montrer qu'avec une
extrapolation de la droite mesurée, le volume devient théoriquement....nul à une température de -273.15
[°C]. Non sérieusement à partir d'une certaine température il faut utiliser des modèles quantiques et de plus
cette relation n'est valable vraiment que pour les gaz (ainsi, lorsque la vapeur d'eau devient liquide... ce n'est
plus valable).

- A volume V constant (système "isochore"), la pression d'une quantité fixée de gaz est proportionnelle à sa
température absolue. C'est la "loi de Charles":

(34.4)

Par la suite, Amedeo Avogadro, à qui l'on doit le vocabulaire de "molécule" affirme le concept moléculaire
des gaz et conclut que des volumes à égaux de gaz différents, pris dans les mêmes conditions de température
et de pression, contienne le même nombre de molécules.

GAZ RÉEL

L'équation d'état des gaz parfaits est approximative. Par exemple, un gaz parfait ne pourrait ni se liquéfier ni
se solidifier, quels que soient le refroidissement et la compression auxquels il est soumis. Les gaz réels,
surtout dans des conditions de pression et de température proches de la transition à l'état liquide, peuvent
présenter des écarts considérables avec la loi des gaz parfaits!

Il faut donc l'adapter aux cas réels. L'équation d'état de Van der Waals est particulièrement utile et bien
connue peut être obtenu de manière qualitative une fois l'équation des gaz parfaits démontrée et est alors
donnée par (voir plus bas comment nous l'obtenons):

(34.5)

pour une mole, a et b étant des paramètres adaptables déterminés par des mesures expérimentales effectuées
sur le gaz concerné. Ce sont des paramètres qui varient d'un gaz à un autre.

L'équation de Van der Waals peut également être interprétée au niveau microscopique. Les molécules
interagissent les unes avec les autres. Cette interaction est fortement répulsive pour les molécules proches les
unes des autres, devient légèrement attractive pour un éloignement moyen et disparaît lorsque l'éloignement
est important. À pression élevée, la loi des gaz parfaits doit être rectifiée pour prendre en compte les forces
attractives ou répulsives.
THÉORÈME DU VIRIEL

Nus allons ici aborder une étude des gaz parfaits via une méthode particulière. Elle permet d'obtenir un
résultat intéressant et particulièrement pour l'astrophysique (cf. chapitre d'Astrophysique). Le théorème du
Viriel permet également d'obtenir d'autres résultats très intéressants mais qui pédagogiquement sont un peu
difficiles d'accès. Le lecteur qui serait intéressé à cette deuxième partie de résultats pourra directement se
reporter un peu plus loin où les concepts de pression et de température cinétique sont traités.

Par définition, "l'expression du Viriel" d'un point matériel est le scalaire:

(34.6)

Par définition, le "Viriel" d'un système composé de N points matériels est:

(34.7)

Soumis à une force centrale, le Viriel s'écrit (par les propriétés du produit scalaire):

(34.8)

Le "théorème du Viriel" s'énonce ainsi : Pour un système en équilibre (!), l'énergie interne est égale à
l'opposé de son demi-Viriel total lorsque toutes les particules sont repérées par rapport à son centre de
masse.

Démonstration:

Soit la relation mathématique:

(34.9)

Sa dérivée seconde:

(34.10)

En multipliant par et en sommant sur i :

(34.11)

Or:

(34.12)

et:

(34.13)

Donc:
(34.14)

Cette dernière expression est valable quelle que soit la position d'un système de coordonnées adopté.
Cependant, il est intéressant de placer son origine au centre de masse du système car nous ne sommes plus
dépendants de son mouvement.

Si le système est en équilibre, les quantités macroscopiques qui la caractérisent ne sont pas dépendantes du
temps. Nous en concluons alors que la somme de n'importe quelle quantité attachée à n'importe quel point
matériel du système est en fait une quantité dudit système.

Ainsi, est une quantité macroscopique indépendante du temps. Cela implique que:

(34.15)

Ce qui s'écrit encore (nous multiplions par ½ des deux côtés):

(34.16)

Nous avons donc finalement:

(34.17)

Cette expression de l'énergie cinétique est connue sous le nom de "théorème de Viriel"et le membre de
droite est donc appelé le "Viriel du système".

C.Q.F.D.

Nous noterons que:

(34.18)

où est l'énergie cinétique totale associée à l'ensemble des points matériels du système. Nous l'appelons
"l'énergie interne du système" et les thermodynamiciens la note souvent avec la lettre U. est l'énergie
d'un point matériel quelconque du système.

Il est possible de retrouver l'expression du Viriel à partir d'un système de particules (nuage en accrétion).
Strictement, l'équilibre n'existe pas dans un tel cas. Néanmoins, nous pouvons admettre que si la contraction
gravitationnelle est suffisamment lente alors ses différentes phases peuvent êtres considérées comme une
succession d'états d'équilibre.

Dans le cas d'une force centrale et dérivant d'un potentiel, nous pouvons écrire:

(34.19)

et donc :
(34.20)

Si l'énergie potentielle est de la forme k/r (ce qui est le cas pour le potentiel électrique et gravitationnel)
alors il vient:

(34.21)

et il reste:

(34.22)

En résumé, le théorème du Viriel nous donne une relation entre les énergies cinétique et potentielle totales.
Pour être valable, le mobile doit décrire une trajectoire autour du centre de force central et rester
indéfiniment dans un volume fini (état lié). Ce type de raisonnement est applicable à un très grand nombre
de phénomène, depuis la structure de certaines galaxies jusqu'au dégagement d'énergie dans les explosions
nucléaires en passant par l'étude du Soleil et le comportement des gaz réels. Il s'agit du premier résultat qui
nous intéressait.

Dans un système gazeux, l'énergie potentielle peut s'écrire comme la somme de l'énergie des forces agissant
de l'extérieur plus celle qui sont interne même au gaz. Tel que:

(34.23)

Or les forces internes peuvent s'écrire comme:

(34.24)

Il ne faut pas dans cette somme prendre la force qu'exerce chacune des particules sur elle-même. Tel que:

(34.25)

Ce qui nous donne:

(34.26)

Dans la double somme, nous pouvons regrouper les termes deux à deux et utiliser le principe d'action-
réaction tel que:

(34.27)

Pour obtenir:

(34.28)

Ce qui finalement nous donne:


(34.29)

Et:

(34.30)

Le premier terme de droite fait intervenir les forces intérieures (interactions) entre les (paires de) particules
et le deuxième terme de droite fait intervenir les forces extérieures.

Considérons maintenant un gaz contenu dans un récipient. Ses molécules ne sont sujettes à des forces
extérieures que lorsqu'elles heurtent une paroi et nous imaginons qu'en moyenne cette force est
perpendiculaire à la paroi (chocs élastiques).

(34.31)

Pour toutes les faces contenues dans les plans définis par les axes, nous avons toujours:

(34.32)

Puisque en moyenne est toujours perpendiculaire à .

Pour les autres faces (BCFE par exemple) nous avons et donc:

(34.33)

où nous appelons a la coordonnée selon Oy de l'extrémité de (ne pas confondre avec l'accélération!). Dès
lors pour chaque face:

(34.34)

Effectivement car la pression interne du système sur les parois étant définie par:

(34.35)

Par le théorème du Viriel, en ajoutant les contributions non nulles des faces BCFE, DEFG et ABED, il vient:
(34.36)

Si l'énergie cinétique moyenne d'une molécule est:

(34.37)

L'énergie cinétique moyenne totale pour N molécules est alors (nous reviendrons sur cette relation plus loin
mais avec une autre approche) :

(34.38)

ce que les thermodynamiciens notent souvent:

(34.39)

où U est donc l'énergie interne du gaz et ddl le nombre de degrés de liberté des contituants.

La relation antéprécédente, appelée "théorème d'équipartition de l'énergie", est importante car elle permet:

1. Une interprétation microscopique de température T et de déterminer l'énergie interne d'un gaz parfait
monoatomique (et par extension d'autres gaz avec des degrés de libertés autres).

2. De constater que le système de température en Celsius n'est pas adapté à la réalité physique.
Effectivement, dans le système utilisant les Celsius, à 0 °C tout devrait être immobile (énergie cinétique
nulle) or il est évident que ce n'est pas le cas pour toutes les substances. Donc il faut introduire une nouvelle
température qui met en adéquation l'énergie cinétique mesurée et la température traditionnelle. Il s'agira de
la "température absolue" mesurée en Kevlin [K] dont l'équivalence énergie cinétique/température mesurée
est elle que le 0 °C correspond à 273.15 [K].

L'énergie interne est une contribution à l'énergie qui n'apparaît pas en mécanique classique. Du point de vue
macroscopique, un récipient immobile qui contient un fluide ne possède pas d'énergie cinétique, alors que
son énergie potentielle est constante. Nous pouvons l'ignorer en donnant la valeur zéro à cette constante.

Du point de vue microscopique, les choses changent cependant! Effectivement, les atomes ou molécules du
fluide sont en mouvement et interagissent. Il faut leur associer une énergie (l'énergie interne) qui est la
somme des contributions relatives à chaque atome.

Dès lors:

(34.40)

C'est "l'équation générale d'état d'un gaz réel", c'est-à-dire l'équation d'état qui tient compte des interactions
entre molécules. Il est intéressant de remarquer que finalement cette relation peut nous permette de calculer
l'énergie du gaz même s'il n'y pas de parois!

Si le gaz est parfait, il n'y a pas d'interactions entre les N molécules (par hypothèse) et alors nous avons
"l'équation des gaz parfaits" suivante:
(34.41)

Que nous retrouvons beaucoup plus fréquemment sous la forme:

(34.42)

si n est exprimé en moles avec R la constante des gaz parfaits.

Si la température est constante, nous retrouvons la "loi de Boyle-Mariotte":

(34.43)

Pour arriver à l'équation des gaz parfaits, il est utile de rappeler que nous avons fait trois hypothèses :

H1. Les molécules sont assimilées à des sphères dures dont le diamètre est négligeable devant la distance
moyenne qui les sépare. C'est que ce que nous appelons "l'hypothèse structurale".

H2. A la limite, et c'est ce que nous avons retenu, si nous considérons les molécules comme ponctuelles, la
possibilité d'interaction entre les particules s'annule. Les seules interactions qui subsistent seront les chocs
sur les parois du récipient qui contient le gaz. Ces chocs sont parfaitement élastiques de sorte que nous
puissions appliquer les lois de conservation de la quantité de mouvement de l'énergie cinétique. C'est ce que
nous appelons "l'hypothèse interactive limite"

H3. Le gaz est étudié dans un état d'équilibre thermodynamique ce qui se traduit par l'homogénéité des
variables intensives et extensives. C'est que ce que nous appelons "l'hypothèse du chaos moléculaire".

Dans un cas particulier, si les interactions dérivent d'un potentiel central:

(34.44)

Il vient ainsi:

(34.45)

Si en outre l'énergie potentielle est du type (attention de ne pas confondre le caractères k avec la constante de
Boltzmann notée de la même manière!) :

(34.46)

nous avons:

(34.47)

et dès lors:

(34.48)
où est l'énergie totale moyenne du système.

Au fait, il faut bien prendre garde au fait que nous n'avons pas rigoureusement démontré l'équation des gaz
parfaits. Effectivement, lorsque nous avions posé plus haut:

(34.49)

Cela supposait implicitement que l'équation des gaz parfaits était déjà connue (…).

Cette approche de la cinétique des gaz est intéressant car utile en astrophysique. Cependant, ce n'est de loi
pas la plus simple dans un cadre scolaire et pédagogiquement. Nous nous proposerons de revenir sur ces
mêmes résultats via les concepts de pression et de température cinétique une fois l'équation de Van der
Waals déterminée.

En 1875, le savant hollandais J.D. Van der Waals (1837-1923) essaya donc de remplacer l'équation des gaz
parfaits par une relation qui tiendrait compte des forces intermoléculaires et de la taille des molécules. La
première correction, et la plus évidente, à l'équation des gaz parfaits:

(34.50)

est de soustraire le volume des molécules de gaz du volume V. Nous pouvons le faire logiquement en
remplaçant V par V-Nb où b est une constante très faible représentant bien évidemment le volume moyen par
molécule (il existe des tables pour cela). Donc:

(34.51)

où le terme est communément appelé le "covolume".

Pour tenir compte des forces intermoléculaires que nous avons négligées précédemment, nous pouvons
tenter une approche approximative en sachant déjà que la force d'attraction de chaque molécule se fera sur
N-1 molécules. Par conséquent, le numérateur de la force d'attraction contiendra (par la somme des tous les
termes) trivialement si le gaz est isotrope et homogène un terme du type N(N-1) pour l'influence de toutes
les molécules entre elles ce qui si N est très grand peut être approximé par .

Nous savons également qu'au numérateur il y aura un terme de masse pour chaque particule. Si nous
connaissons N/V alors il ne reste plus qu'à connaître la densité massique du gaz (mais ce n'est pas une
variable extensive donc nous éviterons de la faire apparaître explicitement). Ainsi, le terme peut s'écrire

directement

En suivant ce raisonnement, Van der Waals ajouta au terme de droite de l'équation ci-dessus un terme

négatif proportionnel à la quantité . La présence de ce terme se traduit par un abaissement de la


pression au fur et à mesure que croit la densité du gaz. La relation modifiée est ainsi:

(34.52)

où a est une constante de proportionnalité. Nous pouvons réécrire cette relation sous la forme:
(34.53)

qui est appelée "équation de Van der Waals". Elle est une excellente description de l'équation d'état dans un
large domaine des variables P,V,T, les valeurs a et b étant caractéristiques de chaque gaz. Les constantes a et
b sont déterminées expérimentalement comme nous en avons déjà fait mention.

L'équation de Van der Waals peut être mise sous forme d'un développement du type Viriel en utilisant un
développement de Taylor (MacLaurin) :

(34.54)

ou en réorganisant les termes:

(34.55)

Remarquons qu'il existe une température pour laquelle est nulle. Nous l'appelons "température de
Boyle" du gaz: c'est la température à laquelle le gaz réel ressemble à un gaz parfait. Il est très délicat
d'obtenir ces paramètres expérimentalement.

PRESSION CINÉTIQUE

Recherchons le nombre de molécules d'un gaz parfait toutes supposées animées d'une vitesse égale v qui
viennent frapper une surface S pendant une durée dt.

Si le gaz étudié est dans un état d'équilibre thermodynamique, cela se traduira par l'homogénéité des
variables intensives (hypothèse du chaos moléculaire).

Il s'ensuit que la densité des particules est constante :

(34.56)

Si nous admettons que les molécules sont en mouvement, nous supposerons qu'il y a isotropie des vitesses.
En d'autres termes, puisque les vitesses peuvent vectoriellement être décrites dans un système de 3 axes
orthogonaux (trois dimensions spatiales), il y a 6 directions possibles primaires au total (2 directions par axe
: en avant, en arrière...).

Cela se traduit par l'équivalence entre les différentes directions. Il y a :


(34.57)

particules ayant une vitesse v selon l'une des directions primaire.

Donc pendant une durée dt, la surface S de la paroi est percutée par une partie des molécules contenues dans
le volume . En effet, seul 1/6 des molécules contenues dans ce volume se dirigent effectivement vers
la surface S.

(34.58)

Le nombre de molécules qui viennent heurter la paroi pendant la durée dt est donc :

(34.59)

Étudions maintenant la dynamique du choc d'une particule sur la paroi :

La particule de masse m qui arrive sur la paroi avec la vitesse repart avec une vitesse si le choc est
parfaitement élastique.

La variation de la quantité de mouvement de la particule est donc :

(34.60)

En vertu de la conservation de la quantité de mouvement, cette quantité de mouvement est transférée à la


paroi : la variation de la quantité de mouvement subie par la paroi est l'opposé de celle de la particule :

(34.61)

La variation totale de la quantité de mouvement de toutes les particules qui viennent frapper la paroi pendant
la durée dt vaut alors en module :

(34.62)

En appliquant le principe fondamental de la dynamique, nous pouvons passer à la force subie par la paroi
pendant la percussion de ces molécules :
(34.63)

donc :

(34.64)

Or par définition de la pression et en prenant le module :

(34.65)

nous avons alors la "pression cinétique" donnée par :

(34.66)

La pression cinétique est donc la traduction de la fréquence des chocs sur la paroi. Plus les molécules sont
nombreuses (terme en ) et rapides (terme en v), plus le nombre de chocs augmentent. Cela est conforme à
l'expérience et à l'intuition.

TEMPÉRATURE CINÉTIQUE

En remplaçant par le quotient N/V, l'équation précédente peut se mettre sous la forme :

(34.67)

Si nous l'identifions avec l'équation d'état des gaz parfaits vue plus haut :

(34.68)

il vient :

(34.69)

Or la quantité de matière n est égale au rapport du nombre de particules sur le nombre d'Avogadro :

(34.70)

ce qui permet de définir la "température cinétique" par :

(34.71)

Nous pouvons alors introduire une constante qui nous est déjà connue appelée par Max Planck "constante de
Boltzmann" et telle que :
(34.72)

Remarque: Nous avions déjà fait mention de cette relation lors de notre présentation des constantes
universelles dans le chapitre traitant des Principes de la mécanique.

L'expression de température cinétique prend alors la forme :

(34.73)

Cette relation montre que la température cinétique est le reflet de l'énergie cinétique des particules. D'une
façon imagée, c'est l'image de la violence des chocs.

Ainsi, l'énergie d'un gaz parfait se réduit à la somme des énergies cinétique des particules qui le constitue :

(34.74)

Les atomes d'un gaz parfait monoatomique sont assimilables à des points matériels. Leur énergie cinétique
est une énergie cinétique de translation dont la valeur moyenne, par atome, s'écrit :

(34.75)

Dans l'espace des vitesses, toutes les directions sont équivalentes : il y a isotropie de la distribution des
vitesses. En coordonnées cartésiennes, il vient :

(34.76)

et par suite de l'isotropie :

(34.77)

d'où :

(34.78)

ainsi, l'énergie cinétique moyenne par degré de liberté de translation est égale à :

(34.79)

Le lecteur remarquera bien évidemment que nous obtenons ici les mêmes résultats et conclusions que lors de
notre étude du théorème du Viriel à la différence que l'approche est ici plus simple et donc plus didactique.

LIBRE PARCOURS MOYEN


Nous allons voir maintenant un cas d'études très intéressant des gaz qui permet de mettre au clair beaucoup
d'incompréhensions dans la vie de tous les jours (fumée dans les restaurants, chaleurs près d'un radiateur,
...). Cependant les phénomènes sont en réalité plus complexes il faut aussi prendre en compte la diffusion, la
convection, etc.

Considérons une molécule, qui se déplace à la vitesse moyenne . Sa sphère d'influence balaie alors,
pendant l'unité de temps de son déplacement, un volume:

(34.80)

Si l'unité de volume renferme n molécules, le nombre de chocs pendant l'unité de temps sera alors de:

(34.81)

si les autres molécules étaient immobiles... Donc pour tenir compte du mouvement des autres molécules,
considérons les schémas ci-dessous avec trois scénarios simplistes:

(34.82)

De gauche à droite nous avons:

1. La vitesse relative des molécules est

2. La vitesse relative est nulle

3. La vitesse relative vaut (Pythagore)

Les deux premiers cas sont quand même un peu extrêmes... Le troisième sera considéré comme représentant
une moyenne et peut servir de nouvelle base au calcul précédent.

Ainsi, en utilisant la vitesse relative du dernier scénario, le nombre de chocs pendant l'unité de temps
devient :

(34.83)

Ainsi, entre deux chocs, une molécule parcourt une distance moyenne :

(34.84)

C'est donc l'expression du libre parcours moyen en fonction de la densité moléculaire n et du rayon r de la
sphère moléculaire, paramètre intrinsèque du gaz considéré. Compte tenu de la relation:

(34.85)
Soit:

(34.86)

Une application numérique donne pour l'oxygène aux conditions normales de température et de pression
ce qui signifie que le libre parcours moyen vaut environ 100 fois le diamètre d'une molécule de
taille standard.

En utilisant la relation de la vitesse moyenne la plus probable dans le cadre de l'hypothèse d'une distribution
de Maxwell des vitesses (cf. chapitre de Mécanique Statistique) nous avons:

(34.87)

pour une molécule de masse molaire de 30 [g] à température normale. Ce qui donne un nombre de
collisions:

(34.88)

Cette fréquence élevée de chocs explique, dans les conditions normales de température et de pression, la
rapidité avec laquelle l'équilibre statistique s'établit au sein d'un gaz.

A la température ambiante et pour un vide de , nous obtenons avec les mêmes valeurs :
.

Les dimensions des récipients contenant les gaz étant toujours inférieures à cet ordre de grandeur, il apparaît
que lorsque le vide est réalisé dans une enceinte, les chocs intermoléculaires sont négligeables vis à vis des
chocs molécules-parois.

PLASMAS

Nous définissons le "plasma" comme un état de la matière dans lequel certaines liaisons électroniques ont
été rompues, provoquant l'apparition d'électrons libres, chargés négativement et d'ions, chargés
positivement. Les gaz faiblement ionisés appelés "plasmas" par abus de langage, possèdent les mêmes
propriétés mécaniques (écoulements, ondes acoustiques, etc.) que les gaz neutres, en revanche leurs
propriétés électromagnétiques (conductivité électrique, indice de réfraction) en diffèrent par suite de la
présence d'électrons libres en leur sein.

Remarque: Le plasma est aussi nommé "quatrième état de la matière" (après les états solide, liquide et
gazeux et avant le cinquième état de la matière : le condensat de Bose-Einstein).

Dans leur état normal, les gaz sont des isolants électriques. Cela tient au fait qu'ils ne contiennent pas de
particules chargées libres, mais seulement des molécules neutres. Cependant, si nous leur appliquons des
champs électriques assez intenses, ils deviennent conducteurs. Les phénomènes complexes qui se produisent
alors portent le nom de décharges dans les gaz et sont dus à l'apparition d'électrons et d'ions libres.

Le résultat d'une décharge dans un gaz est donc la production d'un gaz ionisé contenant par exemple
électrons, ions positifs et neutres (atomes ou molécules) par unité de volume. En général, le gaz
est macroscopiquement neutre. Nous avons alors alors:
(34.89)

Cette neutralité est la conséquence des forces électrostatiques très intenses qui apparaissent dès que l'on a
. La densité de particules est donc la première grandeur fondamentale.

Le "degré d'ionisation" d'un gaz est défini par le rapport:

(34.90)

où est la densité (nombre de particules par unité de volume) des neutres et n celle des électrons (ou des
ions positifs). La valeur du degré d'ionisation dans les divers types de gaz ionisés varie en pratique depuis
des valeurs très faibles, de l'ordre de , par exemple, jusqu'à 1.

La deuxième grandeur fondamentale est la température. Lorsqu'on chauffe un gaz à une température T
suffisamment élevée ( de l'ordre de ), l'énergie moyenne (voir théorème du Viriel) :

(34.91)

de translation de ses molécules peut devenir du même ordre que leur énergie d'ionisation Ei. Dans ces
conditions, lorsque deux molécules entrent en collision, il peut y avoir ionisation de l'une d'entre elles.

Si le gaz est en équilibre thermodynamique, l'ionisation par collision est contrebalancée par des processus de
recombinaison entre électrons et ions et il en résulte que les trois variables ne sont pas
indépendantes : l'ionisation est déterminée par la pression et la température, nous disons alors que le gaz est
en "état d'équilibre d'ionisation thermique".

A des températures plus élevées, les atomes du gaz peuvent d'ailleurs s'ioniser plusieurs fois. Dans de
nombreux cas, l'ionisation est due à un champ électrique extérieur, et le gaz n'est pas en équilibre
thermodynamique. Il atteindra souvent un état stationnaire qu'on pourra caractériser par les paramètres
(température des électrons), (température des ions) et (température des molécules).

Les trois températures ainsi introduites sont définies par la condition que représente l'énergie
cinétique moyenne des particules d'espèce a, dans un repère où elles ont une vitesse moyenne nulle. L'écart
entre , et peut être important : par exemple, dans un tube à décharges typique, nous pourrons avoir :
et . La forte valeur de est due à l'action du champ électrique sur les
électrons, et l'ionisation est alors produite par les collisions de ces électrons chauds sur les molécules neutres
du gaz.

En conclusion il n'y a que deux grandeurs de base permettant de caractériser un plasma la densité et la
température électronique. Nous allons maintenant nous pencher sur deux autres grandeurs importantes mais
non fondamentales dans le sens où elles s'expriment à partir de la densité et de la température.

Si dans un plasma initialement neutre, nous produisons une perturbation locale sous la forme d'un excès de
charge électrique positive ou négative, celui-ci va tendre à revenir vers l'état d'équilibre de neutralité.
Cependant, nous pouvons voir facilement que la perturbation initiale engendre en général une oscillation
pendulaire non amortie du plasma autour de son état d'équilibre. Considérons par exemple la situation
représentée sur la figure ci-dessous.
(34.92)

À l'instant initial la région au centre contient un déficit d'électrons et la région tout autour un excès
d'électrons. Cela produit un champ électrique tendant à créer un mouvement des électrons dans le sens des
flèches. Dans ce mouvement, ceux-ci acquerront une certaine énergie cinétique et ils pourront, au bout d'un
certain temps, dépasser la position d'équilibre. Un trop grand nombre d'électrons ayant quitté la région
externe, il y aura un défaut d'électrons dans cette région et un champ électrique tendant à les ramener vers
elle. Au bout d'un certain temps, la situation initiale est reconstituée et le cycle recommence. Les vibrations
ainsi produites sont appelées oscillations de plasma électroniques.

Nous pouvons étudier quantitativement ce problème en posant les équations générales d'une oscillation de
charge électronique et moyennant les hypothèses simplificatrices suivantes :

H1. Les ions sont supposés immobiles étant donné qu'ils sont beaucoup plus lourds que les électrons, et
leur densité uniforme égale à

H2. L'agitation thermique est négligeable

H3. Les collisions sont négligeables

H4. Les oscillations sont de faible amplitude

H5. Il n'y a pas de champ électrique ou magnétique imposé par des sources extérieures

Maintenant, rappelons que nous avons démontré dans le chapitre d'Électrodynamique que (équation de
conservation de la charge) :

(34.93)

Donc, en notant Q la charge élémentaire, I le courant, V l'unité de volume, S l'unité de surface traversée, L
l'unité longueur, t l'unité de temps et le vecteur perpendiculaire à la surface S nous avons :

(34.94)

comme les unités de la longueur L sur le temps t sont des celles d'une vitesse, nous pouvons écrire :
(34.95)

relation qui constitue "l'équation hydrodynamique des électrons".

Remarque: Un plasma est certes en théorie globalement neutre mais nous pouvons avoir en théorie
localement un volume non neutre. C'est cette hypothèse qui nous permet de poser que la divergence du
courant n'est pas nulle!

Rappelons maintenant la deuxième loi de Newton (cf. chapitre de Mécanique Classique):

(34.96)

Dans cette dernière relation, nous avons négligé le terme de pression cinétique et le terme de collision
(hypothèses 2 et 3) et négligé le champ magnétique lié à l'oscillation. Nous pouvons simplifier ces équations
en utilisant l'hypothèse 4 sous la forme:

(34.97)

où est une petite perturbation. Supposons de plus que les quantités variables varient à la pulsation
, nous pouvons donc écrire:

(34.98)

A partir de l'équation de continuité et de Newton, les deux équations hydrodynamiques des électrons
s'écrivent donc :

(1)

(2)
(34.99)

Mais nous avons d'autre part la loi de Gauss (cf. chapitre d'Électrodynamique) :

(34.100)

en effet compte tenu de la condition de neutralité du plasma non perturbé nous avons :

(34.101)

De l'équation (2) ci-dessus, nous tirons :

(34.102)

en remplaçant dans l'équation (1), nous avons :


(34.103)

Finalement en remplaçant cette dernière expression dans la loi de Gauss, nous tirons :

(34.104)

Mais dans les oscillations de charges d'espace nous avons par définition . La relation ci-dessus
conduit donc à l'expression de la "fréquence plasma" ou encore "fréquence de Langmuir":

(34.105)

En physique, la fréquence plasma est ainsi la fréquence caractéristique des ondes de plasma, c'est-à-dire des
oscillations des charges électriques présentes dans les milieux conducteurs, comme le métal ou les plasmas.
A l'image de l'onde électromagnétique qui, quantifiée, est décrite par des photons, cette onde de plasma est
quantifiée en "plasmons".

Les oscillations des charges électriques peuvent être comprises grâce au raisonnement suivant : si les
électrons d'une zone du plasma sont déplacés, alors les ions de cette zone, n'ayant que peu bougé du fait de
leur masse importante, vont exercer sur ces électrons une force de Coulomb attractive. Ceux-ci vont donc
revenir vers leur position initiale, et ainsi de suite...
35. ÉLECTROSTATIQUE

J usqu'ici nous nous sommes concentrés sur l'interaction gravitationnelle et la grandeur caractéristique de la
matière, appelée "masse", qui lui est associée. Nous avons évoqué l'interaction électromagnétique, en
analysant des phénomènes macroscopiques, comme le frottement, la cohésion, l'élasticité, les forces de
contact, etc. Maintenant nous nous penchons sur les forces électroniques et la caractéristique de la matière,
appelée "charge", qui leur est associée. L'interaction électromagnétique lie la matière, sous toutes ses formes
observables. C'est elle qui fait tenir les électrons au noyau dans l'atome, qui fait tenir ensemble les atomes
dans les molécules, les molécules dans les objets et même votre nez à votre visage (eh oui... nous ne tenons
pas à grand chose.. lol).

La "charge" produit la "force électrique" ou "force de Coulomb" et nous commençons seulement à


comprendre cette force. La charge est une notion fondamentale, qui ne peut pas être décrite en termes de
concepts plus simples et plus fondamentaux. Nous la connaissons par ses effets et malheureusement pas par
ce qu'elle est (c'est idem pour la masse rappelons-le aussi).

L'expérience a montré aussi que bien que la charge ait comme la masse une propriété additive, elle comporte
cependant aussi des valeurs négatives (et non exclusivement positive comme l'est à priori la masse). Ainsi,
dans le langage actuel et comme l'expérience le confirme, deux charges identiques se repoussent et deux
charges différentes s'attirent.

Voyons maintenant la force qui est associée à la charge :

FORCE ELECTRIQUE

Il a expérimentalement été établi par Coulomb qu'une particule témoin subit une force d'une intensité
proportionnelle à sa charge q, lorsqu'elle est placée au voisinage d'une ou plusieurs charges électriques
, dans un milieu de permittivité (permittivité au champ électrique bien sûr...) donnée par (sous forme
vectorielle et non relativiste) :

(35.1)

où est le vecteur position d'une charge témoin.

En d'autres termes, deux corps chargés s'attirent ou se repoussent selon une force directement
proportionnelle à leur charge et inversement proportionnelle au carré de la distance qui les sépare.

Dans le cas d'un système à deux particules séparées d'une distance r, nous avons la même relation simplifiée
et nous retrouvons la forme plus commune de la force électrique ou "force de Coulomb" telle qu'elle est
donnée dans la plupart des ouvrages (sous forme scalaire et non relativiste) :

(35.2)

Remarques:

R1. Fréquemment, cette dernière relation est définie sous le nom de "loi de Coulomb" dans la plupart des
écoles et admise comme non démontrable. Au fait, il n'en est rien ! Cette relation peut se démontrer comme
nous le verrons lors de l'étude de la physique quantique des champs (cf. chapitre de Physique Quantique Des
Champs) en utilisant l'équation de Klein-Gordon dans le contexte d'une champ de potentiel à symétrie
sphérique (démonstration effectuée par Yukawa).

R2. Pour la forme relativiste de la loi de Coulomb, le lecteur se reportera au chapitre de Relativité Restreinte
où il est démontré que (forme vectorielle) :

(35.3)

La permittivité dans le vide est elle donnée expérimentalement par :

(35.4)

et relativement au milieu considéré, nous définissons une permittivité relative qui permet plus facilement
de déterminer les propriétés d'un matériau par rapport au champ électrique tel que :

(35.5)

Nous définissons également le rapport :

(35.6)

appelé "constante diélectrique".

Le facteur entre parenthèses ne dépend que de la distribution des charges dans l'espace et de la
permittivité du milieu considéré. Puisque sa valeur varie d'un endroit à l'autre et dépend du vecteur
position de la charge témoin, il forme un ensemble de vecteurs, dont la propriété est celle d'une multitude
de lignes de champs électriques d'où l'utilisation du terme "champ électrique".

Chacun des éléments de cet ensemble porte donc le nom de "champ électrique" , au point , dans la
distribution de charges :

(35.7)

Les ingénieurs utilisent souvent une autre notation qui permet de caractériser uniquement la géométrie du
champ et ce indépendamment du milieu et introduisent le concept de "champ de déplacement":

nous retrouverons ce vecteur dans le chapitre d'Electrodynamique lors de notre synthèse des équations de
Maxwell.

La force Coulombienne, agissant sur la charge témoin q, s'écrit alors de façon conventionnelle:

(35.8)

POTENTIEL ÉLECTRIQUE
Soient deux point A et B dans une région de l'espace où il existe un champ électrique et soit un
chemin reliant ces deux points, alors dans le cas particulier où la source d'un champ est une sphère ou
un corps ponctuel et que nous posons une charge à son voisinage nous avons pour le travail effectué par la
force pour déplacer la charge du point A au point B :

(35.9)

Par ailleurs, ce travail est comme nous le verrons plus loin, assimilable à l'énergie potentielle.

Nous définissons ainsi la "différence de potentiel" ou simplement le "potentiel" donné par :

(35.10)

et donc :

(35.11)

Remarques:

R1. Le potentiel est souvent appelé "tension" par les électriciens, électrotechniciens ou autres ingénieurs.
Parfois par abus de la langue anglophone le terme "voltage" est ensuite utilisé par référence à l'unité de
mesure du potentiel qui est le "Volt" noté [V].

R2. La différence de potentiel peut aussi bien se faire entre deux bornes chargées de manières opposées (+,-)
qu'entre deux bornes (+,neutre) ou encore (-,neutre). Ces deux derniers cas représentent typiquement la
configuration utilisée par les trains, trams, l'orage et presque tous les appareils électroménager

Démontrons maintenant dans le cadre le plus général qui soit que le champ vectoriel stationnaire dérive
d'un champ de potentiel :

Soit une charge Q repérée par rapport à un référentiel par le vecteur . Alors en chaque point de l'espace il
existe un champ tel que:

(35.12)

développons cette expression:

(35.13)
Si est un champ de potentiel stationnaire alors, il doit exister un potentiel de ce champ qui
satisfasse :

; ; (35.14)

Regardons si le potentiel existe pour un champ de Coulomb.

Nous devons alors avoir pour le champ en x:

(35.15)

d'où:

(35.16)

et si nous effectuons le même développement pour chaque composante, nous obtenons également le même
résultat. Donc le potentiel est un champ scalaire et non vectoriel comme l'est le champ électrique !

est appelé dans le cas d'un champ de Coulomb "potentiel coulombien" et est noté U. Comme nous
pouvons le constater par l'expression de , C est une constante arbitraire, qui impose dans le cas
d'absence de charges que:

(35.17)

Ce qui nous donne finalement:

(35.18)

Ce qui donne pour toutes les composantes :

(35.19)

que nous notons plus brièvement:

(35.20)

Remarque: Les mêmes développements et résultats (et ceux qui vont suivre) sont applicables en ce qui
concerne le champ de potentiel gravitationnel. Cependant il est rare qu'ils soient effectués dans la littérature
ou les écoles car l'être humain ne contrôle pas le champ gravitationel avec une facilité et une intensité
équivalente à celle du champ électrique...
INDEPENDANCE DU CHEMIN

Démontrons maintenant que la différence de potentiel entre deux points A et B ne dépend pas du chemin
parcouru tel que nous l'avons fait pou le champ de potentiel gravitationnel dans le chapitre de Mécanique
Classique.

Soit un chemin reliant deux points A et B et un champ et faisons en sorte d'exprimer le champ en x, y et
z par rapport à une seule variable t (qui n'a rien avoir avec le temps...) qui rendrait compte de sa variation
lors d'un déplacement quelconque entre ces deux points:

(35.21)

Cette dernière expression montre bien que U est indépendant du chemin quelle que soit la manière dont
nous paramétrons celui-ci.

Le champ de Coulomb est donc un "champ conservatif". En effet, si nous considérons un chemin fermé et
soit A et B deux points confondus du chemin alors la différence de potentiel est sera nul.

ÉQUIPOTENTIELLES ET LIGNES DE CHAMP

Nous pouvons maintenant à partir de ce que nous avons établit, définir les "équipotentielles" et les "lignes de
champ".

Soit un champ de Coulomb défini par rapport à un référentiel. Alors à chaque point (x,y,z) de l'espace, nous
pouvons associer un vecteur champ électrique ainsi qu'un potentiel électrique.

Définition: Nous définissons les "lignes de champ" comme étant une famille de courbes pour lesquelles le
vecteur est tangent et constant en chaque point et les "équipotentielles" comme étant des lignes
pour lesquelles le potentiel U(x,y,z) est aussi constant.

Dans ce cas, et c'est ce que nous allons démontrer, toutes les lignes de champ sont perpendiculaires à toutes
les équipotentielles.

Démonstration:

Utilisons la propriété suivant de conservation du champ de coulomb pour la démonstration :

(35.22)

Comme nous sommes en présence d'un champ électrique, celui-ci dérive donc d'un potentiel comme nous le
savons. Ceci implique que si le champ n'est pas nul le potentiel ne l'est également pas. Donc, dans l'intégrale
curviligne:
(35.23)

un des termes est nul ! Ce n'est pas le champ électrique puisqu'on est présence d'un, ce qui discrédite le
potentiel U et comme la charge se déplace n'est pas nul non plus. Écrivons alors l'intégrale curviligne
d'une autre manière:

(35.24)

d'où:

(35.25)

nous pouvons donc conclure que les équipotentielles sont bien perpendiculaires aux lignes de champ
électrique et inversement. C'est ce qu'il fallait démontrer.

Voici les exemples de lignes de niveaux comprenant lignes de champs et lignes de potentielles obtenu à
l'aide de Maple (nous montrerons lors de notre étude des équations différentielles comment obtenir les
fonctions mathématiques des lignes de champs) :

A gauche : un seule charge - A droite : deux charges de signe égal


A gauche : deux charges de signes opposés - A droite : quatre charges de signe égal
(35.26)

Remarque: Mis à part avec les charges opposées, nous rappelons que les mêmes résultats sont applicables
pour les masses avec le champ gravitationnel.

Deux applications de ces résultats sont très importants (pour lesquels nous nous limiterons à l'étude des
propriétés les plus importantes) :

1. La détermination des lignes de champs et équipotentielles pour un fil rectiligne infini tel que nous
pouvons en approximation en considérer dans les circuits électriques ou les lignes hautes tensions aériennes
(afin de déterminer l'influences des champs des fils avec leur environnement - cette étude fait partie du
domaine de l'électrodynamique de l'ingénieur que nous appelons la CEM pour "Compatibilité
Électromagnétique"). Les résultats pourront aussi être utilisés pour déterminer la "tension de pas" pour
certains systèmes rectilignes qui détermine pour une distance donnée, le potentiel par mètre pour lequel un
mammifère peut être tué par électrochoc proche d'un tel fil. Une extension (sur laquelle je ne souhait pas
trop m'attarder bien que le sujet soit passionnant mais très chaud) est aussi l'influence d'un tel type de
potentiel sur le fonctionnement du cerveau humain dans le cas de l'usage des téléphones portables (antennes
émettrices d'un potentiel) ou d'habitations proche de lignes hautes tensions....

Remarque: Nous déterminerons dans le chapitre de Magnétostatique la loi de Biot et Savart qui donne le
champ magnétique pour un tel fil parcouru par une intensité de courant donnée.

2. La détermination des lignes de champs et équipotentielles du dipôle électrique qui a une énorme
importance en chimie comme nous le verrons lors des développements. Nous verrons également quelle est la
dynamique de celui-ci lorsqu'il est plongé dans un champ électrique uniforme l'énergie d'interaction entre
dipôles (comme c'est souvent le cas en chimie).

FIL RECTILIGNE INFINI

Soit:

(35.27)

Nous avons :

(35.28)

en faisant usage du concept de densité linéique de charges tel que nous l'avons défini dans le chapitre
Principes de la section de mécanique, nous avons :

(35.29)

Considérons une ligne infinie de section négligeable, et portant une charge linéique continue . Le but est
donc de calcul le champ électrique et le potentiel en tout point M de l'espace extérieur à cette ligne afin de
connaître les influences des charges de cette ligne sur son environnement en ne considérant que l'influence
du champ électrique (si les charges étaient en mouvement il faudrait également prendre en compte
l'influence du champ magnétique ce que nous ferons dans le chapitre de Magnétostatique).
Pour cela, la méthode consiste à découper la ligne en de petits éléments de ligne dl, chacun de ces éléments
portant une charge dq. Le champ créé par la charge en P au point M à distance x et de projection orthogonale
H sur la ligne est :

(35.30)

L'astuce consiste maintenant à prendre le symétrique P' de P par rapport à H (la projection orthogonale de M
sur le fil) pour lequel nous avons identiquement :

(35.31)

Le champ total est donc :

(35.32)

Or, nous avons :

(35.33)

Donc :

(35.34)

Comme nous pouvons nous en douter, cette dernière relation montre bien que le champ est orthogonal à la
ligne (au fil...).

La norme de est :

(35.35)

Cette relation comporte 3 variables dépendantes r,dl,x. La norme du champ total en un point est donc la
somme des normes sur l'ensemble de la longueur du fil puisque tous les vecteurs ont même direction.

Pour effectuer ce calcul, nous allons effectuer un changement de variable, et mettre r,dl,x en fonction de
l'angle entre la ligne et le vecteur . Dans le triangle rectangle HMP :

(35.36)

si nous prenons l'origine des z en H. Nous avons aussi :

(35.37)
et :

(35.38)

d'où :

(35.39)

L'intégration est facile, mais il faut faire attention aux bornes. Nous devons intégrer sur une moitié de ligne,
donc entre 0 et :

(35.40)

et donc :

(35.41)

Le potentiel se déduit aisément en prenant la primitive de E :

(35.42)

La constante est indéterminée puisque lorsque r tend vers l'infini, U tendant vers zéro conduit à une constant
infinie. Cette indétermination est due essentiellement à l'approximation de la ligne infinie.

DIPÔLE ÉLECTRIQUE RIGIDE

Une disposition très intéressant de charges est celle constituant un "dipôle" électrique. Elle consiste en deux
charges égales et opposées +q,-q séparées par une très petite distance. Nous allons chercher à déterminer le
potentiel et le champ électrique en un point M de l'environnement du dipôle.

Pour déterminer cela, considérons une charge quelconque en un point et un point M très éloigné de .
Prenons un repère quelconque centré en O :
(35.43)

Le potentiel créé au point M par la charge s'écrit :

(35.44)

Dans le triangle , la distance peut être écrite selon le théorème du cosinus :

(35.45)

Le potentiel devient :

(35.46)

ou encore :

(35.47)

A très grande distance, r devient très supérieur à , la quantité :

(35.48)

tend vers zéro. Nous pouvons donc effectuer un développement de MacLaurin de au voisinage de
(cf. chapitre sur les Suites Et Séries). Pour ne pas alourdir le calcul, nous nous limiterons à l'ordre deux
en r :

(35.49)

donc :
(35.50)

En ne gardant que les termes du second ordre en r :

(35.51)

Le potentiel devient :

(35.52)

Nous avons gardé dans l'expression du potentiel trois termes. Le terme est le potentiel créé par une
charge qui se trouverait en O. Autrement dit, à l'ordre zéro, le potentiel crée par une charge située en un
point proche de O est identique au potentiel créé par une charge qui se trouverait en O. Les termes
sont des termes correctifs, à l'ordre un et à l'ordre deux respectivement. Nous remarquons que ces
deux termes varient en , donc décroissant plus vite que le premier. Ces deux termes sont donc plus
efficaces à plus petite distance.

Nous voyons que les termes font intervenir la quantité . Cette quantité est ce que nous définissons
comme étant le "moment dipolaire" du dipôle électrostatique:

(35.53)

Remarque: Le moment dipolaire est exprimé en Coulomb par mètre mais par mesure de commodité (...) il
est exprimé en Debye [D] par les ingénieurs.

Le potentiel créé à grande distance par une distribution discrète de charges s'obtient en sommant toutes les
contributions individuelles :

(35.54)

Ce qui peut aussi s'écrire :

(35.55)

Par définition, est le terme unipolaire ou monopolaire, le terme dipolaire,


quadripolaire. Si la distribution de charge est au total nulle, comme c'est le cas d'un atome ou d'une
molécule non ionisée, seuls subsistent les contributions multipolaires.

Revenons au dipôle. Le terme monopolaire est nul, puisque la somme des charges est nulle. Si nous
négligeons les termes d'ordre supérieurs à deux, il reste la contribution dipolaire. Les angles et sont
complémentaires, donc . Mais, comme , le produit est constant. Le
potentiel s'écrit alors :

(35.56)

ou encore :

(35.57)

où .

Rappelons que nous avons démontré :

(35.58)

et comme nous l'avons vu en analyse vectorielle, le gradient en coordonnées sphérique nous amène à écrire :

(35.59)

d'où :

(35.60)

Pour déterminer l'équation des équipotentielles, rappelons que ces lignes (ou "surfaces" dans l'espace)
s'obtiennent par la contrainte :

(35.61)

d'où :

(35.62)

avec .

Le champ électrique doit être par définition tangent aux lignes de champ, donc parallèle au déplacement
élémentaire.
(35.63)

Puisque , nous avons :

(35.64)

Donc finalement il ne reste plus que :

(35.65)

Qui est donc une équation différentielle qui s'intègre facilement :

(35.66)

Ce qui équivaut à écrire :

(35.67)

La tracé des lignes de champs et des équipotentielles donnent alors en coordonnées sphériques (ne pas
oublier que la composant verticale est nulle par symétrie) :

(35.68)

Bien que dans un dipôle électrique les deux charges soient égales et opposées, donnant une charge résultante
nulle, le fait qu'elles soient légèrement déplacées est suffisant pour produire un champ électrique non
identiquement nul. Dans les atomes, le centre de masse des électrons coïncide avec le noyau, et par
conséquent le moment électrique dipolaire moyen de l'atome est nul. Mais si un champ extérieur est
appliqué, le mouvement des électrons est distordu et le centre de masse des électrons est déplacé d'une
distance x par rapport au noyau. L'atome est alors polarisé et devient un dipôle électrique de moment p. Ce
moment étant proportionnel au champ extérieur .

Remarque: Les molécules par ailleurs peuvent avoir un moment électrique permanent. De telles molécules
sont dites "molécules polaires". Par exemple, dans la molécule HCl l'électron de l'atome d'hydrogène passe
plus de temps à se déplacer autour de l'atome de chlore qu'autour de l'atome d'hydrogène. Aussi, le centre
des charges négatives ne coïncide-t-il pas avec le centre des charges positives et la molécule possède un
moment dipolaire. Par contre, dans la molécule , tous les atomes sont alignés, et le moment électrique
dipolaire résultant est nul par raison de symétrie.

Quand un dipôle électrique est placé dans un champ électrique, une force s'exerce sur chacune des charges
du dipôle. La force résultante est :

(35.69)

Considérons le cas particulier où le champ électrique est dirigé le long de l'axe des X et où le dipôle est
orient parallèlement à ce champ. Si nous considérons seulement les grandeurs :

(35.70)

avec a étant la distance entre les deux charges, et par conséquent :

(35.71)

Ce résultat montre qu'un dipôle électrique orienté parallèlement au champ tend à se déplacer dans la
direction dans laquelle le champ s'accroît (selon le gradient de celui-ci). Nous remarquons que si un le
champ électrique est uniforme, la force résultant sur le dipôle est nulle.

L'énergie potentielle du dipôle est :

(35.72)

Si nous utilisons la relation :

(35.73)

pour décrire le champ électrique uniforme et si est l'angle entre le dipôle et le champ électrique, le dernier
facteur est juste la composante du champ parallèle à . Donc :

ou (35.74)

L'énergie potentielle est minimale pour , ce qui montre que le dipôle est en équilibre quand il est
orienté parallèlement au champ.

Ces configurations d'un dipôle placé dans un champ électrique ont des applications très importantes. Par
exemple, le champ électrique d'un ion en solution polarise les molécules du solvant qui entoure les ions et
elles s'orientent comme sur la figure ci-dessous :
(35.75)

Dans un solvant à molécules polaires tel que l'eau, les ions d'un électrolyte en solution s'entourent d'un
certain nombre de ces molécules en raison de l'interaction charge-dipôle. Ce phénomène est appelé la
"solvation" de l'ion, précisément "hydratation" si le solvant est de l'eau.

Ces molécules orientées deviennent plus ou moins solidaires de l'ion, augmentant sa masse effective et
diminuant sa charge effective, qui est partiellement masquée par les molécules. L'effet net est que la mobilité
de l'ion dans un champ extérieur est réduite. De même, lorsqu'un gaz ou un liquide, dont les molécules sont
des dipôles permanents est placé dans un champ électrique, les molécules à la suite des couples dus au
champ électrique, tendent à s'aligner avec leurs dipôles parallèles. Nous disons alors que la substance a été
"polarisée".

Il peut donc être intéressant de déterminer le champ électrique vectoriel produit par un dipôle plutôt que le
potentiel. Le champ électrostatique crée en un point M par le doublet s'obtient en effectuant la somme
vectorielle des champs créés en ce point des charges positive P et négative N, d'où :

(35.76)

La distribution des charges étant invariantes par rotation autour de l'axe Oz du doublet, la topographie est
indépendante de l'angle azimutal des coordonnées sphériques. Nous pouvons la représenter dans un plan
méridien quelconque passant par l'axe NP. Le champ est donc donné par :

(35.77)

Ayant :

(35.78)

vectoriellement, nous avons :


(35.79)

Le produit scalaire étant la multiplication des composantes une à une, nous avons :

(35.80)

d'où :

(35.81)

Finalement :

(35.82)

Donc par un développement limité en série de MacLaurin comme nous l'avons fait au début :

(35.83)

soit en introduisant :

(35.84)

Il peut être pertinent aussi de calculer l'énergie d'interaction entre deux dipôles électriques. Si nous appelons
le moment dipolaire, nous pouvons écrire :

(35.85)

Si nous désignons par le moment du second dipôle et si nous utilisons la relation :

(35.86)

nous trouvons que l'énergie d'interaction entre les deux dipôles est :
(35.87)

Nous pouvons tirer plusieurs conclusions importantes de ce résultat. L'énergie d'interaction est
symétrique par rapport aux deux dipôles, car la permutation de et la laisse inchangée. C'est un résultat
prévu. L'interaction entre deux dipôles n'est pas centrale car elle dépend des angles que le vecteur de
position ou le vecteur unitaire fait avec et .

Un atome, une molécule ou un ion, dont le moment dipolaire est nul à l'état fondamental, acquièrent un
moment dipolaire sous l'action du champ électrique appliqué comme nous l'avons vu puisque les charges de
signes opposées sont sollicitées dans des sens opposés. Les barycentres des charges positives et négatives ne
coïncidant plus, il apparaît un "moment dipolaire induit". Dans une approximation expérimentale linéaire
valable pour des champs excitateurs faible, ce moment dipolaire induit est proportionnel au champ appliqué
, ce que nous traduisons par (il s'agit au fait d'une approximation de la relation de Langevin-Debye que
nous démontrerons plus tard) :

(35.88)

La quantité , dont la dimension physique est celle d'un volume, est la "polarisabilité" de l'édifice.
L'interaction électrostatique dipôle-dipôle a été introduite par J.D. Van der Waal en 1873, dans le cas des
molécules, afin d'interpréter les écarts réels par rapport au gaz parfaits.

Les forces de Van der Waals sont répulsives lorsque la distance entre les molécules est très faibles car elles
s'opposent à l'interpénétration des nuages électroniques, ce que nous exprimons en introduisant leur volume
(covolume).

En revanche, elles sont attractives lorsque cette distance est suffisante. Nous attribuons cette attraction à
trois types d'interaction mettant en cause des dipôles rigides ou induits :

1. Les forces entre molécules polaires (dipôles rigides), dites de W. Keesm

2. Les forces entre une molécule polaire (dipôle rigide), et une molécule polarisable (dipôle induit) dites de
Debye.

3. Les forces moyennes entre les dipôles induits instantanés qui apparaissent même lorsque les molécules ne
sont pas polaires, dites de F. London.

Dans ces trois cas, l'énergie électrostatique est négative (attraction) et varie comme . Pour le montrer,
calculons l'énergie d'interaction entre deux dipôles rigides, de moments dipolaires et :

avec et (35.89)

Par conséquent :

(35.90)

d'où :
(35.91)

Ainsi, la dépendance radiale de la force est en . Cette décroissance très rapide de la force de Van der
Waals avec la distance permet d'expliquer sa très courte portée et par conséquent sont influence lorsque le
milieu est suffisamment dense.

Remarque: L'interaction entre molécules polaires, de type Keesom, est rendue très importante par la
présence l'atome d'hydrogène, car ce dernier, en raison de sa petite taille, interagit aussi avec les atomes des
autres molécules. C'est elle qui est là l'origine de la "liaison hydrogène".

FLUX DU CHAMP ÉLECTRIQUE

Soit un champ vectoriel et S une surface appelée "surface de Gauss" dans l'espace. Si nous divisons cette
surface en un nombre N de petites surfaces dS chacune traversée par un champ et ayant un vecteur
unitaire perpendiculaire (cas particulier) à leur surface, nous pouvons alors former la somme:

(35.92)

Lorsque N tends vers l'infini et tous les dS vers zéro, nous obtenons pour cette somme:

(35.93)

La valeur de cette intégrale est appelée donne donc le flux du champ à travers la surface S délimitée
par un domaine et où .

Dans le cas du champ électrostatique, nous écrivons :

(35.94)

Cette expression définit le "flux électrique".

La question inévitable qui se pose alors est : quelle est sa signification physique ? Le flux d'un fluide est la
quantité de fluide (notamment le volume) qui traverse une surface par seconde; il y alors écoulement de
quelque chose. Quant au flux électrique, du point de vue classique, rien ne s'écoule, le champ électrique est
déjà établi et il est statique, mais il traverse la surface. La valeur du champ électrique en tout point de
l'espace est l'intensité du champ en ce point, tandis que le flux peut être considéré comme la quantité de
champ qui traverse la surface S. Il y a une centaine d'années, les physiciens identifiaient le flux avec le
nombre des lignes de champ traversant la surface. Mais le moins que nous puissions dire est que la vision
simpliste que les lignes de champ ont une une réalité distincte et que nous pouvons les compter est
trompeuse. Nous verrons en mécanique quantique des champs que celle-ci soutient qu'un courant de photons
virtuels est la nature même des interactions électromagnétiques. Malgré cela, les physiciens ne se sont pas
pressés d'associer le flux des photons virtuels du 20ème siècle à l'image des lignes de champs continus du
19ème siècle. Quelle que soit sa nature, la notion de flux est puissante et de grande utilité pratique, aussi
bien en électricité qu'en magnétisme.

Comme nous le démontrons dans le cadre des équations de Maxwell (cf. chapitre d'Electrodynamique), la
résolution de cette intégrale est (c'est la "loi de Gauss" ou également dit "théorème de Gauss") :
(35.95)

CAPACITES

Comme application directe du théorème de Gauss, très utile en électronique et pour les ingénieurs,
considérons une grande feuille mince et plane, portant une charge surfacique homogène et baignant dans
un milieu de permittivité . Dans la région proche de son centre, le champ résultant de tous les champs des
charges est normal, uniforme, constant et s'éloigne de la feuille. Considérons une surface de Gauss en forme
d'un cylindre limité par les bases et sa surface tubulaire et symétrique par rapport la feuille.
Elle enferme donc une charge . Il en résulte que :

(35.96)

et comme et , nous trouvons :

(35.97)

Finalement, le champ électrique d'une grande feuille chargée plane et mince est :

(35.98)

Si nous mettons face à face deux plaques identiques mais avec des charges opposées, la somme algébrique
donnera bien évidemment :

(35.99)

A l'exception des extrémités, où l'effet de bord est important, le champ global est partout la somme
vectorielle des champs uniformes produits par les deux couches minces opposées. Nous appelons un tel
système un "condensateur plan et parallèle".

(35.100)

Le résultat est aussi remarquable car il est indépendant de la distance d entre les plans. Le calcul du potentiel
électrique y est donc simplifié. Soit :

(35.101)

Ainsi, la capacité du condensateur plan et parallèle vaut donc :


(35.102)

Voyons un deuxième exemple scolaire qu'est le condensateur cylindrique:

Les armatures d'un condensateur cylindrique sont deux cylindres infinis (ou très grands relativement à leur
diamètre) coaxiaux de rayon et .

(35.103)

Par le théorème de Gauss, nous savons que :

(35.104)

Et donc puisque le champ est colinéaire en tout point à la surface il vient immédiatement en connaissant
l'expression de la surface du cylindre :

(35.105)

Or :

(35.106)

Et donc,

(35.107)

Calculons aussi la capacité d'un condensateur sphérique qui correspond en première approximation à
certains générateurs de Van Der Graaf que nous avons dans les labos de quelques écoles, de musées ou
même de centres de recherche:

Un condensateur sphérique est constitué de deux sphères concentriques de rayon et avec .


(35.108)

Nous avons maintenant immédiatement:

(35.109)

Et donc puisque le champ est colinéaire en tout point à la surface il vient immédiatement en connaissant
l'expression de la surface d'une sphère:

(35.110)

Or :

(35.111)

Nous avons alors:

(35.112)

Donc, nous avons alors:

(35.113)

Voilà pour les exemples classiques....

Nous venons donc de voir que la capacité était définie par:

(35.114)

soit en régime non continu (cf. chapitre d'Électrocinétique):

(35.115)

Nous avons alors pour la puissance instantanée (cf. chapitre d'Électrocinétique):

(35.116)
En supposant un condensateur idéal qui ne dissipe pas d'énergie par effet-joule) il vient:

(35.117)

Donc par intégration dans un intervalle de temps donné de 0 à t nous avons pour le deuxième terme:

(35.118)

Cette énergie est donc toujours positive et est stockée sous forme électrostatique dans le condensateur.

Dans le cadre d'un régime sinusoïdal, la puissance moyenne sera nulle. Nous pouvons généraliser ceci en
admettant qu'un condensateur parfait ne dissipe aucune puissance par effet Joule.

LA RIGIDITÉ DIÉLECTRIQUE

La "rigidité diélectrique" d'un milieu isolant représente la valeur maximum du champ en que le
milieu peut supporter avant le déclenchement d'un arc électrique (donc d'un court-circuit). Pour un
condensateur utilisé en électronique, si nous dépassons cette valeur, nous observons la destruction de
l'élément. Cette valeur maximale de la tension appliquée aux bornes, est appelée "tension de claquage"
du condensateur. Nous pouvons définir la rigidité du milieu comme étant :

(35.119)

Exemple:

Pour l'air, on trouve dans les tables la valeur :

Lorsque nous parlons de rigidité diélectrique nous parlons aussi du diélectrique qui est un isolant ou une
substance qui ne conduit pas l'électricité et qui est polarisable par un champ électrique. Dans la plupart des
cas, les propriétés du diélectrique sont dues à la polarisation de la substance. Lorsque le diélectrique (dans
notre cas, l'air est le diélectrique) est placé dans un champ électrique, les électrons et les protons de ses
atomes se réorientent et, dans certains cas, à l'échelle moléculaire, une polarisation est induite (comme nous
l'avons vu lors de notre étude des dipôles). Cette polarisation engendre une différence de potentiel, ou
tension, entre les deux bornes du diélectrique; celui-ci emmagasine alors de l'énergie qui devient disponible
lorsque le champ électrique est supprimé. L'efficacité d'un diélectrique est sa capacité relative à
emmagasiner de l'énergie comparée à celle du vide. Elle s'exprime par la permittivité relative, déterminée
par rapport à celle du vide. La force diélectrique est la capacité d'un diélectrique à résister aux champs
électriques sans perdre ses propriétés isolantes. Un diélectrique efficace libère une grande partie de l'énergie
qu'il a emmagasinée lorsque le champ électrique est inversé.

ÉNERGIE POTENTIELLE ÉLECTROSTATIQUE

Considérons deux charges . La première est supposée au repos et fixe la deuxième est amenée de
l'infinie à une distance a de (le même raisonnement a été appliqué pour le champ gravitationnel dans le
chapitre de Mécanique Classique). Supposons que les deux charges soient de même signe. Comme ont
tendance à se repousser mutuellement, il faut fournir une énergie potentielle pour approcher
(infiniment lentement) de . Le travail dW la force électrostatique en un point quelconque est par
définition :

(35.120)

L'énergie potentielle du système est :

(35.121)

car F est résistant (l'origine du signe "-").

Donc :

(35.122)

On obtient alors simplement l'énergie potentielle en un point (donc le x au numérateur se simplifie avec un
des x au dénominateur) au signe près:

(35.123)

Cette énergie potentielle peut donc être négative ou positive.

Cela n'empêche pas que pour avoir la variation d'énergie potentielle il faut intégrer la relation
antéprécédente.

Ainsi que la relation:

(35.124)

L'avant dernière relation peut aussi se mettre sous la forme :

(35.125)

Remarque: Attention! Quand on fait de la physique, il faut voir de quelle énergie potentielle on parle. Là est
tout le problème! Si vous prenez par exemple l'énergie potentielle due a la force de gravitation, elle peut
prendre n'importe quelle valeur en fonction du point de référence. Si la référence est le niveau de la mer, un
point situé sous le niveau de la mer aura une énergie potentielle négative, par contre si la référence est le
centre de la Terre, il n'y aura que des énergies potentielles positives. C'est pour cela qu'on écrit plutôt
l'énergie potentielle sous forme de différence de hauteur par rapport à une référence en mécanique. Pour
l'énergie potentielle de l'électron, il faut savoir avec quoi il interagit. Si c'est avec une charge négative, le
produit des charges est positif et donc l'énergie potentielle d'interaction sera positive, s'il interagit avec une
charge positive, le produit des charges est négatif et l'énergie potentielle d'interaction électrostatique est
négative. Bref, il faut bien savoir de quoi on parle. Les mots ont leur importance en physique aussi.

En général, si l'énergie potentielle diminue avec la distance, la force est répulsive, si elle augmente avec la
distance, la force est attractive.
36. MAGNÉTOSTATIQUE

L es aimants sont connus depuis l'Antiquité (sans pour autant qu'on savait qu'elle était l'origine de leurs
propriétés) sous le nom de "magnétite", pierre trouvée à proximité de la ville de Magnesia (Turquie). C'est
de cette pierre par ailleurs que provient le nom actuel de champ magnétique. Les chinois furent les premiers
à utiliser les propriétés des aimants différentes de celles des particules chargées, il y a plus de 1'000 ans,
pour faire des boussoles. Elles étaient constituées d'une aiguille de magnétite posée sur de la paille flottant
sur de l'eau contenue dans un récipient gradué.

Au même titre que le champ électrique, une bonne/meilleure compréhension de l'origine de ce champ ne
peut se faire que par l'intermédiaire de théories modernes comme la physique quantique ondulatoire ou la
physique quantique des champs. Le lecteur débutant devra donc prendre son mal en patience avant d'avoir
les connaissances nécessaires pour étudier ces théories.

L'étude quantitative des interactions entre aimants et courants fut faite par les physiciens Biot et Savart
seulement en à partir de 1820. Ils mesurèrent l'amplitude des oscillations d'une aiguille aimantée en fonction
de sa distance à un courant rectiligne. Ils trouvèrent que la force agissant sur un pôle est dirigée
perpendiculairement à la direction reliant ce pôle au conducteur et qu'elle varie en raison inverse de la
distance. C'est le premier cas que nous allons étudier:

Soit un déplacement de charges électriques produisant dans l'espace un champ vectoriel dont les effets sont
mesurable et dont les propriétés diffèrent de celles du champ électrostatique. Nous en déduisons l'existence
d'un nouveau champ vectoriel que nous appelons (temporairement) "champ magnétique" et que nous
noterons .

Le cas d'étude le plus simple consiste en un fil rectiligne indéfini (exemple que nous pouvons aussi assimiler
à un simple déplacement de charges sans nécessairement avoir un fil comme support) parcouru par un
courant I (cf. chapitre d'Électrocinétique) montre que les lignes de champ magnétique sont des cercles ayant
le fil pour axe.

(36.1)

Remarque: Le sens de se définit habituellement par l'intermédiaire de "l'observateur d'Ampère", c'est-à-


dire un observateur qui serait placé le long du fil, de façon que le courant aille de ses pieds vers sa tête et qui
regarderait le point M où nous évaluons le champ ma. est dirigé de la droite vers la gauche de cet
observateur.

Il a été expérimentalement établi que la valeur de à la distance r du fil est proportionnelle au courant I qui
le parcourt inversement proportionnel à r :

(36.2)
Ce résultat a été obtenu expérimentalement par les physiciens Biot et Savart et constitue traditionnellement
la base de l'étude théorique du champ magnétique.

Le coefficient de proportionnalité k dépend comme toujours des unités choisies. Pour l'ensemble de ces
conséquences, il est avantageux d'écrire l'expression précédente sous une forme qui fasse apparaître la
longueur du cercle de rayon r. Nous posons donc :

(36.3)

et obtenons ainsi :

(36.4)

où est une nouvelle constante que nous appelons "susceptibilité magnétique" (à nouveau au même titre
que la permittivité électrique il existe une "susceptibilité relative")

THEOREME D'AMPERE

Il est intéressant de calculer la "circulation du champ magnétique" de le long d'un contour qui tourne
une fois dans le sens positif autour du fil orienté dans le sens du courant (observateur d'Ampère) :

(36.5)

Remarque: Le long du contour, le champ est colinéaire au contour comme nous l'avons vu précédemment
d'où le fait que le produit scalaire puisse s'écrire comme simple produite de normes.

Nous obtenons ainsi par définition "loi d'Ampère" (ou "théorème d'Ampère") :

(36.6)

L'expression que nous avons obtenue peut encore être simplifiée si nous introduisons un nouvel être
physique appelé "intensité du champ magnétique" ou encore plus couramment "excitation magnétique" et
qui est notée par la lettre: .

Si nous considérons que nous sommes dans le vide où il n'y a aucun dipôle magnétique alors nous le
définissons par :

(36.7)

Dès lors, nous sommes souvent amenées à parler de "induction magnétique" pour et de "champ
magnétique" pour . Mais les deux sont allégrement confondus suivant les auteurs et surtout les contextes
(de même que ce sera le cas dans ce site).

Alors, finalement nous pouvons écrire la loi d'Ampère sous la forme :

(36.8)
L'intérêt de la loi d'Ampère ainsi que du concept de circulation du champ magnétique paraît (peut paraître)
ainsi plus évident.

Cette dernière relation à bien évidemment une grande utilité en physique théorique car elle nous permettra
de déterminer d'autres résultats forts importants. Sinon, au niveau de la pratique, le physicien de laboratoire
ou l'électricien/électrotechnicien sera souvent confronté à utiliser pour de petites et moyennes expériences
des électro-aimants dont il pourrait souhaiter re-calibrer les valeurs nominales ou encore de solénoïdes.

ÉLECTRO-AIMANT

Déterminons donc par exemple (important et intéressant) le champ magnétique dans l'entrefer de longueur
et de section d'un électro-aimant d'un de longueur et de section .

La loi d'Ampère nous donne :

(36.9)

dans le cas de l'électro-aimant nous pouvons écrire que la circulation du champ est la somme de la
circulation du champ de l'entrefer et de l'aimant lui-même:

(36.10)

où N correspondant au nombre de boucles de courant entourant l'aimant et qui permet la production du


champ magnétique.

Nous avons par définition:

et (36.11)

d'où :

(36.12)

Si l'entrefer n'est pas trop grand et que d'où :

(36.13)

ce qui revient à écrire alors :

(36.14)

d'où :
(36.15)

La relation est la même pour un électro-aimant ayant deux bobines.

FORCE D'UN AIMANT OU ELECTRO-AIMANT

Si nous avons connaissance du champ magnétique B produit par un aimant à sa surface, nous pouvons
calculer avec une certaine approximation la force nécessaire pour le décoller d'une surface en Fer.

Pour cela, nous noterons F la force nécessaire pour faire décoller l'aimant à une distance d d'une surface de
Fer. Nous supposerons la distance d suffisamment petite pour que l'on puisse accepter que dans tout le
volume situé entre l'aimant et le Fer, le champ magnétique est constant.

Ainsi, le travail fait par la force F est (cf. chapitre de Mécanique Classique) :

(36.16)

Ce travail s'est transformé en énergie du champ magnétique dans le volume créé entre l'aimant et le Fer. La
densité volumique d'énergie due au champ magnétique dans l'air étant (cf. chapitre d'Électrodynamique) :

(36.17)

Le volume de l'espace créé entre l'aimant et le Fer étant égal à où S est la surface de l'aimant qui
était collée au Fer. Nous avons alors l'équivalence dimensionnelle suivante :

(36.18)

Nous en déduisons la force de contact pour de petites valeurs de d:

(36.19)

où B est la valeur limite du champ magnétique qui amène notre matériau à se coller à l'aimant (de façon à ce
qu'en soulevant l'aimant, le matériau associée suive)

BOBINE SOLONOÏDALE INFINIE

Une application aussi particulièrement importante en électronique et électrotechnique est celle du calcul
d'une bobine de fil parcourue par un courant que nous considérerons comme constant dans un premier
temps. Il s'agit ni plus ni moins d'une bobine d'induction ou plus techniquement appelée une "inductance".
Voyons de quoi il s'agit:

Un solénoïde est une bobine formée par un fil conducteur enroulé en hélice et parcouru par un courant
d'intensité I. Dans ce qui suit, nous supposons que le champ d'induction d'un solénoïde est nul entre les
spires et parallèle à l'axe du solénoïde.
Considérons le schéma suivant et intéressons nous en approximation qu'à la partie interne du solénoïde en
admettant que le champ extérieur est nul par la longueur infinie de celui-ci et la parfaite jointure des
bobines... :

(36.20)

Appliquons la loi d'ampère au trajet rectangulaire abcd. Ainsi :

(36.21)

La première intégrale du membre de droite donne où B est la grandeur de à l'intérieur du solénoïde et


h, la longueur du segment ab. Nous pouvons remarquer que le segment ab, même s'il est parallèle à l'axe du
solénoïde, ne doit pas nécessairement coïncider avec lui.

La deuxième et la quatrième intégrale sont nulles car, pour ces deux segments. et sont partout
perpendiculaires : étant donné que est nul partout, les deux intégrales sont nulles. La troisième
intégrale est également nulle puisque le segment calculé se trouve à l'extérieur du solénoïde où nous avons
supposé que le champ magnétique de la bobine était idéal.

Ainsi, l'intégrale pour tout le trajet rectangulaire est tel que :

(36.22)

mais le courant I est la somme des courants passant dans chacune des N contenues dans le chemin
d'intégration. Mais en électronique nous avons l'habitude de travailler avec la valeur n (nous choisissons la
lettre minuscule par analogie avec la thermodynamique ou les minuscules représentent des densités) qui est
le nombre de spire par unité de longueur :

(36.23)

Ainsi, nous avons :

(36.24)

Bien que cette relation ait été établie pour un solénoïde idéal infini, elle donne une grandeur assez précise
(sans être exacte!) du champ d'induction magnétique pour les points d'intérieur situés près du centre d'un
solénoïde réel. Cette relation révèle par ailleurs que le champ magnétique est en approximation indépendant
du diamètre du solénoïde et qu'il est uniforme à travers la section de celui-ci. En laboratoire, un solénoïde
est un dispositif pratique pour produire un champ d'induction uniforme de la même façon que le
condensateur plan est utilisé pour produire un champ électrique uniforme.

BOBINE TOROÏDALE
La bobine toroïdale est un autre exemple important de l'application de la loi d'Ampère. Effectivement, nous
retrouvons particulièrement ce type de configuration dans l'électronique de petite puissance (ordinateurs par
exemple) ou les inductances sont pour la plupart toroïdales ou la production d'énergie avec les fameux
Tokomak qui de façon schématisée (très...) se réduisent à des bobines toroïdales.

(36.25)

Pour des raisons de symétrie il est clair que les lignes d'induction magnétique forment des cercles
concentriques à l'intérieur de la bobine. Appliquons la loi d'Ampère au trajet d'intégration circulaire de rayon
r:

(36.26)

C'est-à-dire :

(36.27)

Il s'ensuit que :

(36.28)

Ainsi, contrairement à B l'intérieur d'un solénoïde, B n'est pas constant à l'intérieur de la bobine toroïdale.

RELATION DE MAXWELL-AMPERE

Soit la densité de courant en un point quelconque de l'espace dans le cas d'une distribution à trois
dimensions et soit S une surface fermée qui s'appuie sur un contour quelconque. Le courant I qui traverse
est bien évidemment donné par :

(36.29)

D'après la loi d'Ampère, la circulation du champ magnétique le long de est égale à cette intégrale. Elle
peut donc prendre ici, selon le choix du contour , une infinité de valeurs variables de façon continue.
D'autre part, le théorème de Stokes (cf. chapitre de Calcul Différentiel Et Intégral) fournit que :

(36.30)

d'où :
(36.31)

et nous en ressortons finalement que :

(36.32)

Nous pouvons faire une similitude osée de ce résultat avec la relation ci-dessous (démontrée dans le chapitre
d'Électrodynamique), par extension de la charge statique et de la charge dynamique :

(36.33)

qui n'est d'autre que la première équation de Maxwell (cf. chapitre d'Electrodynamique). Dès lors, comme
nous avons vu en électrostatique, nous avons :

(36.34)

Par analogie, l'idée est de poser (cette hypothèse se vérifie un peu plus bas par les résultats remarquables
obtenus) :

(36.35)

relation que nous pouvons écrire de manière plus élégante en supposant le courant non dépendant de la
position de l'observateur dans l'espace et colinéaire au vecteur perpendiculaire de la surface traversée :

(36.36)

où représente le périmètre du fil dans lequel le courant I circule.

LOI DE BIOT-SAVART

Du dernier développement, nous tirons donc :

(36.37)

Rappelez-vous qu'à la dernière étape de notre développement précédent (nous l'avons précisé implicitement)
que le chemin d'intégration est perpendiculaire au courant ! Mais le champ magnétique ne peut pas être nul
en tout point de la ligne du courant. Dès lors, nous sommes amenés à écrire ce qui est caché :

(36.38)

La relation ci-dessus nous permet donc, par extension, d'écrire sous une forme plus générale :
(36.39)

qui n'est d'autre que la "loi de Biot-Savart" souvent présentée en premier dans les classes scolaire comme
début d'étude du magnétisme.

Cette dernière forme peut tout aussi bien s'écrire (forme très importante) :

(36.40)

Donc :

(36.41)

Nous retrouvons ici l'approximation non relativiste du champ magnétique tel que nous l'avons déterminé lors
de notre étude de la mécanique relativiste, où nous avons démontré que :

(36.42)

Une autre forme importante de l'expression du champ magnétique est :

(36.43)

Comme J est colinéaire à , nous pouvons écrire :

(36.44)

Donc :

(36.45)

Une remarque importante s'impose à notre niveau du discours : dans le cadre des études scolaires pré-
universitaires, les formulations mathématiques des champs magnétique et électrique sont considérées
comme des lois indémontrables d'où l'on tire plus tard les équations de Maxwell (de plus les développements
ne sont pas des plus esthétiques et rigoureux). L'aspect totalement expérimental de relations aussi
importantes peut avoir une image néfaste de la physique théorique sur les étudiants. Il convient dès lors de
préciser que lors des études universitaire, nous avons une approche juste un peu moins pragmatique.

Effectivement, nous postulons l'équation de Schrödinger (cf. chapitre de Physique Quantique Ondulatoire)
dont nous nous servons pour démontrer la formulation non relativiste de la loi de Coulomb à l'aide de la
théorie de Yukawa (cf. chapitre de Physique Quantique Des Champs). Ensuite, pendant l'étude de la
relativité restreinte (cf. chapitre de Relativité Restreinte), nous déterminons la forme relativiste de la loi de
Coulomb. Ensuite, nous admettons l'existence du champ magnétique dont l'expression est donnée
expérimentalement par la force de Lorentz (voir plus bas dans ce chapitre) et de par les propriétés des
transformations de Lorentz et de la connaissance de l'expression relativiste de la loi de Coulomb nous
déterminons l'expression relativiste du champ magnétique. Ensuite, par approximation non relativiste, nous
tombons sur la loi de Biot-Savart. Cette manière de procéder est beaucoup mieux accueillie par les étudiants
mais pas nécessairement accessible à tous les niveaux.

Revenons maintenant sur la loi de Biot-Savart. Un exemple important en astrophysique de loi de Biot-Savart
dans le cadre des jets de plasmas des disques d'accrétion sont les boucles de courant circulaires uniques (il
faut y rajouter aussi la force de Laplace dans le cadre relativiste pour comprendre la dynamique de ces jets).

La figure ci-dessous en représente un bon exemple :

(36.46)

Nous avons donc une boucle circulaire de rayon R parcourue par un courant d'intensité I. L'objectif étant de
calculer et un point P de l'axe de cette boucle.

Le vecteur correspondant à un courant élémentaire au sommet de la boucle sort perpendiculairement du


plan de la page. L'angle entre ce vecteur et est donc de . Le plan formé par et est normal à la
figure. Le vecteur produit par ce courant élémentaire est normal à ce plan de par la forme de la loi de
Biot-Savart. Il est donc dans ce plan de la figure et à angle droit avec le vecteur comme indiqué sur la
figure.

Décomposons en deux parties : la première, est le long de l'axe de la boucle et la seconde, est
perpendiculaire à cet axe. Seule la composante contribue à l'induction magnétique totale au point P. Il en
est ainsi du fait que les composantes de tous les courants élémentaires sont sur l'axe et qu'elles
s'additionnent directement. Quant aux composantes , elles sont dirigées dans différentes directions
perpendiculairement à cet axe de sorte que, par symétrie, leur contribution est nulle sur cet axe (prenez
vraiment garde à ce cas particulier).

Nous obtenons :

(36.47)

C'est une intégrale scalaire effectuée sur tous les courants élémentaires. Nous obtenons d'après la loi de Biot-
Savart :

(36.48)

De plus, nous avons selon le schéma :


(36.49)

En combinant ces relations, nous obtenons :

(36.50)

La figure révèle que r et ne sont pas des variables indépendantes. Nous pouvons les exprimer en fonction
de la nouvelle variable x, la distance entre le centre de la boucle et le point P. Les relations entre ces
variables sont :

(36.51)

En substituant ces valeurs dans l'expression de , nous obtenons :

(36.52)

Nous remarquons que, pour tous les courants élémentaires, I,R,x ont respectivement les mêmes valeurs.
L'intégration de cette différentielle donne :

(36.53)

Une point important de cette relation est en où nous obtenons donc :

(36.54)

Un autre cas d'application important de la loi de Biot-Savart consiste à reprendre l'exemple précédent, mais
pour une forme continue plane quelconque et considérée comme ponctuelle et dont nous aimerions connaître
la valeur du champ ailleurs que sur l'axe de symétrie. Les résultats seront très utiles lorsque nous étudierons
le physique quantique corpusculaire et donc les propriétés magnétiques des métaux.

DIPÔLE MAGNÉTIQUE

Le dipôle magnétique a tout comme en électrostatique, une énorme importance dans l'étude des propriétés
magnétiques des matériaux pour lesquelles il permet d'élaborer de bons modèles théoriques.

Avant de lire ce qui va suivre, nous conseillerions au lecteur (c'est même plus qu'un conseil) de lire le
absolument tout le développement du dipôle électrostatique rigide dans le chapitre d'Électrostatique.
Effectivement, la plupart des calculs qui vont suivre comportement les mêmes raisonnements,
développements et approximations mathématiques à quelques infimes nuances près. Nous n'avons dès lors
pas souhaité refaire les mêmes calculs intermédiaires déjà présent lors du calcul du dipôle électrostatique
(cependant, si vraiment il y a difficulté de la part du lecteur, nous sommes prêts à compléter... mais bon...).
Le dipôle magnétique a une différence non négligeable relativement au cas pratique que nous nous imposons
comme cadre d'étude... il n'y pas 2 charges ! Effectivement, des charges au repos émettent en première
approximation (c'est expérimental et... théorique) un champ magnétique intrinsèque beaucoup trop faible
pour être considéré comme intéressant dans le cadre de l'étude des propriétés magnétique des matériaux. Il
convient cependant de préciser quelque chose d'intéressant (de sympa), les charges coulombiennes
élémentaires sont parfois modélisées (à tort!) par les physiciens comme en rotation sur elles-mêmes (le
"spin") et sont représentées comme une superpositions de spires circulaires (tiens... une spire...) en
infiniment petites ce qui fait qu'un observateur dans un référentiel au repos (au centre de la charge ) peut
interpréter la charge coulombienne globale comme étant un courant en déplacement dans les différentes
spires, induisant ainsi un champ magnétique intrinsèque (joli non !?).

Bref, considérons un spire plane (tiens... une spire...), de forme quelconque, de centre O, parcourue par un
courant permanent et constant dont un des points de la spire est notée par P. Nous allons calculer le champ
magnétique créé par cette spire en tout point M de l'espace, situé à grande distance de la spire (précisément,
à des distances grandes comparées à la taille de la spire).

Remarque: Personnellement il y a certaines étapes du calcul que je trouve... comment dire... de très loin pas
convaincantes... mais bon... il y a tellement d'approximations que l'on est plus à ça près... hummm....

Nous posons :

(36.55)

Nous allons dont utiliser la loi de Biot-Savart dans la limite appartenant à la spire :

(36.56)

Mais donc :

(36.57)

Évaluons le terme pour des points M situés à grande distance de la spire :

(36.58)

où nous avons fait comme le dipôle électrostatique rigide un développement limité à l'ordre 1.

Remarque: La dernière approximation est très grossière dans le sens qu'il s'agit d'un choix astucieux des
termes à négliger pour arriver à un résultat esthétique visuellement et permettant de définir le moment
magnétique dipolaire (voir un peu plus loin)...

En reportant cette expression dans la loi de Biot-Savart, nous obtenons :


(36.59)

Évaluons séparément chaque terme intervenant dans la parenthèse :

1.

puisque le vecteur est indépendant du point sur la spire et que nous faisons une intégration curviligne
sur toute la spire, en revenant au point de départ.

2.

De par les propriétés du produit vectoriel :

(36.60)

Or puisque et sont perpendiculaires, nous avons qui est la surface infinitésimale dS' d'un carré
et cela ne représente rien étant donné que l'abscisse est curviligne par rapport à O. Effectivement :

(36.61)

Donc, nous pouvons écrire :

(36.62)

où est le vecteur normal au plan de la spire (vecteur de base de l'axe Z). Ce résultat est général, valable
quelque soit la surface.

D'où :

(36.63)

3.

de par les propriétés du produit vectoriel.


Prenons une surface S plane quelconque. Sur cette surface, nous avons :

(36.64)

puisque nous revenons au même point de départ. Nous avons donc l'égalité :

(36.65)

Nous allons utiliser ces relations pour calculer l'intégrale inconnue du début. Si nous décomposons les
vecteurs et dans la base engendrant le plan de la spire, nous obtenons :

(36.66)

or :

(36.67)

D'où :

(36.68)

De par l'égalité , nous avons :

(36.69)

Rappel :

(36.70)

Sous forme de composantes (seulement la troisième est non nulle), nous avons :

(36.71)

d'où :

(36.72)

Ce qui nous amène à écrire :


(36.73)

En rassemblant ces résultats, nous obtenons pour le champ magnétique :

(36.74)

Nous voyons donc apparaître une grandeur importante car décrivant complètement la spire vue depuis une
grande distance, à savoir le "moment magnétique dipolaire" :

(36.75)

souvent noté aussi par un M par certains auteurs.

En faisant usage de la propriété suivante du produit vectoriel (cf. chapitre de Calcul Vectoriel) :

(36.76)

Nous obtenons alors l'expression du champ magnétique approximative créé par un dipôle :

(36.77)

à comparer (pour le fun) avec l'expression du champ électrique pour un dipôle électrique rigide :

(36.78)

Nous sommes quand même arrivés à mettre cela sous une forme assez identique et esthétique après quelques
approximations...

Nous avons aussi :

(36.79)

d'où :

(36.80)

L'origine du champ magnétique d'un matériau quelconque doit être microscopique. En utilisant le modèle de
Bohr de l'atome (cf. chapitre de Physique Quantique Corpusculaire), nous pouvons nous convaincre que les
atomes (du moins certains) ont un moment magnétique dipolaire intrinsèque. Effectivement, le modèle de
Bohr de l'atome d'Hydrogène consiste en un électron de charge en mouvement (circulaire) autour
d'un noyau centre (un proton) avec une période .

Si nous regardons sur des échelles de temps longues par rapport à T, tout se passe comme s'il y avait un
courant :
(36.81)

Nous avons donc une sorte de spire circulaire, de rayon moyen la distance moyenne au proton, c'est à dire le
rayon de Bohr . L'atome d'Hydrogène aurait donc un moment magnétique intrinsèque :

(36.82)

où est le moment cinétique de l'électron et q/2m le "facteur gyromagnétique". Ce raisonnement peut se


généraliser aux autres atomes. En effet, un ensemble de charges en rotation autour d'un axe vont produire un
moment magnétique proportionnel au moment cinétique total. Cela se produit même si la charge totale est
nulle (matériau ou atome neutre) : ce qui compte c'est l'existence (scalaire) d'un courant.

Du coup, nous pouvons expliquer qualitativement les propriétés magnétiques des matériaux en fonction de
l'orientation des moments magnétique des atomes qui les composent :

- Matériaux amagnétiques: ce sont les matériaux où les moments sont distribués aléatoirement, il n'y a pas
de champ magnétique intrinsèque.

- Matériaux diamagnétiques: ce sont la matériaux qui soumis à un champ magnéatique, ont leur moment qui
s'opposent à celui-ci et sont donc repoussés (très faiblement) par les aimants. Ils induisent donc un moment
magnétique opposé à la direction du champ magnétique.

- Matériaux paramagnétiques: ce sont les matériaux pour lesquels les moments peuvent s'orienter dans la
direction d'un champ magnétique extérieur et pouvant donc être ainsi aimantés (attirés) momentanément. Ils
induisent donc un moment magnétique dans la direction du champ magnétique.

- Matériaux ferromagnétiques : ce sont les matériaux dont les moments sont déjà orientés dans une direction
particulière, de façon permanente (aimants naturels).

Remarque: La Terre est connue pour avoir un champ magnétique dipolaire, où le pôle Nord magnétique
correspond au pôle Sud géographique (à un angle près). Au niveau macroscopique, l'explication de
l'existence du champ magnétique observé sur les étoiles est encore aujourd'hui loin d'être satisfaisante. La
théorie de "l'effet dynamo" essaie de rendre compte des champs observés par la présence de courants,
essentiellement azimutaux, dans le coeur des astres. Plusieurs faits connus restent partiellement non éclaircis
:

- Les cycles magnétiques : le Soleil a un champ magnétique à grande échelle qui ressemble à celui de la
Terre, approximativement dipolaire. Cependant, il y a une inversion de polarité tous les 11 ans (sur 11 ans).
Pour la Terre, on a pu mettre en évidence qu'il y avait eu une inversion il y a environ 700'000 ans.

- Non alignement avec le moment cinétique de l'astre : s'il est de l'ordre d'une dizaine de degrés pour la
Terre, il est perpendiculaire pour Neptune!

LOI DE LORENTZ

En électrostatique, nous avons calculé la force exercée par une ou un ensemble de charges au repos sur une
charge immobile ou en mouvement. La force exercée s'écrivait alors de la manière suivante:

(36.83)
Dans le cas le plus général, où les charges agissantes sont en mouvement, la force qu'elles exercent sur une
charge ponctuelle q placée en un point de l'espace est la somme de deux termes : l'un qui est indépendant de
la vitesse de cette charge, l'autre qui en dépend. Voici comment s'écrit cette relation :

(36.84)

qui n'est d'autre que la "loi de Lorentz" ou "force de Lorentz".

Pour démontrer cette relation, nous allons poser deux hypothèses mais avant il est important d'informer le
lecteur que cette démonstration nécessite des outils mathématique non nécessairement évidents (il faut avoir
lu le chapitre de Mécanique Analytique et de Physique Quantique Ondulatoire pour comprendre) :

H1. Soit une particule ponctuelle non-relativiste de masse m, de position et de vitesse


; nous supposons qu'elle est soumise à une force et qu'elle satisfait les équations de Newton:

(36.85)

avec les relations de commutations suivantes (cf. chapitre de Physique Quantique Ondulatoire):

(36.86)

Il faut bien voir que la dernière relation est une hypothèse et qu'elle n'est pas équivalente aux règles de
commutation que nous avons vues en physique quantique entre positions et impulsions!

H2. Il existe des champs et , ne dépendant pas des vitesses, tels que:

(36.87)

et qui vérifient les équations de Maxwell (cf. chapitre d'Électrodynamique) :

(36.88)

A un niveau classique, nous exprimons les hypothèses de commutation en utilisant la correspondance


commutateurs-crochet de Poisson (cf. chapitre de Mécanique Analytique), soit:

(36.89)

avec (rappel):

(36.90)

Maintenant, nous définissons un potentiel vecteur (cf. chapitre d'Électrodynamique) tel que:
(36.91)

alors l'hypothèse ( ) de commutation peut s'écrire:

(36.92)

donc nous pouvons dire que ne dépend que de et t puisqu'il commute identiquement à .

De plus, nous savons que la mécanique classique admet une formulation lagrangienne (équivalent aux
équations de Newton) pour laquelle les équations de la mécanique deviennent (cf. chapitre de Mécanique
Analytique):

(36.93)

où L désigne le lagrangien du système. Dès lors, avec:

(36.94)

nous pouvons intégrer la relation :

(36.95)

et nous obtenons:

(36.96)

Le signe "-" de la constante d'intégration du potentiel vecteur se justifie pour être en cohérence avec ce que
nous avons vu en théorie de Jauge (cf. chapitre d'Électrodynamique).

La seconde équation de Lagrange nous donne alors:

(36.97)

En développant un peu:

et (36.98)

Pour l'ensemble des coordonnées, cela donne sous forme condensée et en utilisant les outils de l'analyse
vectorielle:
(36.99)

Donc:

(36.100)

ou autrement écrit:

(36.101)

Nous retrouvons donc bien l'expression de la force de Lorentz où et sont donnés par:

(36.102)

comme nous l'avons vu en théorie de Jauges. Certes la démonstration est loin d'être évident mais elle est
possible.

Arrêtons-nous un instant sur l'expression de la force de Lorentz. Nous voyons avec cette relation, qu'une
charge immobile (ou non) dans un champ électrique subira une force qui lui donnera l'impulsion nécessaire
à faire varier son énergie cinétique (nulle ou non nulle au départ). Cette constatation n'est cependant pas
valable pour le champ magnétique. Effectivement, lorsque nous plaçons une charge immobile dans un
champ magnétique, cette dernière ne subira aucune force du champ magnétique et donc ne verra pas son
énergie cinétique varier. Si la particule chargée à une vitesse initiale non nulle, il s'ensuit que le champ
magnétique va changer les composantes du vecteur vitesse mais pas la norme. Ainsi, nous avons pour
habitude de dire que : "le champ magnétique ne travaille pas".

Démonstration:

(36.103)

Donc :

(36.104)

L'énergie cinétique de la particule ne change donc effectivement pas à cause du champ magnétique.

Maintenant, si nous nous intéressons uniquement au second terme de cette relation, nous pouvons arriver à
démontrer la loi de Laplace :

Nous avons:

(36.105)

où est la densité volumique de charge. Si et sont supposés parallèles nous pouvons écrire que:
(36.106)

Une densité de courant nous permet de calculer la vitesse d'entraînement des porteurs de charges dans un
conducteur. Le nombre d'électrons de conduction dans un fil est égal à:

(36.107)

où n est le nombre d'électrons de conduction par unité de volume et le volume du fil.

Une quantité de charges traverse un fil en un temps t donné par:

(36.108)

L'intensité I du courant étant définie par:

(36.109)

nous obtenons que:

(36.110)

De:

(36.111)

Nous pouvons maintenant tirer que:

(36.112)

Enfin, nous trouvons que:

(36.113)

qui est la "loi de Laplace" ou "force de Laplace".

Voyons quelques cas importants d'application de la loi de Lorentz :

EFFET HALL CLASSIQUE

Précédemment, nous avons étudié l'action d'une induction magnétique sur un circuit filiforme en ayant pour
but de trouver l'expression des forces magnétiques appliquées à la matière même de ce circuit.

Portons maintenant notre attention sur les électrons de conductivité eux-mêmes, en nous plaçant dans le cas
de la figure ci-dessous:
(36.114)

où un ruban métallique est parcouru par un courant continu . Le vecteur densité de courant est constant
et parallèle aux grands côtés PQ ou RS du ruban.

Imaginons alors que le ruban soit plongé dans un champ magnétique uniforme perpendiculaire aux plans
PQ et RS (selon l'axe Z). Les charges mobiles de densité volumique contenues dans un élément de
volume dV sont donc soumises à la force magnétique :

(36.115)

Cette force modifie les trajectoires des électrons mobiles et, au cours d'un régime transitoire, provoque leur
accumulation sur le bord avant du ruban tandis qu'un excès de charges positives apparaît sur le bord arrière.

Ce phénomène produit un champ électrique supplémentaire parallèle à RP qui exerce sur les charges
mobiles du volume une force électrique:

(36.116)

Les deux forces s'opposent donc l'une à l'autre et la force coulombienne tend à ramener les trajectoires
électroniques dans leur position initiale. Un régime permanent s'établit peu à peu.

Remarque: En fait, à chaque fois que nous parlons de régime permanent en physique, nous mentons un peu.
Il s'agit au fait juste d'un équilibre stable et en général, le système oscille autour de sa position d'équilibre.
Au bout d'un certain temps, un système comme le conducteur impliqué dans notre exemple montre des
oscillations négligeables. La physique c'est aussi parfois qu'une question d'approximations...

Quand ce régime est atteint, la densité de courant est à nouveau parallèle à PQ et les forces électriques et
magnétiques ci-dessus sont vectoriellement opposées. Nous avons donc :

(36.117)

avec :

(36.118)

Dans certains ouvrages cette égalité est notée sous forme de ses composantes telle que :

(36.119)

Or, comme nous l'avons démontré dans le chapitre d'Électrocinétique:

(36.120)
dès lors :

(36.121)

Nous définissons alors le "coefficient de Hall" par :

(36.122)

peut être aussi bien utilisé à l'équilibre pour la mesure de que par extension si nous supposons
alors donc à la mesure de la densité de porteurs dans l'échantillon.

Remarque: Nous parlons également de "résistance de Hall". Il s'agit simplement du rapport de la tension de
Hall sur le courant circulant dans l'échantillon. Il ne faut cependant pas confondre la résistance de Hall avec
. Notons que la résistance de Hall varie linéairement avec le champ magnétique.

Dans un semi-conducteur à deux dimensions, l'effet Hall est également mesurable. Par contre, à
suffisamment basse température, nous observons une série de plateaux pour la résistance Hall en fonction du
champ magnétique. Ces plateaux apparaissent à des valeurs précises de résistance, et ce, indépendamment
de l'échantillon utilisé. Ceci fait l'étude de "l'effet Hall quantique" que nous n'étudierons pas dans ce
chapitre.

Sous forme scalaire la relation de "l'effet Hall", encadrée ci-dessus, s'écrit:

(36.123)

Nous pouvons aussi l'exprimer en explicitant la différence de potentiel qui correspond par définition au
champ électrique.

Si l est la largeur du ruban, nous avons:

(36.124)

Si e est son épaisseur, le courant I qui le parcourt est:

(36.125)

Compte tenu des positions relatives des divers vecteurs, la relation exprimant l'effet Hall équivaut donc à:

(36.126)

Plus esthétiquement et sous une forme traditionnelle, la tension de l'effet Hall est donnée par:

(36.127)

avec:

(36.128)
qui est la "constante de Hall". Elle est inversement proportionnelle à la densité des porteurs libres et dans le
cadre des métaux elle est négative.

Dans d'autres domaines d'étude comme celui des semi-conducteurs, nous écrivons la tension de Hall sous la
forme traditionnelle:

(36.129)

où q est la charge de l'électron et n la notation traditionnelle (sic!) de la densité de porteurs dans le cadre de
l'étude des semi-conducteurs.

Nous avons alors dans ce dernier domaine la constante de Hall qui est définie par:

(36.130)

Ce qui a fait cependant la renommée de l'effet Hall, outre le fait que ce résultat est utilisé pour fabriquer des
sondes de champs magnétiques, c'est que pour certains types de semi-conducteurs cette constante de Hall est
positive!!!! Ce qui signifierait avec les modèles standards que nous avons à notre disposition jusqu'à
maintenant, qu'il y aurait des charges positives qui feraient office de courant... et à l'époque de la mise en
place de cette expérience, ceci était inexplicable.

Or nous verrons plus tard qu'en utilisant la théorique quantique dans le cadre des semi-conducteurs que des
charges positives peuvent pourtant sous certaines conditions apparaître et être à l'origine d'un courant!

RAYON DE LARMOR

Un cas très intéressant d'étude de laboratoire est le mouvement d'une charge dans un champ magnétique
uniforme. Pour cette étude, considérons une particule de masse m et de charge q placée dans un champ
magnétique uniforme avec une vitesse initiale .

Nous avons selon la loi de Lorentz :

(36.131)

Puisque la force magnétique est nulle dans la direction du champ, cette direction est privilégiée. Nous allons
donc tirer parti de cette information et décomposer la vitesse en deux composantes, l'une parallèle et l'autre
perpendiculaire au champ, . L'équation du mouvement s'écrit alors :

(36.132)

La trajectoire reste donc rectiligne uniforme dans la direction du champ ! Prenons un repère cartésien dont
l'axe est donné par la direction du champ magnétique tel que . L'équation du mouvement ne
s'écrit dès lors que plus que sur deux composantes puisque :
(36.133)

d'où :

(36.134)

Une solution très simple à ces deux équations différentielles est dans un cadre non relativiste :

(36.135)

où nous avons donc choisi une vitesse initiale suivant X. En intégrant, nous obtenons :

(36.136)

où les constantes d'intégration ont été choisies nulles (choix arbitraire). La trajectoire est donc un cercle de
rayon :

(36.137)

appelé "rayon de Larmor", décrit avec la pulsation :

(36.138)

dite "pulsation gyro-synchrotron". Ce cercle est parcouru dans le sens conventionnel positif pour des charges
négatives.

Le problème d'une telle configuration pour construire un accélérateur, c'est que si nous augmentons l'énergie
de la particule (en ajoutant un champ électrique synchronisé sur la pulsation gyro-synchrotron et colinéaire
au mouvement), sa vitesse augmente mais le rayon de Larmor aussi. Or, le "cyclotron" qui est basé sur ce
système a un rayon limité puisqu'il est difficile de maintenir un champ magnétique constant sur une grande
surface.

Plus difficile encore, dans le cas relativiste, la pulsation s'écrit avec le facteur de Fitzgerald-Lorentz (cf.
chapitre de Relativité Restreinte):

(36.139)

Nous voyons alors qu'il faut ajuster la pulsation du champ électrique à la pulsation de rotation lorsque la
vitesse augmente: l'accélérateur est maintenant un "synchrocyclotron".
Pour résoudre le problème de l'augmentation du rayon, nous utilisons alors un "synchrotron" constitué d'un
tube à vide unique comportant de sections droite contenant des cavités accélératrices et des section cours
équipées d'aimants créant à chaque instant le champ magnétique adapté à la vitesse des particules. Cette
technique, dont il est facile de parler mais très difficile à mettre en pratique, est la plus utilisée à nos jours.
Le LHC du CERN fait partie de la famille des synchrotrons

A partir de cette relation il est inversement aisé d'avoir l'énergie cinétique de la particule:

(36.140)

C'est sur la base de cette relation que fonctionnent les "spectromètres de masse de Dempster". C'est en
utilisant cette technique que les chercheurs ont découvert dans les années 1920 que les atomes d'un même
élément chimique n'ont pas nécessairement la même masse. Les différentes variétés d'atomes d'un même
élément chimique, variétés qui diffèrent par leur masse, sont les isotopes (cf. chapitre de Physique
Nucléaire).

Le rayon de Larmor correspond à la distance la plus grande que peut parcourir une particule dans la
direction transverse avant d'être déviée de sa trajectoire. Cela correspond donc à une sorte de distance de
piégeage. A moins de recevoir de l'énergie cinétique supplémentaire, une particule chargée est ainsi piégée
dans un champ magnétique.

Il est intéressant de noter que l'énergie cinétique transverse d'une particule est élevée (grande masse ou
grande vitesse transverse) et plus le rayon de Larmor est grand. Inversement, plus le champ magnétique est
élevé et plus ce rayon est petit.

Remarque: Le confinement du plasma dans un tokamak est basé sur cette propriété qu'ont les particules
chargées de décrire une trajectoire en hélice autour d'une ligne de champ magnétique. D'où l'intérêt d'utiliser
un tore.
37. ÉLECTRODYNAMIQUE

N ous allons dans ce chapitre étudier un ensemble d'équations qui peuvent résumer à elles seules
l'ensemble de nos connaissances sur l'électrostatique et la magnétostatique. Ces équations, au nombre de
quatre, se nomment "équations de Maxwell-Heaviside" (que nous abrégerons par abus comme de nombreux
autres ouvrages "équations de Maxwell") et vont nous permettre d'aborder la branche de la physique appelée
"électrodynamique" et donc des ondes électromagnétiques.

Remarque: Il est très important de bien comprendre ce qui va suivre! Certains des développements seront
réutilisés dans les chapitres de Relativité Restreinte, de Physique Quantique Des Champs, etc. Par ailleurs, il
faudrait que le lecteur lise en parallèle le chapitre de Relativité Restreinte pour mieux comprendre les
tenants et aboutissants de certains résultats et la provenance de quelques outils mathématiques.

Rappel : Nous supposerons que tout à chacun sait en ce début de 3ème millénaire que les rayons gamma, les
ondes radio, les micro-ondes, la lumière visiible (et non visible) sont simplement des ondes
électromagnétique (E.M.) de fréquences différentes!

PREMIERE EQUATION DE MAXWELL

Soit définit un champ de vecteurs dans l'espace. Considérons une surface S fermée dans le champ. Alors à
chaque point (x, y, z) appartenant à la surface correspond un vecteur du champ.

Dans ce cas le théorème d'Ostrogradsky (cf. chapitre de Calcul Vectoriel) donne :

(37.1)

avec V étant le volume de la surface (dite "surface de Gauss") fermée.

Remarque: Le théorème d'Ostrogradsky est vérifié à condition qu'il n'existe pas de singularités de
dans V.

Rappel : Dans le cas du théorème de Ostrogradsky le vecteur est conventionnellement dirigé vers
l'extérieur de la surface.

Dans le cas particulier du champ électrique, nous obtenons des résultats très intéressants. En effet soit une
charge Q repérée par rapport à un référentiel par le vecteur .

Alors, nous avons vu dans le chapitre d'Électrostatique qu'en chaque point de l'espace il existe un champ
tel que:

(37.2)

d'où :
(37.3)

Comme nous pouvons le constater, le champ possède une singularité en . Considérons une
surface de Gauss tel que la charge Q se trouve à l'extérieur de cette surface. A l'intérieur du volume V
délimitant la surface S le champ ne possède alors pas de singularité. Nous pouvons donc calculer la
divergence de :

(37.4)

Donc si nous calculons le flux à travers cette surface nous trouvons (voir le chapitre de Calcul Vectoriel
pour la description détaillée de l'opérateur Nabla):

(37.5)

Le flux est nul !

Dans le cas où la charge Q se trouve à l'intérieur de la surface de Gauss n'est plus défini en
nous avons alors:

(37.6)

Avec étant le flux de sur une petite boule B entourant la charge ponctuelle Q.

Dans ce cas :

(37.7)

car la divergence est définie partout sur V-B. Il nous reste donc:
(37.8)

Mais dans le cas d'une sphère il est facile de calculer

Nous avons :

(37.9)

d'où la "première équation de Maxwell" ou "loi de Gauss" pour le champ électrique (ou "théorème de
Gauss") :

(37.10)

Explications : Cette équation suggère que le flux du champ électrique traversant une surface close (d'où le
cercle sur l'intégrale) est égale, à un facteur dimensionnel près, à la charge totale enfermée dans cette
surface.

Remarques:

R1. Il est intéressant (et trivial) de remarquer que le résultat est identique si nous prenons la formulation
relativiste (cf. chapitre de Relativité Restreinte) de l'expression du champ électrique (à cause des
différentielles qui sont partielles et non totales) !

R2. L'intégrale de la dernière relation est une intégrale curviligne (donc évaluée sur une courbe). Dans le
domaine de l'électrodynamique les intégrales curvilignes s'appliquent très souvent sur des chemins ou
surfaces fermées d'où l'indication d'un cercle superposé au symbole de l'intégrale portant alors le nom de
"circulation du champ de vecteurs".

Si nous exprimons maintenant cette équation en fonction du potentiel électrique, nous obtenons :

(37.11)

où donc . Nous pouvons noter la relation ci-dessus de façon plus esthétique en utilisant le
Laplacien scalaire, tel que nous obtenions la relation:

(37.12)

appelée "équation de Maxwell-Poisson".

DEUXIEME EQUATION DE MAXWELL

Dans le cas particulier du champ magnétique, nous obtenons des résultats très intéressants. En effet soit un
courant I repéré par rapport à un référentiel par le vecteur . Alors en chaque point de l'espace, nous avons
vu dans le chapitre de Magnétostatique qu'il existe un champ tel que:
(37.13)

d'où :

(37.14)

Comme nous pouvons le constater, le champ possède une singularité en . Considérons alors
une surface de Gauss tel que le courant I se trouve à l'extérieur de cette surface.

A l'intérieur du volume V délimitant la surface S le champ ne possède alors pas de singularité. Nous
pouvons donc calculer la divergence de :

(37.15)

D'où :

(37.16)

Si nous calculons le flux à travers cette surface nous trouvons alors :

(37.17)

Le flux est nul !

Dans le cas où le courant I se trouve à l'intérieur de la surface de Gauss n'est plus défini en
nous avons alors :

(37.18)
Avec étant le flux de sur une petite boule entourant partiellement le conducteur rectiligne
transportant le courant I. Dans ce cas:

(37.19)

car la divergence est définie partout sur V-B.

Il nous reste donc:

(37.20)

Mais dans le cas d'une sphère il est facile de calculer :

(37.21)

Nous avons alors loi de Gauss pour le champ magnétique :

(37.22)

Dans le cas du champ magnétique, et sont perpendiculaires donc :

(37.23)

Remarque: D'où nous pouvons aussi déduire que !

Donc, soit donnée une surface de Gauss dans un champ magnétique, alors le flux du champ magnétique à
travers cette surface vaut:

(37.24)

relation qui constitue la "deuxième équation de Maxwell".

Explication : La deuxième équation est basée sur le fait qu'il n'existe aucun " monopôle magnétique" dans la
nature, c'est-à-dire, qu'à tout pôle positif, nous devons retrouver un pôle négatif (à partir d'un aimant, les
lignes du champ ne divergent pas). La deuxième équation vient toutefois rajouter l'idée (démontrée par
Dirac) que s'il était possible de retrouver un monopôle dans la nature, il serait le point de source du champ
magnétique. Nous verrons cela un peu plus loin dans les détails.

Remarque: Il est intéressant (et trivial) de remarquer que le résultat est identique si l'on prend la forme
relativiste (cf. chapitre de Relativité Restreinte) de l'expression du champ électrique (à cause des
différentielles qui sont partielles et non totales)!

TROISIEME EQUATION DE MAXWELL


Nous démontrerons dans le chapitre d'Électrocinétique (car il faut des notions que nous n'avons pas encore
rencontrées), que la variation du flux du champ magnétique dans le temps à travers une boucle conductrice
induit une tension dans cette boucle donnée par la "loi de Faraday" :

(37.25)

et nous avons déjà démontré dans le chapitre d'Électrostatique que:

(37.26)

donc:

(37.27)

Remarque: Nous verrons dans le chapitre d'Électrocinétique qu'il n'est pas tout à fait correct de noter le
potentiel U comme ci-dessus car au fait, la loi de Faraday exprime la force électromotrice (potentiel
électromoteur) e et ce potentiel est non conservatif contrairement au potentiel électrostatique de Coulomb.

Si nous développons cette relation, en utilisant le théorème de Stokes (cf. chapitre de Calcul Vectoriel) nous
obtenons alors:

(37.28)

Ceci est la "troisième équation de Maxwell" ou "loi de Maxwell-Faraday" dite parfois encore "loi
d'induction".

Explication : La troisième équation affirme qu'une variation du champ magnétique produit un champ
électrique dans une boucle conductrice. Cette équation est donc basée sur la théorie de Faraday.

Remarque: Il est évident que cette formulation est aussi relativiste.

QUATRIEME EQUATION DE MAXWELL

La 4ème équation de Maxwell est la plus importante. Elle est une généralisation de la loi d'Ampère qui a
déjà été démontrée dans le chapitre de Magnétostatique et pour laquelle nous avions obtenu (il est très facile
de vérifier que cette relation est également valable pour l'expression relativiste du champ magnétique) :

(37.29)

La troisième équation de Maxwell nous dit que la variation d'un champ magnétique donne lieu à un champ
électrique nous pouvons donc supposer que la réciproque est vraie.

Un endroit typique où l'on peut observer une variation d'un champ électrique est par exemple le
condensateur.

Nous savons que :


(37.30)

et que le champ électrique entre deux plans parallèles, de surface S, portant des charges ,
uniformément est donné par (cf. chapitre d'Électrostatique):

(37.31)

Ce résultat est indépendant de la distance d entre les plans. La deuxième équation de Maxwell donne:

(37.32)

La capacité d'un condensateur étant définie par (cf. chapitre d'Électrostatique) :

(37.33)

nous avions obtenu dans le cas particulier d'un condensateur plan et parallèle que la capacité vaut :

(37.34)

Comme nous savons que :

(37.35)

rien ne nous empêche d'écrire que:

(37.36)

Nous nommons "courant de déplacement". En exprimant l'expression ci-dessus en utilisant la densité


superficielle de courant, il vient :

(37.37)

Le courant de déplacement engendre un champ magnétique calculable au moyen de la loi d'Ampère:

(37.38)

Dans tout phénomène où nous observons un déplacement de charge, nous pouvons supposer qu'il y a
création d'un courant de déplacement qui se superpose au courant de conduction à cause des effets capacitifs
dans la matière. Nous écrivons dès lors:
(37.39)

où nous avons (rappel) :

et (37.40)

D'autre part, le théorème de Stokes fournit que (à nouveau, il est facile de vérifier que cette relation est aussi
juste pour l'expression relativiste du champ magnétique) :

(37.41)

d'où :

(37.42)

et nous en ressortons finalement que:

(37.43)

Ceci est la "quatrième équation de Maxwell" ou "équation de Maxwell-Ampère".

Explication : La quatrième et dernière équation de Maxwell associe la création d'un champ magnétique à
toute variation d'un champ électrique ou à la présence d'un courant électrique.

Remarque: Il est évident que cette formulation est aussi relativiste.

Résumé :

Nous avons donc les quatre équations de Maxwell suivantes appelées "formes locales des équations de
Maxwell" (lorsque les intégrales ne sont pas indiquées) :

(37.44)

Dans le cas où , les physiciens pour différencier le fait que qu'ils ne travaillent pas dans la vide
mais dans la matière écrivent les équations locales de Maxwell sous la forme suivante :

(37.45)
où est (rappel) appelé "champ de déplacement" ou encore "induction électrique" et (rappel) "excitation
magnétique".

Remarque: Attention! est une réaction du vide au champ . Cela s'explique par la constante de
permittivité du vide mise dans l'intégrale (du moins c'est une façon de voir la chose).

Mais dans le vide et dans le cas où nous considérons une absence de charges, nous obtenons :

(37.46)

Ce résultat est important car il exprime la propagation possible d'un champ électrique et magnétique et ce
même en l'absence de sources. Nous utiliserons ces équations pour déterminer les équations d'onde
électromagnétiques plus loin.

Remarque: Il est possible d'exprimer les équations de Maxwell sous forme relativiste (la relativité restreinte)
mais .... en réalité, comme nous l'avons déjà fait remarquer, les équations sont inchangées! En effet, les
équations de Maxwell sont déjà relativistes. Ceci n'a rien d'étonnant car les vecteurs des champs électrique et
magnétique, le photon (cf. chapitre de Physique Quantique Des Champs), se propagent à la vitesse de la
lumière. A cette vitesse, la relativité est reine et une théorie correcte ne pouvait être que relativiste. On peut
toutefois exprimer les équations à l'aide des notations mathématiques tensorielle (voir plus loin notre
démonstration du tenseur du champ électromagnétique). Sous cette forme les équations deviennent
incroyablement simples et compactes (une seule équation extrêmement courte). Formulées de cette manière,
les champs électriques et magnétiques s'écrivent comme un champ unique appelé bien évidemment "champ
électromagnétique". C'est un champ tensoriel comme nous le verrons plus loin.

MONOPÔLES MAGNÉTIQUES

Remarquons qu'en optant pour le système de mesure naturel où , nous avons alors pour les équations de
Maxwell dans le vide :

(37.47)

puisque comme nous le démontrerons plus loin, dans le vide :

(37.48)

Alors la transformation :

(37.49)

amène la seconde paire d'équations précédentes en la première ! Cette symétrie des équations de Maxwell
est appelée "dualité" et c'est un indice vers lequel le champ électrique et magnétique ne sont que les parties
unifiées d'un tout que nous appellerons le "champ électromagnétique".

De plus, si nous introduisons le champ complexe suivant :


(37.50)

la dualité (en prenant la partie réelle seulement), s'écrit alors :

(37.51)

la paire d'équations de Maxwell indiquée précédemment se réduit alors à (nous utilisons la propriété de
linéarité de produit vectoriel) plus qu'une seule paire d'équation dont il ne faut pas oublier de prendre la
partie réelle :

(37.52)

Cependant, cette symétrie ne s'étend pas aux équations de Maxwell avec sources exprimées dans le système
naturel par :

(37.53)

car cela se traduirait au mieux (n'oubliez pas de prendre la partie réelle pour le champ intéressé) :

(37.54)

mais une fois sur deux cela ne marche pas (fait la substitution de vous verrez que vous obtenez toujours
une des équations sur la paire qui est conforme l'autre pas). L'astuce consiste alors à séparer les deux
densités en leur partie imaginaire et réelles respectives :

(37.55)

Nous obtenons alors (toujours sans oublier de prendre les parties réelles) :

(37.56)

il suffit alors de poser . Ces équations sont certes charmantes mais leur généralisation n'apporte
rien de nouveau cependant car aucune charge magnétique (exprimée par ) - appelée "monopôle
magnétique" - ont été observées à ce jour. Dans le cadre expérimental, nous disons alors que sont réels
tel que nous ayons bien .

ÉQUATION DE CONSERVATION DE LA CHARGE


Nous avons donc démontré les quatre équations de Maxwell qui sont les fondements de l'électrodynamique
classique.

Les équations de Maxwell peuvent être divisées en deux groupes:

- des "équations sans source" :

et (37.57)

- des "équations avec sources" (dans le vide) :

et (37.58)

Dérivant la première équation avec sources par rapport au temps:

(37.59)

et prenant la divergence de la seconde, nous obtenons :

(37.60)

en simplifiant un peu :

(37.61)

or, et donc:

(37.62)

Après simplification nous obtenons :

(37.63)

qui est appelée "équation de conservation de la charge" ou "équation de continuité".

Elle s'interprète comme: entre deux instant voisins , la variation dQ de la charge contenue dans une
surface fermée délimitant un système ne peut être attribuée exclusivement qu'à un échange de charges avec
l'extérieur.

Cette équation est très importante, car elle implique lors de l'étude de la relativité restreinte, que la charge est
une quantité invariante par translation.
THÉORIE DE JAUGES

Avant de commencer à lire ce sous-chapitre, il est de première importance pour le lecteur d'aller faire un
petit tour dans la section d'Algèbre du site, dans laquelle se trouve un chapitre de Calcul Vectoriel où nous
faisons un rappel des différents opérateurs vectoriels indispensables en physique et leurs propriétés.

Ce qui va suivre est très important car outre le fait que nous allons faire apparaître naturellement un nouveau
champ (le potentiel vecteur) qui est indispensable dans certaines équation de la physique quantique
relativistes (voir chapitre du même nom) nous reprendrons cette démarche de jauges dans le chapitre de
physique quantique ondulatoire où les conséquences sont beaucoup plus vastes!

Soit la relation connue:

(37.64)

il existe de par les propriétés des opérateurs rotationnel et divergence (cf. chapitre de Calcul Vectoriel) un
"potentiel vecteur" tel que :

(37.65)

qui satisfait donc (la divergence du rotationnel d'un champ est toujours nulle car il s'agit d'une propriété
mathématique) :

(37.66)

Remarque: Le potentiel vecteur est donc... un potentiel ! De même que nous pouvons définir un potentiel U
dont dérive , nous pouvons définir un potentiel pour le champ . Mais pour des raisons
techniques (provenant de l'expression des rotationnels de et de dans les équations de Maxwell), le
potentiel n'est pas aussi simple que U et ne peut pas s'exprimer comme un simple scalaire : il faut
utiliser un potentiel vecteur.

Si nous portons la relation dans l'équation de Maxwell nous obtenons :

(37.67)

Nous posons maintenant (la notation n'a aucun rapport avec la force newtonienne!):

(37.68)

et nous utilisons les propriétés mathématiques des opérateurs rotationnel et gradient pour écrire une nouvelle
relation (le signe "-" est là par anticipation de ce qui suivra):

(37.69)

où dès lors :
(37.70)

où est un "potentiel scalaire".

Remarques:

R1. Le champ semble obéir aux mêmes propriétés que le champ gravitationnel (loi de Newton-Poisson)
mais ce n'est qu'une curiosité (les unités et les autres propriétés mathématiques n'étant pas équivalentes)

R2. Le lecteur voit sans peine que si le potentiel vecteur est nul, nous retrouvons alors (cf. chapitre
d'Électrostatique) :

(37.71)

ce qui renforce les hypothèses des développements précédents (et ce n'est pas tout...)

De plus, les champs et restent inchangés si nous effectuons dans les relations précédentes les
remplacements suivants (les termes s'annulent trivialement) :

(37.72)

où est une fonction arbitraire de et t.

Nous appelons une telle transformation un "changement de jauge". La liberté sur le choix des potentiels
permet de leur imposer une contrainte que nous appelons la "contrainte de Jauge".

Nous utiliserons soit la "jauge de Lorenz" en imposant:

(37.73)

ou soit la "jauge de Coulomb" en imposant:

(37.74)

Remarque: Nous trouvons souvent dans la littérature la dénomination "jauge de Lorentz" à la place de
"jauge de Lorenz", car comme nous l'avons déjà démontré dans le chapitre de Relativité Restreinte, la jauge
de Lorenz est invariante dans les transformations de Lorentz.

Montrons qu'il est possible d'imposer la jauge de Coulomb. Pour cela, étant donnés et , il suffit de
trouver dans les équations:

(37.75)

tel que la relation (jauge de Coulomb) soit vérifiée. Ainsi, doit vérifier trivialement:
(37.76)

La relation :

(37.77)

est appelée "équation de poisson du potentiel vecteur".

De même, pour montrer qu'il est toujours possible d'imposer la condition de Lorenz, il suffit de trouver
dans les équations précitées :

(37.78)

tel que (nous laissons le soin au lecteur de faire le développement car c'est de l'algèbre élémentaire, sinon
quoi envoyez-nous un mail et nous rajouterons ce qui manque) la relation ci-dessous soit vérifiée :

(37.79)

où l'opérateur:

(37.80)

est par définition appelé le "d'Alembertien" (nous le retrouverons souvent ce terme à partir de maintenant
aussi bien en électrodynamique qu'en physique quantique) qui est donc aussi invariant par transformation
Lorentz comme nous le verrons lors de notre étude de la relativité restreinte (cf. chapitre de Relativité
Restreinte).

Donc sans écrire cela avec le d'alembertien nous aurions :

(37.81)

Effectivement :

(37.82)

En reportant les équations :


et (37.83)

dans les deux autres équations de Maxwell dans le vide :

et (37.84)

nous obtenons, en faisant apparaître le laplacien par une des propriétés des opérateurs vectoriels
rotationnel, gradient et divergence (cf. chapitre de Calcul Vectoriel):

(37.85)

les relations suivantes:

(37.86)

la dernière relation étant appelée "jauge arbitraire".

Pour la jauge de Lorenz, ces deux dernières équations se simplifient en (n'hésitez pas à nous contacter si
vous ne voyez pas comment) :

(37.87)

que nous appelons "équations d'onde des potentiels électromagnétiques" en analogie avec les équations
d'onde des champs électrique et magnétique que nous déterminerons plus loin.

Pour la jauge de Coulomb, les mêmes équations se simplifient en:

(37.88)

Sachant que nous pouvons aussi écrire les deux équations d'onde des potentiels
électromagnétiques sous la forme :

(37.89)
Posons maintenant (afin homogénéiser les unités) tel que nous définissions un "quadrivecteur
potentiel" qui nous permet d'écrire vectoriellement les deux relations ci-dessus de manière unifiée :

(37.90)

Remarque: Le fait que le d'alembertien du quadrivecteur potentiel s'exprime à partir du quadrivecteur


courant qui est contravariant (cf. chapitre de Relativité Restreinte) nous amène à poser que le quadrivecteur
potentiel est lui-même contravariant!

Relation que nous noterons sous une forme condensée de la manière suivante :

(37.91)

où sera appelé "quadrivecteur courant".

Remarque: Nous retrouverons ce quadrivecteur lors de notre détermination du tenseur du champ


électromagnétique (à la différence que nous serons en unités naturelles mais cela ne change pas le fond...).

Le quadrivecteur potentiel tel que défini nous amène à pouvoir écrire la (quadrivergence) jauge de Lorenz en
faisant usage de la notation tensorielle :

(37.92)

Ce qui permet finalement d''écrire la jauge de Lorenz sous forme covariante :

(37.93)

Il s'agit donc d'une équation de la forme de celle de Klein-Gordon pour une particule de masse nulle (cf.
chapitre de Physique Quantique Relativiste). Donc nous pouvons dire dans un sens que l'invariance de jauge
électromagnétique est reliée au fait que la masse du photon est nulle!

Remarque: Il est utile de noter que le fait de poser (avec ou sans les unités naturelles où ) est
une notation qui sera également adoptée lors de notre étude de l'équation de Dirac (cf. chapitre de Physique
Quantique Relativiste) ou encore en physique quantique de champs (mis à part qu'il y aura une partie
imaginaire).

Ces notations nous amènent enfin à pouvoir écrire :

(37.94)

Nous obtenons ainsi l'équation de continuité :

(37.95)
équivalent (sous forme) tensoriel de (voir la démonstration juste plus haut dans le texte) :

(37.96)

Pour résumer en gros... :

Un certain nombre d'effets physiques se modélisent, selon les cas, par des champs qui peuvent être scalaires,
vectoriels, spinoriels ou encore tensoriels que nous appelons donc des jauges. Un certain nombre de
phénomènes physiques s'avèrent respecter des conditions dites de symétrie, vis à vis de ces jauges. Cette
symétrie s'exprime par ce que nous appelons donc une invariance de jauge.

Par exemple, le champ qui permet de modéliser le champ électromagnétique est comme nous l'avons vu, un
champ de quadrivecteurs formé d'un potentiel scalaire (dont le gradient est le champ électrique ) et d'un
potentiel-vecteur (dont le rotationnel est le champ magnétique ). Ce champ quadrivectoriel qui permet
de modéliser le champ électromagnétique est appelé une jauge.

Il s'avère que nous obtenions donc exactement les même effets physiques sur un système de particules
chargées si nous remplaçons cette jauge par une autre jauge en lui rajoutant une contrainte de Jauge
(exemple typique entre la jauge de Lorenz ou de Coulomb vues plus haut). L'invariance des lois de la
physique lors du passage d'une jauge à une autre étant une invariance de jauge. Dans le cas du champ
électromagnétique, cette invariance de jauge s'avère exprimer la conservation de la charge électrique
(comme nous l'avons montré).

Mathématiquement, de tels changements de jauges s'avèrent être le résultat de l'action d'un groupe de
symétrie de dimension infinie (transformant ces jauges les unes en les autres) que nous appelons le "groupe
de jauge" de l'interaction considérée (ici l'interaction électromagnétique).

Pour le champ gravitationnel par exemple (cf. chapitre de Relativité Restreinte), l'interaction gravitationnelle
se modélise par un champ de tenseurs symétriques de rang 2 et avec une signature donnée. Ce champ de
métrique est distribué sur une variété 4D modélisant l'espace-temps. C'est la jauge de l'interaction
gravitationnelle. D'après la relativité générale (principe d'équivalence) nous ne changeons rien à l'interaction
gravitationnelle si nous changeons le système de coordonnées spatio-temporelles dans lequel nous
exprimons la métrique. Le passage d'une expression de la métrique à une autre en changeant de système de
coordonnées est aussi un changement de jauge. L'invariance de jauge de la relativité générale exprime alors
la possibilité de passer d'une jauge à une autre sans changer pour autant les géodésiques suivies par des
particules test tombant en chute libre dans le champ gravitationnel modélisé par le champ de métrique.

L'invariance de jauge de la relativité générale est ce que nous appelons l'invariance par difféomorphisme
(changement de système de coordonnées bijectif présentant un certain degré de régularité) et le groupe de
jauge de la relativité générale est donc le groupe des difféomorphisme de (appelé le "groupe souple").

Il convient de préciser aussi que le potentiel vecteur n'est peut-être pas si virtuel que ça. En effet, il est
possible de modifier les trajectoires de particules chargées passant à l'extérieur du volume cylindrique où
règne un champ magnétique induit par un courant électrique (circulant dans l'enroulement d'un solénoïde
où ce champ est "emprisonné"). Il est donc possible d'influer sur la trajectoire de particules circulant dans
une zone où le champ magnétique est nul mais où son potentiel vecteur ne l'est pas.

Par ailleurs, nous utiliserons les résultats ici lors de notre étude de la théorie de Yang-Mills dans la voie de
l'unification électrofaible (voir le modèle standard dans le chapitre de Physique Quantique Des Champs).

Remarque: L'expérience connue qui fait intervenir le potentiel vecteur est celle d'Aharonov-Bohm (cf.
chapitre de Physique Quantique Ondulatoire).
TENSEUR DU CHAMP ÉLECTROMAGNÉTIQUE

Afin de déterminer le tenseur du champ électromagnétique supposons dans un premier temps que l'action
(cf. chapitre de Mécanique Analytique) d'une particule chargée dans un champ électromagnétique serait
donnée par (choix à priori empirique mais... vous verrez un peu plus loin) :

(37.97)

Remarque: La notation reste réservée à l'action d'un particule libre (cf. chapire de Relativité Restreinte).

Le lagrangien pour une particule chargée dans un champ électromagnétique est donc la somme du
lagrangien de la particule en interaction avec le champ électromagnétique additionné du lagrangien de la
particule libre (cf. chapitre de Relativité Restreinte):

(37.98)

Remarque: Il s'agit donc du lagrangien de l'interaction de la particule avec le champ additionné du


lagrangien de la masse de la particule. Dès lors on voit qu'il manque encore le lagrangien du champ
électromagnétique lui-même en l'absence de charges (appelé : lagrangien du champ libre) mais nous verrons
cela plus loin.

Ceci est donc (à priori) le lagrangien d'une particule chargée dans un champ électromagnétique.

Nous allons démontrer que ce lagrangien est correct :

Le moment généralisé est donc (cf. chapitre de Mécanique Analytique et de Relativité Restreinte) :

(37.99)

Pour vérifier que nous avons fait le bon choix de lagrangien au départ, nous allons obtenir les équations du
mouvement et s'assurer qu'elles coïncident avec la force de Lorentz. Les équations de Lagrange sont, dans ce
cas :

(37.100)

Or nous avons :

(37.101)

et donc :

(37.102)
Mais nous avions fait remarquer lors de la définition du potentiel scalaire que d'où :

(37.103)

Nous devons donc nécessairement avoir par analogie avec la force de Lorentz :

(37.104)

Il nous faut donc avant de poursuivre vérifier que :

(37.105)

Avec :

(37.106)

En composantes :

(37.107)

Donc :

(37.108)

et comme :
(37.109)

Nous avons donc bien l'égalité :

(37.110)

Ces développements confirment donc notre hypothèse initiale comme quoi l'action du champ peut s'écrire :

(37.111)

et qu'elle exprime l'interaction d'une particule chargée avec un champ (car on y retrouve la force de
Lorentz!).

Nous avons donc maintenant démontré que le "lagrangien de l'interaction courants-champs" :

(37.112)

dont avions supposé empiriquement la forme au début est donc finalement bien correct !

L'intégrale d'action s'écrivant alors :

(37.113)

Introduisons la vitesse de la particule sous la forme et l'intégrale s'écrit :

(37.114)

Nous avons vu en relativité restreinte que :

(37.115)
et de même :

(37.116)

Les intervalles d'espace-temps sont des invariants tel que (cf. chapitre de Relativité Restreinte) :

(37.117)

Si le référentiel O' n'est pas en mouvement ), nous avons:

(37.118)

d'où :

(37.119)

ce qui s'écrit aussi :

(37.120)

Dès lors :

(37.121)

Faisons usage du quadrivecteur potentiel (voir plus haut) :

(37.122)

Et en faisant usage du quadrivecteur déplacement (cf. chapitre de Relativité Restreinte) :

(37.123)

L'expression de l'action d'une particule chargée dans un champ électromagnétique et dans une métrique de
Minkowski (cf. chapitre de Relativité Restreinte et Relativité Générale) se réduit finalement l'expression
condensée :

(37.124)

avec donc :

(37.125)
sans oublier que sur ce site nous utilisons la métrique (cf. chapitre de Relativité Restreinte et
Relativité Générale).

Remarquons que l'intégrale d'action en l'absence de champ magnétique et électrique s'écrit :

(37.126)

ce qui correspond bien à ce que nous avons obtenu en relativité restreinte pour une particule libre !

D'après le principe de moindre action, l'intégrale d'action a une variation nulle pour le mouvement effectif de
la particule, soit :

(37.127)

Remarque: De par l'égalité avec zéro, nous pouvons éliminer le signe moins devant l'intégrale.

Utilisant l'expression de l'abscisse curviligne (cf. chapitre Calcul tensoriel et de Relativité Générale) :

(37.128)

Pour la métrique de Minkowski nous pouvons écrire (rappelons que dans la métrique euclidienne seulement
les termes de la diagonale où sont non nuls) :

(37.129)

Ainsi :

(37.130)

l'intégrale précédente s'écrit alors :

(37.131)

Cela donne en utilisant les composantes curvilignes (cf. chapitre de Calcul Tensoriel) :

(37.132)

Intégrons par partie (cf. chapitre de Calcul Différentiel Et Intégral) seulement les deux premiers termes de
l'intégrale :

(37.133)
Intégrons par parties (cf. chapitre de Calcul Intégral Et Différentiel) la première intégrale :

(37.134)

Or, comme :

et (37.135)

Alors :

(37.136)

Avec :

et (37.137)

Alors :

(37.138)

Les quantités étant arbitraires, l'expression entre crochets est nulle :

(37.139)

Notons :

(37.140)

Les quantités contravariantes forment les composantes de ce que nous appelons le "tenseur du champ
électromagnétique" ou le "tenseur de Faraday" ou plus couramment le "tenseur de Maxwell". Nous disons
alors que est le "rotationnel du potentiel".
Les "équations du mouvement d'un particule dans un champ électromagnétique" prennent ainsi la forme :

(37.141)

Remarques:

R1. La lettre F est choisie relativement au physicien Faraday.

R2. Certains physiciens appellent cette relation : "géodésique corrigée par une force de Lorentz" (ce qui n'est
au fond pas faux)

R3. Le tenseur de champ électromagnétique est invariant sous les transformations :

(37.142)

Effectivement :

(37.143)

Dans une métrique de Minkowski (nous allons avoir besoin du tenseur de champ électromagnétique dans
le chapitre de Relativité Restreinte, d'où le choix de cette métrique), nous avons cependant :

(37.144)

Ce qui donne :

(37.145)

Le terme est traditionnellement toujours notée (même s'il n'est pas plus totalement
contravariant).

Il nous reste à déterminer les composantes du tenseur contravariant (tenseur qui a la propriété d'être
antisymétrique tel que ).

Commençons par le plus simple. Nous supposerons comme évident que :

(37.146)

Ensuite, en se rappelant que :


(37.147)

D'où (rappelons que la métrique de Minkowski est du type ):

(37.148)

Ce qui nous donne pour l'instant :

(37.149)

Maintenant, étant connu que et les autres composantes du tenseur s'écrivent compte
tenu de :

(37.150)

et donc :

(37.151)

ainsi, avec les dérivées partielles contravariantes selon la métrique de Minkowski :

(37.152)

Ainsi, nous avons :


(37.153)

Mais comme nous le verrons en relativité restreinte, le vrai tenseur du champ électromagnétique est être
défini par :

(37.154)

afin que les transformées de Lorentz soient conformes.

Ce qui fait que l'équation du mouvement est finalement :

(37.155)

L'expression sous forme tensorielle du champ électromagnétique met bien en évidence l'unité du champ
électromagnétique alors que généralement les champs électrique et magnétique sont considérés séparément
en théorique classique.

Mais comme en physique théorique nous travaillons souvent en unités naturelles (c'est un peu la norme...),
nous avons alors :

(37.156)

et donc l'équation du mouvement :

(37.157)

En notant maintenant les composantes de 1 à 4 au lieu de 0 à 3 (c'est plus facile pour les élèves de se repérer
dans la matrice) et sans oublier que les dérivées partielles sont covariantes et en adoptant, à nouveau, les
unités naturelles tel que (in extenso ), les deux équations de Maxwell avec sources s'écrivent :
(37.158)

En utilisant le tenseur du champ électromagnétique, il apparaît alors remarquablement que ces deux
équations peuvent être écrites sous la forme de l'équation tensorielle condensée suivante :

(37.159)

où est le "quadrivecteur courant" défini par (en unités naturelles!) :

(37.160)

En utilisant la première définition du tenseur de Faraday (celle où les composantes du champ sont divisées
par c)et en prenant pour connu (nous le démontrerons plus tard) que nous avons dans le
système SI :

avec (37.161)

Comme nous allons de suite le voir, la partie temporelle de cette équation donne la divergence du champ
électrique et la partie spatiale le rotationnel du champ magnétique.

Remarque: Nous avions déjà rencontré (défini) ce quadrivecteur lors de notre étude de la jauge de Coulomb
plus haut ainsi que lors de notre étude de la relativité restreinte (cf. chapitre de Relativité Restreinte).

Effectivement :

(37.162)

De même, les deux équations de Maxwell :


(37.163)

peuvent s'écrire sous la forme condensée tensorielle :

(37.164)

Effectivement :

(37.165)

Finalement toutes les équations de Maxwell, en adoptant les unités naturelles, se résument à :

(37.166)

Nous pouvons aussi utiliser le symbole d'antisymétrie (cf. chapitre de Calcul Tensoriel) tel que nous
puissions écrire :

(37.167)

avec pour rappel :

Le lagrangien que nous avons déterminé plus haute n'est cependant pas complet. Effectivement, lorsque
nous appliquons le principe variationnel nous avons déjà vu de nombreuses fois dans les différents chapitres
de ce site (mécanique classique, mécanique ondulatoire, magnétostatique, relativité restreinte, relativité
générale, etc.) que nous pouvions obtenir les équations du mouvement (trajectoires) des sujets (corps)
étudiés. Les équations obtenues contenaient aussi des paramètres qui expliquaient la source de ce
mouvement (propriétés de la matière, vitesse, champ, etc.) comme cela a été le cas avant!
Précédemment, nous avons appliqué le principe variationnel sur le lagrangien d'interaction charge-champ
(magnétique + électrostatique) et avons obtenu l'équation du mouvement corrigée par la force de Laplace.

Lorsque nous avons déterminé les équations du mouvement de la particule chargée à partir du principe de
moindre action, nous avons fixé le champ électromagnétique (le champ est connu) et nous avons fait varier
la trajectoire. Le principe variationnel, doit alors également nous permettre d'obtenir les équations du champ
à partir de la démarche inverse : nous fixons la trajectoire de la particule (trajectoire connue) et nous faisons
varier le champ électromagnétique (potentiel et tenseur).

Nous devrions alors obtenir les équations de Maxwell qui, au même titre que l'on obtient ce qui fait le
mouvement de la particule lors l'on fixe le champ dans le principe variationnel, nous donne l'information sur
ce qui est la source du champ électrique et magnétique lorsque l'on fixe la trajectoire dans le principe
variationnel.

L'envie est alors très grande de reprendre simplement l'expression de l'action obtenue plus haut :

(37.168)

et de lui appliquer une variation sur le champ après un petit changement dans la manière de l'écrire :

Nous savons que les charges électriques bien qu'elles soient ponctuelles, sont considérées généralement
comme un charge transportée par un courant répartie de façon continue dans l'espace. Soit cette densité
de charge, nous avons alors tel que :

(37.169)

Considérons des charges électriques se déplaçant à la vitesse v et écrivons la quantité suivante (ne pas
oublier que nous continuons à travailler en unités naturelles tel que !) :

(37.170)

avec en unités naturelles :

Ainsi nous avons :

(37.171)

Si nous appliquons le principe variationnel seulement sur le champ (constant en amplitude donc la source du
champ est constante telle que ) et que nous considérons donc le mouvement des charges connues, il
est immédiat que le premier terme ci-dessus est nul. Nous avons alors :

(37.172)
pour que cette intégrale soit nulle il faudrait que soit nul... ce qui est plutôt gênant si nous souhaitons
déterminer les caractéristique d'une source qui alors n'existerait pas... Dès lors, nous remarquons qu'il
manque quelque chose à notre lagrangien!

L'idée est alors la suivante : nous connaissons une équation tensorielle qui fait intervenir la densité de
courant qui est et qui implicitement contient les deux seules équations de Maxwell qui donnent
des informations sur la source des champs électrique et magnétique respectifs (les deux autres donnant des
propriétés des champs et non pas des sources) soit (toujours en unités naturelles) :

(37.173)

Il est donc suffisant d'obtenir ces deux équations (donc l'équation tensorielle y relative) suite au principe
variationnel pour avoir les propriétés de la source du champ.

Ce qui signifie simplement que dans l'idéal nous devrions (et attendons à) avoir est :

(37.174)

où l'intégrale s'annule exactement lorsque !

Il est alors tenant d'écrire quelque chose de la forme (remarquez que nous avons abaissé l'indice du potentiel
A et monté celui de la densité de courant j dans la seconde intégrale ce qui ne change rien
mathématiquement parlant au résultat)

(37.175)

Nous pouvons nous aider de la propriété suivante des quantités du lagrangien pour déterminer l'expression
"???" manquante : ils sont tous invariants. En d'autres termes et pour rappel, leur pseudo-norme (scalaire) est
égale par changement de référentiel de Galiléen (cf. chapitre de relativité Restreinte) telle que :

(37.176)

La première relation est évidente, nous l'avons déjà démontrée de nombreuses fois. La deuxième l'est peut-
être moins alors donnons une petit indication (non générale) pour vérifier quelle soit correcte : est le
produit scalaire de j et de A. Si nous faisons subir la même (quadri)rotation aux deux vecteurs, puisque les
transformations de Lorentz sont des rotations (cf. chapitre de Relativité Restreinte), l'angle entre j et A reste
inchangé et donc le produit scalaire.

Il nous faut donc ceci dit, trouver la quantité "???" comme étant un scalaire invariant faisant intervenir le
tenseur de Faraday d'une manière ou d'une autre.

Nous pouvons alors essayer directement avec la quantité suivante (sachant d'avance, grâce à nos précurseurs
que c'est la bonne hypothèse) :
(37.177)

faisant intervenir le tenseur covariant et contravariant de Faraday car nous savons que :

1. C'est un scalaire invariant. Effectivement, écrivons en termes de champs électriques et


magnétiques pour en comprendre la signification physique (en unités naturelles) :

(37.178)

Remarque: Si nous n'étions pas en unités naturelles, le résultat du calcul serait de la forme :

(37.179)

La quantité (ou en unités naturelles) est donc un invariant du champ.

Exemple:

Dans un référentiel O, considérons une onde électromagnétique plane. Les modules du champ électrique et
du champ magnétique sont reliés par (voir plus loin la démonstration). L'invariant du champ
considéré est donc nul. Dans un autre référentiel, avec la même structure du champ, nous aurons alors aussi
.

2. Parce qu'un variationnel sur ce terme donne :

(37.180)

où l'on devine qu'en creusent un peu, contient implicitement le terme . Nous voyons aussi qu'un
facteur 2 apparaît tel qu'il nous faudra introduire une constante de normalisation , ne serait-ce déjà aussi
que pour l'homogénéité des unités de l'expression de l'action.

Donc finalement essayons avec quelque chose du genre :

(37.181)
A présent, pour chercher les équations du champ électromagnétique, nous considérons que les mouvements
des charges sont connus et nous utilisons le principe de moindre action en faisant varier seulement les
composantes du potentiel-vecteur et celles du tenseur du champ électromagnétique.

Il en résulte que la variation de la première intégrale est nulle et qu'il reste :

(37.182)

Substituons dans la seconde intégrale, les composantes par leur expression implicite
, il vient :

(37.183)

Or nous savons que est égal à puisque le tenseur de Faraday est antisymétrique :

(37.184)

Rien ne nous empêche de permuter les indices dans le premier membre à droite de l'égalité :

(37.185)

Donc finalement :

(37.186)

Intéressons nous à la seconde intégrale :

(37.187)

En appliquant le théorème de Fubini (cf. chapitre de Calcul Différentiel Et Intégral) qui dit que l'on peut
intégrer selon n'importe quel ordre les variables d'intégration (sous certaines conditions) on peut alors
appliquer l'intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral) de manière à écrire :

(37.188)

où dS représente la frontière-surface de l'hyper-volume sur lequel on intégrait initialement et qui omet


la variable prise en considération par le choix de l'indice supérieur v.

Maintenant selon l'indice supérieur v concerné, les bornes du premier terme de l'égalité :
(37.189)

seront sur les composantes de temps ou les composantes d'espace. Si nous nous concentrons sur les bornes
temporelles d'intégration, il s'agit des moments initiaux et finaux de l'action sur laquelle nous appliquons ce
variationnel.

Or aux extrémités temporelles, le variationnel du potentiel vecteur est nul (par définition) donc
l'intégrale sur la composante de temps sera nulle.

Maintenant sur les composantes spatiales, les bornes (spatiales) sont celles qui permettent d'intégrer la
surface-frontière de l'hyper-volume au temps final. Si celui-ci est pris comme l'infini, le rayon de la surface-
frontière sera infini et en tout point de cette surface, l'énergie transportée par le champ ainsi que l'amplitude
des composantes du champ sera nulle (voir démonstration plus bas).

Donc le variationnel de l'action s'écrit finalement :

(37.190)

Les variations du potentiel-vecteur étant arbitraire, l'intégrale précédente sera nulle si l'intégrande elle l'est,
d'où la relation

(37.191)

ce qui nous amène à :

(37.192)

nous retrouvons donc les deux équations de Maxwell donnant exprimant la source si et seulement si (en
unités naturelle) :

(37.193)

Nous avons donc alors :

(37.194)

Avec finalement pour "lagrangien total de l'interaction charge-champ" en unités naturelles est :

(37.195)

ou avec le système SI :

(37.196)
Remarque: Nous reviendrons sur ce lagrangien avec une autre approche (très intéressante) dans le chapitre
de Physique Quantique Des Champs.

ÉQUATIONS D'ONDE ÉLECTROMAGNETIQUE

Maxwell supposa que l'onde électromagnétique était une combinaison des phénomènes qu'explicitent la
troisième et quatrième équation. Si une onde électromagnétique est éloignée de sa source on peut alors
négliger la densité superficielle de courant de la source comme ayant une influence nulle sur l'onde (nous
disons alors que ce sont les équations de Maxwell sans source dont nous avons déjà fait mention plus haut).
Alors, les troisième et quatrième équations de Maxwell s'écrivent :

et (37.197)

Les champs d'excitation magnétique et électrique étant perpendiculaires, plaçons-les de façon

commode dans un système d'axes orthogonaux unitaires et euclidiens appartenant à en


choisissant que:

et (37.198)

Remarque: Attention! Il faut bien se rappeler que dans ce qui suit, H est la composante en z de et E la
composante en y de .

Le calcul (simple) de et donne, après simplification:

et (37.199)

d'où:

et (37.200)

En identifiant les termes semblables, nous obtenons "l'équation de propagation" du champ électrique :

(37.201)

et procédant de manière identique :

(37.202)

relations qui sont toutes deux de la forme d'une équation d'onde (cf. chapitre de Mécanique Ondulatoire) de
la forme (rappel) d'une équation de Poisson :

(37.203)
où nous avons :

et (37.204)

La vitesse de propagation de l'onde électromagnétique dans le vide est donc:

(37.205)

les unités ainsi que les valeurs numériques concordent...

La vitesse de propagation de l'onde électromagnétique dans la matière est donc:

(37.206)

car l'expérience montre que nous ne pouvons dépasser la vitesse de la lumière, ce qui est un des
postulats de la relativité restreinte et générale.

Donc nous pouvons finalement écrire :

(37.207)

soit en utilisant le d'Alembertien en une dimension :

(37.208)

A défaut d'avoir trouvé l'expression directe de E(x,t) et B(x,t), nous venons d'obtenir des équations
différentielles ne contenant qu'un seul de ces champs. Nous appelons ces équations respectivement
"équation d'onde pour le champ électrique" et "équation d'onde pour le champ d'induction magnétique".

Elles ont la même forme et admettent une solution du même type. Une solution évidente et particulière (nous
laissons le soin au lecteur de faire cette vérification) des ces équations différentielles est la fonction
trigonométrique sinus:

(37.209)

en se rappelant la relation entre la pulsation , la vitesse de propagation c et le nombre d'onde k que nous
avions démontré dans le chapitre de Mécanique Ondulatoire.

Une solution plus générale est la somme des solutions triviales (cf. chapitre de Calcul Différentiel Et
Intégral) :
(37.210)

Mais nous avons vu lors de notre étude des phaseurs (cf. chapitre de Mécanique Ondulatoire) que cette
solution réelle n'est qu'un cas particulier d'une solution plus générale et se trouvant dans le corps des
complexes. Donc finalement, nous pouvons écrire :

(37.211)

ce qui constitue l'onde plane monochromatique qui est le type d'onde le plus simple à manipuler en
physique.

En trois dimensions, la solution est par extension :

(37.212)

Remarque: L'onde monochromatique ne peut pas représenter une réalité physique. En effet, si nous
calculons l'énergie électrique associé à tout l'espace, nous obtenons pour celle-ci une énergie infinie (car elle
n'a ni début, ni fin!) ce qui n'est pas réaliste.

Or, l'équation des ondes est linéaire (solution est toujours la somme d'autres solutions). Donc ceci implique
qu'une superposition d'ondes de fréquences différentes (nombre d'onde et pulsation aussi alors!) est
également solution. Ainsi, en variant le vecteur d'onde (et implicitement via sa norme, la pulsation, la
fréquence et la période) nous balayons également l'ensemble des directions de propagation possibles.

Ecrit mathématiquement cela donne, pour le champ électrique :

(37.213)

et rien ne nous empêche de sortir un coefficient de l'amplitude initiale du champ tel que :

(37.214)

et nous retrouvons donc ici une relation très similaire une transformée de Fourier inverse (cf. chapitre sur les
Suites Et Séries) ce qui est remarquable! Alors l'astuce consiste maintenant à poser car la relation
précédente n'est alors pas qu'une simple analogie avec la transformée de Fourier, c'est une transformée de
Fourier!

Nous pouvons donc relier le champ réel au champ :


(37.215)

Ces deux relations étant souvent condensées sous la forme :

(37.216)

Le champ réel est donc à l'instant initial la transformée de Fourier inverse du champ . Le terme
représente donc la composante spectrale liée au vecteur d'onde particulier du champ réel. Cette
solution générale de l'équation des ondes s'appelle un "paquet d'ondes"

Rappels :

R1.Identiquement à la mécanique ondulatoire (cf. chapitre de Mécanique Ondulatoire), les coefficients


(pulsation) et (nombre d'onde) sont exigés pour exprimer la variation du sinus par des radians et pour
lui donner une direction et une pulsation.

R2. La périodicité dans le temps de la fonction sinus impose:

(37.217)

d'où la définition de la période de l'onde :

(37.218)

R3. La périodicité dans l'espace donne permet de définir façon identique la longueur d'onde de la fonction
comme :

(37.219)

Nous constatons donc que l'onde plane se déplace selon x en parcourant une distance en un temps T. La
vitesse de l'onde électromagnétique est alors:

(37.220)

En introduisant:
(37.221)

dans nous obtenons le résultat remarquable pour l'onde plane oscillatoire:

(37.222)

EQUATION DE HELMOLTZ

Maintenant, examinons en détail une autre solution de la forme :

(37.223)

où cette fois-ci, nous faisons explicitement mention des coordonnées afin d'éviter toute confusion.

Remarque: La solution particulière avec le cosinus est plus appréciée par les enseignants que celle avec le
sinus car elle permet comme nous allons le voir, une écriture condensée avec les phaseurs (cf. chapitre de
Mécanique Ondulatoire).

Si nous utilisons la notion de phaseur, nous pouvons récrire cette solution sous la forme :

(37.224)

Donc :

(37.225)

dans l'équation d'onde :

(37.226)

nous obtenons :

(37.227)

qui n'est d'autre que "l'équation de Helmoltz" (pour l'électrodynamique) à une dimension. Il s'agit bêtement
de l'équation d'onde écrite d'une manière traditionnelle particulière que nous retrouvons dans de nombreux
autres domaines de la physique.

ÉNERGIE VEHICULEE

Il est évident que toute onde électromagnétique transporte donc de l'énergie. Exprimons la valeur de cette
énergie.
La direction de propagation d'une onde électromagnétique étant celle du vecteur , nous définissons
alors le vecteur de Poynting comme:

(37.228)

dont la valeur s'exprime en joules par seconde et par unité de surface:

La norme du vecteur de Poynting représente donc la puissance instantanée qui est transportée par l'onde
électromagnétique à travers une surface unitaire, perpendiculaire (nous insistons sur le "perpendiculaire") à
sa direction de propagation. Dès lors, nous pouvons aussi écrire le vecteur de Poynting sous la forme
(attention à ne pas confondre l'énergie et le champ électrique qui sont représenté par la même lettre) :

(37.229)

où est comme à l'habitude le vecteur unitaire perpendiculaire à (cette dernière relation nous sera utile
pour étudier une petite propriété du rayonnement synchrotron).

Pour une onde électromagnétique plane, la norme du vecteur de Poynting vaut:

(37.230)

Cette grandeur varie en fonction du temps et du lieu. En un endroit donné, sa valeur moyenne est la valeur
moyenne du pendant une période T:

Rappel:

(37.231)

Donc :

(37.232)

La valeur moyenne du vecteur de Poynting d'une onde électromagnétique plane est une constante... qui ne
dépend ni de la position et du temps.

Remarque: Nous pouvons faire une analogie osée et amusante avec l'électronique en faisant une analyse
dimensionnelle du produit ci-dessus. Nous avons :

(37.233)
...pour démontrer l'énergie contenue dans une unité de volume les physiciens pragmatiques feraient une
analyse dimensionnelle. Evitons cela et intéressons nous toujours au cas particulier de l'onde plane:

Basons-nous sur l'énergie électrique d'une capacité plane idéale productrice d'ondes électromagnétiques
planes avec un rendement de 100%:

(37.234)

et notons la densité volumique d'énergie :

(37.235)

d'où nous tirons que :

(37.236)

et l'énergie totale transportée par l'onde électromagnétique dans ce cas particulier est donc:

(37.237)

Donc la densité d'énergie électrique d'une onde électromagnétique est égale à sa densité d'énergie
magnétique.

De par ce résultat, nous sommes amenés à définir "l'intensité I (moyenne) d'une onde électromagnétique" par
la valeur moyenne de son vecteur de Poynting:

(37.238)

C'est donc la puissance moyenne que transporte l'onde par unité de surface. Or, nous avons démontré plus
haut l'expression moyenne du vecteur de Poynting, ce qui nous amène à écrire :

(37.239)

Maintenant, utilisant la relation entre énergie et quantité de mouvement (cf. chapitre de Physique Quantique
Ondulatoire):

(37.240)

nous obtenons la densité de quantité de mouvement de l'onde électromagnétique:

(37.241)
Or si la direction de est perpendiculaire au front d'onde et est donc confondue avec la direction de
propagation de l'onde son module est:

(37.242)

Nous avons donc pour la densité de quantité de mouvement:

(37.243)

Comme la quantité de mouvement doit avoir la direction de la propagation, nous pouvons écrire sous forme
vectorielle:

(37.244)

Si une onde électromagnétique possède de la quantité de mouvement, elle possède aussi une densité de
moment cinétique. Le moment cinétique par unité de volume est alors:

(37.245)

Ainsi, une onde électromagnétique transporte de la quantité de mouvement et du moment cinétique aussi
bien que de l'énergie!!!

Ce résultat n'est pas surprenant. Une interaction électromagnétique entre deux charges électriques implique
un échange d'énergie et de quantité de mouvement entre les charges. Cela s'effectue par l'intermédiaire du
champ électromagnétique qui transporte une densité d'énergie et de quantité de mouvement échangés.

ÉMISSIONS

Pour prévoir la forme et les propriétés du rayonnement émis par des antennes ou autres sources il faudrait
rigoureusement faire appel à des ordinateurs et aux modèles numériques correspondants au problème à
étudier. Formellement, le résolution des équations de Maxwell dans des systèmes macroscopiques est assez
difficile et prend du temps. De plus, ceci est plutôt le travail de l'ingénieur qui cherche une exploitation
pratique à partir de théories fondamentales. Le physicien théoricien s'intéresse aux fondements de l'univers
et aux systèmes isolés et parfaits.

Cependant, nous souhaiterions exposer la théorie de la diffraction et pour cela, nous devons faire un crochet
théorique à une approximation des propriétés du rayonnement d'une source ponctuelle sphérique dans le
vide.

L'onde dans le cas d'une source ponctuelle sphérique se propage sphériquement dans l'espace (nous parle
alors "d'onde sphérique") et le vecteur de Poynting est radial.

Les vecteurs et sont localement contenus dans le plan tangent à la sphère de rayon r (c'est
logique!).
Pour que le flux d'énergie soit constant, l'intensité de l'onde doit diminuer avec la distance. En effet, la
conservation de l'énergie impose qu'à travers une sphère de rayon l'énergie rayonnée par unité de
temps soit égale à celle qui traverse la sphère de rayon :

(37.246)

Ceci implique naturellement:

(37.247)

Mais:

(37.248)

ce qui implique:

(37.249)

Nous pouvons faire de même pour la composante du champ magnétique.

Conclusion : l'intensité I d'une onde électromagnétique sphérique se propageant dans le vide diminue en
et l'amplitude des champs électrique et magnétique diminue en 1/r. Par extension (information
importante pour les téléphones portables) l'énergie transportée diminue donc en .

Il est facilement compréhensible maintenant d'appréhender pourquoi les physiciens utilisent


systématiquement la fréquence pour caractériser une onde car l'amplitude n'est pas constante dans le vide
alors que la fréquence est une sorte de signature de l'émetteur qui ne se perd pas à travers l'espace!!!

RAYONNEMENT SYNCHROTRON

Considérons une charge en mouvement uniforme rectiligne. Les champs électrique et magnétique d'une telle
charge ont été étudiés dans les chapitres précédents. Nous avons également démontré plus haut que le champ
magnétique est dans cette configuration, toujours perpendiculaire au champ électrique. La première
conséquence est que le champ électrique est radial et le champ magnétique transversal.

Donc si nous entourons la particule en mouvement d'une surface sphérique fermée imaginaire, nous avons
alors trivialement (voir la définition du vecteur de Poynting) :

(37.250)

puisque effectivement, en tout point de la surface, en est perpendiculaire, tangent, donc tangent
aussi et donc l'angle entre et est égal à un angle droit donc le produit scalaire est nul.
Donc en conclusion le flux total d'énergie rayonnée est nul pour une charge en mouvement rectiligne
uniforme. Autrement dit, une charge en mouvement rectiligne uniforme, ne rayonne pas d'énergie
électromagnétique mais transporte avec elle l'énergie du champ électromagnétique (nous voilà rassuré!).
Ceci est confirmé par les observations expérimentales.

Cependant, la situation est très différente pour une charge en mouvement accéléré. Le champ électrique
d'une charge accélérée n'est plus radial et ne possède plus la symétrie par rapport à la charge qu'il possède
lorsque le mouvement est uniforme (nous allons le démontrer). Conséquence... une charge électrique
accélérée rayonne de l'énergie électromagnétique et donc voit son énergie cinétique diminuer !

Une conclusion importante est qu'il faut, pour maintenir une charge en mouvement accéléré, fournir de
l'énergie pour compenser celle perdue par rayonnement. Si la particule au lieu d'être accélérée est décélérée
(c'est typiquement ce que nous cherchons à faire en radioprotection) à nouveau la particule va émettre de la
même manière le même rayonnement (nous allons aussi le démontrer). C'est ce qui ce produit, par exemple,
lorsqu'une charge, telle qu'un électron ou un proton, heurte une cible à grande vitesse. Une fraction
substantielle de son énergie totale s'en va sous forme d'un rayonnement appelé "rayonnement de freinage"
ou plus communément "bremsstrahlung" (de l'allemand Bremsung : freinage; et Strahlung : rayonnement).

Les équations que nous allons déterminer restent valable pour n'importe quel type de mouvement accéléré
relativiste ou non. Par exemple, une particule chargée se déplaçant sur une orbite circulaire est soumise à
une accélération centripète et émet donc du rayonnement. Par conséquent, lorsqu'un ion est accéléré dans un
accélérateur cyclique, comme un cyclotron, un bêtatron ou un synchrotron, une fraction de l'énergie qui lui
est fournie est perdue sous forme de rayonnement électromagnétique, cet effet étant relativement plus
important dans les accélérateurs cycliques que dans les accélérateurs linéaires.

Quand les charges atteignent des énergies très élevées, comme cela se produit dans les synchrotrons où
l'accélération est grande (heureusement pour nous car cela nous permettre de faire une petite approximation
fort utile...), les pertes dues au rayonnement, appelé "rayonnement synchrotron", deviennent importantes et
constituent une limitation sérieuse dans la construction d'accélérateur cycliques de très haute énergie mais
restent cependant infiniment utiles à l'industrie de pointe.

Une autre considération importante se rapport à la structure atomique. Selon le modèle atomique de
Rutherford (cf. chapitre de Physique Quantique Corpusculaire), nous imaginons l'atome comme formé d'un
noyau central chargé positivement, les électrons chargés négativement décrivant autour de lui des orbites
fermées. Mais ceci implique, que les électrons se déplacent suivant un mouvement ayant une accélération et,
si nous appliquons les idées développées jusqu'à maintenant, tous les atomes devraient rayonner
continuellement de l'énergie (même en l'absence de source d'énergie extérieure comme le Soleil). Par suite
de cette perte d'énergie, les orbites électroniques devraient se contracter, amenant à une réduction
correspondante de la taille de tous les corps. Heureusement pour nous, cela ne s'observe pas (la matière ne
s'effondre pas sur elle-même) mais cela nous amène donc à supposer dans le cadre du modèle de Rutherford
que les mouvements des électrons dans les atomes est gouverné par certains principes supplémentaires que
nous n'avons pas encore envisagés. C'est ce qui nous amènera à créer le modèle de Bohr de l'atome (cf.
chapitre de Physique Quantique Corpusculaire) mais qui aura, lui aussi comme ne le verrons, d'autres défaut.

Pour déterminer l'énergie émise par une charge en mouvement accéléré nous allons devoir faire usage
d'outils mathématique qui ne sont plus du même niveau que ceux utilisés précédemment. Il est donc
conseillé que le lecteur ait un bon bagage mathématique. Par ailleurs, exceptionnellement nous ferons usage
de logiciels de calculs pour certains points du développement.

Considérons tout d'abord le schéma suivant :


(37.251)

Lorsque la distribution de charges et la distribution de courant se trouvent au point , le


point M reçoit l'onde électromagnétique émise par les charges et le courant lorsqu'ils étaient au point c'est-
à-dire à l'instant t' (à cause de la vitesse limite de la propagation du champ dans l'espace). Le retard temporel
est la durée de propagation depuis le point vers le point M, soit :

(37.252)

Donc :

(37.253)

Soit :

(37.254)

Les potentiels au point de coordonnée vectorielle au temps t ont au vu des résultats obtenus dans les deux
chapitres précédents les relations suivantes pour expressions :

(37.255)

Remarque: Nous allons faire usage de ces deux relations du potentiel dans notre étude du champ rayonné car
leur forme mathématique similaire nous permettra, du moins nous l'espérons..., de simplifier les
développements.

Ces deux relations nous sont déjà partiellement connues, la première qui exprime le potentiel électrique
(retardé) a été démontrée dans le chapitre d'Électrostatique dans le cadre non relativiste (donc nos calculs
risquent de ne pas être corrects si nous tombons un résultat qui dépend de la vitesse ! ... nous verrons bien).
Concernant la deuxième relation qui exprime le potentiel-vecteur retardé, nous avons vu plus haut que
était toujours juste au gradient d'une fonction additive près pour (de par les propriétés des
opérateurs vectoriels différentiels) tel que :

(37.256)

et que soit sous forme relativiste ou non, nous avions :

(37.257)

Rappelons aussi (cf. chapitre de Magnétostatique) que :

(37.258)

Il s'ensuit que si nous posons :

(37.259)

que nous retrouvons la loi de Biot-Savart puisque si et seulement si ne dépend pas de r alors (trivial) :

(37.260)

Nous obtenons donc bien :

(37.261)

Bien que cette forme du potentiel vecteur ne donne que la loi de Biot-Savart sous forme non relativiste,
comme elle satisfait toujours :

(37.262)

elle est quand même valable dans le cadre relativiste car cette équation de Maxwell ne dépend pas de la
vitesse. De plus, si nos résultats dans l'étude du rayonnement synchrotron nous donnent à la fin une
expression indépendante de la vitesse, nous aurons encore une fois confirmé cet état de fait.
POTENTIELS DE LIÉNARD-WIECHERT

Soit le cas où une particule de masse m et de charge q parcourt une trajectoire . Par rapport à un point
origine O, sa coordonnée vectorielle est , son vecteur vitesse sera noté:

(37.263)

et son accélération:

(37.264)

Si la charge ponctuelle q se situe à l'origine O, nous avons vu dans le chapitre de Calcul Différentiel Et
Intégral que la fonction de Dirac nous donne :

(37.265)

ainsi que si la charge ponctuelle q se situe à une abscisse , nous avions :

(37.266)

Ce qui vient d'être dit pour un espace à une dimension peut aussi être appliqué à un espace à trois
dimensions comme nous l'avions vu et nous écrivons alors :

(37.267)

Si nous choisissons pour unités pour la fonction de Dirac des , alors nous pouvons écrire :

(37.268)

où q est alors la charge totale au point .

Pour la distribution de la densité de courant, avons de même toujours en choisissant les mêmes unités pour
la fonction de Dirac :

(37.269)

Dès lors au point M, les potentiels au temps t ont pour expression:

(37.270)

C'est une formulation bien utile (un détour) qui va nous permettre de résoudre notre problème.
Pour cela, lorsque la charge se trouve au point au temps t', nous posons :

(37.271)

Nous allons utiliser un long artifice afin de résoudre l'intégrale du potentiel électrique (qui est donc une
intégrale multiple en coordonnées cartésiennes)!

Celui commence en multipliant l'intégrant de par:

(37.272)

cela ne modifie pas l'intégrale puisque:

(37.273)

et que (cf. chapitre de Calcul Différentiel Et Intégral):

(37.274)

Nous disposons alors de l'expression suivante dans laquelle apparaît le temps t':

(37.275)

ce que nous avons le droit d'écrire car la deuxième intégrale ne dépend pas explicitement de t'.

Bon maintenant si nous essayons de résoudre cette intégral, nous allons y passer notre vie... pour rien. Il va
falloir être astucieux

Avant de rechercher une solution de cette intégrale, nous devons d'abord traiter le cas plus général de
l'intégrale suivante :

(37.276)

Soit écrit de manière plus condensée:

(37.277)

qu'il est facile de rapprocher avec l'intégrale antéprécédente:


(37.278)

où nous nous sommes donc arrangés pour que ne dépendant respectivement (explicitement)
que de x, y, z et t.

Nous souhaitons maintenant faire le changement de variables :

(37.279)

Nous rappelons que dans des changements de variables dans les intégrales multiples (voir le Jacobien dans
le chapitre de Calcul Différentiel Et Intégral), nous avons, en passant des coordonnées cartésiennes aux
coordonnées curvilignes les relations suivantes :

(37.280)

où pour rappel:

(37.281)

et où:

(37.282)

n'est pas une valeur absolue mais le déterminant d'une matrice!

Or, dans notre cas traité, rappelons que nous avons tous les qui sont nuls et donc:

(37.283)

et au cas où pendant les développements un des ne le serait plus pour des raisons encore non déterminées,
nous aurions:

(37.284)
L'intégrale multiple devient alors :

(37.285)

où le terme entre accolades est pris à par nécessité de la construction des développements précédents
préparant l'artifice mathématique!

Et rappelons encore une fois (!!) la propriété des fonctions de Dirac:

(37.286)

Nous avons alors immédiatement la simplification:

(37.287)

où:

(37.288)

est donc le Jacobien de la transformation de l'artifice....

Il est évident que par construction du Jacobien, nous avons:

(37.289)

Dès lors il vient:

(37.290)

Pour l'intégral I nous avons alors:

(37.291)

Calculons donc maintenant notre Jacobien...:


(37.292)

En revenant au cas traité, a donc pour composantes:

(37.293)

Ainsi, nous avons le calcul des éléments dé l'inverse du Jacobien:

(37.294)

Bon maintenant que nous avons les composantes de la matrice Jacobienne, il ne nous reste qu'à calculer son
déterminant. Donc soit nous utilisons la relation générale de calcul de déterminant démontrée dans le
chapitre d'Algèbre Linéaire, soit nous utilisons Maple... Alors histoire de gagner un peu de temps faisons
avec Maple:

>with(linalg):

>A:= matrix(4,4,[1,0,0,a,0,1,0,b,0,0,1,c,d,e,f,1]);

où:

(37.295)

avec:
et (37.296)

Continuos avec Maple:

>det (A);

Ce qui donne:

1 - cf - eb - da = 1 - ( fc + eb + da) (37.297)

L'inverse du Jacobien a alors pour expression :

(37.298)

où nous avons utilisé le produit scalaire dans la dernière relation afin de condenser l'expression.

Soit:

(37.299)

L'intégrale multiple:

(37.300)

où pour rappel:

(37.301)

soit autrement écrit:


(37.302)

mais suite à notre changement de système de coordonnées nous avons pour rappel:

(37.303)

Or, rappelons encore une fois que :

(37.304)

Donc il faut prendre g en ! Il vient:

(37.305)

Ce qui permet d'écrire :

(37.306)

Il en est de même pour:

(37.307)

qui s'écrit alors:

(37.308)

Finalement la résolution de l'intégrale I s'écrit :


(37.309)

On accède ainsi enfin aux expressions des potentiels.

- Le potentiel scalaire s'écrit :

(37.310)

- Le potentiel vecteur s'écrit :

(37.311)

Compte tenu de l'intégrale qui est quasiment la même que pour le potentiel scalaire excepté le terme ,
nous arrivons en faisant les mêmes développements que précédemment à l'expression :

(37.312)

En résumé, les potentiels pris à l'instant (retard temporel de propagation):

(37.313)

ont pour expressions:

(37.314)

ces potentiels sont appelés "potentiels de Lienard-Wiechert" avec:


(37.315)
38. ÉLECTROCINÉTIQUE

L e développement de l'électrodynamique a permis à une grande partie de l'humanité de modifier


considérablement sa qualité de vie. Nous savons à peu près tous aujourd'hui ce que nous lui devons: lumière,
frigo, radio, télévision, ordinateurs, voitures, trams, trains, avions, robots, et d'autres choses merveilleuses et
parfois moins aussi...

Avant de commencer à étudier l'électrocinétique (les ingénieurs parlent "d'électronique" ou


"d'électrotechnique") nous allons définir les deux lois (le terme est mal choisi puisque la première est
démontrée dans le chapitre d'Électrostatique et la seconde dans le chapitre d'Électrodynamique mais bon...
conformons-nous à la tradition...) fondamentales de l'étude de l'électrocinétique et la terminologie de base
des circuits ou installations électriques. Même si certains éléments au début ne seront pas compris de suite
par le lecteur, ceux-ci deviendront triviaux au fur et à mesure de l'avancement de sa lecture.

Définitions:

D1. Un circuit électrique est constitué d'un ensemble de dispositifs appelés "dipôles", reliés entre eux par un
fil conducteur.

D2. Un "noeud" d'un circuit est une interconnexion où arrivent 3 fils ou plus.

D3. Une "branche" est un tronçon de circuit situé entre deux noeuds.

D4. Enfin, une "maille" est un ensemble de branches formant une boucle fermée.

Remarque: Un dipôle s'insère dans un circuit par l'intermédiaire de deux pôles, l'un par où s'effectue l'entrée
du courant (borne +), l'autre la sortie (borne moins) selon la convention des physiciens (celle des électriciens
est l'inverse...).

Le dipôle est caractérisé par la réponse du courant I à une différence de potentiel U entre ses bornes : c'est à
dire par la courbe caractéristique:

(38.1)

Nous verrons que dans tout conducteur, la présence d'une résistivité (voir plus loin) entraîne une chute de
tension et, en toute rigueur, il en va de même pour les fils. Mais ceux-ci étant mis en série avec d'autres
dipôles, nous négligeons en général dans les petits circuits la résistance des fils devant celle des dipôles
présents. Donc, les fils situés entre deux dipôles d'un circuit seront supposés équipotentiels (le potentiel est
le même sur les deux bornes).

LOIS DE KIRCHHOFF

Les lois de Kirchhoff en électrocinétique (à ne pas confondre avec celle de la thermodynamique et de


l'optique) expriment les propriétés physique de la charge et du champ électrique et sont donc au nombre de
deux (une loi pour chaque).

Elles vont nous permettre sans faire appel à l'artillerie mathématique implicitement cachée derrière d'obtenir
simplement des résultats forts pertinents.

LOI DES MAILLES


La loi des mailles (implicitement il s'agit simplement de la conservation de l'énergie) exprime le fait que
lorsqu'une charge parcourt un circuit fermé (chemin fermé), l'énergie qu'elle perd en traversant une partie du
circuit est égale à l'énergie qu'elle gagne dans l'autre partie. Ainsi, la somme algébrique des potentiels le
long d'une maille est nulle telle que :

(38.2)

Pour cela, il faut choisir arbitrairement un sens de parcours de la maille et convenir que les tensions dont la
flèche pointe dans le sens du parcours sont comptées comme positives et les autres comme négatives.

Remarque: Cette loi exprime tout simplement du fait que le champ électrique (Coulombien) est un champ
conservatif comme nous l'avons vu dans le chapitre d'Électrostatique.

LOI DES NOEUDS

La loi des noeuds (implicitement il s'agit simplement de la conservation du courant) exprime la conservation
de la charge qui signifie que la somme des courants sortant d'un noeud (un noeud peut être vu comme un
séparateur de lignes de champs - in extenso des volumes rattachés par une même surface) est égale à la
somme des courants entrant. Autrement dit, la somme algébrique des courants est nulle en tout noeud d'un
circuit tel que:

(38.3)

Pour cela, il faut choisir un signe pour les courants entrant et le signe contraire pour les courants sortant
(comme nous le faisons en thermodynamique avec la masse).

Remarque: Cette loi exprime tout simplement l'équation de conservation de la charge (ou de continuité de la
charge) que nous avons démontré aussi dans le chapitre d'Électrodynamique.

MODÈLE DE DRUDE

Le modèle de Drude de la conduction électrique va nous permettre d'introduire les concepts élémentaires de
l'électrocinétique. Dans un premier temps, nous allons définir dans ce qui va suivre les concepts de courant,
de densité de courant et ensuite de résistance.

Un conducteur électrique (nous ne parlons pas de semi-conducteurs ou supraconducteurs à ce niveau du


discours) peut être vu de manière très simplifiée comme un tuyau de section contenant un gaz d'électrons
formé de n charges élémentaires q par unité de volume.

En absence de champ électrique, chaque électron possède une vitesse moyenne vectorielle nulle car il reste
au voisinage de l'atome. Sous l'action d'un champ électrique homogène et constant (cas du courant continu
donc!), certains électrons sont déplacés dans une direction privilégiée, jusqu'à ce qu'ils entrent en collision
avec un autre atome (aspect classique) où ils reprennent une vitesse moyenne de dérive nulle et ainsi de
suite.

C'est le modèle le plus ancien et le plus élémentaire du courant électrique. Les bases en furent jetées par
Drude en 1902, peu après la découverte de l'électron par Thomson (1897). D'où le nom de "modèle de
Drude".

Insuffisant pour concevoir et a fortiori développer les composants qui forment depuis la fin du 20ème siècle
l'essentiel des éléments actifs utilisés en électronique, le modèle des boules de billard présente néanmoins
des intérêts considérables :
- C'est un auxiliaire utile pour donner à notre esprit une image de phénomènes dont nous n'avons en fait
aucune perception directe, puisqu'ils se déroulent dans l'infiniment petit

- Les résultats, pour l'ingénieur, de théories plus exactes, comme la théorie des bandes d'énergie en
particulier, se laissent formuler au moyen des mêmes concepts que ceux apparaissant dans le modèle Boules
de billard. Citons parmi ceux-ci le nombre volumique et la mobilité des électrons

- Tout primitif qu'il soit, ce modèle conduit à une interprétation phénoménologique intéressante des lois
fondamentales telles que la loi d'Ohm ou la loi de Joule. Il lie les phénomènes microscopiques à certaines
grandeurs observables.

Son nom l'indique, ce modèle assimile les électrons à de minuscules boules de billard. Ces particules sont
donc des objets classiques, simplement régis par la loi de Newton et les lois de Maxwell. Cette conception
corpusculaire de l'électron n'est d'ailleurs pas totalement opposée aux résultats de la mécanique quantique,
dans la quelle un paquet d'ondes, peut toujours être interprété comme une particule, avec sa masse et sa
vitesse (voir le théorème d'Ehrenfest dans le chapitre de Physique Quantique Ondulatoire).

Dans un millimètre cube de cuivre, nous admettrons que le nombre d'électrons est tellement élevé qu'il n'est
donc alors pas question de les traiter individuellement, ce qui serait d'ailleurs sans intérêt. C'est le
comportement moyen des électrons qu'il convient d'étudier. Deux types d'interactions conditionnent ce
comportement, ce sont :

- l'interaction des électrons avec la matière dans laquelle ils évoluent, et dont ils font partie

- l'interaction des électrons avec les champs électromagnétiques appliqués de l'extérieur

La distance parcourue par un électron est appelée "libre parcours moyen de l'électron de conduction" et si
est l'intervalle de temps entre deux collisions successives alors nous avons trivialement:

(38.4)

Le temps de collision est une variable aléatoire. Tous paramètres physiques restant constants, cette variable
aléatoire est stationnaire, sa valeur moyenne porte le nom de "temps de collision moyen".

Nous supposons que:

(38.5)

la vitesse moyenne, est créée par l'accélération du champ électrique:

(38.6)

Nous obtenons alors la " vitesse moyenne de dérive" ou "vitesse d'entraînement" des électrons (drift
velocity) donnée par:

(38.7)

Cette relation est nommée ainsi car leur vitesse initiale est due à l'agitation thermique entretenue de
l'environnement extérieur et correspond à la vitesse thermique dont nous avons déterminé l'expression lors
de notre étude de la distribution de Maxwell-Boltzmann dans le chapitre de Mécanique Statistique (nous en
calculerons les valeurs un peu plus bas dans le présent texte).
Nous admettons donc, dans le cadre du modèle Boules de billard, que les électrons se comportent comme les
atomes d'un gaz parfait. C'est une hypothèse grossière mais suffisante pour l'instant!

La vitesse moyenne est supposée identique pour tous les électrons libres lorsque le champ électrique
appliqué est supposé uniforme, stationnaire, et dirigé selon un seul axe. Elle permet de définir "l'intensité"
I du courant électrique dans le conducteur.

Définition: Le "courant" ou "intensité" I mesure la charge qui traverse la section droite S d'un
conducteur par unité de temps dt et est donc donné par selon ce qui a été montré juste avant par:

(38.8)

Une tranche de conducteur, de volume contient donc la charge:

(38.9)

Elle traverse la section S en un temps dt, tel que:

(38.10)

Le courant s'écrit alors:

(38.11)

Si I est vu comme le flux d'une "densité de courant" J à travers la surface S, nous avons alors :

(38.12)

la densité de courant étant supposée constante sur chaque point de la surface.

Nous avons donc:

(38.13)

et après simplification:

(38.14)

qui est donc l'expression de la "densité de courant" dans le conducteur.

Comme nous connaissons l'expression de la vitesse, nous pouvons écrire:

(38.15)

En nous définissons la "conductivité" par:


(38.16)

Nous remarquons que la conductivité contient le produit du nombre volumique des électrons par leur
mobilité. Il faut par conséquent que l'une au moins de ces grandeurs ait une valeur élevée pour qu'un
matériau présente une haute conductivité.

La mobilité est plus grande dans les semiconducteurs que dans les métaux. Cette caractéristique est
cependant complètement masquée par le rapport des nombres volumiques des électrons : n est 1'000'000 à
100'000'000 fois plus faible dans les semiconducteurs que dans les métaux, ce qui explique la conductivité
supérieure de ces derniers.

Selon la relation:

(38.17)

démontrée juste plus haut, la conductivité dépendrait du champ électrique, par l'intermédiaire du temps de
collision. En effet, plus le champ électrique croît, plus la vitesse des électrons augmente. La distance entre
les points de chocs possibles restant la même, le temps de collision, et par conséquent la conductivité,
devraient diminuer (et donc la résistance augmenter!).

Or, l'indépendance de la conductivité (et respectivement de la résistance) avec le champ électrique est un fait
expérimental établi avec précision dans tous les conducteurs habituels dans des conditions normales
d'utilisation civiles.

L'origine de cette contradiction réside dans la différence considérable des ordres de grandeur de la vitesse
thermique donnée par la distribution de Maxwell-Boltzmann (cf. chapitre de Mécanique Statistique) :

(38.18)

et la vitesse moyenne de dérive vue plus haut:

(38.19)

avec le temps de libre parcours moyen qui sera obtenu à l'aide de l'expression:

(38.20)

Nous avons vu dans le chapitre de Mécanique Statique que pour un électron à température ambiante:

(38.21)

Et calculons la vitesse de dérive pour le cuivre avec dans ce métal:


et (38.22)

Ce qui nous permet d'obtenir la valeur:

(38.23)

et donc:

(38.24)

En prenant , ce qui est à considérer comme une valeur élevée puisque ce champ produit
une densité de courant de:

(38.25)

nous avons finalement:

(38.26)

Par conséquent, même dans un fort champ électrique industriel, la vitesse de dérive est négligeable par
rapport à la vitesse thermique.

Comme la vitesse thermique ne dépend que très peu du champ électrique, il s'avère qu'en pratique la vitesse
des électrons est indépendante du champ électrique. En d'autres termes l'établissement d'un courant, même
intense, n'a qu'une incidence absolument négligeable sur la vitesse des électrons!

Remarque: Dans la très grande majorité des cas, les dimensions des conducteurs sont grandes, comparées à
la distance moyenne parcourue par un électron entre deux chocs consécutifs. Le comportement des électrons
à la surface du conducteur revêt alors une importance secondaire. C'est la raison pour laquelle le milieu
conducteur est souvent, implicitement, considéré comme infini. Les transistors FET et MOST constituent à
cet égard une exception importante. Le courant y circule dans une couche suffisamment mince pour que la
mobilité des électrons soit affectée par la diffusion des électrons aux surfaces délimitant cette couche.

Cependant un point important à constanter est de calculer le libre parcours moyen des électrons dans le
modèle classique de Drude. Nous avons effectivement:

(38.27)

qui est donc très supérieur, d'au moins un ordre de grandeur (facteur 10), aux distances inter-atomiques. Il en
résulte que les collisions successives sur les atomes du réseau ne sont pas responsable de la loi d'Ohm (que
nous allons voir maintenant) contrairement à un des hypothèses de départ du modèle de Drude mais que ce
sont les impuretés et les défaut du matérieau qui en sont responsable! Nous verrons aussi un peu plus loin
qu'avec le modèle théorique des bandes d'énergie le libre parcours moyen est au fait nettement plus grand
encore!

LOI D'OHM
A partir de la relation démontrée précédemment:

(38.28)

et en prenant la définition de la "conductivité" par:

(38.29)

Il vient finalement:

(38.30)

qui est la "loi locale d'Ohm". Nous la retrouverons sous forme différentielle dans le chapitre de Mécanique
Statistique et nous verrons qu'elle appartient au fait à la famille des lois de diffusion!

Remarque: Puisque la conductivité est nécessairement un scalaire, l'écriture vectorielle de la loi d'Ohm
implique que les lignes de champ électrostatiques indiquent également le chemin pris par les charges
électriques. Par ailleurs, comme la conductivité est un scalaire nécessairement positif dans le modèle
classique, ceci implique que le courant a la même direction que le champ électrique.

Si nous multiplions l'égalité sous forme scalaire à droite et à gauche par L nous obtenons:

(38.31)

Donc nous avons:

ou (38.32)

Nous définissons l'inverse de la conductivité comme la "résistance électrique" définie par:

(38.33)

Remarque: Il est important de remarquer que la résistance électrique est proportionnelle à la longueur de
l'élément résistif et inversement proportionnel à sa surface de section. Par exemple dans les câbles hautes
tension la résistance est donnée en Ohm par kilomètre ce qui permet ensuite de calculer la puissance perdue
par kilomètre et donc aussi l'argent perdu par perte Joule.

Dès lors, nous pouvons écrire la loi d'Ohm sous sa forme la plus communément connue :

(38.34)

où donc (attention!!!) le potentiel U représente la différence de potentiel sur la longueur de l'élément résistif
(appelé également "dipôle résistif") comme nous le voyons dans les développements et non pas le potentiel
total extérieur!
Remarque: Cette relation n'est valable que pour des conducteurs idéaux dans des conditions normales de
températures et de pression et pour lesquels le modèle de Drude s'applique. Donc les semi-conducteurs et
supraconducteurs en sont exclus.

Puisque U est le potentiel de l'élément résistif, nous faisons alors souvent référence dans le domaine de
l'électrotechnique à la "chute de potentiel" (effectivement, au delà de l'élément résistif le potentiel n'est plus
le même que le point qui précède ce même élément résistif).

Pour les câbles en cuivre typiques d'usage non industriel il existe une table américaine très utile dans la
pratique donnant avec une relativement bonne tolérance la resistivité en fonction du diamètre et le courant
maximal admissible. Voici un échantillon de cette table:

AWG Diamètre du fil Résistance en Courant max. Courant max.


en mm (avec Ω par mètre théoriquement admissible théoriquement
isolant) à l'air libre en A admissible en A
1 7.35 0.0040 211 119
2 6.54 0.0051 181 94
... ... ... ... ...
12 2.05 0.00521 41 9.3
13 1.83 0.00657 35 7.4
14 1.63 0.00829 32 5.9
15 1.45 0.0104 28 4.7
16 1.29 0.0132 22 3.7
... ... ... ... ...
Tableau: 55.1 - Codes AWG pris de Wikipedia

où AWG signifie "American Wire Gauge" et correspond une petite jauge qu'on peut acheter pour
rapidement déterminer le diamètre d'un câble à l'aide de la table ci-dessus sans avoir un pied à coulisse:

(38.35)Source: Wikipedia

RÉSISTANCE ÉQUIVALENTE

Nous pouvons maintenant nous intéresser sur toute la longueur d'une ligne de champ électrique parcourue
colinéairement par une courant I supposé constant en tout point (c'est une approximation donc...) à la
résistance totale si n éléments résistifs sont mis les uns à cotés des autres linéairement.

La réponse est relativement simple puisque si nous notons le potentiel à la première extrémité de
l'élément résistif et l'autre extrémité, nous avons alors (le lecteur remarquera que l'usage de la loi des
mailles dans la relation suivante se fait logiquement sans même avoir nécessairement connaissance de celle-
ci) :
(38.36)

c'est-à-dire un résultat analogue à celui obtenu par une résistance unique dont la valeur est donnée
approximativement par (si le courant est constant sur toute la ligne) la "résistance équivalente de résistances
en série" :

(38.37)

Considérons maintenant n résistances en parallèles toutes sous une tension U (de par la loi des mailles) et
alimentées par un courant I. Le courant se sépare alors en n courants :

(38.38)

Dans chacune des n branches. En vertu de la loi des noeuds, nous avons :

(38.39)

c'est-à-dire que l'ensemble des résistances mises en parallèles sont analogues à une "résistance équivalente
de résistances en parallèles":

(38.40)

donnée donc par la moyenne harmonique (cf. chapitre de Statistiques)!

Le fait de brancher des appareils en parallèle permet donc d'avoir toujours la même tension aux bornes de
ceux-ci. C'est ainsi que sont disposé par ailleurs les prises électriques dans une installation domestique!

CAPACITÉ ÉQUIVALENTE

Nous pouvons de même, appliquer le même type de raisonnement aux capacités. Rappelons que nous avons
défini dans le chapitre d'Électrostatique, la capacité comme étant donnée par :

(38.41)

Considérons, au même titre que les résistances, n condensateurs de capacités mis en série les uns derrière
les autres. Nous portons aux potentiels et les deux extrémités de la chaîne et nous apportons la charge
Q sur l'ensemble du système. Le potentiel (tension) total aux bornes de la chaîne de condensateur s'écrit
alors simplement :

(38.42)

et correspond donc à celle d'une capacité unique C de "capacité équivalente de capacités en série" :
(38.43)

où nous retrouvons une moyenne harmonique.

Considérons maintenant n condensateurs de capacités mis en parallèle avec le même potentiel U. La


charge électrique de chacun d'entre eux est alors imposée (de par la loi des mailles) par la relation:

(38.44)

La charge électrique totale est simplement :

(38.45)

ce qui correspond à une "capacité équivalente de capacités en parallèle" :

(38.46)

qui est la somme arithmétique des capacités individuelles.

FORCE ÉLECTROMOTRICE

Soit une portion AB d'un circuit, parcourue par un courant permanent I allant de A vers B. L'existence de ce
courant implique que le potentiel en A est supérieur (différent) en valeur absolue à celui en B (en valeur
absolue). Cette différence de potentiel se traduit par l'existence du champ électrostatique produisant une
force de Coulomb:

(38.47)

capable d'accélérer une charge q.

Ainsi, soit:

(38.48)

la puissance nécessaire pour communiquer une vitesse v à une particule de charge q quelconque. Sachant
que dans ce conducteur il y a porteurs de charge par unité de volume, la puissance totale P mise en jeu
dans le brin AB parcouru par un courant I est :

(38.49)

c'est-à-dire :
(38.50)

où:

(38.51)

Cette puissance est donc la "puissance électrique" disponible entre A et B, du simple fait qu'il y circule un
courant I.

Si nous considérons dans ce circuit AB une partie résistive pour laquelle nous mesurons une différence de
potentielle

alors la puissance disponible à l'intérieur de celui-ci est donnée par la "puissance joule":

(38.52)

Ainsi, parmi cette puissance disponible, une certaine partie est dissipée sous forme de chaleur (effet Joule)
dans un dipôle passif tel que la résistance.

Cependant, quelque chose cloche dans nos développements précédents si nous y regardons de plus près.
Effectivement, si nous appliquons le raisonnement à un circuit fermé, c'est-à-dire si nous regardons la
puissance totale fournie entre A et A par la force de Coulomb, nous obtenons (bien évidemment puisque le
champ électrostatique coulombien est conservatif) :

(38.53)

c'est-à-dire une puissance nulle?! Eh oui! Cela signifie qu'il ne peut y avoir de courant en régime permanent
dans une boucle fermée et lorsque qu'il y a un courant, alors cela implique que la force de Coulomb n'est pas
responsable du mouvement global des porteurs de charge dans un conducteur!!

Dès lors, le courant dans un conducteur peut être compris avec l'analogie de la rivière circulant dans son lit
(...). Pour qu'il y ait un écoulement, il faut que l'eau s'écoule d'une région plus élevée vers une région plus
basse (d'un potentiel gravitationnel plus haut vers un autre plus bas). Ainsi, le mouvement de l'eau d'un point
élevé vers un point plus bas est bien dû à la simple force de gravitation. Mais si nous voulons constituer un
circuit fermé, alors il faut fournir de l'énergie (grâce à une pompe) pour amener l'eau à une plus grande
hauteur et le cycle peut alors recommencer.

C'est exactement ce qui se passe dans un circuit électrique. Si nous voulons qu'un courant permanent circule
il faut qu'une autre force que la force électrostatique permette aux charges de fermer le chemin (c'est un
raisonnement purement mathématique) ! C'est à ce titre que nous devons faire intervenir une source
d'énergie "artificielle" externe tel que le "générateur électrique" qui est alors l'équivalent de la pompe
hydraulique pour l'eau.

Le générateur doit alors nous imposer comme propriété physique que lorsque son circuit est ouvert (courant
I étant alors nul) une "différence de potentiel" D.D.P. se maintienne entre ses bornes impliquant
nécessairement la présence d'une autre force compensant l'attraction coulombienne du conducteur. Ainsi, la
force totale s'exerçant sur une charge q s'écrit dès lors :

(38.54)
avec étant le champ électrostatique et le "champ électromoteur". À l'équilibre et en l'absence de
courant, nous devons avoir :

(38.55)

Cela signifie que la D.D.P. aux bornes d'un générateur ouvert vaut alors :

(38.56)

Nous appelons et notons :

(38.57)

(un peu maladroitement) la "force électromotrice" FEM propre du générateur.

Puisque, à l'intérieur du générateur, nous avons :

(38.58)

à circuit ouvert, cela signifie qu'un générateur est un conducteur non-équipotentiel (ou à "champ non
conservatif").

À l'équilibre, mais en présence d'un courant I (générateur branché dans un circuit fermé), les porteurs de
charge responsables de ce courant subissent une force supplémentaire, due aux collisions se produisant à
l'intérieur du conducteur. Pour un générateur idéal, ces collisions sont négligeables et nous obtenons :

(38.59)

En revanche, pour un générateur non idéal, de telles collisions se produisent et se traduisent par l'existence
d'une résistance interne r.

Ainsi, la vraie force électromotrice est donnée par :

(38.60)

La résistance interne du générateur introduit donc une chute de tension proportionnelle au courant fourni, ce
qui fait qu'il délivre un potentiel inférieur à celle donnée par sa FEM.

Les générateurs diffèrent selon la source d'énergie utilisée et la méthode de conversion de celle-ci en énergie
électrique (autrement dit, selon la nature de ). Nous pouvons ainsi produire de l'énergie électrique à
partie d'une pile (énergie chimique), d'un générateur électrostatique (énergie mécanique,), d'une dynamo
(énergie mécanique), d'une pile solaire (énergie du rayonnement) ou d'un thermocouple (énergie chaleur).

Reprenons le calcul fait précédemment mais appliquons-le cette fois-ci à l'ensemble du circuit. Soit alors V
le volume total occupé par le conducteur formant le circuit et la force s'exerçant sur les charges mobiles q
et donc responsable de leur mouvement.

La puissance totale P qui doit être fournie en régime permanent est alors :
(38.61)

où :

(38.62)

est la FEM totale du circuit. L'intégrale portant sur l'ensemble du circuit, la FEM totale est donc la somme
des FEM présentes le long du circuit (s'il y en a). Si celles-ci sont localisées dans des dipôles, l'expression
devient :

(38.63)

où les sont les valeurs algébriques des différentes FEM :

1. correspond à un "générateur" (production d'énergie électrique)

2. correspond à un "récepteur" (consommation d'énergie électrique)

Un moteur convertit de l'énergie électrique en énergie mécanique et correspond donc à un récepteur de FEM
: nous disons également, qu'il possède une "force contre-électromotrice" ou FCEM.

LOI DE FARADAY

Maintenant que nous avons démontré la nécessité de la force électromotrice nous allons pouvoir démontrer
la provenance de la "loi de Faraday" ainsi que la "loi de Lenz" dont nous avions fait usage en
électrodynamique pour démontrer la troisième équation de Maxwell. La détermination de la loi de Faraday
va également nous permettre de définir le concept d'inductance et d'étudier ses propriétés.

Faisons la même démarche que Faraday et posons-nous la question suivante : Comment crée-t-on un courant
?

Un courant est un déplacement de charges dans un matériau conducteur. Ces charges sont mises en
mouvement grâce à une D.D.P. qui est maintenue par une FEM. Ainsi, une pile, en convertissant son énergie
chimique pendant un instant dt fournit donc une puissance P modifiant l'énergie cinétique des dQ porteurs
de charge et produisant ainsi un courant I.

Soit la puissance nécessaire pour communiquer une vitesse à une particule de charge q. Sachant que
dans un conducteur il y a n porteurs de charge par unité de volume, la puissance totale P que doit fournir le
générateur (idéal) est alors (voir plus haut) :

(38.64)

Nous posons donc que la FEM idéale d'un circuit est :


(38.65)

Or, la force de Coulomb est incapable de produire une FEM comme nous l'avons démontré tout à l'heure.
Pour créer un courant continu dans un circuit fermé, il faut donc un champ électromoteur dont la circulation
le long du circuit ne soit pas nulle. L'expérience de Faraday montre donc que c'est l'existence du champ
magnétique qui permet l'apparition du courant (!!!!). Cela signifie que la force de Lorentz doit être
responsable de l'apparition d'une FEM, c'est-à-dire :

(38.66)

Donc :

(38.67)

Les propriétés du produit vectoriel (cf. chapitre de Calcul Vectoriel) nous donnant:

(38.68)

nous pouvons écrire :

(38.69)

Une petite remarque s'impose à ce niveau du discours. Si est bien le vecteur vitesse des charges q il ne
peut être celui qui est colinéaire à car sinon nous aurions:

(38.70)

et donc e serait nul et ceci n'est pas possible car contredirait tous les développements faits jusqu'à présent !
Au fait, est la vitesse de l'ensemble du circuit qui entraîne avec lui l'ensemble des charges à la même
vitesse !

Ainsi, pendant un temps dt, le circuit se déplace d'une distance:

(38.71)

vecteur qui est perpendiculaire à . Dès lors:

(38.72)

est la surface (voir les propriétés du produit vectoriel dans le chapitre de Calcul Vectoriel) décrite par le
déplacement de l'élément sur la distance tel que:

(38.73)
Nous avons alors :

(38.74)

Nous reconnaissons l'expression du flux (dit "flux coupé") à travers la surface élémentaire . Ce qui nous
amène à écrire (il y a un petit peu d'intuition - bon sens - avec la manipulation des différentiels mais bon
c'est aussi ça la physique...) :

(38.75)

Nous venons de démontrer la "loi de Faraday" dans le cas d'un circuit rigide, déplacé dans un champ
magnétique statique. Nous avons vu apparaître naturellement l'expression du flux coupé. En fait, la seule
chose qui compte, c'est l'existence d'un mouvement d'ensemble du tout ou d'une partie du circuit (revoir la
démonstration pour s'en convaincre). Ainsi, l'expression de la FEM induite :

(38.76)

reste valable pour un circuit déformé et/ou déplacé dans un champ magnétique statique. Cette démonstration
s'est fait à partir de la force de Lorentz et est donc à priori indépendant du référentiel choisi!

LOI DE LENZ

L'énoncé de la loi de Lenz est le suivant : L'induction produit des effets qui s'opposent aux causes qui lui ont
donné naissance.

Cette loi est, comme la règle du flux maximum, déjà contenu dans les équations et n'apporte rien de plus,
hormis une intuition des phénomènes physiques. En l'occurrence, la loi de Lenz n'est que l'expression du
signe "-" contenu dans la loi de Faraday.

Exemple:

Si nous approchons un circuit du pôle nord d'un aimant, le flux augmente et donc la FEM induite est
négative. Le courant induit sera alors négatif et produira lui-même un champ magnétique induit opposé à
celui de l'aimant. Deux conséquences :

1. L'augmentation du flux à travers le circuit est amoindrie

2. Il apparaît une force de Laplace (cf. chapitre de Magnétostatique) négative, s'opposant à


l'approche de l'aimant.

Ce signe "-" dans la loi de Faraday (la loi de Lenz) décrit le fait que dans des conditions normales, il n'y a
pas d'emballement possible (exemple: courant ne faisant qu'augmenter).

C'est la raison pour laquelle la loi de Lorenz est souvent appelée "loi de Lenz-Faraday".

INDUCTANCE

Nous avons donc :


(38.77)

Or la loi de Biot-Savart nous donne (cf. chapitre de Magnétostatique) :

(38.78)

Dès lors :

(38.79)

que nous simplifions simplement par:

(38.80)

où L est le "coefficient d'auto-induction" ou "auto-inductance" (ou "self"), exprimé en "Henry" [H]. Il ne


dépend que des propriétés géométriques du circuit et est nécessairement positif.

Avec les lois que nous avons énoncées jusqu'à présent, nous sommes en mesure d'étudier certains régimes
variables. En effet, tous les raisonnements basés sur la notion d'un champ (électrique ou magnétique)
constant au cours du temps peuvent aisément être appliqués à des systèmes physiques variables (champs
dépendant du temps), pourvu que cette variabilité s'effectue sur des échelles de temps longues par rapport au
temps caractéristique d'ajustement du champ. Voici tout de suite un exemple concret:

La plupart des lois de la magnétostatique supposent un courant permanent, c'est-à-dire le même dans tout le
circuit. Lorsque nous fermons un interrupteur, un signal électromagnétique se propage dans tout le circuit et
c'est ainsi que peut s'établir un courant permanent : cela prend un temps de l'ordre de l/c où l est la taille du
circuit et c la vitesse de la lumière. Si nous avons maintenant un générateur de tension sinusoïdale de
période T (c'est juste un exemple... pris au hasard...), alors nous pourrons malgré tout utiliser les relations
déduites de la magnétostatique si :

(38.81)

Ainsi, bien que le courant soit variable, la création d'un champ magnétique obéira à la loi de Biot-Savart tant
que le critère ci-dessus reste satisfait. Ce type de régime variable est également appelé "régime
quasistatique" dans le sens qu'il est transitoire.

Donc, puisque nous avons :

et (38.82)

Nous avons alors si et seulement si le courant est variable dans le circuit :

(38.83)

L étant constant pour un circuit rigide. La self ("inductance" en français) crée donc une force électromotrice
inverse de celle générée par le courant à ses bornes. Cette force électromotrice a donc un sens inverse à celle
du générateur électrique.
Remarque: Nous voyons bien dans la relation obtenue, qu'en régime stationnaire, si le courant est constant,
alors la force électromotrice est nulle et la self se comporte alors comme une simple équipotentielle!

Il convient de donner maintenant un exemple important et simple à la fois de la loi de Lenz en l'appliquant
au calcul l'inductance d'un solénoïde de rayon r (l'inductance d'un solénoïde torique à section circulaire
ayant déjà été faite dans le chapitre de Magnétostatique). Nous avons vu dans le chapitre de Magnétostatique
que le champ magnétique dans un solénoïde était donné par :

(38.84)

De plus, nous avons (où l est la longueur du solénoïde) nous avons vu plus haut que le flux du
champ magnétique était donné par (si le champ est perpendiculaire à la surface traversée) :

(38.85)

Donc le flux à travers N spires s'écrit :

(38.86)

Dès lors, dans le cas d'un solénoïde avec N spires il vient immédiatement :

(38.87)

Le taux de variation du flux magnétique se trouve par dérivation, soit :

(38.88)

La force électromotrice engendrée est ainsi :

(38.89)

Avec :

(38.90)

Calculons maintenant la puissance reçue par une bobine. Nous avons démontré plus haut que nous avons
toujours dans notre cas d'étude et si nous modélisons l'inductance comme un dipôle non idéal:

(38.91)

où les lettres en minuscules indiquent que nous sommes en régime non constant:
(38.92)

Contrairement au développement que nous avions fait dans le chapitre d'Électrostatique pour le même calcul
en ce qui concerne la capacité, nous n'avons pas négligé ici la dissipation d'énergie par effet Joule. Mais il
faut savoir que dans la majorité des cas ce terme est aussi négligé!

Donc par intégration dans un intervalle de temps donné de 0 à t nous avons pour le deuxième terme:

(38.93)

Lors i décroit, la bobine restitue cette énergie. Nous ne pouvons donc pas stocker de l'énergie dans une
bobine isolée contrairement à un condensateur.

Dans le cadre d'un régime sinusoïdal, la puissance moyenne sera nulle. Nous pouvons généraliser ceci en
admettant qu'une inductance parfaite ne dissipe aucune puissance par effet Joule.

SEMI-CONDUCTEURS

Le défaut principal du modèle de Drude vu précédemment est de considérer l'électron comme une particule
classique. Un ensemble de telles particules n'est évidemment pas soumis au principe d'exclusion de Pauli.
Autrement dit, à température nulle, ils peuvent tous posséder une énergie nulle comme le montrent les
expressions mathématiques que nous avons obtenues. Par ailleurs, le modèle de Drude nous a montré aussi
que la résistivité augmente lorsque la température s'élève alors que c'est l'inverse pour le silicium!

Au fait, nous retenons en général quatre dates à la source du développement de cette théorie:

- En 1833, Michael Faraday fait état de la conductivité d'un matériau qui augmente avec la température.

- En 1839, Antoine Becquerel découvre que sous illumination une tension électrique apparaît à la jonction
de certains matériaux (et liquides). C'est l'effet photovoltaïque, qui donnera naissance beaucoup plus tard
(vers 1950) aux cellules solaires.

- En 1873, Willoughby Smith montre que la conductivité de certaines substances augmente lorsque qu'on les
illumine. C'est la photoconductivité.

- Enfin, en 1874 Karl Ferdinand Braun découvre le phénomène de redressement électrique lorsqu'une pointe
métallique est déposée sur certains conducteurs, c'est-à-dire que le courant électrique passe dans un sens
lorsque le potentiel électrique appliqué à la pointe est positif mais non lorsqu'il est négatif!

Bien que ces découvertes fussent totalement incomprises et surtout non reconnues comme étant les
différentes expressions d'un même phénomène physique (la semi-conductivité), les application pratiques
furent immédiates et menèrent à la deuxième révolution industrielle qui est celle de la microélectronique!

Ce type de difficulté (parmi de nombreuses autres...) s'efface en grande partie avec le modèle de l'électron
libre dans un puits de potentiel, imaginé par Sommerfeld en 1928. Dans ce modèle les électrons, soumis au
principe de Pauli, suivent la distribution en énergie de Fermi-Dirac (cf. chapitre de Mécanique Statistique),
alors que dans le modèle de Drude ils suivaient la loi de Maxwell-Boltzmann.

Il en découle deux résultats importants :


- Seule une fraction des électrons est susceptible de voir son énergie varier sous l'effet d'une action
extérieure (température, champ électrique, etc.)

- Même au zéro absolu, l'énergie cinétique des électrons n'est pas nulle.

Le modèle de Sommerfeld fournit une base pour l'édification de théories plus spécifiques et est à la base du
domaine de la "physique du solide" selon certaines sources. Ce n'est donc pas un modèle achevé traitant d'un
problème précis comme la conduction électrique ou l'émission thermoélectronique. Cette base est la
distribution en énergie des électrons, obtenue par le produit de deux fonctions : la densité des états et la
distribution de Fermi-Dirac.

Malgré les améliorations qu'il apporte, ce modèle ne donne cependant pas une description satisfaisante des
propriétés électroniques des solides dans tous les cas. Ses limitations proviennent du fait qu'il ne tient pas
compte implicitement de la structure réelle des matériaux et des interactions entre électrons. Ce modèle ne
permettra donc jamais d'expliquer objectivement pourquoi tel cristal est conducteur, et tel autre isolant ou
semi-conducteur (par exemple le diamant et le silicium ont la même structure cristalline et configuration
électronique mais à partir d'une certaine température l'un devient conducteur et l'autre reste isolant!).

La théorie des semi-conducteurs, appelée plus souvent "théorie des bandes" pour des raisons que nous
verrons plus loin, est aussi un exemple fameux de l'application des résultats de la physique quantique
ondulatoire (voir chapitre du même nom) et de la statistique quantique (cf. chapitre de Mécanique
Statistique).

Pour son étude, nous nous concentrerons ici sur le modèle scolaire qualitatif le plus simple qui est celui basé
sur un semi-conducteur cristallin avec un réseau parfaitement périodique et à bandes paraboliques (nous
préciserons cela à nouveau plus loin).

Le lecteur un peu critique verra que les développements qui vont suivre ne sont cependant pas purement
quantiques (il y a un même avec la mécanique classique limite acceptable)... donc l'approche est un peu
grossière mais elle permet d'avoir une idée qualitative des phénomènes dans les semi-conducteurs. C'est une
des raisons pour laquelle ce modèle est appelé "modèle semi-classique des bandes paraboliques".

Au fur et à mesure des années nous compléterons les développements qui vont suivre pour au final tenter
d'avoir toute la démarche détaillée. D'ici là il faudra être patient...

Nous ferons abstraction des concepts qui ne sont pas absolument nécessaire à l'introduction du modèle pour
présenter ici uniquement l'essentiel qui suffit à l'ingénieur dans son travail quotidien.

Pour commencer la partie mathématique de l'étude des semi-conducteurs, nous considérerons un cristal
soumis à une différence de potentiel. Un électron de conduction du cristal sera donc soumis d'une part à une
force interne résultant du champ cristallin, et d'autre part à une force d'origine externe résultant du
champ électrique appliqué au cristal.

Les hypothèses du modèle sont :

H1. Il existe à la surface des métaux une barrière de potentiel empêchant les électrons de quitter la matière.

H2. À l'intérieur de la matière, les électrons sont soumis à un potentiel constant!

H3. Les électrons sont indépendants (pas d'interactions entre eux).

H4. Les électrons obéissent aux lois de la mécanique quantique et classique

H5. Les électrons obéissent aux lois de l'électrodynamique de Maxwell


H6. Les bandes d'énergie forme un spectre continu de niveaux d'énergie

La première hypothèse repose sur l'observation élémentaire suivante : les électrons se déplaçant dans un
métal ne franchissent pas, à température ambiante tout au moins, les surfaces limitant l'échantillon.

La deuxième hypothèse paraît assez brutale. C'est elle qui bannit du modèle la notion de structure de la
matière. Elle sera remplacée dans le modèle des bandes d'énergie (sect. 2.6) par un potentiel périodique
rendant compte de l'influence des noyaux chargés positivement. Cette hypothèse traduit le fait que les
électrons sont considérés comme libres dans le puits de potentiel.

La barrière de potentiel possède une largeur finie, c'est-à-dire que le passage du potentiel régnant à l'intérieur
de la matière au potentiel régnant à l'extérieur se fait sur quelques distances interatomiques. Mais les
dimensions de l'échantillon étant en pratique toujours très grandes vis à vis d'une distance interatomique, on
peut considérer la barrière de potentiel comme infiniment abrupte, ce qui simplifie les calculs.

Remarque: Nous admettrons pour simplifier les calculs que les électrons se déplacent dans une seule
direction (celle du champ électrique) ce qui évitera de se balader avec des vecteurs.

L'équation de la dynamique s'écrit alors naturellement pour cet électron:

(38.94)

Nous écrivons alors (rien ne nous interdit de le faire) que l'électron dans le cristal répond à la sollicitation de
la force externe comme une quasi-particule de masse dans le vide:

(38.95)

C'est l'étude de ce dernier terme qui va nous intéresser. Pour cela rappelons que dans le cadre de l'étude
détaillée de la propagation de l'électron libre dans le vide, où nous négligeons les effets de son spin, nous
avons démontré qu'il doit obligatoirement être décrit selon l'équation de Schrödinger par un paquet d'onde
(cf. chapitre de Physique Quantique Ondulatoire) centré sur un état sinon quoi sont énergie serait infinie.

Peut cependant se poser la question.... de ce qui nous amène à le considérer comme libre.... Eh bien c'est
l'expérience qui montre que lorsque nous appliquons un certain potentiel seuil, un courant commence à
apparaître dans les semi-conducteurs.

Nous avons démontré (toujours dans le cadre de la propagation de la particule libre sans spin dans le
chapitre de Physique Quantique Ondulatoire) que le paquet d'onde peut alors être vu dans sa solution
mathématique comme une onde plane (libre) se déplaçant à la vitesse de phase:

(38.96)

que nous noterons pour la suite afin de simplifier les notations:

(38.97)
Or, dans le réseau cristallin, la vitesse de phase peut varier, en fonction de l'endroit du réseau où se trouve
l'électron à cause de forme géométrique potentiel dans le cristal. Il nous faut donc utiliser la vitesse de phase
instantanée:

(38.98)

Rappelons que nous avons aussi en toute généralité l'énergie totale donnée par:

(38.99)

Il vient alors:

(38.100)

Le terme:

(38.101)

n'est de loin pas simple dans le cas d'un cristal (c'est même un cauchemar...).

Evidemment pour une particule libre (cf. chapitre de Physique Quantique Ondulatoire), rappelons qu'il s'agit
de:

(38.102)

Mais pour une particule dans un champ de potentiel ayant une géométrie complexe l'énergie E commence à
avoir une expression dépendante de k en fonction des zones qui peut devenir très complexe (voir les
exemples du chapitre de Physique Quantique Ondulatoire). D'où la justification de l'utilisation de la dérivée.

L'accélération au sens classique de cet électron est alors donnée par:

(38.103)

Nous avons aussi (cf. chapitre de Mécanique Classique):

(38.104)

donc:
(38.105)

d'où:

(38.106)

La dérivée de par rapport à dans la relation précédente s'annulera car la force découle du potentiel
appliqué sur le semi-conducteur seulement et non pas du vecteur d'onde de l'électron lui-même! Il nous reste
alors:

(38.107)

Puisque ici E est l'énergie totale au potentiel soumis de l'extérieur seulement, alors la force est la force
externe générée par l'application du potentiel. Nous avons alors:

(38.108)

et:

(38.109)

Il vient alors par égalisation:

(38.110)

Puisque l'énergie de l'électron peut avoir une forme mathématique compliquée conformément au cas
applicatifs vus dans le chapitre de Physique Quantique Ondulatoire, exprimons sous forme de
développement limité de Taylor (cf. chapitre de Suites et Séries) d'une fonction à trois variables au
deuxième ordre en laissant tomber les termes d'interactions et en en ne prenant pas les termes de premier
degré:

(38.111)

Au fait cette approximation grossière mais toutefois acceptable dans pas mal de cas pratiques tient au fait
que l'expérience montre que les surfaces d'énergie en fonction de k ont en approximation une forme
parabolique dans certains cristaux semi-conducteurs.

Dans les conducteurs, l'approximation de la relation précédente n'est prise qu'au premier terme.
Une autre manière de le voir est que pour un électron libre nous avons pour rappel, en une dimension, la
courbe de dispersion (cf. chapitre de Physique Quantique Ondulatoire):

(38.112)

qui est bien une parabole en fonction de k. Effectivement, si nous prenons notre développement de Taylor en
une dimension il nous reste:

(38.113)

et comme nous avons déterminé avant que:

(38.114)

Il vient:

(38.115)

Si l'électron est libre la courbe de dispersion nous impose d'avoir (sans présence de potentiel):

(38.116)

qui est alors considérée comme "l'énergie du minimum" Il nous reste alors:

(38.117)

et en prenant nous retombons sur courbe de dispersion d'une particule libre (ce qui justifie donc le
fait d'avoir posé pour un électron libre) :

(38.118)

Ce qui montre que l'approximation n'est pas trop fausse.... et justifie le fait que dans certains ouvrages la
relation précédente (série de Taylor) décrit une particule dite "quasi-libre".

Mais revenons-en à:

(38.119)
Et puisque le paquet d'onde est centré autour de normalisons-la comme valant 0 (ce qui équivaut à
centrer les valeurs du vecteur d'onde). Nous avons alors:

(38.120)

Ce qui est intéressant avec ces développements c'est que nous sommes partis d'un électron libre sous forme
de paquet d'onde et grâce au développement de Taylor nous nous retrouvons avec une expression
extrêmement simple de l'énergie d'un électron quasi-libre.

Il en sort que pour un électron quasi-libre nous, sans interactions et sans prendre en compte les effets de spin
nous avons:

(38.121)

Nous remarquons alors une chose forte sympathique! C'est que notre électron quasi-libre à un nombre
d'onde qui ressemble en tout point à celui d'une particule coincée dans un puits de potentiel à parois
rectilignes (voir la démonstration dans le chapitre de Physique Quantique Ondulatoire).

Nous souhaiterons maintenant calculer à l'aide de l'expression de k (n'ayant pas directement celle de E car
trop complexe) la densité d'états (in extenso d'électrons) dans le volume donne par le puits rectangulaire
correspondant.

Nous avons démontré dans le chapitre de Physique Quantique Ondulatoire que pour le puits de potentiel à
barrières rectangulaires:

(38.122)

si nous imposions un nombre entier de demi-longueur d'onde. Si nous imposons un nombre entier de
longueur d'onde (conditions de Born-von Karman afin qu'après une translation du réseau périodique du
cristal nous retrouvions les mêmes propriétés) pour que la solution soit physiquement acceptable, nous
avons alors:

(38.123)

ce qui implique bien évidemment deux fois moins d'états.

Par extension, pour l'espace nous avons alors dans le cas tridimensionnel:

(38.124)

avec:

(38.125)
et où

Le résultat est très similaire à celui du puits de potentiel rectangulaire à une dimension mais nous avons
maintenant des conditions aux bords particulières afin d'avoir une correspondance avec l'expérience et trois
nombres quantiques principaux au lieu d'un seul. De plus, chaque combinaison de ces trois nombre
correspond à une fonction d'onde (état) différente. De plus ces nombres sont indépendants (aucune condition
imposée).

Nous avons alors le premier niveau où tous les n sont unitaires:

(38.126)

Si nous acceptons pour simplifier que le puits à des arêtes de longueurs égales (semi-conducteur à réseau
cristallin cubique), nous avons alors:

(38.127)

Représentons l'espace des k pour un tel réseau cubique et pour différents multiples de :

(38.128)

Donc tous les états quantifiés ne peuvent prendre que des valeurs espacées de dans l'espace des k ce
qui signifie que par volume élémentaire il n'y a un qu'un seul vecteur d'onde possible et donc qu'un seul état
associé. Effectivement, faites un dessin par-dessus la figure ci-dessus si vous voulez et vous verrez (!) mais
ne vous fiez pas aux gros points noirs qui sont là uniquement pour montrer les extrémités des volumes
élémentaires et qui ne correspondent pas tous à des états possibles!

Ainsi, dans un volume sphérique de rayon k de l'espace des k. Nous avons un nombre précis de volume
élémentaires (états):
(38.129)

où dans la littérature il est d'usage (tradition) de ne conserver la forme de la deuxième égalité dans les
développements.

Remarque: La sphère de rayon k, contenant les niveaux à un électron qui sont occupés est appelée parfois
"sphère de Fermi". La valeur du rayon est alors notée et appelée "vecteur d'onde de Fermi". La surface
de la sphère de Fermi, qui sépare les niveaux occupés de ce qui ne le sont pas comme nous le verrons plus
tard est appelée "surface de Fermi".

En considérant maintenant le spin (ben oui tant qu'on y est...) nous multiplions par 2 puisqu'il y a deux états
de spin possible par état:

(38.130)

et en y injectant:

(38.131)

Nous avons alors:

(38.132)

La densité volumique d'états (quasi-)libres sera obtenue en dérivant cette dernière relation par le volume:

(38.133)

Et si nous souhaitons la densité d'états (quasi-)libres (de vibration) par unité d'énergie et de volume il va
nous falloir en plus dériver par rapport à l'énergie :

(38.134)

Ce qui donne:
(38.135)

Ce résultat ne dépendant pas du volume, il est inchangé lorsque celui-ci tend vers l'infini! Donc il est valable
pour tout point du cristal semi-conducteur si celui-ci est parfait...

Ce que nous trouvons également parfois sous les formes (un peu malheureuses...) suivantes dans certains
ouvrages:

(38.136)

et il y aussi ceux-qui ne prennent en compte le spin que plus tard... ce qui donne une forme identique que les
trois relations précédentes mais à diviser par 2.

DENSITÉ STATISTIQUE NON-DÉGÉNERÉE DES PORTEURS NÉGATIFS

Bref, cependant cette relation à un défaut (encore un...)! Effectivement, nous avons vu dans le chapitre de
Mécanique Statistique lors de notre étude de la statistique quantique que dans un système où même le
spectre d'énergie est considéré comme continu, il est impossible de ne pas prendre en compte la
dégénération des différents niveaux d'énergie. Nous avions démontré alors que pour une population de
fermions, à une énergie (ou température) donnée le pourcentage de niveaux dégénérés occupés est donné par
la fonction de Fermi-Dirac:

(38.137)

et que la fonction retournait donc une valeur comprise entre 0 au minimum et 1 au maximum.

Cette fonctionne donne donc pour une température T fixée la probabilité qu'un électron occupe un état
d'énergie E.

Ce qui fait que notre relation D(E) surestime la valeur réelle de densité d'états (quasi-)libres occupés pour
une énergie (ou température) donnée. Ce qui fait que pour avoir une meilleure approximation nous écrivions
en toute logique la densité volumique d'états (quasi-)libres par unité d'énergie:

(38.138)

Cependant, dans la pratique, nous allons chercher à calculer la densité volumique d'états (quasi-)libres dans
un spectre (intervalle) d'énergie. Il vient alors avec la correction ajoutée précédemment:
(38.139)

Soit:

(38.140)

Il vient alors immédiatement que la densité volumique d'états (d'électrons) (quasi-)libres à une température
donnée (conditions normales de température pour les applications civiles) en prenant en compte tous les
états (niveaux) d'énergie possible est alors:

(38.141)

Prendre comme borne inférieure nous évite, comme nous allons le voir un peu plus bas, de nous
retrouver avec une racine négative... ce qui serait gênant... à priori.

De plus, nous pouvons sans erreurs appréciables reporter la limite de l'intégrale à l'infini car
quand E est importante.

Malheureusement, cette intégrale n'est en général pas soluble analytiquement. Il va donc falloir recourir à
des approximations.

Nous allons commencer par faire l'hypothèse que nous somme dans le régime classique du gaz d'électrons.
C'est-à-dire que:

(38.142)

ce qui implique:

(38.143)

En d'autres termes l'énergie E doit être bien supérieure au potentiel chimique (assimilé souvent
malheureusement et à tort dans la littérature sur les semi-conducteurs au niveau de Fermi ). Les
physiciens notent alors cette énergie pour la distinguer et l'appellent "énergie minimale de la bande de
conduction" (qui correspond à l'énergie minimale d'un électron quasi-libre pour satisfaire cette condition).

Remarque: Malheureusement comme précisé dans le paragraphe précédent (!) dans beaucoup d'ouvrages de
qualité sur les semi-conducteurs, le potentiel chimique , qui est pour rappel une notion purement
thermodynamique impliquant une hypothèse d'interactions, est remplacée par le concept d'énergie de Fermi
et pourtant ce n'est pas la même chose! Les deux énergies coïncident que dans le cas où la température T
est nulle!

Donc nous devons considérer le terme de "niveau de Fermi", comme n'étant rien d'autre qu'un synonyme de
"potentiel chimique" dans le contexte des semi-conducteurs.

Nous avons alors:

(38.144)

Où est la fonction de Maxwell-Boltzmann (cf. chapitre de Mécanique Statistique) donnée pour rappel
par:

(38.145)

Et correspond donc bien à un comportement non quantique (soit un gaz d'électrons non-dégénéré!) car
lorsque:

(38.146)

nous avons:

(38.147)

et donc les états d'énergie ne sont de loin pas tous occupés par les électrons (il n'y a donc pas
dégénérescence).

Nous sommes donc bien dans une situation où la physique classique prédomine sur la physique quantique.
C'est la raison pour laquelle dans cette approximation (de Maxwell-Boltzmann) nous disons alors que nous
avons affaire à un "semi-conducteur non-dégénéré" car les électrons ne sont pas entassés dans les niveaux
les plus bas disponibles.

Pour pouvoir continuer, nous faisons un changement de variable en posant:

(38.148)

d'où:
(38.149)

Il vient alors:

(38.150)

Nous faisons une intégration par parties:

(38.151)

nous faisons ensuite un changement de variable en posant:

(38.152)

Ce qui donne:

(38.153)

Nous avons déjà calculé cette intégrale dans le chapitre de Statistiques. Il vient:

(38.154)

Nous avons alors finalement:

(38.155)

Où pour rappel, est la masse de la quasi-particule (et non la masse de l'électron pour rappel!). Donc
après intégration tout se passe comme si tous les électrons étaient concentrés sur le niveau d'énergie
avec un nombre de places disponibles correspondant à:
(38.156)

Ce que nous notons traditionnellement (et de manière un peu malheureuse... car il n'est pas évident de se
rappeler qu'il s'agit d'une densité):

(38.157)

Ou encore:

(38.158)

Où nous avons environ à température ambiante (c'est le paramètre de la masse effective qui varie entre les
deux) les valeurs suivantes d'états (quasi-)libres respective pour le Silicium:

(38.159)

Et pour le Germanium:

(38.160)

Alors qu'il y a environ une densité d'atomes de et environ électrons pour


ces deux éléments.

Cela signifie qu'il y a donc un rapport de 1/100000 entre la densité d'électrons total et le nombre d'électrons
quasi-libres.

Nous remarquons cependant également que ce modèle théorique ne prend pas en compte la structure
électronique (numéro atomique) du matériau étudié.

Ainsi, nous voyons que les variations des densités d'électrons quasi-libres en fonction de la température
(dans la gamme de validité de la température...) sont essentiellement de type exponentiel croissant ou
décroissant.

A partir de la densité des électrons libres (attention il faut bien se rappeler que c'est uniquement les électrons
quasi-libres qui se baladent dans nos équations mathématiques jusqu'à maintenant) dans le cristal semi-
conducteur, nous pouvons en déduire l'énergie du niveau de Fermi (plus rigoureusement il s'agit du potentiel
chimique!):

(38.161)

d'où:
(38.162)

Et puisque nous avons toujours à cause du logarithme qui est négatif, l'énergie de Fermi (plus
rigoureusement il s'agit du potentiel chimique!) qui est inférieure ou égale à l'énergie des électrons quasi-
libres:

(38.163)

Ou en d'autres termes, les électrons (quasi-)libres ont une énergie supérieure à l'énergie de Fermi (potentiel
chimique...) ce qui est conforme à l'approximation du gaz non dégénéré faite plus haut. Cela donne une
condition d'importance capitale pour que les porteurs négatifs puissent être les générateurs de la conduction
dans le matériau.

Ainsi, lorsque nous nous plaçons à une température différente du zéro absolue, les états électroniques ne
sont pas tous dégénérés: il y a étalement des états occupés au voisinage de ce qui constitue par définition
l'énergie de Fermi (cf. chapitre de Mécanique Statistique), effet d'autant plus accentué que la température est
élevée.

DENSITÉ STATISTIQUE NON-DÉGÉNERÉE DES PORTEURS POSITIFS

Avant toute chose, il faut savoir que dans l'état actuel de nos connaissances les "trous" n'émergent pas des
équations mais sont une construction empirique qui permet de faire correspondre la théorie et l'expérience
(charges positives de l'effet Hall par exemple). Il s'agit donc d'un artifice pour faire une théorie simple d'une
question intraitable rigoureusement à notre époque par la physique quantique.

Personnellement, je considère les trous de la même manière que les points de Lagrange en astronomie:
Même s'il n'y aucun corps en ces points de Lagrange cela n'empêche pas un satellite de se mettre en orbite
(quasi-stable) autour de ceux-ci (possibilité que nous n'avons pas démontrée dans le chapitre d'Astronomie)
comme s'il y avait une masse! Par ailleurs des expériences auraient démontré au début des années 2000 que
des points de Lagrange apparaissent au niveau de l'atome dans certaines conditions idéales et simplifiées!

Ceci dit il faut se rappeler que un trou n'est pas un électron qui manque! C'est une idiotie que l'on voit dans
certains ouvrages spécialisés.

Au risque de se répéter un peu souvent, rappelons que pour une température T fixée la probabilité qu'un
électron occupe un état d'énergie E:

(38.164)

Ce qui fait que pour avoir une meilleure approximation nous écrivions en toute logique la densité volumique
d'états occupés par unité d'énergie:

(38.165)

Ce qui nous a amené finalement à la relation suivante de la densité volumique d'états où la présence d'une
masse dans la relation indique que les états occupés le sont par des quasi-particules tel que:
(38.166)

Mais qu'en est-il de la probabilité qu'un électron n'occupe pas pour une température T fixée un état d'énergie
E et trivialement donnée par la différence:

(38.167)

Eh bien nous allons constater que les équations nous amènent à la possibilité d'associer aussi à ces états non
occupés densité volumique d'états avec une masse effective donnée (et plus tard une charge électrique égale
et positive à l'électron).

Nous avons donc:

(38.168)

faisons maintenant la même approximation que pour les porteurs négatifs c'est-à-dire que:

(38.169)

pour imposer un régime semi-classique et donc les états d'énergie ne sont de loin pas tous occupés par les
trous (il n'y a donc pas dégénérescence).

Cette restriction impose:

(38.170)

Soit écrit de la même manière que pour les porteurs négatifs:

(38.171)

Soit contrairement aux porteurs négatifs cela impose:

(38.172)

en d'autres termes l'énergie doit être bien inférieure au niveau de Fermi (potentiel chimique). Les physiciens
notent alors cette énergie pour la distinguer et l'appellent "énergie maximale de la bande de valence"
(qui correspond à l'énergie maximale d'un trou quasi-libre pour satisfaire cette condition).

Dès lors:
(38.173)

Nous sommes donc bien dans une situation où la physique classique prédomine sur la physique quantique.
C'est la raison pour laquelle dans cette approximation nous disons qu'un que nous avons alors affaire à un
"semi-conducteur non-dégénéré" car les trous ne sont pas entassés dans les niveaux les plus hauts
disponibles.

Nous avons alors:

(38.174)

Pour pouvoir continuer, nous faisons un changement de variable en posant:

(38.175)

d'où:

et (38.176)

Il vient alors:

(38.177)

Nous faisons une intégration par parties:

(38.178)

nous faisons ensuite un changement de variable en posant:

(38.179)

Ce qui donne:

(38.180)
Nous avons déjà calculé cette intégrale dans le chapitre de Statistiques. Il vient (puisque la fonction est
paire):

(38.181)

Nous avons alors finalement:

(38.182)

où pour rappel, est la masse de la quasi-particule (et non la masse du trou pour rappel!). Donc après
intégration tout se passe comme si tous les trous étaient concentrés sur le niveau d'énergie avec un
nombre de places disponibles correspondant à:

(38.183)

Ce que nous notons traditionnellement (et de manière un peu malheureuse... car il n'est pas évident de se
rappeler qu'il s'agit d'une densité):

(38.184)

ou encore:

(38.185)

où nous avons environ à température ambiante (c'est le paramètre de la masse effective qui varie entre les
deux) les valeurs suivantes d'états (quasi-)libres respective pour le Silicium:

(38.186)

et pour le Germanium:

(38.187)

BANDES D'ÉNERGIE
Les développements précédents pour les porteurs négatifs et positifs nous ont monté que dans le cadre de
l'approximation d'un gaz de fermion non dégénéré, l'énergie des porteurs négatifs doit se trouver bien au-
dessus du niveau de Fermi (potentiel chimique) et l'énergie des porteurs positifs bien en-dessous.

C'est donc comme s'il y a avait un intervalle d'énergie interdit ou ni électrons, ni trous ont droit de se situer!
Cet intervalle d'énergie est traditionnellement appelé "bande d'énergie interdite" ou plus simplement "bande
interdite" et abrégée B.I.

L'intervalle d'énergie interdit est quand à lui souvent appelé "gap" et est noté .

(38.188)

De plus, sachant que la chimie moléculaire permet de démontrer que des structures sont composées de
multiples bandes (en fonction du premier et deuxième nombre quantique) il vient alors les définitions
rigoureuses suivantes:

D1. La "bande de conduction" (notée BC) d'une structure solide est la bande de plus basse énergie
partiellement occupée ou vide (sachant que d'autres bandes se situent au-dessus en termes énergétiques mais
ne se rempliront que sous des températures élevées et existent que par une description théorique lorsqu'elles
sont vides).

D2. La "bande de valence" (notée BV) d'une structure solide est la bande de plus haute énergie saturée, c'est-
à-dire dont tous les états sont occupés (sachant qu'il peut y avoir en-dessous de multiples bandes en termes
énergétiques et toutes saturées).

Nous avons également l'association schématique traditionnelle des bandes de conduction et de valence avec
la fonction de Fermi-Dirac (qui comme déjà mentionné en tout rigueur devrait être le potentiel chimique à
température non nulle!) représentée sous forme simplifiée par:
(38.189)

Mais au fait cette représentation, que nous retrouvons un peu partout dans les mauvais livres, est très
erronée... puisqu'en faisant une approximation semi-classique par la loi de Maxwell-Boltzmann il n'est plus
question en toute rigueur de représenter la distribution sous forme de loi de Fermi-Dirac comme l'aura
remarqué le lecteur attentif! Comme quoi il faut faire attention car la représentation traditionnelle de
dans la modèle semi-classique indiquerait qu'il y aurait des états occupés dans la bande interdite alors
que si nous représentions la fonction de Maxwell-Boltzmann , nous verrions deux fonctions distinctes
au-dessus et en-dessous de la bande interdite!!!

Et il faut se rappeler (!) que la figure ci-dessus (même si elle est assez fausse) représente concedptuellement
un semi-conducteur non dégénéré suite aux approximations semi-classiques que nous avons faites dans nos
développements en utilisant le modèle d'un gaz non dégénéré (approximation de Maxwell-Boltzmann) et qui
imposait théoriquement:

(38.190)

que de nombreux auteurs écrivent (à nouveau c'est malheureux mais c'est ainsi...):

(38.191)

Donc il vient qu'une autre définition possible du semi-conducteur non dégénéré: c'est celui où le niveau de
Fermi (le potentiel chimique!) se situe dans la bande interdite et ce cas correspond au fonctionnement de la
majorité des composants microélectroniques.

Remarque: Rappelons (cf. chapitre de Mécanique Statistique) que la statistique de Maxwell-Boltzmann a été
bâtie en supposant l'absence d'interaction entre les particules concernées. De plus, cette statistique est
construite dans le cadre de la mécanique classique et ne s'applique donc que lorsque les effets quantiques
sont négligeables, par exemple à des températures suffisamment hautes!

Voici quelques valeurs expérimentales pour des semi-conducteurs courants:


300 [K] 0 [K]
C 5.47 5.51
Ge 0.66 0.75
Si 1.12 1.16
GaAs 1.43 1.53
Tableau: 55.2 - Valeurs de quelques gap

nous comprenons alors de suite au vu des ces chiffres pourquoi le diamant, à structure cristalline et atomique
quasi-identique, est isolant alors que le Silicium devient lui conducteur!

Ce qui est intéressant pour les chercheurs c'est de combiner des matériaux afin de jour avec la largeur de
en fonction des besoins!

Par ailleurs, nous pouvons aussi conclure hâtivement... que ce qui différence isolants et semi-conducteurs
c'est la largeur de leur bande interdite.

Remarquons aussi que l'énergie nécessaire à un électron pour passer de la bande de valence à la bande de
conduction peut lui être fournie par un rayonnement. Dans le cas d'une absorption de lumière, l'énergie
d'un photon peut être suffisante à cela tant que:

(38.192)

A basse température, un tel processus est capable de rendre le matériau conducteur (technologie des
télescopes spatiaux à basse température). Cette propriété est appelée la "photoconductivité".

LOI D'OHM

Nous avons démontré dans le cadre du modèle de Drude que la conductivité était donnée par:

(38.193)

où n est pour rappel la densité de porteurs dans le matériau. Nous avons également démontré que le courant
est inversement proportionnel à la conductivité selon la relation:

(38.194)

Dans le cadre des développements faits plus haut nous avons vu que la densité n des porteurs était donnée
respectivement par les relations suivantes à un potentiel constant (hypothèse du modèle):

et (38.195)

où la masse relative de la quasi-particule (porteur négatif ou porteur positif) ne sont pas nécessairement
égaux! Ainsi, nous avons donc la résistance qui peut être approchée par une relation de la forme:
(38.196)

et nous vérifions aisément cette dépendance en représentant graphiquement:

(38.197)

soit ln(R) en fonction de 1/T (la résistance ne dépend donc que de la température en théorie... à tension
constante).

La vraie complexité tient au fait que beaucoup de termes sont dépendants de la température (le niveau de
Fermi, le temps de libre parcours moyen, etc.) et du potentiel appliqué ce qui fait que dans la réalité les
courbes obtenues ne sont pas de loin pas conformes à la théorie....!

Une application numérique montre que les densités de porteurs et augmentent donc très rapidement
déjà à partir de la température ambiante! Ce qui est conforme à l'expérience avec les semi-conducteurs non-
dégénérés car nous aurons alors la conductivité qui augmente tout aussi fortement ce qui implique une baisse
rapide de la résistance!

La grande sensibilité de la conductivité de certains solides aux variations de température est à l'origine de
nombreuses applications, tant pour les métaux conducteurs que pour les semi-conducteurs. C'est ce que nous
appelons des "thermistances".

Enfin, indiquons que dans le cas du Silicium nous avons alors que l'énergie cinétique due à
l'agitation thermique (cf. chapitre de Mécanique des Milieux Continus) est donnée à température ambiante
par:

(38.198)

Or, nous avons vu précédemment que seuls les électrons dont l'énergie était voisine de celle du niveau de
Fermi pouvaient participer à la conduction. Leur énergie cinétique valant alors:

(38.199)

où est la "vitesse de Fermi".

En égalisant les deux dernières relations:

(38.200)

Il y a donc un rapport d'un facteur de 30 entre les deux énergies, soit en prenant la racine carrée, un rapport 5
entre les vitesses. Nous avons donc:

(38.201)
Or, nous avons déjà vu lors de notre étude du modèle de Drude que la vitesse thermique nous amenait à un
libre parcours moyen supérieur d'un ordre grandeur (facteur 10) des distances interatomiques. Et ici nous
avons donc un facteur 5 en plus!!!! Soit plus de 50 distances interatomiques! Le libre parcours moyen l d'un
électron de conduction est donc beaucoup plus grand que celui que nous avions déterminé à partir du modèle
classique de Drude. Ainsi, le libre parcours moyen ne semble pas due aux collisions avec les ions du réseau
mais elle est imputable aux imperfections du réseau: défauts de structure, atomes étrangers...

Un semi-conducteur parfait (pur), soit sans imperfections, tel que nous l'avons traité théoriquement jusqu'à
maintenant est appelé un "semi-conducteur intrinsèque" : il ne comporte donc aucune impureté et son
comportement électrique ne dépend que de la structure du matériau. Ce comportement correspond à un
semi-conducteur parfait, c'est-à-dire sans défaut structurel ou impureté chimique. Un semi-conducteur réel
n'est jamais parfaitement intrinsèque mais peut parfois en être proche comme le silicium monocristallin pur.

Dans un semi-conducteur intrinsèque, les porteurs de charge ne sont créés que par excitation thermique. Le
nombre d'électrons dans la bande de conduction est alors égal au nombre de trous dans la bande de valence
comme nous l'a montré notre modèle théorique.

Il faut savoir qu'en réalité ces semi-conducteurs ne conduisent pas, ou très peu, le courant, excepté si nous
les portons à haute température.
39. OPTIQUE GÉOMÉTRIQUE

L 'optique est l'étude la fraction de l'énergie rayonnante sensible à la rétine, c'est-à-dire la "lumière" ou dit
(cf. chapitre d'Électrodynamique) de manière plus générale : les "ondes électromagnétiques" et ce dans une
large bande de fréquence qui ne se limite pas (suivant les cas étudiés) à la lumière visible!

Nous avons choisi sur ce site de scinder l'étude de l'optique en trois parties : la photométrie (voir plus bas),
l'optique géométrique (le présent chapitre) et l'optique ondulatoire (prochain chapitre).

1. La "photométrie" s'occupe de la partie des définitions des grandeurs relatives aux propriétés énergétiques
des ondes électromagnétiques relativement à la sensibilité visuelle.

2. "L'optique ondulatoire" où les phénomènes lumineux sont interprétés en tenant compte de la nature de la
lumière. Celle-ci est considérée comme une onde électromagnétique d'une longueur d'onde donnée
définissant sa couleur (grandeur subjective comme nous le verrons plus loin).

Dans certaines expériences, nous devons cependant considérer la lumière comme un phénomène
corpusculaire (cf. chapitre de Physique Quantique Ondulatoire) nous la supposons alors constituée de
particules, les "photons", dont l'énergie est proportionnelle à la fréquence lumineuse selon la loi de Planck
(pas celle de la thermodynamique... l'autre).

3. "L'optique géométrique" où nous décrivons la propagation de la lumière dans les milieux transparents
sans faire intervenir la nature même de la lumière. Il s'agit d'une partie de la physique présentant l'avantage
de ne pas demander d'outils mathématiques compliqués, mais de beaucoup de bon sens géométrique...

Pour des raisons de cohérence, comme nous en avons déjà fait mention, nous avons choisi de mettre la
photométrie dans le même chapitre d'Optique Géométrique (ici même donc...).

Avant de commencer à étudier l'aspect mathématique de l'optique géométrique il nous a semblé bon
d'éclaircir certaines zones floues du domaine de l'optique qui sont rarement bien précisées voir même pas
traitées du tout dans les ouvrages sur le sujet. Ainsi, nous allons d'abord présenter ce qu'est une source ou
une absence de lumière et ensuite comment les couleurs sont vues et traitées par l'être humain.

SOURCES ET OMBRES

L'expérience nous enseigne que dans un milieu homogène et transparent la lumière se propage en ligne
droite et que celle-ci provient toujours de "sources lumineuses" :

Certains objets sont lumineux par eux-mêmes (Soleil, flammes). Les autres objets ne sont généralement pas
visibles dans l'obscurité (absence de lumière) mais s'ils sont éclairés ils renvoient tout ou partie de la lumière
dans toutes les directions (voir le chapitre d'Électrodynamique et de physique quantique corpusculaire) et se
comportent donc dès lors comme des sources lumineuses.

Nous définissons:

D1. Une "source ponctuelle" comme étant un seul "point lumineux"

D2. Une "source étendue" comme un ensemble de sources ponctuelles

D3. Un "rayon lumineux" comme toute droite suivant laquelle se propage la lumière

D4. Un "faisceau lumineux" comme un ensemble de rayons lumineux


D5. Le "diamètre apparent" comme étant l'angle, généralement petit, sous lequel nous voyons une des
dimensions de l'objet (angle exprimé en radians).

La lumière traverse le vide sans subir d'altération. C'est ainsi que la lumière du Soleil, avant d'atteindre la
limite de l'atmosphère terrestre, traverse d'immenses espaces vides sans subir de transformations.

Sur Terre, entre un objet lumineux et l'oeil qui voit cet objet, la lumière traverse une certaine épaisseur d'air.
L'objet demeure visible dans d'autres gaz, ou bien à travers une lame de verre, de mica, de cellophane..., ou
bien encore à travers une couche d'eau, d'alcool, de glycérine... de tels corps constituent des "milieux
transparents".

La plupart des corps ne se laissent pas traverser par la lumière. Placés entre l'oeil et un objet lumineux, ils
suppriment la vision de cet objet : nous disons alors qu'ils sont "corps opaques".

En fait, aucune substance n'est parfaitement transparents et la propagation dans un milieu transparent
s'accompagne toujours d'un affaiblissement. Ce phénomène d'absorption dépend de la nature du milieu et
augmente avec l'épaisseur de substance traversée. C'est ainsi que l'eau, même très pure, est opaque sous une
épaisseur d'une centaine de mètres. Aussi les grands fonds marins ne reçoivent-ils jamais de lumière solaire.

Il arrive que certains corps, dits "corps translucides", laissent filtrer de la lumière sans permettre à l'oeil
d'identifier l'objet lumineux qui l'émet. Tels sont le verre dépoli, le verre strié, la porcelaine mince, le papier
huilé...

Dans un espace sombre, l'oeil situé hors du trajet de la lumière, aperçoit ce trajet grâce aux fines particules
solides (poussières, fumée de tabac, brouillard,...) en suspension dans l'air. Ces particules éclairées diffusent
la lumière qu'elles reçoivent, devenant autant de points lumineux qui matérialisent le volume traversé par la
lumière. L'observation familière montre que ces volumes lumineux paraissent toujours limités par des lignes
droites.

Nous pouvons dès lors appliquer le théorème des rapports de Thalès à certains phénomènes lumineux. Ainsi,
imaginons l'expérience suivante:

Nous réalisons des sources de dimensions assez faibles pour que nous puissions les considérer comme des
sources ponctuelles (c'est-à-dire des points lumineux).

Soit S une telle source ponctuelle de lumière. Considérons le volume que la source S illumine à travers une
ouverture dans un diaphragme se situant dans la trajectoire de la lumière à la distance d. Si nous notons AB
le diamètre circulaire de cette ouverture du diaphragme K et que nous coupons la trajectoire lumineuse par
un écran E, parallèle à K et à distance D de la source, nous observerions que la partie éclairée se limite à un
cercle A'B'.

(39.1)
Si nous pouvions mesurer les diamètres AB et A'B' des deux cercles, ainsi que leurs distances d et D à la
source, nous trouverions qu'ils satisfont au théorème des rapports de Thalès et ainsi que :

(39.2)

C'est également la preuve que le volume lumineux est effectivement limité par des droites issues de S et
s'appuyant sur le bord de l'ouverture du diaphragme.

Ces faits d'observation et d'expérience élémentaires suggèrent l'hypothèse suivante :

Dans un milieu transparent homogène (rappelons qu'un milieu est homogène quand tous ses éléments de
volume possèdent les mêmes propriétés), la lumière provenant d'un point lumineux se propage suivant des
lignes droites issues de ce point. Ces droites sont appelées des "rayons lumineux".

Si nous revenons à la figure précédente, l'ensemble des rayons lumineux contenus dans le cône défini par la
source S et le diaphragme K constitue un "faisceau lumineux".

1. La lumière se propageant ici à partir de S, nous disons que les rayons "divergent" ou encore que le
faisceau est un "faisceau divergent".

2. Quand une source ponctuelle est à l'infini (comme l'est pratiquement une étoile, par exemple), les rayons
qui en partent sont parallèles et les faisceaux qu'ils forment sont appelés "faisceaux parallèles", ou encore
"faisceaux cylindriques".

3. A l'aide d'une lentille convergente (une loupe, par exemple), nous verrons qu'il est possible de changer les
directions de rayons issus d'une source ponctuelle et de les faire concourir en un point S'. Un tel ensemble de
rayons constitue un "faisceau convergent".

Un faisceau lumineux très étroit prend le nom de "pinceau lumineux". Par exemple, les rayons allant d'un
point lumineux à l'oeil forment toujours un pinceau lumineux très délié, parce que la distance du point
observé à l'oeil est nécessairement grande, comparée au diamètre de la pupille.

Si nous revenons à notre expérience avec le diaphragme : si nous diminuons l'ouverture de ce dernier qui
limite un pinceau de rayons lumineux, nous observons (lorsque le diamètre est réduit à moins de quelques
dixièmes de millimètre) que la trace du pinceau sur un écran E, au lieu de s'amenuiser, s'agrandit au
contraire, preuve que la lumière parvient maintenant en des points situés hors du cône SA'B'.

Tout se passe comme si la très petite ouverture AB devenait elle-même une source ponctuelle: nous dit que
la lumière se "diffracte". Nous reviendrons plus tard sur cette propriété de la lumière car il s'agit d'une étude
mathématique assez élaborée (cf. chapitre d'Optique Ondulatoire) et donc complexe à manipuler mais
cependant fort intéressante.

Considérons maintenant une source ponctuelle de lumière. Entre la source et un écran E, interposons un
corps opaque de forme quelconque. Conformément à l'hypothèse de la propagation rectiligne, nous
observons un "cône d'ombre" limité par les rayons qui s'appuient sur le contour du corps interposé.

La région non éclairée du corps opaque est "l'ombre propre", celle qui correspond sur l'écran est "l'ombre
portée".

Si la source de lumière est étendue, l'ombre portée et l'ombre propre n'ont plus leurs contours nettement
délimités. Leurs bords s'entourent d'une zone intermédiaire que l'on appelle la "pénombre".

COULEUR
Définition: Nous nommons "couleur" la perception d'un excitation lumineuse suite à un processus
neurophotochimique par l'oeil d'une ou plusieurs fréquences d'ondes lumineuses avec une (ou des)
amplitude(s) donnée(s).

Remarque: Il importe de ne jamais confondre "couleur", notion perceptive, et "longueur d'onde", notion
physique. Ainsi, l'oeil humain est le plus souvent incapable de distinguer un jaune monochromatique
théorique (une seule longueur d'onde) d'une composition correspondante de vert et de rouge. Cette illusion
permet d'afficher du jaune sur nos écrans d'ordinateur, et, plus généralement n'importe quelle couleur

De par le fait que la partie sensible de la rétine de l'oeil humain est composée d'éléments appelés "cônes"
sensibles chacun à un petit intervalle correspondant respectivement au rouge (via la molécule
d'érythrolable), au vert (via la molécule de chlorolabe) et au bleu (via la molécule d'érythrolabe), nous
pouvons créer n'importe quelle couleurs en additionnant ces trois couleurs de base appelées "couleurs
fondamentales additives" (ou "couleurs primaires additives"). Cela s'appelle la "synthèse additive" des
couleurs.

L'associations française de normalisation (AFNOR) a défini au 20ème siècle la principe de trivariance


visuelle de la manière suivante: Un rayonnement de couleurs quelquonque peut être produite visuellement à
l'identique par le mélange algébrique, en proportions définies de manière unique, des flux lumineux de trois
rayonnements qui peuvent être arbitrairement choisis, sous réserver qu'aucune d'eux ne puisse être reproduit
par un mélange des deux autres.

Dans ce qui suit, nous noterons le rouge (R), le vert (V), le bleu (B), le blanc (W), le noir (N).

Longueur d'onde
Couleur Fréquence [THz]
[nm]
rouge ~ 625-740 ~ 480-405
orange ~ 590-625 ~ 510-480
jaune ~ 565-590 ~ 530-510
vert ~ 520-565 ~ 580-530
cyan ~ 500-520 ~ 600-580
bleu ~ 446-500 ~ 690-600
violet ~ 380-446 ~ 790-690
Tableau: 39.1 - Valeurs de quelques longeurs d'onde et fréquences

Il est claire que vu les fréquences du spectre visible ce ne sera pas demain qu'avec les matériaux connus au
début du 21ème siècle que nous allons construire des antennes ou paraboles capables d'émettre à de telles
fréquences! Déjà que 120 [GHz] c'est un exploit alors 500 [THz] demain....

Remarque: Les cônes L de la rétine sons sensibles aux ondes longues (580 [nm]), donc les rouges. Les cônes
M, sensibles aux ondes moyennes (545 [nm]), donc les verts. Les cônes S, sensibles aux ondes courtes (440
[nm]), donc les bleus. Quand au choix de cette gamme précise du spectre électromagnétique par la Nature, il
suffit de regarder le spectre d'absorption de l'eau pour voir que ça tombe pile dans une fenêtre où l'eau
absorbe très peu. Du coup, nous pouvons voir loin même par temps humide.

En pointant trois faisceaux lumineux (R, V et B) au même endroit, nous pouvons obtenir (au fait il serait plus
rigoureux de dire "percevoir" car ceci est propre seulement à certains mammifères trichromates) de la
lumière blanche. Nous disons alors que le blanc (dans le sens humain du terme) est la somme des trois
couleurs fondamentales additives (rappelons qu'au fait le blanc est rigoureusement la somme des toutes les
couleurs du spectre - donc que le blanc est constitué d'un spectre lumineux continu). Toutes les couleurs
imaginables sont obtenues en variant l'intensité de chacun des trois faisceaux. Le noir est obtenu quand nous
n'envoyons aucune lumière du tout.
Par exemple, si nous additionnons (dans le sens théorique du terme : avec des composants de couleurs
infiniment petits et transparents...) juste du rouge et du vert, nous obtenons du jaune (J), si nous
additionnons se du rouge et du bleu, nous obtenons du Magenta (M), si nous additionnons du vert et du bleu,
on obtient du Cyan (C). Nous pouvons donc résumer cela par les équations suivantes :

(39.3)

Ces trois couleurs (J, M, C) obtenues en additionnant deux couleurs fondamentales additives sont appelées
"couleurs secondaires additives".

Schéma de la synthèse additive :

(39.4)

L'existence de ces trois types de pigment dans les photorécepteurs des cônes sert de base physiologique au
"modèle trichromatique" ou de "trivariance visuelle".

Définition: Une couleur est dite "couleur complémentaire" d'une autre si elles donnent du blanc quand on
les additionne. Par exemple, le jaune est la couleur complémentaire du bleu :

(39.5)

A l'opposé de la synthèse additive, il existe la "synthèse soustractive des couleurs" : c'est celle dont nous
parlons quand nous enlevons de la couleur à une couleur de base. C'est par exemple le cas de l'encre ou des
filtres colorés (dans le sens où il y a un support de base dont il faut traiter la couleur).

Pour comprende quoi il s'agit, posons un filtre rouge sur un rétroprojecteur. La lumière projetée sera rouge.
Nous remarquons donc que le filtre a enlevé de la couleur à la lumière blanche : W est devenu R mais
comme W = RVB, cela veut dire que le filtre rouge a enlevé les couleurs VB à la lumière blanche du
rétroprojecteur. Avec le même raisonnement, nous comprenons qu'un filtre V soustrait les couleurs RB et un
filtre B soustrait RV.
Si nous empilons deux filtres de couleurs fondamentales différentes : par exemple, un filtre R et un filtre V,
nous n'obtiendra rien du tout, autrement dit, du N. En effet, le filtre R ne laisse passer que la lumière rouge et
le filtre V soustrait cette couleur (ainsi que le B). Il ne reste donc plus aucune couleur, autrement dit du N.

Nous remarquons donc que les filtres R, V et B ne permettent pas de synthétiser différentes couleurs par
soustraction puisque nous obtenons du noir dès que nous en superposons deux différents. Ce qui est très
embêtant lorsque le support concerné est du papier et que l'objectif est d'imprimer quelque chose de coloré.

Il est donc plus utile d'utiliser les filtres jaunes, magenta et cyan (J, M, et C) des couleurs additives
secondaires. En effet, un filtre J laisse passer du jaune, c'est-à-dire RV. Il ne soustrait donc que le B à la
lumière blanche d'origine. Selon le même principe, un filtre M soustrait V et un filtre C soustrait R

Nous remarquons alors que la superposition de deux filtres de ces couleurs secondaires donne une nouvelle
couleur sur un support existant. Nous pouvons ainsi synthétiser n'importe quelle couleur en variant l'intensité
de chacun des trois filtres (J, M et C) que nous superposons (sur le rétroprojecteur ou le papier par exemple).
Nous appelons ces trois couleurs les "couleurs fondamentales soustractives".

Schéma de la synthèse soustractive :

(39.6)

Exemples:

E1. Un écran de télévision ou d'ordinateur fonctionne sur le principe de la synthèse additive des couleurs. En
effet, en regardant l'écran à la loupe, on peut se rendre compte qu'il est rempli de petits groupes de trois
luminophores (zone brillant quand on l'excite) R, V et B. Ces luminophores sont tellement proches que
quand ils s'allument ensemble, ils donnent l'impression de se confondre et on perçoit uniquement la synthèse
additive des trois (pixel). Par exemple, sur un écran de télévision entièrement rouge, seuls les luminophores
rouges brillent. Par contre, si l'écran vire au jaune, cela veut dire que les luminophores verts brillent en
même temps que les rouges.

E2. A l'opposé de la télévision, nous trouvons les procédés d'imprimerie qui fonctionnent en synthèse
soustractive. En effet, la feuille est blanche et il faut lui enlever des couleurs pour obtenir celle que nous
désirons. La technique est la même que celle des filtres : les encres contiennent des pigments qui filtrent
certaines couleurs. En utilisant des encres J, M et C, nous pouvons obtenir toutes les couleurs du spectre
visible. Toutefois, les pigments ne sont pas parfaits et le noir est très difficile à obtenir (surcharge d'encre et
teinte plutôt brun foncée). Nous avons donc recours au noir comme quatrième couleur. Ce système s'appelle
"l'impression en quadrichromie". Il est utilisé par exemple par la plupart des imprimantes couleurs et dans
les rotatives de journaux.

Il est intéressant maintenant de s'intéresser aux phénomènes qui superposent les deux concepts (si nous
pouvons dire...). Ainsi, un système qui projette de la couleur selon le système RVB additif ou soustractif
peut lui-même être éclaire par un système équivalent. Il en résulte ainsi une superposition d'effets.

Ainsi, quand nous parlons de la couleur des objets, nous nous référons normalement à l'aspect qu'ils ont
quand ils sont éclairés par de la lumière blanche.

Exemple:

Une tomate rouge, absorbe une partie de la lumière blanche W (VB) et diffuse le reste (R). C'est pour cela
qu'elle nous apparaît rouge quand on l'éclaire avec de la lumière blanche. Un citron, lui, apparaît jaune car il
absorbe le bleu de la lumière blanche W et diffuse le reste (RV).... Mais qu'en est-il d'une tomate éclairée par
une lumière bleue? A quoi ressemble le citron si nous l'éclairons en rouge ?

Nous pouvons répondre en raisonnant comme suit : comme la tomate absorbe VB et donc intrinsèquement le
bleu (B), il ne reste donc rien. Elle apparaît alors noire. Quant au citron, comme il absorbe le bleu (B) et
diffuse la lumière R+V alors si nous l'éclairons seulement avec du rouge R il ne diffusera que du rouge et
apparaîtra donc rouge.

PHOTOMÉTRIE

La matière est capable d'émettre de transmettre et/ou absorber de l'énergie électromagnétique. Plusieurs
facteurs caractérisent ce rayonnement telles que sa gamme spectrale, son intensité, sa direction ainsi que
certaines propriétés intrinsèques à la matière. La photométrie se propose de rechercher les grandeurs qui lui
sont spécifiques ainsi que les lois qui les régissent.

Nous reconnaissons deux types de photométrie : la "photométrie énergétique" et la "photométrie visuelle".


De ce qui va suivre, nous nous en tiendrons principalement à la photométrie énergétique.

Au préalable, nous devons spécifier les conditions dans lesquelles nous allons définir les nouvelles
grandeurs. Nous admettrons donc les hypothèses suivantes :

H1. Le rayonnement se propage dans un milieu transparent pour toutes les intensités, les longueurs d'onde et
leur polarisation

H2. La propagation s'effectue suivant des angles solides (cf. chapitre de Trigonométrie). Nous écartons ainsi
la propagation avec des rayons parallèles

H3. La surface élémentaire dS d'étude est suffisamment petite pour que les rayonnements de ses points
soient identiques mais pas trop petites pour éviter des phénomènes comme la diffraction.

FLUX ÉNERGÉTIQUE

Définition: Le "flux énergétique" d'une source de rayonnement est la puissance qu'elle rayonne. Le flux
se mesure en Watts [W] (soit des joules par seconde [J/s]) et il découle dès lors que pour une source qui
rayonne une énergie (non nécessairement constante), nous avons :

(39.7)
Exprimé dans certains domaines professionnels, l'unité photométrique est le "Lumen" noté [lm] ou en unité
photonique en nombre de photons par seconde :

LOI DE BEER-LAMBERT

Si l'absorption et la diffusion d'un milieu peuvent être considérées comme proportionnelles à


l'épaisseur dz de matière traversée, la variation de flux pourra s'écrire:

(39.8)

dans cette expression est le flux incident et est le coefficient d'atténuation linéique qui est
fonction de la fréquence du rayonnement.

Nous aurons donc une simple équation différentielle (cf. chapitre de Calcul Différentiel Et Intégral) :

(39.9)

qui est la "loi de Beer-Lambert" (qui peut aussi s'exprimer à partir de l'intensité lumineuse que nous
définirons de suite après).

Ordres de grandeur : Atmosphère ; , Verre (BK7)


, ...

Remarque: La variation du coefficient d'absorption atmosphérique avec la longueur d'onde permet


notamment d'expliquer la couleur bleue du ciel.

Il existe de nombreuses autres formulations de la loi de Beer-Lambert dont une assez utilisée en physique
nucléaire (voir chapitre du même nom) dans le cadre de la radioprotection. Voyons de quoi il s'agit :

Considérons un flux de particules frappant perpendiculairement la surface d'un matériau d'épaisseur dx et


de densité atomique N ( ). Si nous considérons les particules frappant une surface S, ces
dernières peuvent théoriquement rencontrer atomes cibles dans cette couche. Le nombre de
particules interagissant sera proportionnel à l'intensité fois ce nombre, et nous avons :

(39.10)

Remarques:

R1. est la constantes de proportionnalité et est nommée "section efficace microscopique". Ces unités sont
souvent exprimées en "barn" ( ).

R2. La densité atomique N est égale à où est la densité en , le nombre


d'Avogadro et la masse molaire de la cible exprimée en .

Si nous admettons maintenant que les centres de diffusion sont les électrons et non pas les atomes cibles,
alors il faut remplacer par où avec Z étant le nombre d'électrons interagissant par atome
cible. D'où :
(39.11)

En identifiant avec la première formulation de la loi de Beer-Lambert, nous voyons que joue le même rôle
que :

et (39.12)

et dans l'hypothèse où l'électron constitue une "sphère d'action" présentant une surface frontale , étant
le rayon de cette sphère. Alors :

(39.13)

et nous avons pour le rayon de la sphère d'action de l'électron :

(39.14)

INTENSITÉ LUMINEUSE

Pour décrire le flux énergétique d'une source, il faut commencer par le mesurer. Le capteur utilisé
(thermocouple, bolomètre, cellule photoélectrique, oeil ou autre) ne peut recevoir qu'une partie : celle qui
arrive dans l'angle solide défini par sa section.

Définition: "L'intensité lumineuse" ou "intensité énergétique" I d'une source ponctuelle est le flux rayonné
dans l'unité d'angle solide centré autour d'une direction d'émission :

(39.15)

Exprimée dans certains domaines professionnels, en unité photométrique en "Candela" [Cd] ou en unité
photonique en (rappelons que les stéradians n'ont pas d'unité au même titre que les radians)

Remarques: Une source est dite "source anisotrope" ou "source directionnelle" si son intensité varie avec la
direction d'observation.

Par comparaison (car cela aide), une unité de Candela est équivalent à l'intensité d'une source dans une
direction donnée, qui émet un rayonnement monochromatique de fréquence 540.1012 [Hz] (ce qui
correspond approximativement à la fréquence à laquelle l'oeil est le plus sensible), et dont le flux lumineux
(ou intensité) dans cette direction est 1/683 [W] par stéradian.

ÉMITTANCE ÉNERGÉTIQUE

Définition: "L'émittance énergétique", "excitance" ou encore "éclairement" M d'une source est le flux
énergétique rayonné (puissance) par unité de surface dS en [W/m2] dans toutes les directions de l'espace
extérieur à la source et dépend des propriétés physico-chimiques de la surface émettrice :
(39.16)

Elle est souvent assimilée dans le vocabulaire courant à la "luminosité" d'une source de lumière ce qui porte
parfois à confusion avec le concept d'intensité lumineuse.

l'émittance énergétique est exprimée dans de nombreux domaines professionnels en unité photométrique
appelée "Lux" [lx] ou en encore unité photonique ou pire encore... en [lm/m2]. Par exemple quand
vous achetez une voiture, les feux de croisement sont indiqués comme valant environ ~20 [lx].

Attention à ne pas confondre l'émittance énergétique avec le flux énergétique!!!

Si la source est ponctuelle et son rayonnement isotrope, sa direction n'est pas à prendre en considération.
Dans le cas de ladite sphère de rayon r, l'émittance a alors pour expression :

(39.17)

Dans le cas précédent de la sphère, un élément dS de la surface sphérique reçoit perpendiculairement le


rayonnement. En toute généralité, une surface élémentaire peut être inclinée par rapport à la direction du
rayonnement avec un angle . Ainsi, nous devons projeter la surface sur la perpendiculaire du rayonnement
en utilisant les raisonnements élémentaires de la trigonométrie:

(39.18)

C'est cette projection qui explique les saisons sur la Terre : la surface balayée par l'émittance à peu près
constante et isotrope du soleil (considéré comme une source ponctuelle) est maximale à l'équateur (surface
perpendiculaire) et donc implique un flux supérieur par rapport à ce que reçoit une latitude supérieure ou
inférieure pour laquelle la projection perpendiculaire de la surface concernée est plus petite que celle à
l'équateur pour une émittance identique.

Remarques:

R1. L'émittance énergétique n'est calculée que dans le demi-espace extérieur avant (celui d'où nous
regardons la source), car seule la moitié de l'énergie échangée par les points de la surface dS est émise sous
forme de rayonnement. L'autre moitié est échangée avec les atomes situés dans le corps.

R2. L'émittance est habituellement aussi parfois notée F ou encore E. Il faudra prendre garde cependant à ne
pas confondre l'émittance M avec la magnitude (noté de la même manière) que nous définissons en
astrophysique.

LUMINANCE ÉNERGÉTIQUE

Soit une source non ponctuelle dont l'émittance énergétique M est connue en tout point. Un élément dS de la
surface de ce genre de source sera par définition de l'intensité pas nécessairement isotrope et donc plus
lumineux (puissant) lorsque l'on l'observe colinéairement au vecteur .

L'intensité énergétique I qu'il rayonne dans une direction, formant un angle , avec la normale à la surface
d'émission est toujours inférieure à celle rayonnée dans la direction du vecteur . Ainsi par simple
application des règles trigonométriques nous obtenons la définition de la "luminance" (ou "radiance") :
(39.19)

exprimée dans certains domaines, en unité photométrique en "Nits" ou en unité photonique en

Remarque: Lorsque nous nous préoccupons que de la lumière visible, la luminance d'une source est quelque
fois appelée "brillance" ou "éclat" (attention ceci n'est pas le cas lorsque l'on traite de l'éclat comme il est vu
en astrophysique).

Nous pouvons aussi écrire :

(39.20)

qui nous donne l'intensité énergétique que rayonne une source de luminance L dans une direction donnée.

Jean-Henri Lambert (1728-1777) a observé que l'intensité énergétique de certaines sources (parmi toutes les
types de sources imaginables...) anisotropes diminue comme le cosinus de l'angle , autour de la direction
perpendiculaire à la surface de la source :

(39.21)

Cette variation de l'intensité est observée lorsque nous mesurons l'énergie thermique rayonnée par un orifice
percé dans un four (ce qui nous ramène au corps noir), isolé thermiquement et dont la température interne
est supérieure à la température externe. Dans ce contexte, l'orifice est appelé un "émetteur Lambert" et ne
balaye un espace que de stéradian.

Remarque: Une source qui obéit à cette loi est dite "source orthotrope".

LOI DE LAMBERT

Une source obéit à la loi de Lambert si sa luminance énergétique est la même dans toutes les directions,
c'est-à-dire que son intensité est isotrope et donc indépendante de l'angle .

Nous avons alors :

(39.22)

Calculons l'émittance d'un émetteur Lambert :

Nous avons donc par définition même de la propriété d'un émetteur Lambert :

(39.23)

et nous avons :
(39.24)

Or nous avons démontré dans le chapitre de Trigonométrie, qu'un angle solide élémentaire était donné par :

(39.25)

Ce qui nous amène à écrire :

(39.26)

En appliquant une intégration par parties (cf. chapitre de Calcul Différentiel Et Intégral) :

(39.27)

L'émittance valant :

(39.28)

Ce résultat est important pour l'étude du rayonnement du corps noir, puisque la valeur de la luminance
mesurée par un capteur permet de déduire l'émittance M, donc le flux énergétique de la source :

(39.29)

Remarque: Nous parlons de la "luminance" d'une source et de "l'éclairement" d'un objet (par une source).

LOI DE KIRCHHOFF

Tout corps irradié par une source énergétique voit le flux énergétique incident se répartir selon trois termes
intuitifs :

(39.30)

où :

- est le flux énergétique géométrique réfléchi ou diffusé

- est le flux énergétique qui traverse le corps sans interactions (transparence intégrale)

- est absorbé et transformé sous d'autres formes d'énergie

Les trois coefficients appelés respectivement "facteur de réflexion" , "facteur de transmission" et


"facteur d'absorption" , dépendent de la longueur d'onde de la lumière incidente et de la température du
corps récepteur.

Pour chaque objet, nous avons bien évidemment :


(39.31)

qui est l'expression de la "loi de Kirchhoff simple" (contrairement à la version différentielle) en photométrie.

Remarque: En physique, nous retrouvons souvent des énoncés de conservation sous la dénomination "loi de
Kirchhoff" comme en électrocinétique par exemple.

DÉCOMPOSITION SPECTRALE

De ce qui vient d'être dit, il découle que toutes les grandeurs définies précédemment peuvent êtres
rapportées à leur décomposition spectrale en longueur d'onde. Ceci résulte du principe de superposition :
tout rayonnement peut être traité comme la superposition de rayonnements monochromatiques.

Ainsi, nous définissons :

(39.32)

et de même :

(39.33)

Remarque: Les unités du flux spectral (ou "décomposé"), intensité spectrale (ou "décomposée"), luminance
spectrale (ou "décomposée") ou émittance spectrale (ou "décomposée") ainsi que les facteurs d'absorption
spectrale (ou "décomposée"), de réflexion spectrale (ou "décomposée") et de transmission spectrale ne sont
bien sûr pas équivalents à leur expression intégrée au niveau dimensionnel.

Nous aurons un grand besoin de la densité de l'émittance lors de l'étude du corps noir dans le chapitre de
Thermodynamique de la section de Mécanique. Rappelez-vous uniquement que nous avons en unités S.I. sur
le principe de décomposition (et inversement superposition) spectrale :

(39.34)

Remarque: Nous avons vu en thermodynamique que les paramètres définis ci-dessus, étant dépendants de la
longueur d'onde sont également dépendants de la température qui émet ces mêmes ondes.

LOI DE RÉFRACTION

Pierre de Fermat proposa que les rayons lumineux répondaient à un principe très général selon lequel le
chemin emprunté par la lumière pour se rendre d'un point donné à un autre était celui pour lequel le temps
de parcours était minimum (en fait un extremum qui peut être un minimum ou un maximum). Cette
proposition, appelée "principe de Fermat", à la base de l'optique géométrique s'appuie sur le principe de
moindre action (principe que nous avons déjà introduit dans le chapitre de Mécanique Analytique) ce que
nous démontrerons plus loin.

Définition: "L'indice de réfraction" d'un milieu à une longueur d'onde donnée mesure le facteur de réduction
de la vitesse de phase de la lumière dans le milieu par rapport au vide (la plus grande qui soit).

Tous les matérieux possèdent ainsi un indice de réfraction, d'une valeur positive et supérieur à 1. Plus un
milieu est dense, plus la vitesse de phase de la lumière est ralentie, plus l'indice de réfraction est élevé.
Considérons (voir figure ci-dessous) deux milieux et d'indices de réfraction respectifs n et m et dont
la surface de contact est plane. Prenons deux points A et B situés respectivement dans le milieu d'indice n (le
point A) et dans le milieu d'indice m (le point B).

Considérons le chemin de la lumière allant de A à B. Le principe de Fermat nous enseigne que le chemin
emprunté par la lumière est tel que le temps mis pour le parcourir est minimum. Nous nous proposons dans
un premier temps d'appliquer une méthode classique pour calculer le chemin du rayon lumineux et dans un
second temps, nous montrerons que le principe de Fermat peut être énoncé comme un principe variationnel.

Choisissons un repère qui simplifie le problème: faisons passer l'axe des abscisses par le plan de contact des
deux milieux et l'axe des ordonnées par le point B. Dans un tel repère, les points A et B ont les coordonnées
suivantes: .

Appelons , le point où le rayon lumineux traverse la surface de contact entre les deux milieux. Le
temps T mis pas la lumière pour aller de A à B est alors:

(39.35)

où :

et (39.36)

sont les vitesses de phase de la lumière dans les milieux et .

Nous pouvons observer sur la figure ci-dessus que les rayons incidents sont réfractés de l'autre côté de l'axe
perpendiculaire à l'interface. Ceci est une caractéristique type des matériaux ayant un indice de réfraction
positif. Mais il est possible physiquement de construire depuis les années 1990 des "métamatérieux"
composites artificiels à indice de réfraction négatif.

L'écriture des deux relations précédentes :

et (39.37)
se justifie par le fait que nous pouvons nous se permettre de faire l'hypothèse que la vitesse de phase de la
lumière ne croît pas en traversant un corps dense mais se voit diviser par un facteur donné dépendant du
milieu qu'elle traverse. Pour s'en convaincre, il suffit d'imaginer un cas absurde où la lumière traverserait
sans perte de vitesse un corps de densité infinie!

En développant les valeurs de AM et MB nous obtenons la dépendance suivante de T en fonction de la


position x de M :

(39.38)

Selon le principe de Fermat, le chemin emprunté par la lumière est celui pour lequel T est minimum.
L'extremum de T(x) est atteint lorsque sa dérivée par rapport à x est nulle.

(39.39)

Notons que:

et (39.40)

où r est "l'angle de réfraction" (à ne pas confondre avec "l'angle de réflexion"!) et i "l'angle d'incidence" de
la lumière allant de A à B.

La condition d'un temps extremum mis par la lumière s'exprime alors:

(39.41)

D'où nous tirons la relation, connue sous le nom de "loi de Snell-Descartes" (qui n'est plus une loi puisque
démontrée):

(39.42)

Il suffit que les angles d'incidence et de réfraction remplissent cette condition pour que le chemin parcouru
par la lumière soit effectivement celui qui prend le moins de temps.

Nous notons plus fréquemment cette loi en physique de la manière suivante :

(39.43)

où est "l'indice de réfraction relatif" du milieu 2 par rapport au milieu 1 qui ont respectivement leur
propre "indice de réfraction absolu" .

Remarques:
R1. Nous verrons lors de notre étude de l'optique ondulatoire que nous pouvons retrouver (démontrer) cette
même relation mais sans les hypothèses de bases de l'optique géométrique. Dès lors, cette dernière relation
est appelée "relation de Descartes-Snellius" ou plus simplement "loi de Snell".

R2. Quand nous parlons de l'indice de réfraction d'un milieu m sans faire référence à un autre milieu, le
milieu implicite est le vide.

R3. Certains matériaux n'ont pas un indice de réfraction isotrope : il dépend alors de la direction de
propagation et l'état de polarisation de la lumière. Cette propriété porte le nom de "biréfringence".

Etudions maintenant la relation entre l'indice de réfraction relatif et la vitesse de phase la lumière dans les
différents milieux qu'elle traverse:

Un rayon lumineux relie deux point et situés de part et d'autre de S. Ce rayon n'est pas représenté dans
la figure. Ne sont tracés que trajets situés de part et d'autre du rayon qui réalise l'extremum (nous nous
basons sur l'étude du trajet maximum maintenant). Par hypothèse, ils sont extrêmement proches, si bien que
la distance est très faible:

(39.44)

Nous admettons qu'ils correspondent au même temps de parcours.

(39.45)

Puisque les deux trajets sont très proches, nous pouvons admettre l'égalité des distances et d'une
part, et de l'autre. Ainsi, par hypothèse:

(39.46)
Mais, sous la même hypothèse:

(39.47)

si bien que:

(39.48)

La "loi de la réfraction" s'énonce finalement en général:

(39.49)

Quant à "l'angle de réflexion", ce dernier est égal à l'angle d'incidence si la surface de réflexion est
parfaitement régulière et plate.

Le principe de Fermat présente donc d'évidentes similitudes avec le principe de moindre action en cela qu'il
consiste en un principe du minimum. Bien qu'une description rigoureuse de la lumière nécessite
l'introduction de la physique quantique il est toutefois possible de l'appréhender par le biais de la mécanique
analytique et de lui appliquer, sous certaines conditions, le principe de moindre action. Nous allons montrer
que nous retrouvons ainsi le principe de Fermat.

Les calculs que nous allons présenter introduisent de nombreuses hypothèses hasardeuses mais en tout état
de cause, ce procédé doit être considéré comme une approximation. A noter que le principe de Fermat
procède lui aussi d'une même approximation que nous pouvons qualifier de "limite classique".

Imaginons que la lumière est composée de "grains" matériels. Il faut alors admettre que ces grains obéissent
à des propriétés physiques plutôt singulières: leur masse est nulle puisque selon la description classique, les
rayons lumineux ne sont pas déviés par le champ gravitationnel. Cette absence de masse les rend donc
insensibles au champ gravitationnel terrestre (attention ! nous sommes dans une description "classique").

Ecrivons l'action pour l'un de ces grains de lumière :

(39.50)

Or, en supposant que le seul champ de potentiel V présent est celui qui dérive du champ gravitationnel et que
nous admettons que la lumière comme y étant insensible (nous savons en relativité général que cela est faux
mais nous avons précisé tout à l'heure que nous ferions des approximations), il s'ensuit que l'action de la
lumière peut s'écrire:

(39.51)

Or, aucune force ne s'applique sur la lumière, par conséquent l'énergie cinétique T est une constante du
mouvement. Appliquons le principe variationnel de moindre action:

(39.52)
D'où nous tirons:

(39.53)

Cette équation signifie que le temps mis par la lumière le long de sa trajectoire est minimum (ou plus
généralement, est un extremum). Nous retrouvons le principe de Fermat. Nous avons donc montré, qu'à la
limite classique et sous certaines hypothèses, le principe de Fermat découle directement du principe de
moindre action.

EFFET TCHERENKOV (CERENKOV)

Nous avons vu dans les paragraphes précédents l'hypothèse (relativement intuitive) que la vitesse de phase
de propagation de la lumière dans un milieu d'indice de réfraction n n'était pas égal à c mais toujours
inférieur en écrivant cela :

(39.54)

L'effet Tcherenkov est (basiquement) un phénomène similaire à une onde de choc (en acoustique),
produisant un flash de lumière, et qui a lieu sur le trajet d'une particule chargée se déplaçant dans un milieu
avec une vitesse de phase supérieure à la vitesse de la lumière du milieu (l'explication rigoureuse sort du
cadre d'étude de ce site de par sa complexité de traitement!).

Effectivement, rappelons d'abord que nous avons vu dans le chapitre d'Électrodynamique que toute particule
chargée en mouvement émettait une radiation électromagnétique. Ensuite, nous avons vu dans les
paragraphes précédents que la vitesse de la lumière dans un milieu donnée dépendait de l'indice de réfraction
de ce milieu (hypothèse qui se vérifie par la justesse expérimentale des développements théoriques qui en
découlent).

Remarques:

R1. C'est cet effet qui provoque la luminosité bleue de l'eau entourant le coeur d'un réacteur nucléaire.

R2. Parfois certains se demandent pourquoi les particules chargées peuvent aller plus vite que la lumière
dans un milieu autre que le vide. C'est simple au fait : même si les deux particules rencontrent à peu près les
mêmes obstacles et difficultés à se propager le photon ne peut être accéléré par une impulsion alors qu'une
particule chargée peut se voir être accélérée par un phénomène donné dans un milieu donné.

Nous avons donc deux données de bases. La vitesse de la particule chargée qui peut s'écrire sous la forme
suivante avec les notations relativistes :

(39.55)

et la vitesse de de phase de la lumière dans un milieu avec un indice de réfraction donné :

(39.56)

Il est facile de voir que pour obtenir il faut avoir :

(39.57)
Soit :

(39.58)

Certains auteurs préfèrent comparer la distance parcourue par la lumière par rapport à celle parcourue par la
particule. Il vient ainsi :

(39.59)

Et donc pour que la particule parcoure des distances égales à celles de la lumière dans le même temps il faut
que . Au-delà, apparaît l'effet Tcherenkov.

FORMULES DE DESCARTES

Nous avons discuté précédemment certains phénomènes qui se produisent lorsqu'un front d'onde passe d'un
milieu à un autre dans lequel la propagation est différente. Non seulement nous avons analysé ce que devient
le front d'onde, mais encore nous avons introduit le concept de "rayon" qui est particulièrement utile pour les
constructions géométriques. Nous nous proposons maintenant d'approfondir les phénomènes de réfraction et
de réflexion d'un point de vue géométrique en utilisant le concept de rayon comme l'outil permettant de
décrire les processus qui prennent place aux surfaces de discontinuité de la propagation. Nous admettrons
également que les processus se limitent à des réflexions et réfractions, aucune autre modification n'affectant
les surfaces d'onde.

Ce traitement géométrique est correct tant que les surfaces et les discontinuités rencontrées par l'onde au
cours de sa propagation sont très grandes devant la longueur d'onde. Tant que cette condition est remplie, le
traitement s'applique aussi bien aux ondes lumineuses, acoustiques (en particulier ultrasonores - très hautes
fréquences), sismiques, etc.

Nous commençons par considérer la réflexion des ondes sur une surface. Nous devons d'abord établir
certaines définitions. Le centre de courbure C (cf. chapitre de Géométrie Différentielle) est le centre de la
surface sphérique de la figure ci-dessous et le sommet O est le pôle de la calotte sphérique.

Définition: La droite passant par O et C est appelée "axe optique".

Si nous prenons O pour origine des coordonnées, toutes les quantités mesurées à droite de O seront prises
comme positives, toutes celles à gauche comme négatives.
(39.60)

Supposons que le point P soit une source d'ondes sphériques. Le rayon donne par réflexion le rayon
et, comme les angles d'incidence et de réflexion sont égaux par rapport à la perpendiculaire AC de la
surface (comme nous l'avons déjà fait remarquer lors de notre étude de la réfraction), nous voyons sur la
figure que :

et (39.61)

d'où :

(39.62)

En admettant que les angles et sont très petits, c'est-à-dire que les rayons sont "para-axiaux" et que
la source est très distante ou que le détecteur est très petit par rapport à la source, nous pouvons écrire avec
une bonne approximation (développement de MacLaurin pour de petits angles) :

(39.63)

En substituant ces valeurs approximatives de et dans , nous obtenons :

(39.64)

qui est la "formule de Descartes pour la réflexion sur une surface sphérique concave". Elle implique, dans
l'approximation utilisée pour l'établir, que pour tous les rayons incidents passant par P passeront par Q après
réflexion sur la surface. Nous pouvons alors dire que Q est "l'image de l'objet" P.

Dans le cas particulier où le rayon incident est parallèle à l'axe optique, ce qui équivaut à placer l'objet à une
très grande distance du détecteur, nous avons . La formule de Descartes devient alors :
(39.65)

et l'image se forme au point F appelée "foyer", et sa distance du détecteur donnée par :

(39.66)

est appelée "distance focale".

La relation obtenue précédemment est également valable pour une surface convexe. Effectivement, il suffit
de tirer les traits représentant les rayons lumineux au-delà de la surface concave pour voir que l'objet d'étude
est le même à une symétrie près :

(39.67)

La seule différence entre la surface concave et convexe tient au fait que dans le cas de la surface convexe,
l'image de l'objet réfléchi apparaît comme s'il semblait être derrière la surface (à l'équivalent du point P).
Ceci nous amène à définir la terminologie suivante :

Définition: Dans le cas d'une surface concave, nous disons que l'image d'un objet est une "image réelle"
alors que dans le cas d'une surface convexe, nous disons que l'image d'un objet est une "image virtuelle".

Remarque: Si l'ouverture du miroir est grande, de telle sorte qu'il reçoive des rayons fortement inclinés la
formule de Descartes que nous avons précédemment déterminé n'est plus, nous le savons, une bonne
approximation Il n'y a plus dans ce cas une image ponctuelle bien définie d'un "point objet", mais un nombre
infini d'entre elles : en conséquence l'image d'un objet de grandes dimensions apparaît flou puisque les
images se superposent. Cet effet porte le nom "d'aberration de sphéricité" et la partie de l'axe optique qui
contient l'ensemble des images réfléchies s'appelle alors la "caustique par réflexion". L'aberration de
sphéricité ne peut pas être éliminée, mais un dessin approprié de la surface permet de la supprimer pour
certaines positions sur l'axe optique appelées "stigmatiques". Par exemple, dans notre cas d'étude précédent,
il est évident (par construction géométrique) que si nous posons P en C, alors le point C devient alors le
point stigmatique. Nous disons alors qu'il est le point "rigoureusement stigmatique".

Par contre pour le miroir parabolique tous les rayons convergent vers le foyer du miroir où est concentrée
l'énergie lumineuse reçue par le miroir. Réciproquement, nous plaçons le filament d'une lampe au foyer d'un
miroir parabolique pour obtenir des projecteurs de grande portée. Nous donnons aussi une forme
parabolique aux antennes de réception des ondes hertziennes. Pour la télévision diffusée par des satellites
comme on travaille en ondes centimétriques (fréquence de quelques GHz) une distance focale de l'ordre du
mètre est convenable pour l'antenne (in extenso cela s'applique aux télescopes et radiotélescopes).

(39.68)

L'idée pour démontrer que le foyer de la parabole est le point stigmatique rigoureux est la suivante :

Reprenons le schéma que nous avons utilisé lors de notre étude des coniques dans le chapitre de Géométrie
Analytique :

(39.69)

Nous y avons rajouté le point qui est la projection orthogonale du point M (point d'incidence du rayon
lumineux) ainsi que la tangente de la parabole au point M. Si nous arrivons à démontrer que la tangente à M
est la médiatrice du segment , alors nous démontrons également que l'angle d'incidence et de réflexion
sont bien égaux.

Prenons l'équation :

(39.70)

d'une parabole de paramètre (cf. chapitre de Géométrie Analytique) rapporté à un repère principal .
Le foyer à donc pour coordonnées et la directrice a pour équation :

(39.71)
Nous obtenons l'équation de la tangente en par la dérivée en ce même point (attention... rappelez-vous de
l'orientation particulière de la parabole!) :

(39.72)

Ce qui s'écrit encore :

(39.73)

et en sachant que :

(39.74)

nous obtenons donc l'équation de la tangent :

(39.75)

Un des vecteurs directeur de la tangente est donc alors :

(39.76)

D'autre part, nous avons (cela se vérifie facilement en posant ):

et (39.77)

Nous avons donc le produit scalaire :

(39.78)

comme les vecteurs et ont même norme d'après la définition de la parabole, nous en déduisons
déduit que le vecteur (directeur de la tangente) dirige la bissectrice de l'angle des vecteurs et et
donc par extension que la tangent à M est bien la médiatrice de .

Nous pouvons toujours dans le cadre des surfaces sphériques, déterminer le grandissement :
(39.79)

où pour rappel le centre de courbure C (cf. chapitre de Géométrie Différentielle) est le centre de la surface
sphérique de la figure ci-dessous et le sommet O est le pôle de la calotte sphérique.

Ainsi, le "grandissement" M d'un système optique est défini comme le rapport de la grandeur de l'image ab à
celle de l'objet AB, c'est-à-dire :

(39.80)

Nous voyons d'après la figure ci-dessus que :

(39.81)

Nous avons donc, en tant compte de ce que :

(39.82)

d'où :

(39.83)

Faisons maintenant une étude équivalente à celle effectuée précédemment, ayant les mêmes propriétés de
symétrie et les défauts, mais sur les "dioptres sphériques" (résultats intéressant pour ce qui est de l'étude de
l'oeil).

Nous allons donc considérer la réfraction au passage d'une surface sphérique séparant deux milieux d'indices
de réfaction absolus et (voir figure ci-dessous).
(39.84)

où pour rappel le centre de courbure C (cf. chapitre de Géométrie Différentielle) est le centre de la surface
sphérique de la figure ci-dessous et le sommet O est le pôle de la calotte sphérique.

Les éléments géométriques fondamentaux sont les mêmes que ceux définis pour les surfaces sphériques.

Nous considérons donc dans un premier temps un dioptre concave et observant que la "distance objet" est
situé à l'opposé des autres points, nous devons opter à une convention de signe pour mettre cette observation
en évidence dans les équations. Ainsi, q sera défini comme une valeur négative.

Un rayon incident tel que PA est réfracté suivant AQ et coupe donc l'axe optique en q. Nous observons sur la
figure que :

et (39.85)

Remarque: Nous avons opté pour pour refléter le fait que q est négatif d'après nos conventions de signe.
Sinon quoi, les relations trigonométrique remarquables nous donneraient un q positif.

Nous avons d'après la loi de Snell :

(39.86)

et nous admettrons comme pour les surfaces sphériques que les rayons sont peu inclinés. Dans ces
conditions les angles et sont très petits et que nous pouvons écrire à l'aide des développement
en série de MacLaurin et de sorte que la loi de Snell s'écrit :

(39.87)

D'après la figure nous pouvons faire les approximations :

(39.88)
de sorte qu'en substituant dans l'approximation de la loi de Snell nous trous après simplification élémentaire
:

(39.89)

qui constitue la "formule de Descartes pour la réfraction au passage d'une surface sphérique". Bien qu'elle ait
été démontrée dans le cas d'une surface concave, elle reste valable pour les surface convexe en tenant
compte alors de ce que r est négatif à son tour.

Le "foyer objet" appelé également "premier point focal" d'une surface sphérique réfringente est la
position d'un point objet de l'axe optique tel que les rayons réfractés soient parallèles à l'axe optique, ce qui
revient à former l'image du point à l'infini, où . La distance de l'objet à la surface sphérique est
appelée alors "distance focale objet", et nous la désignons par . En posant et . Nous avons
alors :

(39.90)

La distance focale est positive et le système dit "convergent" quand le foyer objet est réel, placé devant la
surface sphérique. Quand le foyer objet est virtuel la distance focale est négative et le système est dit
"divergent".

De même, si les rayons incidents sont parallèles à l'axe optique, ce qui revient à avoir un objet très éloigné
de la surface sphérique , les rayons réfractés passent par un point de l'axe optique appelé "foyer
image" ou "second point focal" (avec à nouveau les même problèmes de stigmatisme). Dans ce cas la
distance de la surface sphérique à l'image est appelée "distance focale image" et nous la désignons par .
En posant et nous avons alors :

(39.91)

Intéressons nous maintenant à un autre type de surface réfléchissantes et réfractantes: les lentilles.

Une lentille est par définition un milieu transparent limité par deux surfaces courbes (généralement
sphériques), bien que l'une des faces d'une lentille puisse être plane. Une onde incidente subit donc deux
réfractions à la traversée de la lentille. Admettons pour simplifier que les milieux de part et d'autre de la
lentille sont identiques et leur indice de réfraction égal à 1 (l'air ou le vide par exemple) tandis que l'indice
de réfaction de la lentille est n. Nous ne considérerons également que les lentilles minces, c'est-à-dire dont
l'épaisseur est très petite devant les rayons de courbure :
(39.92)

L'axe optique est maintenant la droite déterminée par les deux centres . Considérons le rayon incident
PA passant par P. Au passage de la première surface, le rayon incident est réfracté suivant le rayon AB. Si
nous le prolongions, le rayon AB passerait par Q' qui est donc l'image de P donnée par le premier dioptre. La
distance q' de Q' à s'obtient par l'application de la seconde formule de Descartes (sans oublier que la
première partie de la lentille est un dioptre convexe) :

(39.93)

Mais en ayant d'où :

(39.94)

En B le rayon subit une deuxième réfraction et devient le rayon BQ. Nous pouvons dire alors que Q est
"l'image finale" de produit par le système des deux dioptres constituant la lentille. Mais, en considérant la
réfraction en B, l'objet (virtuel) est Q' et l'image est Q, à une distance q de la lentille. Donc, en appliquant à
nouveau :

(39.95)

avec à nouveau et en prenant garde au fait que selon notre point de référence q
devient -q' nous avons alors :

(39.96)

En combinant les deux relations précédentes pour éliminer q' nous trouvons que :
(39.97)

ce que constitue la "formule de Descartes pour les lentilles minces". En écrivant cette équation, il convient
d'appliquer à la convention des signes que nous avons fixés, c'est-à-dire que les rayons sont positifs
pour une surface concave et négatifs pour une surface convexe, vue du côté duquel la lumière frappe la
lentille.

Le point O dans la figure précédente, est choisi de façon à coïncider avec le "centre optique" de la lentille.
Le centre optique à pour propriété d'être un point tel que tout rayon passant par lui sort parallèlement à la
direction du rayon incident!!

Pour montrer qu'en tel point existe, considérons, dans la lentille ci-dessous (à symétrie horizontale et
verticale) :

(39.98)

Considérons les deux rayons parallèles générateurs des dioptres (éléments de la lentille)
choisis tels que les plans tangents correspondants et sont par construction aussi parallèles.

Pour le rayon , dont la direction est telle qu'il se réfracte suivant , le rayon émergent est et
parallèle à de par la symétrie horizontale de la lentille. Ainsi, les triangles et étant
semblables quels que soient les "rayons générateurs", nous voyons ainsi que la position de O est satisfaite
par la relation :

(39.99)

et existe donc indépendamment des rayons générateurs.

Comme dans le cas d'un simple dioptre, le foyer objet , ou "premier point focal d'une lentille" est la
position de l'objet pour laquelle les rayons émergent parallèlement à l'axe optique ( ) après avoir
traversé la lentille. La distance de la lentille à est alors appelée "distance focale objet" nous la désignons
par f. En posant alors et dans l'équation de Descartes précédente, nous obtenons la distance
focale objet sous la forme :

(39.100)

que nous appelons parfois "équation de l'opticien".

Pour un rayons incident parallèle à l'axe optique (q - f) le rayon émergent passe un point , caractérisé par
, et appelé "foyer image d'une lentille" ou "second point focal d'une lentille". Par conséquent, dans une
lentille mince les deux foyers sont placés symétriquement de chaque côté.

Par ailleurs, si f est positif, la lentille est dite "lentille convergente", si f est négatif elle est dite "lentille
divergente".

Remarque: A nouveau, les problèmes d'aberrations sont aussi existants pour les lentilles.

ÉQUATION DE CONJUGAISON

Tout point d'un objet étendu (non ponctuel donc!) envoie de la lumière dans toutes les directions de l'espace.
Si une partie de cette lumière tombe sur une lentille, elle en émerge soit convergente en un point, soit
divergente en semblant venir d'un point image.

Pour trouver l'image, il suffit alors de considérer intuitivement les situations suivantes dans le cas d'une
lentille convexe (à gauche) ou concave (à droite):

1. Si les rayons lumineux, non confondus avec l'axe de symétrie horizontal de la lentille, passent par le
centre optique O de la lentille convexe ou concave, nous avons vu plus haut qu'à ce moment ils sortent alors
parallèles aux rayons entrants.

2. Si les rayons lumineux, confondus avec l'axe de symétrie horizontal de la lentille, passent par le centre
optique O de la lentille convexe ou concave (donc ils passent par le centre optique O) alors ils seront non
déviés (c'est une situation particulière du cas suivant!).

3. Si les rayons lumineux partant de l'objet et se dirigeant vers la lentille sont parallèles à l'axe de symétrie
horizontal de la lentille et non confondus ou confondus avec ce dernier, alors si la lentille est convexe nous
avons démontré qu'ils convergent tous sur un même foyer image .

4. Si les rayons lumineux partant de l'objet et se dirigeant vers la lentille sont parallèles à l'axe de symétrie
horizontal de la lentille et non confondus ou confondus avec ce dernier, alors si la lentille est concave nous
avons démontré qu'ils divergent tous et qu'ils ont une image virtuelle venant pour tous du foyer objet
(c'est la situation miroir du cas précédent!).

5. Tous les rayons partant de l'objet qui ne sont pas parallèles à l'axe de symétrie horizontal de la lentille et
qui ne passent pas par le foyer objet en se dirigeant vers la lentille convexe alors sortiront non parallèles
de la lentille.

6. Tous les rayons partant de l'objet qui ne sont pas parallèles à l'axe de symétrie horizontal de la lentille et
qui ne passent pas par le foyer objet en se dirigeant vers la lentille concave alors sortiront non parallèles
de la lentille (c'est le cas miroir du cas précédent).
Si nous sommes attentifs, nous voyons que les 6 situations ci-dessus qui sont intuitives peuvent se réduire
par symétrie miroir à 3 situations (1), (3), (5).

Appliquons cette superposition à l'exemple de la fleur ci-dessous située à une distance entre f et 2f d'une
lentille convergente (convexe).

Du sommet S, traçons ses 3 rayons. Ils convergent par construction géométrique (donc résultat à accepter tel
quel) au même point P (ce que nous avons démontré), qui est l'image du sommet S de la fleur mais à une
distance non symétrique par rapport à O. De même, E est l'image de D.

(39.101)

Le schéma ci-dessus fournit donc une relation analytique entre les distances de l'image et de l'objet et la
distance focale.

Les triangles et sont semblables et tous leurs angles sont donc égaux ce qui nous amène à écrire
par application du théorème de Thalès (cf. chapitre de Géométrie Euclidienne) :

(39.102)

où .

Les triangles SOD et POE sont aussi semblables d'où à nouveau par application de Thalès :

(39.103)

En combinant les deux derniers rapports, nous obtenons ainsi "l'équation de conjugaison" (qui ne s'accorde
pas...) :

(39.104)

L'application de cette équation est très importante. Elle permet en définissant à quelle distance on place un
objet de la lentille et en souhait avoir son image à une distance , quelle doit être la distance focale de la
lentille convergente (et ce indépendamment des indices de réfraction !).

Un peu de biologie... :
Le cristallin de l'oeil pouvant se déformer sous l'effet de certains muscles, constitue une lentille à focale
variable permettant d'accommoder la vision des objets à distance variable. La distance du centre optique à la
rétine étant fixe, le seul moyen de voir clairement des objets situés à des distances différentes est de modifier
la distance focale. Dans son état ordinaire, le cristallin a une configuration assez plate, avec un grand rayon
de courbure (il a alors une grand distance focale).

L'oeil à pour rôle de focaliser la lumière provenant d'un objet à l'infini (environ 25 centimètres pour un
humain moyen...) sur la rétine. Mais tous les yeux ne font pas cela correctement et le "punctum remotum"
(distance maximale de vision distincte sans accommodation) est parfois à une distance finie, même parfait
inférieur à cinq mètres (entraînant probablement une fatigue des yeux).

Si l'objet s'approche, les muscles se contractent, le cristallin gonfle et sa distance focale diminue de façon
que l'image se forme toujours sur sa rétine. Le point le plus proche qui peut être vu clairement avec le
maximum d'accommodation est appelé le "punctum proximum". Cette distance évolue beaucoup avec l'âge :
elle est de dix centimètres pour un enfant de dix ans, de cent centimètres pour une personne de soixante ans
(c'est la presbytie).

Il est habituel de parler de "puissance dioptrique" d'une lentille qui est simplement l'inverse de sa distance
focale. La puissance d'une lentille s'exprime ainsi en "dioptries" où .

Ainsi :

(39.105)

PRISME

En optique, le prisme est un des composantes les plus importants. On le retrouve en chimie, en physique de
la matière condensée, en astrophysique, en optoélectronique et encore dans beaucoup d'autres appareils
courants de la vie de tous les jours (comme les lentilles).

Nous allons dans les paragraphes qui suivent déterminer les relations les plus importantes à connaître
relativement aux prismes et utiles à l'ingénieur et au physicien.

Nous nous intéressons aux rayons lumineux entrant par une face et sortant par une autre ayant subit deux
réfractions (nous n'étudierons par les réflexions).

Voici la représentation type d'un prisme en optique géométrique avec le rayon incident S et sortant S ' et les
deux normales N, N ' aux arêtes du sommet d'ouverture . Plus les divers angles d'incidence et de
réfraction:
(39.106)

Nous savons que la somme des angles d'un quadrilatère (toujours décomposable en deux triangles dont la
somme des angles est ) vaut . Donc dans le quadrilatère délimité par les sommets 1234. Nous avons la
somme:

(39.107)

Maintenant que la situation est posée passons à la partie optique...

Nous avons quatre relations fondamentales à démontrer pour le prisme.

D'abord, nous avons au point d'incidence I et I ' la loi de Descartes qui nous permet d'écrire:

(39.108)

Comme l'indice de réfraction de l'air est de 1 alors nous avons simplement en I:

(39.109)

Dans la même idée en I ' nous avons:

(39.110)

Donc:

(39.111)

Nous avons aussi la relation:

(39.112)

Soit:

(39.113)
L'angle de déviation D est facile à déterminer. Il suffit de prendre le quadrilatère central:

(39.114)

Donc:

(39.115)

Nous avons donc les 4 relations fondamentales du prisme:

(39.116)

Connaissant i et i' et l'indice de réfraction m nous pouvons alors déterminer tous les paramètres.

L'idéal serait encore de pouvoir se débarrasser de la connaissance expérimentale de i'.

Nous avons donc:

(39.117)

Or:

(39.118)

Ainsi il vient:

(39.119)

Donc:

(39.120)

Puisqu'il est avéré que l'indice m d'un milieu varie avec la longueur d'onde on comprend aisément que le
prisme est capable de disperser la lumière blanche.

Enfin, si i est petit en prenant au premier ordre:

(39.121)

Dès lors, si i est petit, i/m l'est aussi donc:


(39.122)

Donc si i et sont petits:

(39.123)
40. OPTIQUE ONDULATOIRE

D ans ce chapitre seront dégagés certains éléments qui ont conduit au développement de la mécanique
quantique. Effectivement, la mécanique quantique est née, en premier lieu, d'une étude attentive de la nature
de la lumière. Bien que cette science nouvelle soit développée au début du 20ème siècle, les considérations
qui l'ont guidée alors sont incontestablement le résultat de 25 siècles de maturation. Au fond, c'est à une
longue histoire de la lumière pleine de contreverses que la mécanique quantique apporte enfin au 20ème
siècle une magistrale conclusion.

PRINCIPE D'HUYGENS

Huygens visualisait la propagation de la lumière comme résultant d'un processus de génération d'ondelettes
sphériques en chaque point atteint par un front d'onde, ondelettes dont la somme donnait le champ en
propagation. En traçant la tangente aux fronts d'onde des ondelettes à un instant donné, on obtenait le front
d'onde de l'onde totale à ce même instant.

Nous rappelons qu'une surface d'onde ou "front d'onde" (cf. chapitre de Mécanique Ondulatoire) est le lieu
des points du milieu atteins par le mouvement ondulatoire au même instant. La perturbation a donc même
phase en tous points d'une surface d'onde. Pour une onde plane, par exemple, la perturbation s'exprime par
(nous l'avons démontre dans le chapitre traitant de la Mécanique Ondulatoire) :

(40.1)

ou dans une formulation plus générale :

(40.2)

qui donne donc l'expression de la propagation de la perturbation pour laquelle la "surface d'onde" est le lieu
des points où la phase a même valeur à un instant donnée. La surface d'onde est donnée en
conséquence par l'équation :

(40.3)

Huygens, a donné une méthode imagée de représentation du passage d'une surface d'one à une autre dans le
cas où l'onde est supposée résulter du mouvement des particules constituant le milieu matériel. Ainsi, si nous
considérons la surface d'onde S ci-dessous :

(40.4)
Quand le mouvement ondulatoire atteint cette surface, chaque particule a,b,c,... de la surface devient une
source secondaire d'ondes, émettant des ondes secondaires (indiquées par les petits demi-cercles) qui
atteignent la couche suivante de particules du milieu. Ces particules sont mises en mouvement et forment la
nouvelle surface d'onde S' et ainsi de suite... Ainsi, Huygens avait une conception ondulatoire de la lumière,
mais il ne considérait pas la nature périodique de l'onde, ce qui ne lui permettait pas d'introduire la notion de
couleur de la lumière; de plus, selon son principe, une onde se propageant en sens inverse à celui de l'onde
incidente devrait aussi se manifester, ce qui n'est pas le cas dans un matériau homogène.

L'intuition d'Huygens est cependant proche de la réalité, comme le montrera Fresnel dans sa théorie de la
diffraction. Il faudra cependant attendre Kirchhoff, qui introduira un facteur d'inclinaison (oblicité) dans la
théorie, pour obtenir une explication de l'absence d'onde se propageant vers l'arrière (le temps venu nous
rédigerons les développements y relatifs).

LOI DE MALUS

Comme tous les "points correspondants" .sont équidistants, par le principe


d'Huyghens, la "loi de Malus" (la première donc et pas celle obtenue lors de l'étude de la polarisation de la
lumière comme nous le verrons plus loin) affirme que l'intervalle de temps entre les points correspondants
de deux surfaces d'onde est le même pour tout couple de points correspondants.

Conséquences (se référer en même temps à la figure ci-dessous) :

(40.5)

- Lorsque l'onde se propage dans un milieu homogène, les rayons lumineux doivent être rectilignes et les
surfaces d'onde rester parallèles.

- Lorsque l'onde change de milieu, les distances entre deux paires de points correspondants varient d'un
milieu à l'autre, si les vitesses de propagation sont différentes.

Cette loi permet de retrouver le loi de Descartes-Snellius que nous avons déjà démontré en optique
géométrique, ce qui assure à priori que le principe d'Huygens reste valide dans le cadre de l'optique
géométrique.

Démonstration:

Selon la figure ci-dessus, nous avons :


(40.6)

en divisant chaque terme par , nous obtenons :

(40.7)

Comme nous obtenons donc bien la loi de Descartes-Snellius telle que nous l'avions obtenu en
optique géométrique :

(40.8)

DIFFRACTION DE FRAUNHOFER

Du point de vue de l'optique géométrique, un faisceau lumineux est un cylindre de section qui rassemble
un grand nombre de rayons parallèles. Il est donc supposé rectiligne lorsqu'il est défini dans un milieu
homogène.

L'émittance énergétique du faisceau ne varie que si une lentille (ou un autre dispositif) fait varier
sa section ou si le milieu absorbe de l'énergie.

Le faisceau lumineux "éclate" quand un obstacle ne laisse passer qu'une partie de sa section.

Le principe d'Huygens montre que ce sont les bords de l'obstacle qui engendrent cette diffraction.

Le phénomène est général mais n'est bien observable que si le rapport est très grand. L étant la longueur
des bords. Cette condition est nécessaire pour que l'intensité de la partie non diffractée du faisceau ne
masque pas l'effet.

Définitions:

D1. Nous parlons de "diffraction de Fraunhofer" lorsque, comme supposé précédemment, les rayons
lumineux incidents sont parallèles et le phénomène observé à relativement grande distance de l'écran.

D2. Nous parlons de "diffraction de Fresnel" lorsque les rayons incidents forment un faisceau divergent, en
provenance d'une source ponctuelle ou si nous observons le phénomène à faible distance.

Considérons un cas générique et le plus répandu dans les laboratoires de physique qui est la diffraction par
une fente rectangulaire étroite :

Pour cela, nous considérons que le faisceau incident est une onde électromagnétique plane et périodique,
perpendiculaire à la fente et donnée par :

(40.9)

Rappel : Sa longueur d'onde étant donnée par

CAS D'UNE FENTE RECTANGULAIRE


La largeur e de la fente est orientée selon l'axe y, sa hauteur h est supposée très grande afin de pouvoir
négliger l'effet des extrémités.

Suivant le principe d'Huygens, le front de l'onde plane, délimité par la fente, constitue une multitude de
sources , de largeur dy, qui émettent, en phase, des ondelettes sphérique décrites par leur vecteur
champ associée :

(40.10)

Considérons maintenant un point d'observation P, à une distance R de la source (assimilée à la fente). Nous
avons vu lors de l'étude des sources d'émission de type sphériques (cf. chapitre d'Électrodynamique) que leur
amplitude diminuait de manière inversement proportionnelle à la distance telle que :

(40.11)

Or, les ondelettes, suivant à quel point de la fente elles sont assimilées, ne vont pas toutes parcourir la même
distance R mais un distance propre r . Cependant, si R est suffisamment éloigné de la fente, nous nous
permettrons d'approximer :

(40.12)

reste encore le terme périodique où nous posons . Or, nous avons pour valeurs extrêmales
:

(40.13)

Ces valeurs correspondant respectivement, à l'avance et au retard des fonctions d'onde décrivant la
propagation des ondelettes dans les extrémités de la fente.

Effectivement, il suffit de voir la figure ci-dessous, en considérant donc et ainsi :


(40.14)

Ainsi, nous avons :

(40.15)

Donc les différentes ondelettes sont déphasées et produisent ainsi des interférences.

Définition: En mécanique ondulatoire, on parle "d'interférences" lorsque deux ondes de même type se
rencontrent. Ce phénomène se rencontre souvent en optique avec les ondes lumineuses, mais il apparaît
également avec les ondes sonores.

L'onde diffractée dans la direction de , est alors donnée par la somme de toutes les contributions :

(40.16)

Sachant que (relations trigonométrique) :

(40.17)

Nous avons donc :


(40.18)

Nous avions démontré dans le chapitre d'Électrodynamique que l'énergie (in extenso l'intensité) d'une onde
électromagnétique était donnée (dans le vide) par la valeur scalaire moyenne du vecteur de Poynting :

(40.19)

Nous avons donc :

(40.20)

qui est l'émittance lumineuse émise dans la direction .

Si nous introduisons le sinus cardinal que nous avons déjà rencontré lors de notre étude des transformées de
Fourier dans le chapitre sur les Suites et Séries nous avons alors l'écriture de la relation précédente qui se
trouve nettement condensée:

(40.21)

Dont nous pouvons avoir une forme générique tracée avec Maple en utilisant:

>Gamma:=3;plot((sin(Gamma*x)/(Gamma*x))^2, x=-Pi..Pi);

Donc nous pouvons obtenir le même résultat en prenant le module au carré de la transformée de Fourier d'un
signal monochromatique au travers d'une fenêtre rectangulaire. Ainsi, il semble possible d'étudier les
phénomènes de diffraction en utilisant la transformée de Fourier et ce domaine se nomme "l'optique de
Fourier".

Voici une représentation graphique du rapport pour différentes valeurs du rapport :


(40.22)

De part et d'autre de la frange centrale, il y en a d'autres, plus étroites et disposées symétriquement. Leur
intensité diminue très rapidement selon le terme prépondérant au dénominateur :

(40.23)

Dont voici une image réelle:

(40.24)

Entre les franges, se trouvent des zones d'obscurité qui sont le siège d'interférences destructives. Leur
position sont données par la condition :

(40.25)

sauf pour où l'on observe un maximum !


Nous observons donc des franges sombres dans les directions :

(40.26)

Ainsi, la largeur angulaire de la frange centrale est le double de la valeur angulaire obtenue pour le premier
minimum :

(40.27)

Nous obtenons la largeur des pics suivants, comme suit :

Deux minima successifs satisfont donc les conditions :

(40.28)

Ainsi :

(40.29)

En posant:

(40.30)

il vient dès lors :

(40.31)

Puisque l'émittance énergétique diminue très rapidement, seules les premières franges (pour lesquelles
) sont observables. Il reste :

(40.32)

Les positions des maxima sont elles données par la condition :


(40.33)

Posons :

(40.34)

La résolution numérique de :

(40.35)

donne (en radians) :

(40.36)

Les positions des maxima successifs sont alors :

(40.37)

etc...

Nous aurions facilement pu obtenir une approximation convenable de ce résultat, en considérant que
l'intensité est maximale lorsque :

(40.38)

Ce qui nous amène à écrire :

avec (40.39)
Remarque: Un résultat remarquable de l'expérience de Fraunhofer est qu'elle remet en question la vision
corpusculaire de la lumière telle que nous l'avions au 19ème siècle.

Effectivement, beaucoup d'expériences telle que la projection de l'ombre d'un objet sur un mur semblait bien
montrer que la lumière était tel un corpuscule ne traversant pas la matière et étant stoppée net par tout
obstacle que ce soit en son centre ou en ses bords (il faut attirer votre attention sur les "bords" en
particulier).

Or, l'expérience de Fraunhofer ainsi qu'en particulier celle de Fresnel en ce qui concerne les bords (nous la
verrons plus loin car elles est mathématiquement plus délicate à aborder), montrent bien que la lumière
semble pouvoir se comporter non pas comme un simple corpuscule mais bien comme une onde (à partir du
principe de d'Huygens que nous avons utilisé pour nos développements) tel que nous l'ont montré les
développements précédents qui expliquent parfaitement bien les résultats expérimentaux des diffractions de
Fraunhofer.

Mais alors pourquoi garder le modèle corpusculaire de la lumière? Tout simplement pour d'autres résultats
expérimentaux et théoriques dont pour les plus connus tel que l'effet photo-électrique ou la diffraction
Compton (cf. chapitre de Physique Nucléaire) qui s'expliquent théoriquement à merveille si ce n'est
parfaitement avec un modèle corpusculaire de la lumière (et certaines autres particules de dimension, charge,
spin, etc. donné).

Au fait, comme nous le verront dans le chapitre de Physique Quantique Ondulatoire, c'est le physicien De
Broglie qui va mettre définitivement un terme à cette dualité paradoxale en reliant à l'aide des outils de la
mécanique relativiste et physique quantique ondulatoire les deux aspects mathématiquement.

POUVOIR DE RÉSOLUTION

Selon le critère du physicien anglais Lord Rayleigh : le "pouvoir de résolution" (ou "pouvoir séparateur
angulaire") d'une fente, est l'angle entre deux rayons lumineux de longueur d'onde , issus de deux
sources ponctuelles , éloignées, dont les figures de diffractions sont séparées telles que le premier zéro
de la figure de diffraction se trouve à la place du maximum de l'autre:
(40.40)

Ce concept est énormément utilisé en photographie, astronomie, radioastronomie, etc. Il convient donc d'y
porter une attention toute particulière!

Or, nous avons vu que les minimas étaient donnés par :

(40.41)

et donc pour :

(40.42)

Donc le pouvoir séparateur angulaire est proportionnel au rapport de la longueur d'onde à l'épaisseur de la
fente. Evidemment dans la pratique le but est d'avoir une valeur d'angle la plus grande possible (sinon
les objets de confondent et l'image est floue).

Pour augmenter le pouvoir de résolution il faut donc soit travailler à une longueur
d'onde plus courte soit augmenter l'épaisseur de la fente de l'instrument et comme la longueur d'onde est
souvent imposée par le sujet d'expérience il est naturel de vouloir de faire varier e.
Si la lumière qui passe à travers une fente forme une image sur un écran, et que l'image est observée au
microscope par exemple, il est impossible, quel que soit le grandissement du microscope, d'observer plus de
détails dans l'image qu'il n'est permis par le pouvoir de résolution de la fente. Il faut tenir compte de ces
considérations dans la conception des instruments d'optique.

CAS D'UNE RÉSEAU DE FENTES RECTANGULAIRES

Considérons maintenant un réseau de N fentes étroites de largeur , de hauteur et distantes de d.


Un unique faisceau incident éclaire toutes les fentes.

Remarque: L'étude de ce modèle va nous permettre de comprendre en partie comment fonctionne le prisme
et le fonctionnement des goniomètres utilisé en astronomie pour l'analyse du spectre ainsi que la diffraction
par rayons X par un réseau d'atomes (donc l'importance est non négligeable).

Soit le schéma suivant :

(40.43)

Nous voyons sur le schéma ci-dessus que pour certaines directions , la distance est telle que des
interférences constructives ou destructives se réalisent.

Posons que le réseau est placé dans le plan YZ et que la direction du faisceau ce fait selon l'axe X. Plaçons
nous en un point d'observation P situé dans le plan XY. Selon les propriétés des ondes électromagnétiques
(cf. chapitre d'Électrodynamique), le vecteur champ électrique de l'onde émise par la fente est
perpendiculaire à la direction d'observation et peut s'exprimer par :

(40.44)

et nous avons vu que :

(40.45)

d'où :
(40.46)

Dans une direction quelconque, les ondes issues de deux fentes adjacentes sont déphasées de et au
point P d'observation, le champ électrique résultant est donné par la somme des contributions de chaque
fente avec son décalage propre. D'où :

(40.47)

Nous voyons donc que chaque onde est déphasée de :

(40.48)

Nous pouvons maintenant représenter en utilisant les phaseurs (cf. chapitre de Mécanique
Ondulatoire) dans l'espace des phases tel que :

(40.49)

Ce qui donne graphique pour le deuxième terme contenant la variable de sommation j pour une distance R
fixe :

(40.50)

Nous voyons que les mis bout à bout forment un polygone régulier, inscrit dans un cercle de rayon :
(40.51)

La norme du champ électrique résultant étant égale à la corde définie par l'angle :

(40.52)

nous aurons :

(40.53)

L'énergie lumineuse (in extenso l'intensité) émise dans la direction étant proportionnelle au carré du
champ électrique (cf. chapitre d'Électrodynamique), nous avons alors pour les interférences destructives ou
constructives :

(40.54)

Nous substituons maintenant par l'expression trouvée lors de notre étude plus haut de la diffraction par
une seule fente :

(40.55)

Ainsi, nous obtenons pour l'addition des effets d'interférences et de diffraction :

(40.56)

Bien que cette relation semble compliquée, tous ses paramètres n'ont pas la même importance pratique.

En effet considérons la fonction :


(40.57)

Le terme A présente des maxima lorsque :

(40.58)

et des valeurs nulles si :

avec (40.59)

Bien que le terme B fasse diverger la relation pour , la règle de l'Hospital (cf. chapitre de Calcul
Différentiel Et Intégral) nous donne que :

(40.60)

Il en résulte que pour et donc des valeurs nulles de A et de B, la fonction présente des énormes
pics de hauteur .

Vu leur grande amplitude, les pics principaux sont ceux que l'on observe expérimentalement le plus
facilement. Ainsi, la position angulaire des maxima de la fonction est donnée par :

(40.61)

La valeur de n, qualifie le "numéro d'ordre du maximum d'interférence".

Appliquons ses résultats à la relation d'interférence :

(40.62)

Le pic d'ordre n est centré sur la valeur équivalente qui annule le numérateur et le dénominateur de cette
fraction tel que :

(40.63)

d'où :

(40.64)

Ainsi, un réseau dont nous connaissons la valeur d du pas peut utilisée pour mesurer la longueur d'onde
d'une lumière incidente inconnue.
Cependant, si la lumière incidente est polychromatique (typiquement pour les observations astronomiques),
la relation précédente nous donne pour une longueur d'onde donnée la position des franges d'interférences.
Ainsi, un astronome faisant passer de la lumière polychromatique de son télescope par un réseau diffraction
faire une analyse spectroscopique de la lumière.

La relation nous donne également que pour des valeurs fixes de m et d, plus est grand, plus l'angle l'est
aussi dans un intervalle compris entre . Ainsi, les raies spectrales résultant de l'incidence d'un
faisceau polychromatique montrent un spectre allant du violet (faible longueur d'onde donc petit angle) au
rouge (grande longueur d'onde donc grand angle).

Au moyen d'un goniomètre, nous mesurons les angles des pics principaux d'ordre m, pour le plus grand
nombre possible de valeurs de m. Nous en déduisons de la pente du graphique :

(40.65)

Le pied du pic est situé à en un endroit où le numérateur s'annule pour la première


fois après le passage du pic.

Puisque l'argument de cette fonction augmente de entre deux pics successifs (parmi tous les pics
principaux et secondaires), il vaut à l'endroit du pic d'ordre m (pic principal donc) et doit parcourir
radians supplémentaires pour atteindre le pied du pic.

Le numérateur vaut donc :

(40.66)

La distance angulaire entre le sommet et le pied du pic principal est donc donné par :

(40.67)

Mais dès le premier ordre, nous avons . La différence des deux sinus donne (cf. chapitre de
Trigonométrie) :

(40.68)

Un développement de MacLaurin (cf. chapitre des Suites Et Séries) de donne lorsqu'on prend le
premier terme du développement :

(40.69)
mais nous avons aussi la relation remarquable . D'où la largeur angulaire d'un pic
d'ordre m :

(40.70)

Or :

(40.71)

Donc :

(40.72)

Il est clair que deux raies superposées seront vues comme distinctes si elles sont séparées d'une distance
angulaire égale à leur largeur angulaire. L'expression :

(40.73)

établit qu'à deux positions angulaire correspondent deux longueurs d'onde. Nous pouvons donc donner la
séparation de deux raies par au lieu de .

Ainsi de :

(40.74)

nous tirons :

(40.75)

Mais :

(40.76)

Lorsque et sont petits, nous avons :

(40.77)

Ce qui nous amène à écrire par substitution :

(40.78)
Le pouvoir de résolution R d'un réseau représente sa capacité de séparer deux raies spectrales de longueurs
d'onde et voisines tel que :

(40.79)

Nous voyons que le pouvoir de résolution augmente proportionnellement à l'ordre de diffraction.

FENTES DE YOUNG

Selon le principe de la dualité onde-corpuscule, la lumière se comporte à la fois comme une onde et comme
un corpuscule (particule matérielle). C'est la résolution de problèmes comme ceux du corps noir (cf .
chapitre de Thermodynamique), de l'effet photoélectrique (cf. chapitre de Physique Nucléaire) ou encore
celui de l'effet Compton (cf. chapitre de Physique Nucléaire) qui a révélé l'existence de cette dualité.

Mais nous allons nous maintenant étudier la manière la plus flagrante mettant en évidence l'aspect
ondulatoire de la matière à l'échelle atomique à l'aide de l'expérience des fentes de Young. Nous allons
aborder celle-ci de manière simplifiée comme un cas particulier du réseau de fentes rectangulaires mais
ayant l'avantage de mettre expérimentalement en évidence de manière aisée le comportement duaire et
probabiliste de la matière à l'échelle atomique.

Soit une source de lumière S, qui rayonne une onde monochromatique de longueur d'onde à travers
deux fentes et percées dans un obstacle opaque à la lumière, comme le montre la figure ci-dessous :

(40.80)

Remarque: L'intérêt du dispositif est qu'il permet de produire deux sources de lumières cohérentes. C'est-à-
dire deux sources dont la différence de phase est constante tout au long de l'expérience.

Nous disposons un écran d'observation E en un point H tel que la distance :

(40.81)

où a serait typiquement de l'ordre du millimètre et D du mètre.

L'onde donnera après son passage à travers les fentes et , comme nous l'avons déjà vu, naissance à
deux ondes "filles" et de même pulsation qui emprunteront respectivement les chemins
et et qui iront interférer au point M de l'écran E.

Si l'interférence en M est constructive, ce point sera alors situé sur une frange brillante et si l'interférence en
M est destructive, il sera sur une frange obscure. Pour observer cela, écrivons d'abord l'onde résultante au
point M :
(40.82)

dans laquelle nous avons en termes de phaseurs (cf. chapitre de Mécanique Ondulatoire) :

et (40.83)

où A est l'amplitude k est le vecteur d'onde et t, représente la variable temps comme nous l'avons déjà étudié
en détail dans le chapitre de Mécanique Ondulatoire.

Maintenant, faisons un changement de variable (histoire de ne pas avoir à se trimbaler de longues


exponentielles) :

et (40.84)

Remarque: Nous verrons plus loin qu'au fait et

Pour le calcul de l'intensité au point M, nous allons prendre la norme complexe (module) de de ce qui
s'écrit donc comme le produit du complexe et son conjugué :

(40.85)

Remarque: Ce calcul est très important car l'analogie avec la physique quantique ondulatoire est très forte à
ce niveau et similaire au calcul de l'amplitude de probabilité (cf. chapitre de Physique Quantique
Ondulatoire).

Donc :

(40.86)

L'intensité est donc maximale si et seulement si :

(40.87)

Donc que :

(40.88)

avec . Ce qui donne :

(40.89)

Remarque: C'est ici que trivialement nous voyons que et


L'intensité est donc nulle si et seulement si :

(40.90)

Donc que :

(40.91)

avec . Ce qui donne :

(40.92)

Maintenant, il nous faut calculer en fonction de z pour savoir ce que nous observons sur l'écran E.

Considérons pour cela le schéma suivant :

(40.93)

où et .

Nous avons sur notre schéma :

(40.94)

Or , donc nous avons :

(40.95)

Comme z et a sont petits devant D et en utilisant l'approximation :

(40.96)

si est petit devant 1. Nous avons alors :


(40.97)

De même :

(40.98)

Donc en soustrayant ces deux relations :

(40.99)

Donc finalement en utilisant la relation :

(40.100)

il vient :

(40.101)

Ainsi, la distance entre deux maximum consécutifs est :

(40.102)

et est appelé "interfrange".

Pour les franges d'intensité nulle il vient immédiatement :

(40.103)

Cette relations révèle que l'intensité I présente des minima (franges obscures) et maxima (franges brillantes)
distribués selon la direction z de manière périodique. Cela ne nous étonne pas plus que cela pour l'instant car
il découle du cas plus général étudié plus haut.
(40.104)

Il convient cependant de préciser que les calculs précédents montrent que l'intensité des franges est partout
égale. Or nous observons expérimentales (voir la figure ci-dessus) que leur intensité diminue lorsqu'on
s'éloigne du centre de l'écran. Comme nous l'avons déjà vu, deux phénomènes sont à l'origine de cette
observation :

Premièrement, les fentes ont une certaine largeur, ce qui implique un phénomène de diffraction. En effet,
une lumière envoyée sur un petit trou n'en ressort pas de façon isotrope. Cela se traduit par le fait que la
lumière est majoritairement dirigée vers l'avant. Cet effet se répercute sur la figure observée après les fentes
d'Young : l'intensité des franges décroît au fur et à mesure que l'on s'éloigne du centre.

Le second phénomène à prendre en compte est le fait que les ondes émises en et sont des ondes
sphériques, c'est-à-dire que leur amplitude décroît au fur-et-à-mesure qu'elles avancent. Ainsi l'amplitude de
et ne sera pas la même au point M.

Donc nos calculs restent approximatifs par rapport à l'étude que nous avions fait du réseau de fentes
rectangulaires mais c'est ainsi que l'expérience des fentes de Young est présentée dans les écoles et cela
suffit à mettre en évidence le résultat principal.

L'expérience originelle de Thomas Young peut donc être interprétée en utilisant les simples lois de Fresnel
comme nous l'avons fait avec le réseau de fentes. Ce qui met en évidence le caractère ondulatoire de la
lumière. Mais cette expérience a par la suite été raffinée, notamment faisant en sorte que la source S émette
un quantum à la fois. Par exemple, on peut à l'heure actuelle émettre des photons ou des électrons ou encore
des atomes un par un. Ceux-ci sont détectés un par un sur l'écran placé après les fentes d'Young. Nous
observons alors que ces impacts forment petit à petit la figure d'interférences. Selon des lois classiques
concernant les trajectoires de ces corpuscules, il est impossible d'interpréter ce phénomène!!! D'où l'intérêt
de l'étude théorique et expérimentale des fentes de Young.

De gauche à droite et de haut en bas, voici les motifs obtenus en accumulant 10, 300, 2'000 et 6'000
électrons avec un flux de 10 électrons/seconde. L'accumulation des électrons finit par constituer des franges
d'interférence ce qui est assez déroutant à priori!
(40.105)

Nous reviendrons sur ce phénomène crucial dans le chapitre de Physique Quantique Ondulatoire pour en
dire un peu plus.

POLARISATION DE LA LUMIÈRE

Ce n'est qu'au 19ème siècle qu'on découvrit la polarisation de la lumière (nous allons de suite expliquer de
quoi il s'agit). Cependant, à l'époque de Newton, on connaissait déjà un phénomène dû à la polarisation :
l'existence de cristaux dits "cristaux biréfringents" (tel le spath d'Islande) qui ont la propriété de réfracter un
seul rayon en deux rayons distincts (aujourd'hui nous savons que les deux rayons réfractés par un tel cristal
sont polarisés).

Pour comprendre ce qu'est la "polarisation de la lumière", revenons au cas d'une onde se propageant sur une
corde (cf. chapitre de Mécanique Ondulatoire). Une telle onde peut le faire dans un plan vertical (droite)
aussi bien que dans un plan horizontal (gauche) ou dans tous les plans intermédiaires:

(40.106)

Dans les deux cas, nous disons que l'onde est "polarisée linéairement", ce qui signifie que les oscillations se
font uniquement et toujours dans le même plan, appelé "plan de polarisation". Une telle onde peut passer à
travers une fente verticale si elle est polarisée verticalement, une onde polarisée horizontalement ne pourra
pas.

Rappel : nous avons vu dans le chapitre d'Électrodynamique que pour les ondes électromagnétiques, le
champ électrique oscille (du moins pour la solution standard des équations de Maxwell) et est orthogonale
à la direction de propagation.
Le vecteur champ électrique d'une onde peut être décomposé en deux composantes perpendiculaires l'une

à l'autre, si l'onde se propage dans la direction z et transportant chacune la moitié de l'intensité de


l'onde. Ces deux composantes changent à tout moment lorsque varie. Le résultat à tout instant est un
champ horizontal total et un champ vertical total.

(40.107)

Si tourne autour de la direction de propagation avec son extrémité décrivant un cercle, nous disons alors
que l'onde est "polarisée circulairement" :

(40.108)

reste alors constant en module mais tourne tout en progressant, effectuant un tour complet pour chaque
parcours égal à une longueur d'onde.

Remarque: La lumière n'est pas forcément polarisée ! Chaque atome émet un train d'ondes qui dure moins
d'un cent millionième de seconde (ces trains d'ondes sont parfaitement expliqués par la propagation de la
particule libre en physique quantique avec les transformées de Fourier), et toutes ces ondes n'ont aucune
corrélation de phase ou d'orientation. Le champ résultant en une position donnée de l'espace, est la somme
géométrique de tous ces trains d'ondes : il change constamment.

Ainsi, la lumière naturelle est un mélange aléatoire et très rapidement variable d'ondes linéairement
polarisées dans toutes les directions. En regardant vers la source, nous observons un champ , résultant qui
oscille dans une certaine direction durant une fraction de période puis saute brusquement à une nouvelle
direction aléatoire tout en restant perpendiculaire à la direction de propagation :

(40.109)

Cette introduction ayant été faite, passons à quelque chose d'un peu plus formel :

Nous avions donc vu en électrodynamique qu'une onde plane progressive monochromatique (même si
physiquement elle n'existe pas...) se propageant dans le vide était composée d'un champ et d'un champ
magnétique et était caractérise par sa pulsation , son amplitude en champ électrique et en champ
magnétique et sa direction de propagation donnée par un vecteur unitaire à choix selon
l'orientation du repère choisi.

Nous avons vu également que ces ondes possèdent des propriétés structurelles remarquables, en particulier :

- et sont transverses, c'est-à-dire que leur direction est en tout point et à tout instant orthogonale à la
direction de propagation (théorème de Malus). Ceci, permettant de définir un plan d'onde, plan généré par
les deux directions de et .

- Les normes de ces deux vecteurs sont reliées par , où est la vitesse de la lumière dans le vide
(c'est ce rapport immense entre le champ magnétique et le champ électrique d'une onde électromagnétique
qui fait que les développements présentés plus loin se font de préférence par rapport à la composante de
l'onde)

- Enfin, ces deux vecteurs sont orthogonaux entre eux, et le trièdre est un trièdre orthogonal direct.

Ces trois propriétés se résument par la relation :

(40.110)

où nous avons choisi le repère tel que l'onde se propage selon la direction . De plus, nous avions montré
que le champ électrique est une fonction d'onde trigonométrique donnée à l'arbitraire de phase près par :

ou (40.111)

Plaçons nous maintenant dans une base (x, y, z). L'expression la plus générale du champ électrique d'une
onde plane progressive monochromatique se propageant selon peut être décomposée selon deux
composantes :
(40.112)

La norme du champ étant dès lors donnée dès lors par :

(40.113)

Si (ce qui est le cas le plus souvent) nous avons alors :

(40.114)

En choisissant une autre origine des temps, nous pouvons toujours nous ramener à écrire :

(40.115)

avec .

Remarque: Le choix d'écrire plutôt que nous sera utile plus tard pour l'utilisation des relations
trigonométriques remarquables et nous permettre de trouver l'équation d'une ellipse (patience... c'est pas très
loin).

En utilisant les phaseurs (cf. chapitre de Mécanique Ondulatoire) ces dernières relations peuvent se ramener
à:

(40.116)
Mais la polarisation la plus générale est décrite par un vecteur complexe normalisé à l'unité dans un espace à
deux dimensions de composantes :

(40.117)

avec .

Cependant, pour décrire ce champ, et donc l'ensemble de l'onde, il est commode de se placer dans le plan
et de décrire l'évolution du vecteur dans ce plan. C'est ce que nous allons faire par la suite. Ceci
revient en fait à choisir une origine des coordonnées selon z. Dans ce cas, nous pouvons écrire :

(40.118)

POLARISATION LINÉAIRE

Définition: Nous disons qu'une onde est "polarisée linéairement" lorsque ou .

Dans le premier cas ( , nous avons :

(40.119)

Dès lors, nous avons qui ont des valeurs comprises respectivement entre

Remarque: Relativement à un diagramme que nous verrons plus loin il convient de prendre en compte que
lorsqu'une composante est positive l'autre l'est aussi et inversement.

Nous avons dès lors à chaque instant :

(40.120)

ce qui signifie que le champ garde une direction fixe. D'où le fait que nous parlions d'onde polarisée
linéairement.

Si nous avons alors :

(40.121)

Dès lors, nous avons qui ont des valeurs comprises aussi entre .
Remarque: Relativement à un diagramme que nous verrons plus loin il convient de prendre en compte que
lorsqu'une composante est positive l'autre est négative et inversement.

Nous avons dès lors à chaque instant :

(40.122)

ce qui signifie aussi que le champ garde une direction fixe. D'où le fait que nous parlions également d'onde
polarisée linéairement.

POLARISATION ELLIPTIQUE

Si est quelconque, et en nous plaçant en , nous avons :

et (40.123)

d'où :

(40.124)

De plus, nous pouvons écrire :

(40.125)

En portant chacun des membres au carré :

(40.126)

et en sommant, nous éliminons le temps et obtenons :

(40.127)

Nous remarquons que si nous retrouvons :

(40.128)
Ceci dit, ceci est l'équation d'une ellipse :

(40.129)

En tout point similaire à la forme générale des coniques que nous avons vue en géométrique analytique (cf.
chapitre de Géométrie Analytique) :

(40.130)

Dans ce cas, l'extrémité de décrit donc une ellipse et nous parlons dès lors naturellement de "polarisation
elliptique".

Suivant la valeur de , cette ellipse peut être parcourue dans un sens ou dans l'autre. Pour déterminer ce
sens, dérivons l'expression du champ et plaçons nous à toujours dans le même plan d'onde en :

(40.131)

Ainsi :

- Si l'ellipse est parcourue dans le sens direct (inverse des aiguilles d'une montre) comme le
montre la figure plus loin. Nous disons alors que la polarisation est "elliptique gauche directe".

- Si l'ellipse est parcourue dans le sens direct aussi (inverse des aiguilles d'une montre) comme
le montre la figure plus loin. Nous disons alors que la polarisation est "elliptique droite directe".

- Si l'ellipse est parcourue dans le sens horaire (sens des aiguilles d'une montre). Nous disons
alors que la polarisation est "elliptique droite indirecte".

- Si l'ellipse est parcourue dans le sens horaire (sens des aiguilles d'une montre) comme le
montre la figure plus loin. Nous disons alors que la polarisation est "elliptique gauche indirecte".

POLARISATION CIRCULAIRE

Si et nous avons alors l'équation de l'ellipse qui se réduit à :

qui est l'équation d'un cercle de rayon , le sens étant toujours donné par le signe du sinus :

- Si il s'agit d'une polarisation circulaire gauche

- Si il s'agit d'une polarisation circulaire droit.

.... voir la figure plus bas pour un schéma.

POLARISATION NATURELLE
Nous pouvons considérer l'émission d'une source comme une succession d'ondes planes progressives
monochromatiques dont l'expression sera donc :

(40.132)

Ces trains d'ondes sont donc dans un état de polarisation particulier. Cependant, cet état varie aléatoirement
d'un train d'onde à l'autre, et ceci en un temps très court par rapport au temps d'intégration des détecteurs.
Ceux-ci ne verront donc pas de polarisation particulière, et le champ n'aura pas de direction particulière.

Nous parlons dès lors de "lumière non polarisée". Si nous superposons cette lumière à une onde polarisée,
nous obtenons ce que nous appelons une "polarisation partielle".

Finalement, nous pouvons résumer tout ce que nous avons vu jusqu'à maintenant par la figure suivante où
nous avons :

- La polarisation linéaire

- La polarisation linéaire partielle (n'est pas représentée)

- La polarisation elliptique gauche ou droite

- La polarisation elliptique partielle (n'est pas représentée)

- La polarisation circulaire gauche ou droite

- La polarisation circulaire partielle (n'est pas représentée)

(40.133)

Nous pouvons représenter cela de manière animée avec Maple (nous n'avons pas mis le *.gif ci-dessous afin
de na pas trop charger le document...) et les commandes suivantes:
> restart;
> with (plots):
> Ex:=1;Ey:=1;phi:=Pi/4;k:=1;omega:=1;
> animate3d([x,a*Ex*cos(omega*t-k*x),a*Ey*cos(omega*t-k*x-phi)],a=0..1,x=-
10..10,t=0..2*Pi,frames=15,grid=[35,35],style=patchnogrid,axes=boxed);

(40.134)

Il est bien entendu possible de modifier les paramètres. Par exemple, donne une polarisation
circulaire, donne une polarisation rectiligne comme nous l'avons montré plus haut.

LOI DE MALUS

Pour polariser de la lumière, le physicien fera usage de polariseurs. Nous n'entrerons pas ici (car ce n'est pas
dans le cadre de l'optique ondulatoire) dans les détails des propriétés atomiques ou moléculaires de la
matière qui sont la cause de la polarisation de la lumière transmise.

Pour nos besoins, nous allons nous restreindre à un polariseur qui polarise une lumière incidente de manière
linéaire selon l'axe x (la composant étant dès lors nulle). Il vient dès lors :

(40.135)

Or, nous avons vu dans le chapitre traitant des équations de Maxwell (chapitre d'Électrodynamique) que :

(40.136)

Dès lors, il vient pour l'intensité maximale (tel que ):

(40.137)
relation qui constitue la non moins fameuse "loi de Malus".

Pour étudier de façon quantitative la polarisation, nous allons nous servir d'un ensemble
polariseur/analyseur. Nous faisons d'abord passer la lumière dans un polariseur dont l'axe fait un angle
avec l'axe x, puis dans un second polariseur, appelé "analyseur", dont l'axe fait un angle avec le même
axe (voir figure ci-dessous) avec :

(40.138)

dont la norme est égale à l'unité !

(40.139)

A la sortie de l'analyseur, le champ électrique s'obtient en projetant la lumière polarisée


linéairement obtenue à la sortie du polaroïd :

avec (40.140)

sur (ce qui signifie : projection=produit scalaire, pour obtenir un vecteur on multiplie par le vecteur sur
lequel on projette ) :

(40.141)

Nous en déduisons la loi de Malus pour l'intensité :

(40.142)

dans le cas particulier de la polarisation linéaire bien sûr. Nous réutiliserons ce résultat en cryptographie
quantique (cf. chapitre de Cryptographie).

COHÉRENCE ET INTERFÉRENCE
Nous allons maintenant voir quelles sont les conditions nécessaires à ce que des ondes planes interférent
entre elles. Ces développements permettent de comprendre bien des choses sur la vision du monde qui nous
entoure via notre oeil (surtout pourquoi l'ensemble des ondes reçues par nos rétines ne se mélangent pas et
donc les couleurs non plus!).

Considérons deux ondes planes et de pulsations et , de vecteurs d'onde et se propageant


toutes deux parallèlement à l'axe .

Nous notons On note et les amplitudes complexes des deux ondes et nous nous s'intéressons à
l'intensité moyenne observée en un point O pris comme origine des coordonnées:

(40.143)

Nous posons:

(40.144)

et nous supposerons:

(40.145)

Au point O les amplitudes complexes s'écrivent

(40.146)

où et représentent les phases de et .

Calculons maintenant l'intensité instantanée au point O qui sera notée J(t). Comme l'intensité moyenne I est
proportionnelle au carré de l'amplitude, nous supposerons qu'il en sera de même pour l'intensité instantanée.
Ce qui nous amène à calculer la somme des parties réelles des amplitudes des deux ondes:

(40.147)

Ce qui s'écrit en se rappelant que (cf. chapitre sur les Nombres):


(40.148)

Soit:

(40.149)

Et nous avons alors:

(40.150)

Il vient la somme de quatre termes:

(40.151)

Pour calculer l'intensité moyenne, nous allons choisir une approche expérimentale. L'intensité moyenne sur
le temps de pose du détecteur (électronique ou biologique) sera donc donnée par:

(40.152)

I est donc la somme des moyennes des quatre termes intervenant dans J(t). En lumière visible (cas de notre
oeil), les fréquences sont de l'ordre de et les temps de pose des détecteurs varient entre la
milliseconde et la seconde. contient alors typiquement périodes de et !!

Examinons l'effet de la valeur moyenne sur chacun des termes de J(t):

1. Nous avons (cf. chapitre de Calcul Différentiel et Intégral):

(40.153)

Nous pouvons estimer que sur un grand nombre de périodes (temps d'ouverture du détecteur), c'est cette
moyenne qui sera mesurée (en l'occurrence c'est celle-ci!).

2. Nous avons de même:


(40.154)

avec la même remarque que précédemment en ce qui concerne le détecteur!

3. Pour le troisième terme c'est un peu différent:

(40.155)

Or, la moyenne d'un cosinus et d'un sinus sur une période est nulle. Donc si le détecteur fait une mesure sur
un temps d'exposition supérieur à , soit sur un grand nombre de périodes, nous aurons:

(40.156)

4. Pour le quatrième terme c'est encore différent dans l'approximation expérimentale. Effectivement:

(40.157)

Or, . Donc le détecteur n'a pas le temps de mesurer l'intensité moyenne sur une période entière en
première approximation puisque:

(40.158)
et que cette valeur est beaucoup beaucoup plus grande dans le spectre du visible que le temps
d'ouverture/échantillonnage de l'oeil qui est lui de 0.1 [s].

Ainsi, nous noterons la moyenne de quatrième terme par:

(40.159)

L'intensité moyenne vaut donc dans un cadre expérimental:

(40.160)

ou:

(40.161)

Si les pulsations sont égales (ou pratiquement égales), c'est alors l'interférence entre deux ondes
planes monochromatiques. L'intensité moyenne s'écrit alors:

(40.162)

L'intensité mutuelle est non nulle et nous disons alors qu'il y a cohérence. Dans le cas contraire, si les deux
pulsations sont très différentes, la moyenne est nulle et nous avons alors:

(40.163)

Le terme d'interférences a disparu, l'intensité moyenne est la somme des intensités moyennes des deux
ondes. Nous disons dans ce cas que les deux ondes sont incohérentes entre elles.

Quand nous savons que l'oeil interprète l'intensité pour former les perceptions des objets nous comprenons
pourquoi deux objets de deux couleurs différentes ne forment pas une perception correspondant à un
mélange des deux couleurs car même si dans le spectre du visible, les pulsations sont presque égales, leur
déphasage en un point donné de l'espace est rarement nul tel que:

(40.164)

Il n'y donc pas interférence et nous avons en réalité:

(40.165)

et ce d'autant plus que le déphasage n'est pas constant dans le temps et que la moyenne de déphasages fait
que le troisième terme s'annule. On ne peut donc pas interférer de manière simple des ondes planes de
sources différentes. Par contre lorsque la source est identique nous retrouvons ce que font nos écrans avec
les trois couleurs primaires RVB.

Lorsque est un multiple de , I est maximale (interférence constructive). Lorsque est de la


forme , I est minimale. Nous avons alors une interférence destructive.

Remarque: Lors de la composition de plusieurs ondes, nous pouvons toujours considérer qu'il y a
interférence. Toutefois, nous appelons "conditions d'interférences" des conditions d'observation des ces
interférences, in extenso des conditions pour que le résultat de leur composition soit suffisamment stable
pour être observé. Il est d'usage de parler de visibilité ce qui restreint à la seule observation par l'oeil
(humain).

Nous avons vu pour l'oeil que la fréquence temps d'échantillonnage est de . Sachant que la lumière
visible à une fréquence de , la fréquence doit donc être stabilisée par la source pendant:

(40.166)

ce qui matériellement est impossible sauf à ce que la source soit la même. Nous en déduisons que pour des
interférences soient visibles à l'oeil, les sources doivent être synchrones à mieux que ce qui en
pratique amène à ne considérer que des sources absolument synchronisées sur une source unique.

Dans le modèle précédent, nous avons par ailleurs négligée qu'une onde réelle est limitée dans le temps. Un
photon est représenté par un paquet d'onde limité. Soit T sa durée, il aura une longueur dans le vide
ou dans l'air que nous appelons "longueur de cohérence temporelle".

Un rayonnement donné est donc une superposition d'une succession de trains d'ondes dont la longueur
moyenne est , les trains d'ondes successifs n'ont pas de relation de phases entre eux: ils ne peuvent pas
interférer.
41. PHYSIQUE QUANTIQUE CORPUSCULAIRE

V oici venu le moment de nous plonger dans les eaux obscures et impénétrables de la physique atomique.

Il va de soi que nous parcourrons les théories de la physique atomique que dans les grandes lignes. Nous
passerons ainsi sur beaucoup de détails mathématiques qui auront déjà été démontrés et vérifiés dans
d'autres chapitres du site.

La physique atomique comme vous le savez déjà certainement le monde de l'infiniment petit (points de
dimension nulle). C'est un monde, vous le verrez, assez particulier où les lois classiques, celles qui
gouvernent notre quotidien macroscopique, ne s'appliquent pas.

Ainsi, au début du 20ème siècle nous savions uniquement que les atomes étaient formés au plus simples par
un noyau central et des électrons en orbite.

L'électron, la première particule subatomique (plus petite que l'atome) à nous être révélée, fut mis en
évidence par des expériences sur les courants électriques dans les solides, les liquides et les gaz. Au 19ème
siècle, les physiciens n'avaient aucune idée de ce qu'était la charge, si elle était continue ou particulaire.
Aujourd'hui, nous savons que la charge est une propriété de la matière et que la charge totale dans un
système est toujours un multiple d'une charge élémentaire correspondant à la charge d'un électron (ou d'un
proton).

Michael Faraday suggéra par des expériences d'électrolyse que l'électricité était composée de particules de
charge e et qu'une mole de ces charges (voir la section de Chimie pour la définition de la mole) était
équivalent à une charge de 1 Faraday soit 96'485 [C]. Comme le nombre d'Avogadro n'était pas connu à
l'époque, il n'était pas possible de déterminer e. Cependant, une mole d'une substance monovalente pouvant
transporter 1 [F] de charge, il devait s'ensuivre qu'une demie mole de la même substance devait transporter
1/2 [F] et ainsi de suite jusqu'à la plus petite unité de charge e, qui devait être transportée par la plus petite
unité de masse m, correspondant à la masse d'un seul atome de cette substance. En 1881, Helmholtz affirma
que si on acceptait l'hypothèse que les substances élémentaires étaient composées d'atomes, nous devions
logiquement en déduire que l'électricité, tant positive que négative, devait être divisée en portions finies qui
devaient se comporter comme des atomes d'électricité. Stoney nomma cette unité fondamentale de charge
"électron". La valeur élémentaire de charge se nomme aujourd'hui prosaïquement le "quantum de charge".

Toutes les charges subatomiques connues aujourd'hui qu'elles soient positives ou négatives, transportent une
charge nette qui est un multiple de e (les quarks, bien sûr, ont une charge fractionnaire mais ils
n'apparaissent pas comme entités isolées. Il existe également des charges fractionnaires dans l'effet Hall
quantique mais cela est une tout autre histoire).

Encore aujourd'hui les meilleurs physiciens disent ne pas vraiment savoir ce qu'est un électron et même un
atome. Au fait, on ne sait toujours pas ce qu'est vraiment la matière...

Les scientifiques ont tenté l'élaboration de plusieurs modèles pour expliquer les observations obtenues de
résultats expérimentaux du monde microscopique. Ainsi, il y a eu dans l'ordre les modèles de Dalton,
Thomson, Rutherford, Bohr, Sommerfeld et Schrödinger (ce dernier incluant les contributions majeures de
Heisenberg, De Broglie, Pauli, Dirac et Einstein pour les plus fameux).

On peut situer la naissance de la physique quantique corpusculaire ou "physique des quanta" ("quantum"
voulant dire "quantité fixe") en 1900, année où Max Planck présentant son célèbre article sur le rayonnement
du corps noir (cf. chapitre de Thermodynamique) à une réunion de la société allemande de physique et
l'incapacité de la physique classique (mécanique, thermodynamique, électromagnétisme) d'expliquer certains
comportement de la matière au niveau microscopique, c'est-à-dire certains phénomènes où interviennent des
particules de faibles masses localisées dans de très petites régions de l'espace.

Pour parvenir à donner une interprétation cohérente de ces expériences, il a été nécessaire d'introduire des
concepts radicalement différents de ceux de la physique classique. Par exemple, on a dû abandonner la
notion de trajectoire, la quantification de l'énergie (loi de Planck) et considérer que les particules
microscopiques ont parfois un comportement semblable à une onde. L'ensemble de ces nouveaux concepts a
donné naissance à une nouvelle physique, la "physique quantique", qui s'est développée rapidement
puisqu'en 1927, déjà, les fondements de la théorie sont achevés. Par son abandon des concepts-clés de la
mécanique classique, on peut dire que la physique quantique constitue une véritable révolution (on l'appelle
par ailleurs la "2ème révolution", la première étant la théorie de la relativité) dans notre façon d'interpréter
les mesures expérimentales. Avec la relativité introduite par Einstein, la physique quantique est un des
piliers de l'édifice théorique de la physique contemporaine du 21ème siècle.

Tout comme la relativité contient la mécanique classique comme cas limite (les lois relativistes approchent
les lois classiques lorsque la vitesse d'une particule est suffisamment faible par rapport à celle de la lumière),
la nouvelle physique quantique contient comme cas limites les lois classiques de la mécanique statistique
voire même de l'électromagnétisme.

Remarque: Nous verrons que la constante fondamentale qui caractérise la physique quantique (comme la
vitesse de la lumière caractérise la relativité) est la constante de Planck.

MODÈLE DE DALTON

En 1803 John Dalton fit l'hypothèse que la matière est composée d'atomes de différentes masses et qui se
combinent en respectant des proportions massiques simples (cependant l'idée d'atome n'était pas nouvelle
elle datait de bien bien plus tôt). C'est cette théorie que Dalton proposa qui est la pierre d'angle de la science
physique moderne. En 1808, l'oeuvre de Dalton intitulée "Un nouveau système de philosophie chimique" fut
publiée. Dans ce livre, il dressa la liste des masses atomiques d'un certain nombre d'éléments connus par
rapport à la masse de l'hydrogène. Ses masses "U.M.A" (cf. chapitre de Physique Nucléaire) n'étaient pas
entièrement correctes mais elles forment la base de la table périodique moderne des éléments. Dalton arriva
à sa théorie atomique par une étude des propriétés physiques de l'air atmosphérique et des autres gaz.

Dalton supposa que l'atome était une sphère :

(41.1)
Ainsi, il put faire une première estimation de la taille des atomes :

En effet, soit la densité typique, la masse atomique et R le rayon (valeur inconnue) d'un élément dont
nous recherchons à déterminer la dimension de l'atome. Nous avons alors très simplement:

(41.2)

Connaissant et , nous obtenons .

MODÈLE DE THOMSON

Thomson est à l'origine de la découverte de l'électron par ses expérimentations sur les flux de particules
(électrons) créés par des rayons cathodiques. Théoricien et expérimentateur, Thomson avança en 1898 la
"théorie du pain aux raisins" sur la structure atomique, dans laquelle les électrons sont considérés comme
des raisins négatifs enfoncés dans un pain de matière positive. Son modèle de l'atome est représenté par la
figure ci-dessous:

(41.3)

Or, nous savons (les physiciens du 19ème le savaient aussi) qu'aucun arrangement de charges électriques
statiques n'est stable si ces charges sont sous l'influence de la force de Coulomb:

(41.4)

que nous avions étudiée dans la section d'électromagnétisme. Il faut donc que les particules qui constituent
l'atome soient en mouvement ce qui nous amène à mettre en place un autre modèle : le "modèle de
Rutherford" suivant :

MODÈLE DE RUTHERFORD

Rutherford assimila donc intuitivement par cette observation théorique, peu d'années après la découverte de
Thomson, l'atome à un système planétaire. Représenté comme ci-dessous:

(41.5)
Il appliqua les résultats que nous avons obtenus en astronomie (cf. chapitre d'Astronomie) lors de l'étude des
orbites képlériennes à l'atome et obtint donc des trajectoires coniques pour la rotation de l'électron autour du
noyau tel que:

(41.6)

où e est l'excentricité (rapport du petit axe ) et p le paramètre focal ( ) d'une ellipse (cf.
chapitre de Géométrique Analytique) et où :

et (41.7)

Remarques:

R1. Il faudra se rappeler lorsque nous aborderons plus loin le modèle de Bohr que dans le modèle de
Rutherford, r peut prendre n'importe quelle valeur théoriquement!

R2. Nous verrons lors de notre étude de la diffusion de Rutherford (cf. chapitre de Physique Nucléaire) que
Rutherford détermina la taille de l'atome d'or comme valant . Nous avons donc un facteur
10'000 avec le modèle de Dalton (c'est dire...).

Or, nous avons vu en électromagnétisme que les équations de déplacement de Maxwell (cf. chapitre
d'Électrodynamique):

(41.8)

et :

(41.9)

décrivent qu'un électron en mouvement (accélération) émet de l'énergiesous forme de rayonnement


électromagnétique que nous appelons en physique le "bremstrahlung" expliqué par les potentiel de Liénard-
Wiechert (cf. chapitre d'Électrodynamique).

Rutherford et Thomson se trouvèrent donc confronté au dilemme suivant:

Si l'électron émet de l'énergie sous forme de rayonnement électromagnétique, il perd donc de l'énergie
cinétique (vitesse) et finira donc nécessairement un jour ou l'autre (sauf intervention extérieure) par tomber
sur le noyau (illustration du phénomène dans la figure ci-dessous). Or la matière nous environnant est stable.
(41.10)

Ils rejetèrent donc leur modèle et Bohr intervient à ce moment là...

MODÈLE DE BOHR

En 1913 Niels Bohr, qui a participé aux travaux de Rutherford sur la diffusion des particules (noyaux de 2
protons, 2 neutrons libres d'électrons), reprend le modèle de Rutherford mais y inclut 3 postulats
fondamentaux:

POSTULATS DE BOHR

P1. L'électron n'émet pas de rayonnement lorsqu'il se trouve sur certaines orbites dites "orbites
stationnaires". Cette affirmation est contraire aux théories de l'électrodynamique. Donc ceci implique que
toutes les orbites ne sont pas autorisées et constitue une véritable révolution dans l'approche de la physique.

P2. Sur toute orbite stable la quantité de mouvement p intégrée sur le chemin r est un multiple entier de la
constante de Planck h (postulat découlant du premier) tel que selon la quantification des échanges d'énergie
étables par la relation de Planck. Ce postulat est parfois appelé "hypothèse quantique de Planck".

P3. La relation expérimentale (loi) de Planck :

(41.11)

est valable pour l'émission ou l'absorption d'une radiation lors de la transition d'un électron d'un état
énergétique ver un état (postulat qui solidifie le premier postulat).

Au fait, nous trouvons ici un concept révolutionnaire et indémontrable (aujourd'hui et à notre connaissance)
qui consiste à quantifier certaines propriétés de la physique.

Continuons donc notre analyse :

QUANTIFICATION

Soit M la masse du noyau central de charge électrique +e et m la masse de l'électron en "orbite". Nous
faisons l'hypothèse que et que la masse centrale est immobile (ce qui est évidemment faux dans la
réalité).
Nous assimilons le mouvement circulaire de l'électron autour du noyau à celui d'un oscillateur harmonique
(masse reliée à un ressort exerçant une force opposée proportionnelle à une constante de rappel afin de
retenir l'objet lié).

Si l'oscillation a lieu dans un plan, son équation différentielle est (cf. chapitre de Mécanique Calssique) :

(41.12)

Une solution (particulière) de cette équation (cf. chapitre de Calcul Différentiel Et Intégral) est :

(41.13)

L'énergie cinétique du système étant donnée dès lors par:

(41.14)

et l'énergie potentielle du système par (cf. chapitre de Mécanique Ondulatoire) :

(41.15)

Si nous notons v la fréquence d'oscillation du mouvement oscillatoire nous avons a bien évidemment (cf.
chapitre de Mécanique Ondulatoire) :

(41.16)

L'énergie totale du système s'écrit finalement après sommation et simplification (trigonométrie élémentaire):

(41.17)

Nous admettons maintenant que l'électron lié ne peut occuper que certains niveaux d'énergie (premier
postulat) selon la loi de Planck :

(41.18)

Ce qui nous donne lorsque nous incluons la loi de Planck dans l'avant dernière relation:

(41.19)

Nous remarquons ici que puisque l'énergie de l'électron est quantifiée l'amplitude de son mouvement l'est
également.

Soit à présent l'intégrale de chemin suivante (attention la notation ambiguë entre la fréquence et la vitesse
peut porter à confusion) dite également "intégrale d'action" (il s'agit au fait du moment cinétique) :

(41.20)
et compte tenu de l'expression de la vitesse obtenue auparavant:

(41.21)

Sur une période de révolution nous avons :

(41.22)

Etant donné que (cf. chapitre de Trigonométrie):

(41.23)

L'intégration devient:

(41.24)

comme (cf. chapitre de Mécanique Ondulatoire) nous avons :

(41.25)

Nous obtenons donc finalement:

(41.26)

Compte tenu que et ainsi que :

(41.27)

Finalement:

(41.28)

Cette condition imposée par Bohr (2ème postulat) résulte de la quantification des échanges d'énergie (loi de
Planck). Ce qui a pour conséquence d'imposer des niveaux stationnaires d'énergie que l'électron peut
occuper autour du noyau.

Pour une orbite circulaire (rappelez-vous bien que nous considérons pour l'instant une orbite circulaire !) de
rayon r le moment cinétique (oui l'intégrale d'action n'est au fait que le moment cinétique) sur la longueur de
l'orbitale est donc:
(41.29)

où bien en utilisant la notation traditionnelle du moment cinétique:

(41.30)

Le moment cinétique est donc quantifié !

MODÈLE DES ATOMES HYDROGENOÏDES SANS ENTRAINEMENT

Nous entendons par l'étude des "atomes d'hydrogénoïdes sans entraînement" lorsque nous considérons des
atomes avec un unique électron de masse m en rotation autour d'un noyau central de charge et de
masse M tel que (donc le noyau est supposé fixe).

Calculons les rayons des orbites stationnaires:

Sur son orbite stationnaire, l'électron est en équilibre car il y a un antagonisme exact entre la force
coulombienne et la force centrifuge. Ceci doit se traduire par l'égalité des forces suivante :

(41.31)

Nous posons à partir de maintenant (afin d'alléger l'écriture) que :

(41.32)

Ce qui nous permet d'écrire la relation :

(41.33)

En recourant à la condition de quantification de Bohr et en élevant au carré:

(41.34)

En divisant les deux dernières relations l'une par l'autre:

(41.35)

nous obtenons :

(41.36)
compte tenu de l'expression de k.

Le rayon des orbites autorisées pour l'électron est donc :

(41.37)

avec et cette relation est communément appelée le "rayon de Bohr" pour .

Les orbites d'un atome selon ce modèle ressemblent donc à :

(41.38)

L'énergie de l'atome hydrogénoïde sans entraînement est donnée par la mécanique classique (cas d'une force
centrale), somme de l'énergie cinétique et potentielle électrostatique :

(41.39)

Avec :

(41.40)

il vient :

(41.41)

En y introduisant l'expression du rayon quantifié obtenu précédemment:


(41.42)

Nous trouvons donc que l'énergie totale de l'atome considéré est quantifiée et négative (ce qui correspond à
des états stables car il faut un apport de l'énergie pour les defaire) telle que:

(41.43)

Entre deux niveaux, le passage d'un électron du niveau vers un niveau (nous préciserons comment lors
de l'étude de l'effet photoélectrique plus loin) se traduit par l'émission d'une raie de fréquence donnée par
l'expression de l'hypothèse de quantification de Planck :

(41.44)

En fait, si nous admettons avec Bohr que les énergies d'un électron sur son orbite sont données par l'inverse
du carré du nombre entier , la différence d'énergie entre deux orbites caractérisées par de grande valeurs de
ces nombres entier tend vers zéro lorsque les nombres entiers tendent vers l'infini. Nous retrouvons alors un
semblant de variation continue pour les énergies échangées par un atome avec le champ électromagnétique
et la notion de trajectoire d'un électron prend alors à nouveau du sens.

En faisant appel à l'expression complète de l'énergie totale, nous trouvons alors la fréquence correspondante
à la raie émise:

(41.45)

la longueur d'onde émise s'en déduit aisément :

(41.46)

La constante (notée aussi selon les situations) est appelée la "constante de Rydberg".

Un électron qui occupe une orbite n est dans un "état stationnaire" si son énergie ne varie pas. En revanche,
une transition directe s'accompagne de l'émission d'un photon dont l'énergie est donnée
par le calcul de la fréquence comme nous allons le démontrer.

"L'énergie d'ionisation" est l'énergie qu'il faut fournir pour éloigner l'électron à l'infini de son orbite. Ainsi
pour l'état fondamental de l'hydrogène, il faudrait poser et .

Le résultat obtenu par Bohr pour l'expression de la fréquence en fonction des niveaux d'énergie de l'électron
et est un résultat formidable car le chimiste Bâlois Balmer avait en 1885 (28 ans auparavant) découvert
expérimentalement que le spectre des raies de l'hydrogène suivait aussi cette loi.

Balmer avait remarqué que les raies spectrales étaient extrêmement fines. Cela laissait supposer que
l'énergie n'était pas émise par les atomes d'une manière continue mais seulement à certaines fréquences bien
précises. En outre, cette finesse des raies explique la précision avec laquelle il avait pu déterminer la
constante de Rydberg.

Les chimistes avaient également constaté que chaque élément atomique possédait son propre spectre. Il était
dès lors clair que toute théorie atomique devrait rendre compte de ces 2 caractéristiques et c'est ce que fit
brillamment le modèle de Bohr à l'aide des postulats des niveaux d'énergies.

Nous définissons les séries suivantes du spectre de l'atome d'hydrogène :

- Pour la série avec et on obtient le résultat des mesures effectuées (le spectre) par
Lymann en 1906 dans l'UV.

- Pour la série avec et on obtient le résultat des mesures effectuées (le spectre) par
Balmer en 1885 dans le visible.

- Pour la série avec et on obtient le résultat des mesures effectuées (le spectre) par
Paschen en 1908 dans l'infrarouge.

- Pour la série avec et on obtient le résultat des mesures effectuées (le spectre) par
Brackett en 1928 dans l'infrarouge.

- Pour la série avec et on obtient le résultat des mesures effectuées (le spectre) par
Pfund en 1924 dans l'infrarouge.

(41.47)

Les quatre raies principales de la "série de Balmer" (visible) sont les plus connues:
(41.48)

Cependant une petite différence subsistait entre la constante de Rydberg théorique et pratique (connue avec
très grande précision). Ceci va conduire à complexifier le modèle :

MODÈLE DES ATOMES HYDROGENOÏDES AVEC ENTRAÎNEMENT

Le noyau de l'atome possède une masse M que nous avons supposée immobile par simplification. En réalité
l'ensemble noyau (M) et électron (m) tourne autour d'un centre de masse commun (évidemment!).

Hypothèses:

H1. L'atome hydrogénoïde est considéré comme un système isolé.

H2. Le noyau et l'électron gravitent chacun sur une orbite circulaire autour d'un centre commun : le "centre
de masse" (cf. chapitre de Mécanique Classique).

H3. Ils ont même vitesse angulaire.

L'atome hydrogénoïde étant un système isolé, le mouvement du centre de masse est soit en mouvement
rectiligne et uniforme soit au repos. Il est donc licite d'y placer un système de repère inertiel.

(41.49)

La définition du centre de masse dans un système de laboratoire est donnée par le théorème du centre de
masse (cf. chapitre de Mécanique Classique):

(41.50)

L'étude présente sera effectuée par rapport au centre de masse, la relation précédente devient donc:

(41.51)

De la relation précédente, en prenant la norme et la valeur absolue il vient que:

(41.52)

La distance entre le noyau et l'électron demeurant constante et égalant nous écrivons :

(41.53)

Nous en déduisons trivialement que:


et (41.54)

En appliquant la loi de la dynamique, nous écrivons que la somme des forces sollicitantes (électrostatique et
centrifuge) de l'électron (uniquement) s'équilibrent tel que:

(41.55)

Que nous pouvons écrire en isolant :

(41.56)

Nous retrouvons l'expression de la masse réduite bien connue dans un système à deux corps :

(41.57)

Attaquons-nous maintenant à la détermination de l'énergie totale de l'atome:

L'énergie cinétique de l'atome est la somme des énergies cinétiques du noyau (N) et de l'électron (e) tel que:

(41.58)

Comme avec comme hypothèse que la pulsation est identique pour le noyau et l'électron:

(41.59)

Avec les relations des différents rayons déterminées précédemment :

(41.60)

et connaissant l'expression de la pulsation:

(41.61)

Par ailleurs, de l'avant dernier développement nous tirons une relation dont nous allons faire usage plus loin
:
(41.62)

L'énergie potentielle de l'électron par rapport au centre de masse étant donnée par (cf. chapitre
d'Électrostatique):

(41.63)

L'énergie totale de l'atome hydrogénoïde est alors :

(41.64)

Par rapport au centre de masse, le moment cinétique total est la somme des moments cinétiques de l'électron
et du noyau (rappelons que le moment cinétique est aussi souvent noté par la lettre L).

(41.65)

La parenthèse de la dernière égalité a déjà fait l'objet d'un calcul précédemment et nous avons donc:

(41.66)

c'est ici que Bohr introduit sa condition de quantification :

(41.67)

or, nous connaissons l'expression détaillée de la pulsation :

(41.68)

Le rayon quantifié a donc pour expression :

(41.69)

L'énergie totale de l'atome devient finalement :

(41.70)

Soit de manière condensée :


(41.71)

A partir de cette dernière relation, nous pouvons déterminer facilement l'expression (comment nous l'avons
déjà fait) des longueurs d'ondes émises par une désexcitation de l'électron d'un orbite à .

Remarque: Il convient bien évidemment de rendre compte que ce modèle est plus précis que le précédent.

HYPOTHÈSE DU NEUTRON

Les résultats de spectroscopie sont connus avec très grande précision, par conséquent les constantes de
Rydberg également (car dépendante de la masse de l'élément atomique étudié).

Les deux raies bleues mesurées de la série de Balmer de l'hydrogène noté H ( composé d'un
proton et d'un électron) et du deutérium D (isotope de l'hydrogène composé d'un neutron en plus) présentent
une différence de longueur d'onde de Angström.

La longueur d'onde appartenant à la série de Balmer s'exprime dès lors (avec la correction du centre de
masse vue précédemment) comme:

(41.72)

Cette dernière expression écrite successivement pour l'hydrogène et le deutérium mène à:

et (41.73)

Nous rappelons que la masse de l'électron nous est connue. Ce qui est intéressant c'est que deux éléments ont
des propriétés chimiques identiques mais des raies différentes. Les scientifiques de l'époque se demandaient
pourquoi et ayant (que) le modèle de Bohr à leur disposition ils ont pu conclure que cette différence dans les
raies venait d'après les deux dernières relations de la différence de la masse du noyau de l'atome après avoir
élaboré le modèle avec entraînement de l'atome hydrogénoïde.

Encore fallait-il déterminer cette différence de masse et expliquer sa provenance!

Nous avons donc:

(41.74)
ce qui montra aux scientifiques de l'époque que le noyau de deutérium est formé de 2 particules de masse
équivalente à celle du proton. Donc par déduction logique, ce noyau se doit d'être composé d'un proton (ce
que l'on sait évidemment!) et d'une particule neutre.

Cette hypothèse et celle du "neutron", qui fut découvert ultérieurement de manière expérimentale en 1932
par Chadwick.

D'ailleurs vous pouvez vérifier dans votre table des isotopes (si vous en avez une...) que la différence de
masse atomique (notion que nous verrons lors de notre étude de la physique nucléaire) est de 0.5001 !!!

MODÈLE DE SOMMERFELD ET WILSON

Pour élaborer leur modèle, Sommerfeld et Wilson firent appel à la dynamique classique pour généraliser le
modèle de Bohr à des orbites de type képlérien (donc non uniquement circulaire mais elliptique dans le cas
général).

Comme nous l'avons vu plus haut, dans le cas d'un système à deux corps sollicités par une force centrale,
l'énergie totale du système est (nous négligeons l'énergie potentielle gravitationnelle) :

(41.75)

Pour trouver l'expression de la trajectoire de la masse m, nous allons procéder exactement de la même
manière que celle utilisée en astronomie (cf. chapitre d'Astronomie) pour déterminer les orbites
képlériennes.

Ainsi, nous avons démontré dans le chapitre d'Astronomie que :

(41.76)

avec:

et (41.77)

Il va sans dire que dans notre cas, il ne s'agit plus d'un potentiel gravitationnel mais électrique. Ce qui nous
amène à écrire pour notre problème:

(41.78)

Encore nous reste-t-il à trouver l'expression de K sous forme quantifiée (selon les postulats de Bohr).

Attaquons-nous d'abord à déterminer l'expression du paramètre focal p de la trajectoire:

Dans notre problème actuel, l'énergie cinétique et potentielle exprimées en coordonnées polaires donnent
(cf. chapitre de Calcul Vectoriel) :
et (41.79)

L'énergie totale de l'atome est donc donné par:

(41.80)

De façon identique à celle de Bohr, Sommerfeld et Wilson appliquèrent la même forme de quantification
pour le rayon-vecteur et l'étendirent à la quantification pour l'angle azimutal.

Soit les moments cinétiques:

et (41.81)

Les quantités de mouvement s'obtiennent par dérivation du lagrangien par rapport aux coordonnées
généralisées puisque (cf. chapitre de Mécanique Analytique):

(41.82)

La quantification sur l'angle est immédiate, puisque est une constante du mouvement. Effectivement, le
lagrangien L étant indépendant de (mais pas de ), l'invariance du moment cinétique se traduit par
l'équation de Lagrange:

(41.83)

Ce qui nous donne:

(41.84)

avec étant le "nombre quantique azimutal", pour rappeler qu'il est lié à la quantification de l'angle
polaire.

De cette dernière relation nous obtenons aussi :

(41.85)

Revenons maintenant à:
(41.86)

ce qui nous donne:

(41.87)

Attaquons-nous maintenant à déterminer l'excentricité e de la trajectoire (à ne pas confondre avec la notation


de la charge électrique si possible !).

Ce qui nous donne:

(41.88)

Pour déterminer la quantification du moment cinétique par rapport à la variable radiale, nous allons nous
servir d'une substitution:

(41.89)

En notant simplement r' la dérivée , l'intégrale s'écrit:

(41.90)

où nous avons utilisé comme nous l'avons déjà démontré.

En reportant:

(41.91)

dans l'intégrale du moment cinétique radial, nous obtenons (simple à obtenir):

(41.92)

d'où nous déduisons compte tenu de que:


(41.93)

ce qui nous amène à:

(41.94)

et donc:

(41.95)

Après quelques simplifications élémentaires nous obtenons finalement :

(41.96)

où , appelé également "nombre quantique radial" peut lui être nul! Car c'est le cas si , c'est-à-dire si
la trajectoire est un cercle (cas particulier de Bohr).

Nous introduisons alors un entier n appelé "nombre quantique principal" tel que:

(41.97)

avec .

Sommerfeld et Wilson montrent par là que les orbitales du modèle de Bohr doivent pouvoir êtres
déterminées par ces deux nouveaux nombres quantiques:

Exemple:

Pour nous avons deux sous-orbitales possibles :

(41.98)

La valeur est impossible par définition car cela signifierait que le petit axe est nul (ellipse dégénérée
en une droite) et l'électron ne peut traverser le noyau (dans le modèle classique en tout cas). Donc la plus
petite valeur entière de possible est 1.

Il y a donc alors n orbites donnant le même terme spectral. Autrement dit, il y a n fois la même
quantification d'énergie. Nous disons également que le niveau d'énergie (total) est "n fois dégénéré".
L'idée de Sommerfeld était de rendre compte de la richesse des spectres observés. De ce point de vue, les
résultats sont décevants: la quantification de tous les degrés de liberté fait bien apparaître plus d'états (il faut
maintenant deux nombres quantique pour spécifier complètement l'état, alors que le modèle de Bohr n'en
considère qu'un) mais le degré supplémentaire ne fait qu'introduire une dégénérescence en énergie.

Pour résumer ce modèle, il y a donc exactement le même nombre de niveaux d'énergie et donc le même
nombre de transitions d'états énergétiques possibles que celui de Bohr. Du point de vue spectral, la théorie
de Sommerfeld-Wilson n'apporte rien de plus que celle de Bohr mis à part que les orbites sont elliptiques et
n'explique donc pas l'étendue des spectres observés.

(41.99)

Au fait, l'idée à partir de maintenant va de reprendre le même modèle en y ajoutant les corrections
relativistes. Le travail va nécessairement être plus long mais ô combien fructueux.

MODÈLE RELATIVISTE DE SOMMERFELD

Cependant, le modèle de Sommerfeld et Wilson peut être considéré comme incomplet si nous ne prenons
pas en compte les variations de paramètres qu'engendre les résultats de la théorie de la relativité restreinte
(cf. chapitre de Mécanique Relativiste).

Effectivement, comme nous l'avons démontré dans le développement du modèle de Bohr, l'énergie cinétique
de l'électron est donnée par:

(41.100)

ce qui nous donne:

(41.101)

Pour l'hydrogène et le niveau , nous trouvons et comme facteur de Michelson-


Morley (cf. chapitre de Relativité Restreinte) :

(41.102)

Certes, la variation est faible mais les valeurs de spectrométrie étaient tellement précises qu'il fallait
introduire la relativité restreinte pour prendre en compte ces infimes variations et ainsi valider la théorie par
l'expérience.
Remarque: Comme nous pouvons le voir facilement, la relation donne que plus la particule est éloignée du
noyau (n grand) plus sa vitesse est faible. Ce résultat a été confirmé expérimentalement en remplaçant
l'électron artificiellement par un muon et les scientifiques ont ainsi remarqué que la durée de vie de ce
dernier augmentait faiblement en fonction de la valeur de n.

Déterminons dans l'ordre des choses, l'expression des conditions de quantification avec les facteurs
relativistes. Avant de commencer, il est important de comprendre que nous considérons le noyau comme
fixe et comme référentiel de notre système. Ainsi, par rapport à ce référentiel la masse de l'électron subit une
variation relativiste mais non le potentiel électrique (il faudrait prendre en compte la variation de ce dernier
si et seulement si le référentiel était l'électron lui-même).

En dynamique relativiste (cf. chapitre de Relativité Restreinte), nous avons démontré que l'énergie cinétique
(sous forme de notation Lagrangienne avec "T" au lieu de ) s'exprime sous la forme:

(41.103)

L'énergie potentielle (sous forme de notation Lagrangienne avec "V" au lieu de ) ne subissant pas de
variation relativiste, nous avons toujours:

(41.104)

Le lagrangien est donc:

(41.105)

En travaillant en coordonnées polaires, dans lesquelles la vitesse a pour expression:

(41.106)

Dès lors:

(41.107)

Les conditions de quantification de Sommerfeld étant:

(41.108)

A présent, nous devons rechercher des expressions relativistes pour et .

Commençons par :
avec (41.109)

Soit:

(41.110)

Ce qui donne:

(41.111)

Comme :

(41.112)

nous avons finalement:

(41.113)

La première condition de quantification s'écrit donc:

(41.114)

pour :

avec (41.115)

Soit:

(41.116)

Ce qui donne:
(41.117)

Comme :

(41.118)

nous avons finalement:

(41.119)

La seconde condition de quantification s'écrit donc:

(41.120)

En résumé, les conditions de quantification de l'atome relativiste de Sommerfeld sont:

et (41.121)

Nous pourrions, en voyant les deux résultats ci-dessus, conclure un peu trop rapidement en pensant qu'il
aurait suffit finalement de multiplier les deux conditions de quantification par le facteur de Michelson-
Morley relativement à la transformation relativiste de la masse. Or, un tel raccourci est complètement faux et
tout sauf rigoureux ! Effectivement, si vous appliquez un tel raisonnement il suffirait alors de prendre
l'expression de l'énergie totale du modèle non relativiste de Sommerfeld-Wilson et d'introduire partout où la
masse se situe le facteur de Michelson-Morley. Pourtant le résultat final n'a absolument rien de semblant
avec le résultat que nous allons obtenir plus loin. Il faut donc toujours être prudent et travailler comme le
mathématicien sans brûler les étapes !

L'énergie totale relativiste de l'atome étant donnée par:

(41.122)

Il nous faut exprimer cette énergie totale en fonction des conditions de quantification. Il y a un long travail
mathématique à effectuer mais indispensable pour arriver au résultat de notre étude.

Soit le calcul de l'expression :

(41.123)

avec :
et (41.124)

En élevant au carré:

et (41.125)

Donc:

(41.126)

Nous ajoutons des deux cotés de l'égalité , ce qui donne :

(41.127)

En multipliant des deux cotés par il vient :

(41.128)

En extrayant la racine carrée:

(41.129)

Si nous introduisons cette dernière relation dans l'expression de l'énergie totale, nous obtenons:

(41.130)

Maintenant, il nous reste à déterminer les expressions de et en fonction de et respectivement .

L'intégrale de quantification de l'angle azimutal est immédiate :

(41.131)
Soit:

(41.132)

L'intégrale de quantification du rayon-vecteur nécessite un développement plus conséquent:

(41.133)

Ensuite, viennent de longs et joyeux développements mathématiques:

En reprenant l'expression de l'énergie totale:

(41.134)

Nous obtenons:

(41.135)

En élevant au carré et en faisant quelques transformations:

(41.136)

En travaillant sur le terme entre parenthèse, on le posera égal à A tel que:

(41.137)
En ajoutant et en retranchent et en décomposant le terme en et ensuite en
les regroupant :

(41.138)

Nous posons en vue de simplification des calculs (pour alléger le nombre de termes à manipuler):

(41.139)

Nous obtenons ainsi:

(41.140)

En mettant en évidence, nous avons :

(41.141)

En ajoutant et en retranchant 1 dans la parenthèse:

(41.142)

En travaillant, à présent, sur les trois derniers termes:

(41.143)

Comme nous avons :

(41.144)

En posant:
(41.145)

Et en posant également:

(41.146)

puisque .

Sommerfeld introduit alors ce qu'il appelle une "constante de structure fine" définie par la relation:

(41.147)

valant :

(41.148)

Remarque: La constante de structure fine est une des constantes les plus importantes de la physique. D'abord
parce qu'elle est sans dimensions, et secundo parce qu'elle est à ce jour la mieux connue (au niveau de la
précision) de toutes les constantes et tertio, parce qu'elle dépend que de termes qui semblent être des
constantes fondamentales. Les physiciens et astrophysiciens cherchent donc à observer si la valeur de cette
constante varie au cours du temps ce qui impliquerait immédiatement qu'une au moins des constantes
implicites n'est pas atemporelle.

Compte tenu de la constante de structure fine, nous écrivons :

(41.149)

En résumé:

(41.150)

Avec:

(41.151)

Nous aboutissons donc à l'intégrale suivante:


(41.152)

Le théorème des résidus (cf. chapitre d'Analyse Complexe) appliqué à l'intégrale précédente donne pour
expression:

(41.153)

Nous voyons trivialement qu'il y a un pôle à l'origine que nous allons calculer le résidu en ce point en
passant à la limite pour . Nous posons pour cela:

(41.154)

En passant à la limite construite sur la base du théorème des résidus:

(41.155)

Le résidu correspondant au pôle est donc :

(41.156)

Nous voyons également qu'il y a un second résidu à l'infini et pour le calculer, nous effectuons à
nouveau un changement de variable. Nous posons (conformément à la méthode ce que nous avons vue dans
le chapitre d'Analyse Complexe):

(41.157)

L'intégrale s'écrit alors:

(41.158)

Pour trouver le résidu, nous allons faire un développement en série de Laurent de:

(41.159)

autour de ce pôle de valeur nulle. Pour ce faire, nous posons :

(41.160)

Nous connaissons le développement de Taylor de l'expression résultante de ce changement de variable:


(41.161)

Appliqué au radical, nous obtenons :

(41.162)

Il vient alors la automatiquement la série de Laurent (chouette!):

(41.163)

où nous voyons immédiatement que le pôle est d'ordre 2.

Le second résidu est le coefficient en :

(41.164)

Effectivement, nous avons simplement appliquaé la relation démontrée dans le chapitre d'Analyse
Complexe:

(41.165)

pour déterminer le résidu se trouvant dans la série de Laurent avec l'ordre du pôle k valant donc 2.

En final, nous aboutissons à:

(41.166)

Avec:

(41.167)

Pour le calcul de nous avons :


(41.168)

Dès lors, l'intégrale curviligne a pour expression:

(41.169)

Après simplification:
(41.170)

Nous élevons au carré:


(41.171)

Donc :

(41.172)

d'où:

(41.173)

Nous posons :

En travaillant sur le dénominateur :


(41.174)

En ajoutant et en retranchant :

(41.175)

Donc:

(41.176)

ou encore:

(41.177)

Ou encore :

(41.178)

Nous considérons dans le terme le radical qui s'écrit encore:


(41.179)

Soit le développement en série (cf. chapitre sur les Suites Et Séries)


alors:

(41.180)

Donc :

(41.181)

Comme , nous pouvons négliger les termes au-delà de l'ordre 2 tel que:

(41.182)

Le terme suivant s'écrit alors:

(41.183)

En travaillant maintenant sur le terme entre les crochets et en considérant uniquement le carré sans tenir
compte de son signe négatif (!):

(41.184)

Soit le développement en série de Taylor de (cf. chapitre sur les Suites Et Séries)
alors
(41.185)

En négligeant les termes au-delà de l'ordre 2:

(41.186)

Le terme entre les accolades s'écrit:

(41.187)

Nous entreprenons le développement en série de Taylor du terme entre les accolades:

(41.188)

En négligeant les termes au-delà de l'ordre 2:

(41.189)

En développant le carré du troisième terme, il vient :

(41.190)

Soit:

(41.191)

L'énergie totale de l'atome devient :


(41.192)

Finalement, nous obtenons pour l'expression de l'énergie:

(41.193)

Nous pouvons donner une autre expression pour l'énergie de l'atome hydrogénoïde puisque :

et (41.194)

L'expression de l'énergie totale de l'atome hydrogénoïde devient:

(41.195)

Soit:

(41.196)

Dans la littérature, nous trouvons d'autres expressions pour l'énergie totale qui sont plus intéressantes que les
précédentes (car plus traditionnelles). Ainsi, en considérant que , il vient:
(41.197)

Si nous cherchons une expression en fonction de la constante de Rydberg (voir plus haut) :

(41.198)

Donc l'expression de l'énergie totale relativiste de l'atome hydrogénoïde la plus condensée que nous
puissions trouver dans la littérature et que nous adopterons dans le présent site est:

(41.199)

La relation ci-dessus révèle bien l'existence d'une structure fine puisque les caractéristiques et de
l'orbite de l'électron apparaissent séparément dans un rapport et non plus uniquement sous la forme d'une
somme comme dans le premier modèle de Sommerfeld et Wilson.

Mais en toute rigueur, nous devrions écrire du fait de l'entraînement du noyau par la multiplication par le
terme :

(41.200)

ou:

(41.201)

Dans la quelle la constante de Rydberg a pour expression:

(41.202)

Cependant comme la masse du noyau est 1840 fois plus lourde que celle de l'électron, nous pouvons
admettre en première approximation que:

(41.203)

MOMENT MAGNÉTIQUE DIPÔLAIRE QUANTIQUE

A la même époque du développement du modèle de Sommerfeld, certains physiciens s'attachent à étudier


une autre propriété de l'atome. Ils observèrent que sous l'application du champ magnétique, les raies se
doublaient. Pour expliquer cela, ils eurent l'idée géniale et extrêmement simple d'expliquer ce phénomène
par le moment magnétique de l'électron.

Remarque: Nous verrons en physique quantique ondulatoire, qu'au fait, même en l'absence de champ
magnétique une mesure très fine des raies montre qu'elles sont toutes doubles et ce à cause du couplage
spin-orbite. Dès lors, une interprétation correcte est de dire qu'il y doublement du dédoublement des raies
sous l'application du champ magnétique.

Ainsi, soit l'expression de la norme du moment magnétique dipolaire (cf. chapitre de Magnétostatique):

(41.204)

le moment magnétique est donc égal à la surface entourée par l'orbite de l'électron multipliée par le courant
de l'électron (perpendiculaire au vecteur unitaire de la surface) sur sa ligne d'orbite soit:

(41.205)

où:

(41.206)

est la période du mouvement.

Nous avons vu que la somme des moments cinétiques étant égale à :

(41.207)

donc le rapport moment magnétique/moment cinétique donne:

(41.208)

Le rapport est appelé le "rapport gyromagnétique orbital" et la quantité:

(41.209)

est appelée "magnéton de Bohr".

Remarque: Il est important de se souvenir des quelques développements et définitions qui viennent d'être
faits lorsque nous développerons l'équation de Pauli en Physique Quantique Relativiste.

Fréquemment nous notons la relation ci-dessus ainsi:

(41.210)

où est appelé "nombre quantique magnétique".


Sachant que le nombre quantique principal est décomposé par les nombres quantiques radial et azimutal, il y
a alors autant de moments magnétiques qu'il y a de géométries différentes d'orbites pour une valeur donnée
du nombre quantique principal. Au fait, il y en a même le double si nous considérons que l'électron peut
tourner dans le même sens ou dans le sens inverse des aiguilles d'une montre (le moment magnétique étant
une grandeur vectorielle).

Maintenant, prenons les deux exemples :

et (41.211)

pour lequel nous posons maintenant , nombre que nous appelons "nombre quantique de moment
cinétique orbital" et ayant des valeurs comprises entre : .

Qu'avons-nous finalement ?

1. Lorsque , nous avons et comme n'a qu'une seule sous-couche, alors lors de l'application
d'un champ magnétique nous n'avons toujours qu'une et une seule raie de visible.

(41.212)

2. Lorsque , nous avons et et comme a deux sous-couches. Lorsqu'aucun champ


magnétique n'est appliqué, les raies des deux sous-couches sont superposées donc indiscernables (on n'en
voit qu'une seule). Mais lorsqu'un champ magnétique est appliqué les deux-sous couches se distinguent de
par le moment magnétique et dès lors nous avons deux raies mais au total il en existe théoriquement 3 (une
sans champ, et deux avec champ).

(41.213)

Ainsi, nous avons :

(41.214)

où :

(41.215)
L'énergie potentielle d'un moment magnétique placé dans un champ magnétique B vaut:

(41.216)

Donc finalement pour chaque orbitale d'électron soumis à un champ magnétique nous avons :

(41.217)

toujours avec .

L'observation du spectre d'un atome dans un champ magnétique a pour effet d'ajouter des raies de par
l'énergie potentielle du moment magnétique. C'est ce que nous appelons "l'effet Zeeman" car c'est ce dernier
qui a mesuré ces raies pour la première fois (avant la théorie).

SPIN

Diverses constatations expérimentales ont conduit à attribuer à l'électron un moment cinétique et magnétique
propre (dédoublement des raies Zeeman elles-mêmes !!!).

Il a effectivement été expérimentalement mesuré que le moment magnétique résultant était juste égal à la
valeur du magnéton de Bohr. Il est alors tentant d'attribuer ce moment magnétique à l'électron et émettre
l'hypothèse que ce dernier viendrait peut-être du fait qu'il tourne sur lui-même (moment cinétique
intrinsèque) : il possèderait donc un "spin" égal au magnéton de Bohr et ce dernier pouvant prendre des
valeurs négatives ou positives. Nous parlons alors de "nombre quantique de spin" et ce dernier donne le
nombre de différentes valeurs que peut prendre le spin.

Cependant, cette vision classique d'une rotation propre (moment cinétique intrinsèque) de la particule est en
fait trop naïve et par la même erronée.

En effet, dans un premier temps, si la particule est ponctuelle, la notion de rotation propre autour de son axe
est tout simplement dénuée de sens physique. Rappelons que puisque par définition, l'axe de rotation d'un
objet est le lieu de points de cet objet qui restent immobiles, alors si la particule est ponctuelle, son axe
propre est sur la particule, donc celle-ci est immobile.

Dans un deuxième temps, si la particule n'est pas ponctuelle, alors la notion possède un sens, mais on se
heurte dans ce cas à une autre difficulté. Supposons par exemple que la particule soit un électron, modélisé
comme étant un corps sphérique de rayon a. Nous obtenons une estimation du rayon a en écrivant que
l'énergie de masse de l'électron est de l'ordre de grandeur de son énergie potentielle électrostatique (cf.
chapitre d'Électrostatique), soit :

(41.218)

La valeur numérique de ce "rayon classique de l'électron" est en prenant sa masse au repos.

Si nous attribuons alors à cet électron un moment cinétique égal à (qui a les unités d'un moment
cinétique), nous obtenons pour un point de l'équateur une vitesse v vérifiant :

(41.219)
La valeur numérique de la vitesse vaut alors ... donc la vitesse de rotation propre serait
supérieure à la vitesse de la lumière dans le vide, ce qui pose bien évidemment des problèmes avec la théorie
de la relativité restreinte (cf. chapitre de Relativité Restreinte).

Nous ne pouvons donc avec les outils mathématiques de la physique quantique corpusculaire formaliser
rigoureusement la notion de spin mais nous y reviendrons dans le chapitre de physique quantique relativiste
(équation de Pauli) et nous montrerons que le spin est au fait quelque chose de beaucoup plus subtile qu'une
simple rotation.

Mais revenons à notre vision classique en attendant. Donc, lorsque nous observons un dédoublement des
raies de Zeeman nous supposons que cela est du au spin s de l'électron qui peut prendre deux orientations
(sens vectoriels) différentes.

Il a donc été mesuré que le moment magnétique propre de l'électron est égal à la valeur du magnéton de
Bohr soit:

(41.220)

Si nous posons (ce que les physiciens aiment bien faire) nous avons:

(41.221)

(ceci juste afin d'obtenir une similitude avec ...)

Cette valeur est constante mais peut être négative ou positive en fonction du sens de rotation propre de
l'électron relativement à l'observateur (le moment cinétique ayant une orientation vectorielle). Ainsi:

(41.222)

Ce résultat, de la plus haute importance, nous amène aussi à la conclusion que chaque nombre quantique
magnétique est dégénéré deux fois par le nombre quantique de spin ! Ainsi, comme nous le verrons un peu
plus loin dans des exemples concrets (avec schémas à l'appui), chaque nombre quantique principal n est dit
"dégénéré" un nombre de fois :

PRINCIPE D'EXCLUSION DE PAULI

Suite au fait que l'état d'un électron atomique peut être caractérisé avec au moins les 4 nombres quantiques
suivants dont nous avons démontré la provenance :

(41.223)

ou sous forme étendue suivante :

(41.224)

Wolfgang Pauli, a alors posé pour expliquer certaines régularités dans les propriétés atomiques un principe
d'exclusion nommée aujourd'hui "principe d'exclusion de Pauli" et qui s'énonce de la manière suivante :
Dans un atome, deux électrons ne peuvent avoir le même quadruplet ordonnée de nombres
quantiques.

Remarques:

R1. Nous notons parfois selon les situations (pour ce que cela change...).

R2. Nous savons par la physique quantique ondulatoire que le principe d'exclusion s'applique aux particules
qui sont des "fermions". Ce sont les particules (élémentaires ou composées) qui ont un spin demi-entier,
comme le proton, le neutron et le neutrino. Ce principe ne s'applique pas au groupe de particules dites
"bosons", qui ont un spin nul ou entier. Les particules alpha, qui sont composées d'un nombre pair de
fermions, sont des bosons. Les photons sont des particules de spin 1, donc des bosons.

Il est possible à partir de ce principe, d'établir une sorte de catalogue des éléments atomiques à partir des
possibilités de remplissage des orbitales, supposées disposées en couches, améliorant ainsi la classification
de Mendeleïev.

Les étudiants les voient fréquemment pour la première fois dans les écoles lors de leurs cours de chimie. Ils
les utilisent la plupart du temps, sans savoir ce qu'ils représentent vraiment.

COUCHES ÉLECTRONIQUES

Au cours des années 1920, Bohr, Stoner et d'autres conçurent un modèle de la structure électronique des
atomes qui permet de comprendre le tableau périodique des éléments. Le travail de Moseley a permis de
déterminer le nombre des protons dans le noyau et, comme l'atome est neutre, c'est aussi le nombre des
électrons orbitaux. Il n'est pas simple de déterminer la structure atomique et dans cette analyse, les
physiciens ont aidé par les expériences menées par les chimistes.

Ainsi, selon les chimistes les électrons occupent des couches et des sous-couches autour du noyau par ordre
d'énergie croissante selon des règles associées à leurs nombres quantiques que nous avons déterminé
précédemment. Ainsi, la "configuration électronique" est l'arrangement des électrons dans un atome, une
molécule ou un autre corps. Précisément, c'est la position des électrons dans une orbitale atomique,
moléculaire ou d'autres formes d'orbitales électroniques.

Remarque: Rigoureusement ce concept de "couche" comme pouvons nous l'imaginer visuellement n'a aucun
sens si l'on se réfère aux résultats de la mécanique quantique (cf. chapitre de Physique Quantique
Ondulatoire). C'est la raisons pour laquelle le débat qui consiste à savoir comment remplir les couches est
stérile car il n'existe par rigoureusement sans une grossière approximation de règle générale.

Chaque couche correspond à une valeur spécifique du "nombre quantique principal" n et traditionnellement
les couches sont désignées (cette tradition devrait être abandonnée... mais comme toutes les traditions elle a
la peau dure...) par les lettres majuscules K, L, M, N, O,... correspondant aux nombres 1, 2, 3, 4, 5...que peut
prendre le nombre quantique principale.

Le "nombre quantique secondaire/azimutal" noté conventionnellement par la lettre l correspondant des états
de dégénérescence que peuvent prendre les couches pour une valeur donnée de n tel que :

Pour la couche K ( ) nous avons une unique sous-couche comme :

(41.225)

et ainsi pour la couche L ( ) nous avons deux sous-couches:


(41.226)

et ainsi pour M ( ) avons trois sous-couches:

(41.227)

et ainsi de suite...

Les chimistes ont pour habitude de noter les premières sous-couches par les lettres latines:

s (sharp), p (principal), d (diffuse), f (fondamental)....

Qui sont l'équivalent alphabétique du nombre quantique secondaire l.

Le "nombre quantique magnétique" désigne donc la position de l'orbitale dans l'espace (au fait, il
représente le vecteur directeur perpendiculaire à la surface de l'orbite décrite par l'électron).

Ce dernier nombre prend, nous l'avons démontré, le double de la valeur qu'il y a de sous-couches par couche
(effet Zeeman : doublement des raies) et puisque :

(41.228)

Le "nombre quantique de spin" désigne le nombre de différentes valeurs que peut prendre le moment
magnétique de l'électron sur une orbitale donnée. Evidemment, il ne peut prendre que deux valeurs qui
correspondent au sens de rotation propre de l'électron par rapport à l'observateur et produit un dédoublement
du doublement des raies (dédoublement Zeeman) :

(41.229)

Définitions:

D1. Une "couche électronique" est un groupe d'états qui ont le même nombre quantique principal n.

D2. Une "sous-couche" est un groupe plus petit d'états qui sont caractérisés par les nombres quantiques de n
et l.

D3. Une "orbitale" est précisée par les trois nombres quantique et elle peut contenir deux électrons
l'un de spin haut et l'autre de spin bas.

D4. Un "état" est défini par les quatre nombres quantiques et contient un seul électron comme
l'exige le principe d'exclusion.

Résumons sous forme de schémas ce que nous avons vu jusqu'à maintenant :

Prenons l'exemple :
(41.230)

Ainsi, le principe d'exclusion de Pauli permet qu'il y ait deux électrons sur la couche K.

Prenons l'exemple :

(41.231)

Ainsi, le principe d'exclusion de Pauli permet qu'il y ait 8 électrons sur la couche L.

Et ainsi de suite...

Sous forme d'atomes schématisés selon le modèle de Bohr, cela donne :


(41.232)

Sous une notation conforme à celle des chimistes, les configurations fondamentales de quelques éléments
s'écrivent :

(41.233)

Qui est une forme condensée du tableau équivalent suivant :


(41.234)

Cependant, bien que le modèle relativiste de Sommerfeld soit d'une précision et d'une cohérence redoutable
par rapport aux observations expérimentales, il n'explique pas certains phénomènes importants que nous
observons à l'échelle de l'atome. Ainsi, ce modèle est dans l'incapacité d'expliquer la désintégration des
éléments, le comportement duaire (complémentaire) de la matière entre onde et corpuscule, l'annihilation
entre matière et antimatière et encore bien d'autres.

Ce sont des développements beaucoup plus complexes et à la fois compatibles avec ce que nous avons vu
qui vont être développés dans le chapitre suivant traitant de la Physique Quantique Ondulatoire permettant
d'expliquer de manière parfaitement satisfaisant nombre de phénomène qui étaient inexpliqués à l'échelle du
nanomètre.
42. PHYSIQUE QUANTIQUE ONDULATOIRE (1/2)

F ille de l'ancienne théorie des quanta (cf. chapitre de Physique Quantique Corpusculaire), la physique
quantique ondulatoire appelée aussi "mécanique quantique" constitue le pilier d'un ensemble de théories
physiques que nous regroupons sous l'appellation générale de "physique quantique".

Cette dénomination s'oppose à celle de la physique classique, celle-ci échouant dans sa description du
monde microscopique (atomes et particules) ainsi que dans celle de certaines propriétés du rayonnement
électromagnétique (voir typiquement les expériences des fentes de Young dans le chapitre d'Optique
Ondulatoire) ou des semi-conducteurs (voir typiquement l'Effet Hall dans le chapitre d'Électrocinétique).

Remarque: L'extension relativiste pertinente de la mécanique quantique est la physique quantique relativiste
(voir. chapitre du même nom).

La mécanique quantique a repris et développé l'idée de dualité onde-corpuscule introduite par De Broglie et
Bohr consistant à considérer les particules de matière non pas seulement comme des corpuscules ponctuels,
mais aussi comme des ondes, possédant une certaine étendue spatiale (cf. chapitre de Physique Quantique
Corpusculaire). Ces deux aspects onde/corpuscule des particules ("quanton"), mutuellement exclusifs, ne
peuvent être observés simultanément. Si nous observons une propriété ondulatoire, l'aspect corpusculaire
disparaît et réciproquement.

A ce jour, aucune contradiction n'a pu être décelée entre les prédictions de la mécanique quantique et les
tests expérimentaux associés. Ce succès a hélas un prix : la théorie repose sur un formalisme mathématique
assez abstrait, qui rend son abord assez difficile. Ce qui est plus difficile encore c'est qu'il est très difficile,
voir impossible, de présenter ce domaine de la physique de manière pédagogique linéaire... Ceci à pour
conséquence que bon nombre d'ouvrages à son sujet (dont le présent texte ne serait être exclu), qu'ils
s'adressent à des spécialistes ou non, voient leur explications ou textes soumis à de nombreuses critiques
d'interprétations, de relecture et de compléments.

Pour en sortir il est favorable de prendre pour base le "principe d'objectivité" du à Heisenberg qui est à la
base de la "mécanique quantique standard" : existe ce qui est expérimentalement observable.

Ce principe est admis par la majorité des physiciens, mais non la totalité. Un électron est il présent à
plusieurs endroits? Pour que cela soit recevable il faut une expérience qui le trouve à plusieurs endroits, ce
qui est impossible donc nous ne sommes pas tenu de répondre à la question! Dire qu'il est à plusieurs
endroits avant que nous l'observions n'est pas recevable en physique: principe d'objectivité. D'une manière
générale, nous allons donc aussi renoncer à la notion de trajectoire et de mouvement, ce qui va permettre, de
lever la contradiction du freinage par rayonnement (cf. chapitre d'Électrodynamique) : car il n'y a plus de
mouvement au sens classique. Les notions de vitesse et d'accélération perdent tout sens à cette échelle!

Une minorité de physiciens nient ce principe et ont fondé une mécanique quantique non standard avec des
grandeurs classiques ce qui explique que l'on puisse trouver surtout dans les revues de vulgarisation des
exposés qui s'écartent de la mécanique quantique standard (celle de la majorité des physiciens). Cette
version non standard donne les mêmes prévisions pour tout expérience réalisable, c'est donc un modèle
possible.

En conclusion la mécanique quantique est une théorie inachevée dans laquelle beaucoup de points sont assez
obscurs.

POSTULATS

Contrairement à la majorité des ouvrages sur le sujet, nous sommes pédagogiquement (et non pas
techniquement!) très peu convaincus quant à l'impact de la présentation des postulats de la mécanique
quantique au début de son étude dans les classes. Nous nous permettons d'exposer nos raisons (expérience
faite):

1. Ils peuvent se déduire de raisonnements mathématiques simples et logiques (algèbre élémentaire et


probabilités) fondées sur les postulats de la physique quantique corpusculaire et du principe de
complémentarité et découlent donc d'une évolution de cette dernière. Même si rigoureusement la démarche
est fausse au moins elle est pédagogique!

2. Ces postulats sont indigestes, voir incompréhensibles si la mécanique quantique (son formalisme et son
vocabulaire) n'a pas été d'abord appréhendée par un certain nombre d'exercices ou d''un usage régulier.

Nous pouvons alors considérer que les seuls éléments non démontrables théoriquement (à notre
connaissance) qui auraient leur place au rang de postulat seraient : le principe de complémentarité de De
Broglie (nous en parlerons plus tard), la loi de Planck (déjà vue au chapitre précédant) et la mesure d'un
observable.

Cependant..., dans l'objectif de respecter la tradition, et surtout de respecter la méthodologie scientifique,


nous avons choisi de quand même présenter ces postulats en début de ce chapitre mais sans trop insister
dessus. Nous conseillons cependant vivement au lecteur non averti, de lire ceux-ci sans trop chercher à les
comprendre mais simplement de penser à y revenir régulièrement pendant la lecture du chapitre. Dès lors,
tout deviendra probablement plus limpide et la lumière sera...

Remarques: Nous verrons des cas pratiques, dans ce chapitre même, de la théorie quantique pour un usage
ultérieur en physique quantique des champs et physique nucléaire. Nous conseillons cependant au lecteur de
lire en même temps les chapitres d'Informatique Quantique, de Chimie Quantique et de Chimie Moléculaire
qui semblerait-il aident plus que grandement la compréhension de certains passages un peu trop théoriques
présentés ici.

1ER POSTULAT : ÉTAT QUANTIQUE

L'état d'un système quantique classique est spécifié par les coordonnées généralisées (cf. chapitre de
Mécanique Analytique) et est complètement décrite par une fonction notée en toute généralité:

(42.1)

dite "fonction d'état" ou "fonction d'onde", dont le module au carré (multiplication de la fonction par son
conjugué) donne la densité de probabilité de trouver instantanément le système dans la configuration
au temps t (si le système est dépendant du temps):

(42.2)

ce que nous justifierons plus loin!

Remarques:

R1. Le fait que nous parlions "d'onde" au lieu de "particule" vient du postulat génial et ma foi assez logique
de De Broglie que nous appelons "postulat de complémentarité" (que nous détaillerons plus loin aussi) et qui
associe à tout particule de matière, une onde et réciproquement.

R2. Le fait que nous traitions des probabilités et que celle-ci soit proportionnelle au carré du module de la
fonction d'onde vient des principes d'incertitudes de Heisenberg que nous démontrerons plus loin et
principalement de l'expérience des fentes de Young avec des électrons (cf. chapitre d'Optique Ondulatoire).
En corollaire, la particule étant nécessairement située quelque part dans l'espace entier, nous avons la
condition de normalisation que l'intégrale sur tout l'espace vaut :

(42.3)

à un facteur de phase près. En d'autres termes doit être normée, ce que nous appelons traditionellement la
"condition de normalisation de De Broglie".

Remarques:

R1. Notons que même normée, est déterminée à un facteur de phase près. De plus, il est préférable que
soit différentiable, car des opérateurs différentiels agissent sur elle pour obtenir des prévisions théoriques
sur des propriétés mesurables, et finie pour qu'elle soit normalisable...

R2. Lorsque l'intégrale donnée plus haut permet d'obtenir une quantité finie, nous disons qu'elle est de "carré
sommable". Dans le cas contraire, il faut la normaliser pour que le modèle théorique corresponde à la réalité!
Nous y reviendrons aussi plus en détails (avec démonstrations!).

Rapellons qu'un "facteur de phase" est un facteur complexe constant de module unitaire. Nous pouvons
l'écrire (selon ce que nous avons étudié dans le chapitre des Nombres lors de notre étude des nombres
complexes) , où est un angle quelconque, appelé la "phase" (cf. chapitre de Mécanique Ondulatoire).
Nous démontrerons aussi plus loin en toute rigueur pourquoi celui-ci n'a aucune influence.

Nous pouvons formuler ce postulat de manière un peu plus formelle car comme nous le verrons dans
plusieurs exemples, la fonction d'onde est souvent un polynôme complexe qui peut dès lors s'exprimer dans
l'espace de Hilbert des polynômes. Cela donne dès lors dans le langage du formalisme bra-ket de Dirac (voir
plus loin les détails) la définition suivante:

Le vecteur d'état "ket" représenté par appartenant à l'espace vectoriel (espace de Hilbert) définit
l'état du système quantique à l'instant t. Ce vecteur d'état possède toutes les propriétés mathématiques
requises par la physique quantique et en particulier le produit scalaire du vecteur par le vecteur dual
(conjugué complexe) "bra" qui doit satisfaire le produit scalaire fonctionnel :

(42.4)

Remarque: La notation bra-ket a été introduite par Paul Dirac pour faciliter (du moins c'est censé...)
l'écriture des équations de la physique quantique, mais aussi pour souligner l'aspect vectoriel possible de
l'objet représentant un état quantique. Ce qui est donc spécifique à la physique quantique est que les vecteurs
ne sont pas dessinés avec des flèches mais avec des ket et des bras (cela vaut mieux qu'un pied....), mais cela
n'est qu'une question de notation et n'apporte aucune nouveauté mathématique. Par ailleurs, il ne faut pas
imaginer que nous écrivions explicitement dans les calculs ces vecteurs sous forme de colonnes (pensez aux
nombres complexes.... il est rare que nous les écrivions sous forme vectorielle)!

Pour résumer ces derniers paragraphes, les deux relations:

(42.5)

et:

(42.6)
sont donc équivalentes!

2ÈME POSTULAT : ÉVOLUTION TEMPORELLE D'UN ÉTAT QUANTIQUE

Si le système n'est par perturbé, l'évolution (supposée non relativiste!) de son état est gouvernée par
l'équation de Schrödinger d'évolution (dépendante du temps donc) :

(42.7)

Cette relation signifie simplement que c'est l'opérateur "énergie totale" ou "hamiltonien" H du système, qui
est responsable de l'évolution du système dans le temps. En effet, la forme de l'équation montre qu'en
appliquant l'hamiltonien à la fonction d'onde du système, nous obtenons sa dérivée par rapport au temps
c'est-à-dire comment elle varie dans le temps.

Remarque: Nous démontrerons plus loin cette relation (ce ne sera pas trivial malheureusement mais c'est
possible et donc cela élimine le besoin de la définir en tant que postulat).

Dans cette dernière relation, H est l'opérateur l'hamiltonien (énergie totale) du système que nous
démontrerons comme valant dans un cas particulier et simple :

(42.8)

Dans le cas où le potentiel est indépendant du temps (correspondant à un système conservatif en


mécanique classique), il existe (nous le verrons dans des exemples) un ensemble de solutions particulières
indépendantes du temps et satisfaisant (relation dont nous démontrerons la provenance) :

(42.9)

où est appelée une "fonction propre" (en analogie avec les vecteurs propres vu en algèbre
linéaire) de l'hamiltonien/opérateur H avec valeur propre/observable .

Ces solutions particulières décrivent alors des états spéciaux appelés "états stationnaires" (puisque
indépendants du temps...), dont nous démontrerons plus tard les propriétés et l'origine du nom, et qui
forment une base orthogonale.

L'équation aux valeurs propres précédente est souvent appelée "équation de Schrödinger indépendante du
temps". Elle définit les états stationnaires et n'a un sens bien évidemment que si le système est conservatif.

C'est surtout l'équation de Schrödinger indépendante du temps qui concerne la chimie quantique et la chimie
moléculaire (sujets que nous traitons dans la section de Chimie du site en détails). Nous cherchons en effet à
obtenir les fonctions d'onde décrivant les états stationnaires, et surtout l'état de la plus basse énergie, "l'état
fondamental", des atomes et des molécules. Les transitions observées en spectroscopie s'effectuant entre ces
états stationnaires (nous le démontrerons plus loin), leur détermination est donc un prérequis pour l'étude de
la spectroscopie. Cependant, il faut bien se rappeler que c'est l'équation d'évolution de Schrödinger, qui est
(dans un premier temps...) l'équation fondamentale de la physique quantique ondulatoire non relativiste : elle
joue le même rôle que l'équation de Newton en mécanique classique, soit celui d'une équation de
mouvement (voir la démonstration du théorème d'Ehrenfest plus bas).
Remarque: Au fait, nous verrons (cf. chapitre de Physique Quantique Relativiste) que l'équation d'évolution
de Schrödinger n'est qu'un cas particulier de ce que nous appelons "l'équation de Klein-Gordon libre" qui
elle-même est un cas particulier de l'équation de "Klein-Gordon généralisée", elle-même étant un modèle
limité par rapport à "l'équation de Dirac linéarisée" ... bref on a pas fini...

3ÈME POSTULAT : OBSERVABLES ET OPÉRATEURS

A chaque propriété physique mesurable (observable) d'un système notée par exemple:

(42.10)

où sont les coordonnées généralisées et les moments généralisés conformément aux notation adoptées
dans le chapitre de Mécanique Analytique, correspond un opérateur linéaire (donc cela peut être aussi un
matrice!), apppelé "opérateur hermitique", noté fréquemment avec un circonflexe tel que pour l'exemple
choisi celui-sera noté:

(42.11)

qui intervient toujours dans le calcul théorique d'un propriété physiquement mesurable.

Pour faire simple..., un opérateur hermitique en physique quantique est une expression mathématique telle
que si on prend son conjugué complexe (ou sa matrice adjointe si l'expression mathématique est une
matrice) alors le calcul théorique de la valeur mesurable est toujours donné par la même expression.

Exemples:

Voici les plus connus dont nous démontrerons l'origine dans le présent chapitre et celui de Physique
Quantique Relativiste:

E1. Coordonnées :

(42.12)

dont nous verrons un exemple pratique avec le théorème d'Ehrenfest dans le présent chapitre.

E2. Quantité de mouvement :

(42.13)

dont nous verrons aussi plusieurs exemples pratiques (dont avec le théorème d'Ehrenfest).

E3. Moment cinétique :

(42.14)

E4. Les matrices de Pauli:

(42.15)

Remarques:
R1. Cela peut sembler tomber du ciel..., mais nous verrons que cela vient tout seul lorsque nous ferons les
développements plus loin de quelques exemples bien concrets ou lors de la lecture du chapitre
d'Informatique Quantique.

R2. Dans le cadre de ce site, nous notons indifféremment, les opérateurs et les observables sans circonflexes
(c'est au lecteur de savoir sur quoi nous travaillons sans se mélanger les pinceaux...).

Nous verrons par ailleurs que certains opérateurs ne sont pas commutatifs et qu'ils obéissent à ce que nous
appelons des "relations d'anti-commutation" (qui sont à l'origine des principes d'incertitudes de Heisenberg).

Exemple (que nous démontrerons plus loin!):

(42.16)

Nous verrons par ailleurs trivialement à l'aide d'un cas pratique que deux observables A, B dont les
opérateurs respectifs commutent tel que :

(42.17)

possèdent une base de vecteurs propres commune. Nous disons alors qu'ils sont simultanément mesurables
avec précision (dans le cas contraire nous avons une incertitude... de Heisenberg). Les deux grandeurs A, B
peuvent alors être appelées "observables compatibles" (O.C).

L'ensemble des O.C. attachées à un système physique constituent un "ensemble complet d'observables
compatibles" (ECOC).

4ÈME POSTULAT : MESURE D'UNE PROPRIÉTÉ

La conséquence du postulat précédent est que la mesure de donne donc toujours une valeur propre de
l'opérateur hermitique associé, . En d'autres termes, les seules valeurs observables de la propriété sont
les valeurs propres de l'opérateur !

Les vecteurs propres et les valeurs propres d'un opérateur ont une signification spéciale: les valeurs propres
sont les valeurs pouvant résulter d'une mesure idéale de cette propriété, les vecteurs propres étant l'état
quantique du système lors de cette mesure.

C'est à cause de ce postulat qu'il est important de s'assurer que toute propriété physique soit représentée par
un opérateur hermitique. En d'autres termes, l'hermiticité de assure que ses valeurs propres (notées par
exemple: ) sont réelles

5ÈME POSTULAT : MOYENNE D'UNE PROPRIÉTÉ

Ce postulat est le moins intuitif et le plus difficile à démontrer (nous le démontrerons par l'exemple lors de
l'étude du théorème d'Ehrenfest). Son énoncé est le suivant :

La valeur moyenne (espérance) d'une propriété physique , quand le système se trouve dans l'état décrit par
la fonction est donnée par :

(42.18)
Une expression équivalente et que je trouve compliquée est la suivante : la probabilité de trouver la valeur
propre (de l'opérateur hermitique ), lors d'une mesure de la propriété effectuée au temps t sur le
système quantique préparé dans l'état décrit par la fonction , est donnée par le carré du module de la
projection de la fonction sur la fonction propre associée à la valeur propre (et son opérateur):

(42.19)

où la "projection" (ou "représentative") est définie par :

(42.20)

l'indice k étant ici pour indiquer qu'il peut y avoir pour certains opérateurs plusieurs valeurs et vecteurs
propres.

Remarque: Nous reviendrons sur ce formalisme et ces relations plus tard. Cependant plusieurse xemples
pratiques sont proposés dans le chapitre d'Informatique Quantique.

PRINCIPES D'INCERTITUDES CLASSIQUES

Avant de s'attaquer directement à la physique quantique et à ses outils mathématiques (et pseudo-
démonstrations des cinq postulats), nous devons d'abord introduire un exemple classique simple dans lequel
apparait un type particulier de phénomènes : la présence intrinsèque de l'incertitude dans toute mesure.

Cette étude sous forme classique et pas très rigoureuse, nous aidera à mieux appréhender l'incertitude
quantique (nous l'espérons) que nous étudierons et déterminerons plus tard et qui elle n'est pas d'origine
expérimentale!

Imaginons que nous souhaitions mesurer au moyen d'un microscope l'abscisse x d'une particule et les
composantes de sa quantité de mouvement p. Pour cela, un faisceau de lumière monochromatique (pour
simplifier) parallèle à éclaire la particule, il faut qu'au moins un photon choque la particule et parvienne à
l'oeil de l'observateur, pour que la mesure de x soit possible :

(42.21)

Une fois x mesuré, nous pouvons imaginer n'importe quel procédé pour mesurer la quantité de mouvement.

Soit l'angle que fait la direction du photon après le choc, avec . Supposons pour alléger les calculs que
la particule ait une masse assez élevée pour que nous puissions négliger le changement d'énergie du photon.
Nous voyons qu'après le choc, les composantes de la quantité de mouvement du photon selon et sont
(42.22)

Effectivement, rappelons que les relations entre les ondes électromagnétiques, l'équivalence masse-énergie
et la quantité de mouvement (cf. chapitre de Relativité Restreinte) sont les suivantes :

(42.23)

Il s'ensuit que la particule peut voir sa quantité de mouvement altérée. Les composantes de sa variation sont
(ne pas oublier qu'initialement elle était nulle en z):

(42.24)

entre sa quantité de mouvement initiale et finale.

La seule information que nous possédons sur l'angle , c'est que ce dernier est strictement, en module, égal
à l'angle d'ouverture u de l'objectif du microscope (restriction technique).

Donc cela implique que :

(42.25)

PREMIÈRE RELATION D'INCERTITUDE CLASSIQUE

Quand nous aurons mesuré la quantité de mouvement p à la fin de l'expérience, il faudra effectuer les
corrections :

(42.26)

de la quantité de mouvement du photon pour savoir la vraie valeur de p de la particule juste avant le début
de la mesure.

Dans ces corrections, il y a une partie inconnue qui correspond à des erreurs de mesure sur et . Il est
possible d'établir avec encore quelques petites finesses... que l'erreur maximale de et sur la quantité
de mouvement initiale est donnée trivialement par la composante x de la "première relation d'incertitude
classique":

(42.27)

puisque nous avons .

Puisque nous avons la relation trigonométrique remarquable suivante (cf. chapitre de Trigonométrie) :

(42.28)
et que , nous obtenons dès lors aussi la première relation d'incertitude pour la
composante z :

(42.29)

Rappelons maintenant que (cf. chapitre d'Optique Ondulatoire) pour une fente rectangulaire nous avons en
posant :

(42.30)

où (en optique ondulatoire) est l'angle permettant de distinguer clairement deux minimas de diffraction (et
donc clairement un objet émettant un rayonnement identique entre deux points). Inversement, du point de
vue de la diffraction, l'ouverture e est donc donnée par :

(42.31)

La valeur de e peut aussi être vue comme le champ de vision (projection orthogonale de la fente sur l'axe X)
de largeur de la particule. Dès lors :

(42.32)

Au même titre que l'erreur maximale est donnée par la condition , nous pouvons aussi écrire
, cela nous amène à écrire que :

(42.33)

DEUXIÈME RELATION D'INCERTITUDE CLASSIQUE

Si nous multiplions:

et (42.34)

nous obtenons la "deuxième relation d'incertitude classique" également appelée "l'incertitude spatiale
classique" :

(42.35)

qui représente donc l'erreur maximale expérimentale d'un microscope à faible ouverture rectangulaire (que
de conditions!).

Remarque: Le lecteur vérifiera sans peine que cette relation appliquée pour un objet macroscopique (de
l'ordre du centimètre) dont la position serait mesurable avec une précision de l'ordre du micromètre donne
une incertitude ridiculement faible sur la quantité de mouvement et donc la vitesse. Par contre, la même
relation appliquée pour la masse d'une particule telle que l'électron avec une précision de mesure de la
position supposée du dixième de nanomètre donnera une incertitude sur la vitesse de l'ordre 1'000 [m/s]...!!

Ainsi, si nous essayons de situer une particule avec une précision de plus en plus grande, sa quantité de
mouvement atteint des valeurs extrêmes. À un certain point, la quantité de mouvement peut être si grande
que l'énergie correspondante est suffisante pour produire une paire de particule-antiparticule. En d'autres
termes, si nous essayons de confiner une particule dans une boîte de plus en plus petite, d'une part, nous
connaissons de moins en moins sa quantité de mouvement et par le fait, nous ne savons même pas combien
de particules il y a dans la boîte!

Cependant (!), nous verrons lors de l'étude des commutateurs appliqués à la théorie de la physique
quantique, que la vraie relation d'incertitude (dont la valeur diffère de celle ci-dessus) apparaît tout
naturellement uniquement à partir de propriétés mathématiques et de la définition de la quantité de
mouvement.

Plus généralement, pour une particule dans un volume à dimensions (x, y, z), un état classique est caractérisé
par les 6 quantités dans l'espace de phase (espace de phases qui est donc de dimension 6)
et l'état quantique occupe le "cube" de volume:

(42.36)

Examinons le produit de :

avec (42.37)

tel que:

(42.38)

et supposons que u soit petit et intéressons nous au rapport quand u tend vers zéro...

Nous avons dès lors:

(42.39)

ce qui nous donne finalement (en première approximation) :

(42.40)

Nous voyons qu'il est possible de jouer sur la variable u pour l'indétermination en z mais cela devient par
contre impossible lorsqu'il s'agit de l'indétermination en x.

TROISIÈME RELATION D'INCERTITUDE CLASSIQUE


En relativité restreinte, nous avons vu que x, y, z, ct constituent les composantes d'un quadrivecteur d'espace-
temps ainsi que celles d'un vecteur d'énergie-impulsion.

Il est donc naturel de compléter les trois relations spatiales par extension :

(42.41)

Nous obtenons ainsi la "quatrième relation d'incertitude classique" appelée également "incertitude
temporelle classique" :

(42.42)

Cependant (!), nous verrons lors de l'étude des commutateurs appliqués à la théorie de la physique
quantique, que cette relation d'incertitude (dont la valeur diffère de celle ci-dessus) apparaît aussi tout
naturellement uniquement à partir de propriétés mathématiques et de la définition de la quantité de
mouvement.

Remarque: Nous reviendrons plus tard sur les implications de cette incertitude temporelle dont les
implications sont à la base de la cosmologie quantique (et de la création de notre Univers) et de la théorie
quantique des champs en particulier en ce qui concerne le potentiel de Yukawa (cf. chapitre de Physique
Quantique Des Champs).

Les incertitudes classiques établies vont nous permettre de mieux comprendre les incertitudes sous leur
forme quantique réelle. Pour cela, parmi d'autres, il va nous falloir faire usage de l'artillerie mathématique
nécessaire. Cependant, dans un souci de clarté, nous avons souhaité présenter la physique quantique
ondulatoire de la manière la plus simple et la moins formelle possible. Cette présentation peut porter le
lecteur à de nombreux contre-sens et il doit donc rester prudent tant qu'il n'en a pas vu la démonstration
rigoureuse!

ALGÈBRE QUANTIQUE

Sous ce terme peu courant et non officiel "d'algèbre quantique" (donc à ne pas en abuser!) nous souhaitons
introduire et rappeler au lecteur des outils " mathématiques qui vont nous êtres très utiles pour résoudre
certaines équations de la physique quantique. Il est donc de première importance de comprendre (ou d'avoir
compris, en ce qui concerne les rappels) au mieux ce qui va suivre!

Remarque: Les puristes risquent de grimper aux rideaux en lisant ...

OPÉRATEURS LINÉAIRES FONCTIONNELS

Définition: Les "opérateurs linéaires" sont des êtres mathématiques agissant sur des fonctions ou vecteurs
(cf. chapitre de Calcul Vectoriel).

Les fonctions sur lesquelles peuvent opérer ses opérateurs peuvent être des fonctions d'une seule variable x,
soit f(x), ou des trois coordonnées d'un point x, y, z soit f(x, y, z) ou écrit encore plus brièvement .
Nous serons amenés à écrire des intégrales de ces fonctions, qui sont le plus souvent étendues à tout
l'espace. Dans le cas d'une fonction des trois coordonnées spatiales d'un point, nous adopterons la notation
suivante :

(42.43)

Ces notations, indispensables pour l'allègement des expressions que nous rencontrerons en physique
quantique étant données, nous en revenons à nos opérateurs.

Partant d'une fonction f, si nous savons lui associer une fonction g de même nature, c'est-à-dire dépendant
des mêmes variables, nous pouvons dire que g est le résultat de l'action d'un opérateur sur f et écrire cela
symboliquement comme un produit simple :

(42.44)

Mais nous introduisons tout de suite une restriction fondamentale: se uls nous intéressent les opérateurs
linéaires (comme en algèbre linéaire quoi...), c'est-à-dire par exemples tels que:

(42.45)

quels que soient les coefficients 1 et 2.

Une catégorie très simple d' opérateurs est constituée par les nombres (scalaires réels ou complexes). En
effet, étant un nombre (typiquement l'opérature de position en physique quantique):

(42.46)

dépend linéairement de f, définissant un opérateur linéaire que nous écrivons . Il y a deux cas particuliers
importants:

1. Opérateur zéro: où sera une fonction bien évidemment nulle partout...

2. Opérateur unité (ou identité): où (ce qui est tout aussi simple...)

Remarque: L'opérateur "Nabla" est également un opérateur linéaire fonctionnel (nous le verrons un peu plus
loin) qui en physique quantique se retrouver dans l'opérateur d'énergie.

Nous vérifions sans peine pour les opérateurs fonctionnels que ces derniers sont commutatifs par rapport à
l'addition, associatifs par rapport à l'addition et la multiplication et distributif par rapport à l'addition à
gauche et à droite (voir les chapitres de Théorie des Ensembles et Algèbre Linéaire au besoin).

Jusqu'à présent, rien ne distingue l'algèbre des opérateurs de celle des nombres. Mais il y a cependant deux
propriétés qu'il faut toujours avoir en tête pour ne pas commettre des erreurs quand nous faisons du calcul
d'opérateurs:

1. Deux opérateurs ne commutent pas en général par rapport à la multiplication (comme en algèbre
linéaire...), c'est-à-dire qu'en général soit deux opérateurs fonctionnels et :

(42.47)
Si nous rencontrons une expression telle que , nous n'avons donc pas le droit d'effectuer en
général, la mise en facteur (il s'agit donc d'un structure particulière de groupe qui est non-commutatif)!

Exemple:

Un exemple simple et important, car utile pour la suite (très proche d'un cas pratique que nous verrons plus
loin), de deux opérateurs qui ne commutent pas avec une fonction d'une seule variable est le suivant (où f est
quelconque). Considérons l'opérateur d/dx agissant sur xf(x) :

(42.48)

en simplifiant par f :

(42.49)

Donc nous avons a ci-dessus un exemple de deux opérateurs qui ne commutent pas puisque:

(42.50)

Remarques:

R1. Si un opérateur peut commuter n'importe comment avec un autre opérateur, c'est que ce dernier est un
nombre (cela rejoint le concept de mesure dont nous avons fait mention dans les postulats).

R2. Lorsqu'un état (une fonction mathématique au sens formel) est inchangé par un opérateur, l'état est alors
appelé "état propre" ou "vecteur propre" du système (nous verrons des exemples pratiques plus loin). L'état
est alors parfaitement mesurable et est assimilé à l'observable classique.

Exemple (d'opérateur):

Partons de l'équation de Schrödinger tridimensionnelle (que nous démontrerons plus loin) à admettre pour
l'instant :

(42.51)

ou bien écrit autrement (c'est plus esthétique...) avec le laplacien :

(42.52)

ou encore:

(42.53)

autrement encore...:
(42.54)

Alors l'opérateur énergie totale (l'hamiltonien H en d'autres termes...) s'exprime comme :

(42.55)

ou en notation lagrangienne :

(42.56)

Remarque: Nous retrouvons ici naturellement la deuxième expression donnée dans le deuxième postulat
mais la notation V pour l'énergie potentielle peut porter à confusion avec le potentiel électrique.

D'autre part, nous savons que :

(42.57)

Les deux dernières expressions doivent être identiques. La seule possibilité pour satisfaire à ces égalités est
de poser :

(42.58)

qui sont les "opérateurs hermitiques de la quantité de mouvement" en mécanique quantique et dont il faudra
se rappeler tout au long de ce chapitre!

Remarque: Nous retrouvons ici naturellement un des opérateurs cités dans le troisième postulat.

Nous pouvons vérifier la justesse de ces opérateurs en les réinjectant dans l'expression de l'énergie cinétique
:

(42.59)

Par ailleurs, il est aisé de vérifier que ce développement reste juste si nous prenons le conjugué complexe de
l'opérateur de la quantité de mouvement.

Ainsi, l'opérateur d'énergie totale (l'hamiltonien) est lui aussi bien hermitique! Ce résultat est très important
pour vérifier par exemple des calculs en utilisant la propriété d'orthogonalité des fonctions propres que nous
verrons plus loin.

OPÉRATEURS ADJOINTS ET HERMITIQUES


Remarque: La lecture des lignes qui vont suivre pourrait s'avérer assez abstraite. Cependant, si vous ne
comprenez pas grand chose ce n'est pas bien grave car souvent tout devient évident pendant l'étude et les
développements d'exemples concrets qui seront donnés plus loin.

Considérons les deux intégrales étendues à tout l'espace (à l'intérieur de l'intégrale il s'agit d'une
multiplication de fonctions et d'opérateurs) sans chercher à comprendre leur utilité pour l'instant:

et (42.60)

où rappelons que la notation est le conjugué complexe de z. Il faut savoir que dans ces deux intégrales,
et représentent des opérateurs.

Nous constatons dans les développement de la physique quantique qu'il y a entre les opérateurs et une
correspondance biunivoque, nous disons que est "l'adjoint" de (la transposée de la conjuguée) ou qu'il
est "hermitique" et nous écrivons :

(42.61)

si les deux intégrales précédentes sont respectées.

De cette définition, nous déduisons l'identité suivante :

(42.62)

Remarque: Nous démontrerons, plus loin, la relation ci-dessus dans un exemple concret mais particulier de
la physique quantique des champs (chapitre suivant) et nous y reviendrons de manière plus rigoureuse dans
notre présentation du formalisme de Dirac dans le chapitre de Physique Quantique Relativiste.

L'opérateur adjoint a plusieurs propriétés, dont les seules qui vont nous intéresser dans ce chapitre sont:

P1. qui est inutile à démontrer car cette relation découle de la définition de l'opérateur adjoint.

P2. étant envisagé comme un nombre complexe (opérateur particulier) nous avons alors . Ce que
nous avons vérifié juste avant par l'exemple avec l'opérateur de quantité de mouvement!

Une catégorie extrêmement importante d'opérateurs est donc constituée par les "opérateurs hermitiques self-
adjoints", ou plus simplement "opérateur hermitiques" égaux par définition à leurs adjoints :

(42.63)

puisque ce sont les seules qui émergent dans les développements de la physique quantique ondulatoire.

Nous remarquons aussi que si nous prenons un opérateur hermitique (comme celui de la quantité de
mouvement pour faire simple par exemple...) et que nous multiplions celui par le nombre imaginaire unitaire
pur i alors il devient anti-hermitique, c'est-à-dire: nom-hermitique.

Remarque: Le terme "hermitique" ou "hermitien" sont équivalents et rappelez-vous que ces opérateurs
peuvent être aussi des matrices!
Un opérateur quelconque, soit , peut se décomposer d'une façon unique en parties hermitique et anti-
hermitique, c'est-à-dire que nous pouvons écrire:

(42.64)

où sont donc hermitiques .

Démonstration:

Si :

(42.65)

car il s'agit d'un simple nombre complexe, alors:

(42.66)

La somme de l'opérateur et de son adjoint est donc un opérateur hermitique (la somme ou la soustractions
entre opérateurs hermitiques, reste donc hermitique).

En général, il est trivial que le produit de deux opérateurs hermitiques n'est pas nécessairement un
opérateur hermitique, car nous vérifions que la condition pour laquelle le produit de deux opérateurs
hermitiques soit lui-même hermitique, est que les deux opérateurs "commutent" (voir ce qui suit).

COMMUTATEURS ET ANTI-COMMUTATEURS

Définitions:

D1. Le "commutateur" de deux opérateurs et , s'écrit :

(42.67)

D2. "L'anti-commutateur" de deux opérateurs et , s'écrit :

(42.68)

Remarques:

R1. Comme le commutateur est beaucoup plus fréquent dans les développements que l'anti-commutateur, s'il
n'y a pas de confusion possible, nous le notons donc simplement .

R2. Des exemples concrets et triviaux de ces commutateurs dans le cadre de notre étude la physique
quantique ondulatoire seront présentés dans le texte qui suit.

Citons quelques propriétés évidentes des commutateurs (car ce sont ceux que nous utiliserons le plus):
(42.69)

où sont des nombre quelconques (les démonstrations sont faites - au besoin - pendant le
développement d'exemples pratiques).

Cherchons l'adjoint de :

(42.70)

d'où un résultat très simple:

(42.71)

ce qui pourra se vérifier aisément avec l'exemple pratique que nous ferons juste quelques lignes en-dessous.

La relation suivante est très utile dans la pratique (triviale, mais comme d'habitude au besoin nous pouvons
rajouter la démonstration):

(42.72)

nous avons de même:

(42.73)

Nous démontrerons plus loin dans un cas concret, que si deux opérateurs ne commutent pas, alors il est
impossible d'avoir un état ayant une valeur précise et unique pour les deux opérateurs à la fois (en physique
quantique il existe une configuration d'expérience ou le premier opérateur représente la quantité de
mouvement et le second la coordonnée spatiale). Ce résultat implique que les opérateurs sont souvent
nommés des "observables".

Attardons nous un moment sur un exemple concret des commutateurs et dont un des résultats est
fondamental!

Nous avons démontré plus haut les relations:

(42.74)

Considérons la relation (simple différentielle mathématique habituelle):

(42.75)

Si nous divisons par des deux côtés de l'égalité et qu'ensuite nous multiplions par , nous obtenons
:
(42.76)

ce qui nous donne:

(42.77)

donc il vient que le commutateur de x et est égal à et donc que les quantités ne commutent pas. Nous
avons donc la "relations d'anti-commutation" suivante :

(42.78)
(cycl.)

Ainsi (en nous basant sur le deuxième postulat), les deux observables x et dont les opérateurs ne
commutent pas ne possèdent une base de vecteurs propres commune. Ils ne sont donc pas simultanément
mesurables avec précision et constituent donc une incertitude d'Heisenberg.

Remarques:

R1. L'abréviation (cycl.) signifiant que l'on peut permuter circulairement les lettres (x, y, z) et que le résultat
reste le même.

R2. Bien que ce résultat puisse paraître étonnant il n'en est pas moins extrêmement correct puisque
découlant d'un raisonnement mathématique nous ne pouvons plus simple et rigoureux.

Considérons donc maintenant aussi la relation :

(42.79)

et en procédant de la même manière que précédemment, nous obtenons :

(42.80)
(cycl.)

Les deux relations :

et (42.81)

peuvent se résumer à:

(42.82)

en utilisant les coordonnées et moments généralisés et sont remarquables sous plusieurs angles:

- Premièrement, parce qu'à partir de considérations purement théoriques et mathématiques nous retrouvons
également en physique quantique une incertitude équivalente (mais pas égale!) à celle obtenue lors de notre
étude des principes d'incertitudes de Heisenberg (qui rappelons-le avaient été obtenues à partir d'un cas
pratique classique).
Effectivement, si nous prenons le module du commutateur de gauche, nous avons alors la "relation
d'incertitude spatiale de Heisenberg" :

(42.83)

qui rappelons-le, peut également s'écrire sous la forme:

(42.84)

La constante de Planck étant extrêmement petite, cela explique que cet effet est impossible à détecter à notre
échelle macroscopique. Par contre, la masse des électrons étant extrêmement petite aussi, la fraction ci-
dessus devient notable pour un électron et l'effet de cette incertitude est important!

Enfin, par commutation des composantes du quadrivecteur impulsions (cf. chapitre de Relativité Restreinte),
nous avons la "relation d'incertitude temporelle de Heisenberg" :

(42.85)

Une conséquence fantastique découle de l'incertitude sur le temps et l'énergie et de la relativité. Imaginons-
nous le vide le plus total (vide quantique) et supposons que nous regardions ce qui ce passe en un point de
l'espace donné pendant un temps très court. Alors le principe d'incertitude temporelle nous dit que l'énergie
de cet état (le vide!) est très imprécise. Or la relativité dit que l'énergie c'est aussi de la masse (et aussi un
champ), donc des particules. Donc, pendant ce temps très court des particules peuvent apparaître
spontanément du vide ! Nous les appelons des "particules virtuelles" car elles disparaissent très vite et sont
engendrées par les "fluctuations quantiques du vide".

Cette variation est suffisamment faible pour que nous puissions la mesurer aujourd'hui avec nos instruments.
Cependant, nous en observons les effets seulement dans les grands collisionneurs de particules de la planète.

- Deuxièmement, ces relations sont remarquables parce que l'incertitude est une valeur complexe. Ce qui
amène à considérer que le corps des complexes est inhérentà la structure réaliste de notre environnement
(espace-temps) au niveau du monde quantique. Le monde quantique est donc un monde d'incertitude
complexe. Et cette probabilité ne semble pas être une conséquence de notre imprécision ou de notre
ignorance mais semble bien être une propriété intrinsèque de la nature.

Remarque: Les relations et propriétés de commutation et d'anti-commutation seront indispensables pour


développer la théorie quantifiée du moment cinétique et du spin.

REPRÉSENTATIVES

Introduisons maintenant les notations quantiques contemporaines, que nous considérons pour l'instant
comme des abréviations d'intégrales portant sur des fonctions d'ondes, nous écrirons (dans le but futur de
calculer des densités de probabilités) :

(42.86)

car il s'agit d'un produit scalaire fonctionnel complexe (cf. chapitress d'Analyse Fonctionnelle et de Calcul
Vectoriel).

Avec cette notation, la relation que nous avions présentée lors de notre étude des opérateurs :
(42.87)

devient (c'est plus léger déjà... mais moins pédagogique) :

(42.88)

Cela dit, l'ensemble E des fonctions qui nous intéressent en physique quantique ondulatoire constituent
un espace linéaire fonctionnel. Effectivement, en physique quantique, les équations différentielles que nous
devons résoudre (équation de Schrödinger) pour décrire le comportement d'une particule, sont telles que la
solution générale peut être très souvent décomposée en la somme des solutions particulières (nous
démontrerons cela!). En mathématique, nous disons alors que les états sont linéaires, c'est-à-dire que toute
combinaison d'états est encore un état.

Ainsi l'état d'une particule est, comme nous le démontrerons plus tard, représenté par un "état quantique" ou
un "vecteur d'état" noté qui correspond aussi à une fonction mathématique la décrivant complétement.

Par exemple, si et sont deux états possibles, alors:

(42.89)

est également un état possible pour le système (de par la propriété des espaces linéaires fonctionnels).

Revenons maintenant à notre espace linéaire fonctionnel (ou "espace linéaire des états"). Le fait que
l'ensemble E des fonctions qui nous intéressent constituent un espace linéaire fonctionnel signifie que si
, nous avons aussi :

(42.90)

quels que soient les coefficients et (cf. chapitre de Calcul Vectoriel).

Si les fonctions constituent un espace, il est alors naturel de chercher à les rapporter à une base
orthonormée. Ainsi, une suite de fonctions (qui sont les fonctions propres) constituera une base
orthonormée si nous avons (forme de relation démontrée en calcul tensoriel):

(42.91)

où nous le rappelons, est le symbole de kronecker (cf. chapitre de Calcul Tensoriel).

Définition: La base est dite "base complète" si bien évidemment toute fonction peut se développer en
série des fonctions propres tel que:

(42.92)

où est un nombre quelconque (c'est en partie ici qu'il faut revenir aux quatrième et cinquième postulats de
la physique quantique ondulatoire).
Calculons maintenant le produite scalaire fonctionnel (cf. chapitre d'Analyse Fonctionnelle):

(42.93)

Cette dernière relation montre que nous avons identiquement (nous changeons la notation des indices):

(42.94)

Ainsi, dans une base orthonormée complète , une fonction sera bien décrite par la donnée des
coefficients . Nous aurons souvent intérêt à les mettre sous le format de la matrice représentative de
dans la base :

(42.95)

Considérons maintenant un opérateur tel que:

(42.96)

Mais nous pouvons également écrire (remarquez l'apostrophe dans la relation!):

(42.97)

Multiplions cette dernière relation par et calculons le produit scalaire fonctionnel:

(42.98)

A comparer avec (obtenu plus haut) :

(42.99)

En notant , la "matrice représentative" de dans la base , nous pouvons d'après la relation :

(42.100)

écrire finalement :

(42.101)
VALEURS ET FONCTIONS PROPRES

Soit un opérateur (hermitique ou non). Le nombre a est dit "valeur propre de l'opérateur" de , s'il existe
une fonction non identiquement nulle telle que (pour un rappel de notions similaires voir le chapitre
d'Algèbre Linéaire) :

(42.102)

est alors une "fonction propre" (en analogie avec les "vecteurs propres") de , associée à la valeur propre
de a. Notons que a peut très bien être nul (vous comprendrez mieux cela au moment où nous passerons à
l'étude de cas concrets).

En des termes plus physiques, cela revient à dire que lorsqu'un état (une fonction mathématique au sens
formel tel que ) est inchangée par un opérateur, l'état est alors appelé "état propre" ou "vecteur propre" du
système.

Soit l'ensemble des fonctions propres associées à a et un espace linéaire fonctionnel, que nous
nommerons le "sous-espace propre associé" à a. Le nombre de dimensions de s'appelle "multiplicité" (ou
"ordre de dégénérescence") de la valeur propre a, et nous le notons g.

Soit maintenant a une valeur propre simple, ou non dégénérée, . Cela veut dire qu'il y a une seule
fonction propre associée à a, à un coefficient multiplicatif non nul près.

Si (valeur propre double), nous pouvons trouver deux fonctions propres non proportionnelles (non
liées) associées à a, etc.

Exemple:

Voyons un exemple particulier d'une fonction propre avec une valeur propre autre que le cas classique de
l'énergie.

Soit:

(42.103)

avec (opérateur que nous avons déjà vu précédemment) et a une valeur propre.

L'équation devient:

(42.104)

qui se vérifie aisément si :

(42.105)

qui est bien une fonction propre de l'opérateur susmentionné et qui nous sera des plus utiles dans ce qui va
suivre.

ORHTOGONALITÉ DES FONCTIONS PROPRES


Deux fonctions propres et associées à deux valeurs propres différentes sont orthogonales, c'est-à-dire
que:

(42.106)

Démonstration:

Partons avec la notation de de Dirac avec deux fonctions propres et deux valeurs propres associées:

(42.107)

avec .

Nous multiplions respectivement les deux relations précédentes par , et nous intégrons pour obtenir
le produit scalaire fonctionnel:

(42.108)

Rappelons pour continuer que nous avons démontré que:

(42.109)

donc si l'opérateur est auto-adjoint (ce qui est le cas de l'hamiltonien comme nous l'avons montré), c'est-
à-dire que , nous avons:

(42.110)

Dès lors, en retranchant de la dernière relation le complexe conjugué de l'avant dernière, a étant supposé réel
(ou un entier...), nous avons :

(42.111)

ce qui montre bien que:

(42.112)

puisque .

C.Q.F.D
Voyons la même démonstration mais avec la notation traditionelle et plus pédagogique donne:

(42.113)

Si nous multiplions la première équation à gauche par , et la seconde équation par , et que nous
intégrons sur la totalité de l'espace, nous obtenons les deux expressions suivantes:

(42.114)

Si nous prenons le cas de fonctions réelles, nous pouvons écrire:

(42.115)

L'opérateur H étant hermitique (auto-adjoint) comme nous l'avons démontré plus haut, nous avons:

(42.116)

et comme sont admis comme étant des fonctions réelles, nous avons aussi:

(42.117)

Donc:

(42.118)

S'écrit:

(42.119)

Il vient alors:
(42.120)

ce qui montre bien que sont orthogonales selon la définition du produit scalaire fonctionnel.

FORMALISME DE DIRAC

Dirac a conçu un formalisme général très pratique, mondialement utilisé par les physiciens, dont nous allons
donner les éléments essentiels. Les notations utilisées ont d'ailleurs été déjà partiellement introduites dans ce
qui a précédé.

Nous utiliserons le formalisme de Dirac pour deux points, le premier étant de mieux comprendre ce qui a été
vu jusqu'à maintenant lors de l'introduction aux opérateurs fonctionnels, le second étant d'introduire à une
notation et une méthode de résolution que l'on retrouve dans certains ouvrages. Par ailleurs, dans ce site par
simplification d'écriture nous utiliserons parfois ce formalisme.

KETS ET BRAS

Nous considérons un espace vectoriel à n dimensions où n peut très bien être infini (espace de Hilbert).
Un vecteur est défini par n composantes que nous pouvons ranger en colonne pour former
une matrice colonne :

(42.121)

Nous dirons que cette matrice décrit le "vecteur droit" ou le "ket" (cela doit vous rappeler les
"représentatives"). Il est possible d'associer à la matrice colonne la matrice adjointe (transposée conjuguée) :

(42.122)

où les sont les complexes-conjugués des . Nous dirons que la matrice ligne adjointe décrit le "vecteur
gauche" ou le "bra" (cela doit également vous rappeler les "représentatives").

L'addition et la multiplication par un nombre vont de soi. Notons que si , nous avons
trivialement .

Avec deux vecteurs de composantes et , nous pouvons former la quantité suivante, dite "produit
scalaire hermitique" :

(42.123)
nous convenons de l'écrire . Notons que:

(42.124)

le produit scalaire hermitique n'est donc pas simplement commutatif!

Le produit dépend linéairement de et de . Réciproquement si un nombre Q dépend


linéairement d'un ket , il existe un bra tel que :

(42.125)

En mécanique quantique, est appelé "l'amplitude" d'être dans l'état x si le système est dans l'état y. Ce
produit scalaire hermitique sera interprété comme la probabilité que le système physique soit dans l'état x s'il
est dans l'état y.

Une base orthonormée de l'espace étudié est constituée par n vecteurs tels que :

(42.126)

où rappelons-le, est le symbole de Kronecker (cf. chapitre de Calcul Tensoriel).

Tout vecteur de peut se développer sur cette base selon (cf. chapitre de Calcul Vectoriel):

(42.127)

où les sont les composantes de dans la base choisie. Nous vérifions vraiment aisément que (déjà vu
maintes fois dans le chapitre de Calcul Vectoriel):

(42.128)

Si un ket dépend linéairement d'un ket , nous écrivons symboliquement:

(42.129)

où est un opérateur linéaire. Soit donc un opérateur linéaire défini par la relation précédente et un bra
, le produit scalaire hermitique:

(42.130)

est un nombre Q qui dépend linéairement de . D'après ce qui a été vu plus haut, il existe un bra tel
que . dépend visiblement de de manière linéaire. Nous convenons de poser:
(42.131)

A l'aide de cette convention, nous pouvons écrire:

(42.132)

Si , dépend linéairement de . Par définition, nous écrirons:

(42.133)

où est l'opérateur adjoint de .

Formons avec un bra le produit scalaire hermitique:

(42.134)

et nous pouvons écrire (nous l'avons démontré précédemment):

(42.135)

d'où la relation de première importance que nous avons déjà rencontré plusieurs fois sans en avoir expliqué
vraiment l'origine :

(42.136)

Nous rappelons simplement avec cette relation qu'un opérateur hermitique est un opérateur égal à son
adjoint.

Grâce au formalisme de Dirac, ce qui était avant définitions abstraites sont devenus maintenant des
évidences démontrées.

Remarque: A nouveau, un excellent exemple pratique d'application du formalisme de Dirac est proposé dans
le chapitre d'Informatique Quantique (voir section d'Informatique Théorique).

MODÈLE DE SCHRÖDINGER

Des expériences (effet Compton, effet photoélectrique, fentes de Young, optique géométrique/ondulatoire,
etc.) ont montré que les ondes pouvaient, dans certains situations êtres traitées comme des corpuscules (et
inversement). Ce sont ces observations qui amenèrent Niels Bohrà énoncer sont "principe de
complémentarité" qui dit que suivant les expériences effectuées, il faut considérer la matière soit comme une
onde, soit comme des corpuscules. Ces deux aspect se complétant l'un et l'autre.

ONDE ASSOCIÉE DE DE BROGLIE

Le physicien français Louis Victor De Broglie suggère, en 1924, que réciproquement, les particules
(électrons, protons, et autres) pourraient aussi, dans certains cas, montrer des propriétés d'ondes ! De Broglie
émit alors l'idée qu'il existait entre la longueur d'onde d'une particule de matière et sa quantité de
mouvement, une relation similaire à celle d'un photon, soit (v est la notation pour la fréquence pour
rappel...):
(42.137)

donc nous pouvons écrire en utilisant la relations étabilies dans la chapitre de Mécanique Ondulatoire:

(42.138)

où le rapport :

(42.139)

De Broglie émit dès lors l'hypothèse suivante : pour un corpuscule de masse m et de vitesse v nous avons :

(42.140)

est appelé "longueur d'onde associée de De Broglie".

La matière en mouvement aurait donc une longueur d'onde associée. C'est une longueur d'onde extrêmement
petite pour des masses de l'ordre du kilogramme. Même si la vitesse est alors .
Comme nous l'avons vu, les phénomènes d'interférence et de diffraction sont important seulement lorsque la
taille des objets ou fentes n'est pas beaucoup plus grande que la longueur d'onde. Il est donc impossible de
détecter les propriétés ondulatoires des objets de tous les jours. Il n'en est pas de même pour les particules
élémentaires, les électrons en particulier.

Les électrons peuvent donc avoir des longueurs d'onde de l'ordre de ce qui correspond à
l'espacement des atomes d'un cristal. C.J. Davisson et L.H. Germer exécutèrent une expérience cruciale : ils
diffusèrent des électrons sur la surface d'un cristal et au début 1927 observèrent que les électrons éjectés
étaient distribués en pics réguliers. Lorsqu'ils interprétèrent ces pics comme des pics de diffraction, ils
trouvèrent que la longueur d'onde de l'électron diffracté était exactement celle prédit par De Broglie.

Mais alors qu'est-ce qu'un électron ?? Les illustrations qui montrent un électron comme une minuscule
sphère chargée négativement ne sont que des images commodes, mais inexactes. En fait, nous devons
utiliser le modèle corpusculaire ou ondulatoire, celui qui fonctionne le mieux selon la situation de façon à
pouvoir comprendre ce qui se produit. Mais il ne faut pas en conclure qu'un électron est une onde ou une
particule. Nous devrions plutôt dire qu'un électron est "l'ensemble de ses propriétés mesurables". Certains
physiciens emploient encore l'expression "quanton" pour décrire tout système se comportant soit comme une
onde soit comme une particule.

De Broglie put alors suggérer que chaque orbite quantifiée (selon le postulat de quantification de Bohr)
d'une orbite électronique est alors une onde stationnaire. Comme pour les modes résonnants d'une corde,
seules les ondes dont la circonférence de l'orbite circulaire contient un nombre entier de existent, soit :

avec
(42.141)

En remplaçant par , nous obtenons :

(42.142)

Ce qui est bien la condition quantique proposée par Bohr. Les orbites et les états d'énergie quantifiés du
modèle de Bohr, sont dus à la nature ondulatoire de l'électron et au fait que seules des ondes stationnaire
résonantes persistent. Ceci suppose que la dualité onde-corpuscule est à la base de la structure de l'atome.

La notion ondulatoire de la particule permit ensuite au physicien Erwin Schrödinger de développer une
équation dite "équation d'onde" pour décrire les propriétés ondulatoires des particules.

Petit interlude sympathique... puisque connue l'onde associée de De Broglie et étant donné le résultat vu lors
de notre étude du théorème du Viriel dans le chapitre de Mécanique Des Milieux Continus, nous pouvons
mettre en relation :

(42.143)

Ainsi, nous pouvons pour une fluide (liquide), obtenir la valeur de "l'onde thermique associée de De
Broglie". Ce qui nous donne :

(42.144)

Nous reviendrons sur cette relation lors de notre étude des superfluides en mécanique des milieux continus.

ÉQUATION CLASSIQUE DE SCHRÖDINGER

Rappelons la forme unidemensionnelle de l'équation d'onde (cf. chapitre de Mécanique Ondulatoire) :

(1) (42.145)

Pour simplifier, cherchons une solution particulière de la forme (voir le chapitre de Mécanique Ondulatoire
ou le chapitre d'Électrodynamique pour l'analogie) :

(2) (42.146)
est l'amplitude du champ associé à la particule. Il est important de remarquer que la partie périodique
ne contient pas de paramètres de déplacement (comme c'est le cas en électrodynamique par exemple) car la
fonction se doit de décrire des solutions "statiques" (attention à ne pas prendre ce terme à la lettre).

Pour des raisons historiques cette amplitude est couramment appelée "fonction d'onde" bien que cette
appellation soit trompeuse. Il serait peut-être meilleur de l'appeler simplement "amplitude du champ associé
à la matière".

C'est la recherche de l'expression de cette fonction qui va nous amènera lors de l'étude d'un cas particulier
(bien plus loin dans le texte) à l'expression bien connue de l'énergie d'ionisation d'un électron de nombre
quantique n donné et pour son atome de numéro atomique N donné.

Si nous introduisons (2) dans (1), nous obtenons :

(3) (42.147)

Nous avons aussi :

(42.148)

d'où :

(4) (42.149)

si nous introduisons (4) dans (3) nous obtenons alors "l'équation de Schrödinger unidimensionnelle
classique" (en l'absence de champ magnétique...) :

(42.150)

Remarque: L'énergie potentielle pourrait aussi bien être gravitationnelle, qu'électrique ou les deux
combinées (donc de nature quelconque). Mais la gravitation est tellement faible à cette échelle par rapport
aux forces électrostatiques qu'elle est négligée.

Nous pouvons récrire l'équation précédente en la généralisant à un système à trois dimensions. Ce qui nous
donne finalement:

(42.151)
où n'est autre que le Laplacien scalaire :

(42.152)

Remarques:

R1. Cette équation n'est pas un invariant de Lorentz étant donné qu'elle a été établie à partir de l'expression
classique de l'énergie (et non relativiste).

R2. La fonction d'onde plane que nous avons prise au départ n'a pas une signification physique étant donné
qu'elle transporte une énergie infinie. Une meilleure solution est de considérer un paquet d'ondes. Toutefois,
parmi les paquets d'onde généralement employés, elles sont constituées d'une superposition d'ondes planes.
Dès lors, en étudiant ses effets sur une des ondes planes, nous pouvons accepter les conclusions physiques
que nous pouvons en déduire.

HAMILTONIEN DE SCHRÖDINGER

L'équation de Schrödinger peut également s'écrire sous la forme (après quelques petites mises en facteurs
élémentaires) suivante:

(42.153)

Nous écrivons cela en mécanique quantique sous la forme:

(42.154)

où H est donc donc l'hamiltonien du système (ou énergie totale) et constitue un opérateur fonctionnel et
l'énergie totale, la valeur propre.

L'équation de Schrödinger est donc une équation aux dérivées partielles du second ordre, linéaire homogène.
Quelle que soit l'énergie totale, elle admet des solutions (ouf!), mais nous montrons qu'en général ces
solutions croissent très rapidement (croissance de type exponentiel) quand nous nous éloignons à l'infini
dans certaines directions et sont donc physiquement inacceptables. Il n'y a que des valeurs particulières de
l'énergie totale qui donnent lieu à des solutions physiquement acceptables et en général, l'ensemble de ces
valeurs comprend des valeurs discrètes (fonctions trigonométriques à la source) qui sont les "niveaux liés"
du système (parce que leur fonction propre décroît rapidement à l'infini) et un continuum de valeurs qui sont
les "niveaux non liés" (leur fonction propre restant finie à l'infini). Plus précisément, si W est la borne
inférieure des valeurs de l'énergie potentielle à l'infini, les niveaux liés se situent au-dessous de W, alors que
les valeurs supérieures à W constituent le continuum des niveaux non liés.

Par exemple, dans l'étude de l'oscillateur harmonique (un des cas pratiques les plus difficile au niveau du
formalisme) que nous ferons plus loin nous avons:

(42.155)

avec . Il existe donc que des niveaux liés.

Dans l'atome d'hydrogène:


(42.156)

avec . Les niveaux liés seront négatifs, et toutes les valeurs positives de l'énergie seront des niveaux
non liés.

Ceci ayant été dit, voyons également comme exemple (très important) la manière de déterminer
l'hamiltonien H de l'équation de Schrödinger d'une particule chargée non relativiste dans un champ
électromagnétique.

Nous avons vu en mécanique analytique que le lagrangien était défini par la soustraction de l'énergie
cinétique et potentielle selon la relation:

(42.157)

Nous avons dans le chapitre d'Électrodynamique que le lagrangien de l'interaction champ-courant relativiste
était donné par :

(42.158)

Si nous rajoutons un champ électrique (et donc un potentiel électrostatique U) en plus du champ
électromagnétique le lagrangien s'écrit alors (puisque le potentiel se soustrait selon la définition du
lagrangien!) :

(42.159)

Dans l'approximation classique (non relativiste) nous savons que nous avons (cf. chapitre de Relativité
Restreinte):

(42.160)

Comme nous nous restreignons au cas non relativiste nous pouvons éliminer le terme constant d'énergie de
la masse au repos tel que :

(42.161)

Toujours dans le chapitre de Mécanique Analytique, nous avons démontré que l'hamiltonien était donné par
:

(42.162)

Nous avons donc :

(42.163)

De plus, nous avons vu dans le chapitre de Mécanique Analytique que :


(42.164)

Il vient donc que :

(42.165)

Finalement :

(42.166)

Soit après simplification :

(42.167)

H contient donc l'énergie cinétique et l'énergie potentielle totale. Il n'y a pas de terme magnétique car la
force de Laplace, comme nous l'avons démontré dans le chapitre de Magnétostatique, ne travaille pas (y'en a
ils ont de la chance...). H est bien l'énergie totale du système classique, cependant la relation précédente n'est
pas vraiment adaptée au formalisme de Hamilton car les moments conjugués n'apparaissent pas. Mais il est
très simple des les introduire à partir du résultat obtenu précédemment qui était :

(42.168)

donc :

(42.169)

Si nous passons en mécanique quantique, nous devons remplacer les par leurs opérateurs respectifs
dont nous avons démontré l'origine plus haut. Ainsi, nous avons :

(42.170)

qui doit s'écrire dans le cas général (le potentiel vecteur anti-commute avec la quantité de mouvement) :

(42.171)

Ce que l'on note traditionnellement sous la forme (sic!):

(42.172)
Remarque: Dans le chapitre de Physique Quantique Relativiste nous démontrerons la forme relativiste de ce
hamiltonien associée à l'équation de Klein-Gordon généralisée ou encore celui de Dirac qui inclut le spin.

Heureusement nous ne traîterons pas d'exemples où il faudra trouver des solutions à l'équation de
Schrödinger avec un tel hamiltonien sur ce site...

CONDITION DE NORMALISATION DE DE BROGLIE

En général, dans un état dynamique donné, la particule (s'il s'agit d'un système à une particule) décrite par la
résolution de l'équation de Schrödinger pour des paramètres bien définis est mal localisée, car x, y, z sont
mal déterminés de par même le principe d'incertitude de Heisenberg. Il y a donc lieu de définir une
probabilité dP de trouver la particule dans l'élément de volume dxdydz entourant un point (x, y, z), d'où
l'existence d'une fonction de distribution des coordonnées telle que:

(42.173)

où est donc une quantité essentiellement positive ou nulle (probabilités obligent!) qui doit
s'exprimer à l'aide de la fonction de Schrödinger . Nous avons d'ailleurs de tels exemples très
détaillés dans le présent chapitre et à la fin de celui de Chimie Quantique.

Des analogies avec la physique ondulatoire classique, plus précisement avec l'électrodynamique, ont conduit
à admettre que comme la densité volumique d'énergie d'une onde électromagnétique ést proportionnelle au
carré de son amplitude (cf. chapitre d'Electrodynamique), la densité volumique de probabilité devait être
proportionnelle au carré de l'intensité du champ associé tel que:

(42.174)

où nous utilisons le module de la fonction de Schrödinger comme analogie de l'amplitude et où la constante


est un nombre réel. Dans le cadre de la physique quantique il est beaucoup plus fréquent de trouver cette
dernière relation sous la forme évidente suivante:

(42.175)

qui met mieux en évidence la normalisation nécessaire de la fonction de Schrödinger.

Enfin, il est important de notre que les physiciens ont pour habitude pendant les développements de garder la
même notation pour la fonction de Schrödinger non normalisée que celle normalisée tel que (ce qui peut
prêter à confusion):

(42.176)

où représente alors la probabilité de trouver la particule en un certain point de l'espace.

Il est évident alors qu'avec cette manière de noter les choses nous avons alors sur tout l'espace :
(42.177)

comme déjà mentionné lors de notre présentation du premier postulat..

Nous pouvons maintenant considérer la signification physique qui peut-être attachée à l'intensité du champ
associé à la matière. Comme ce champ décrit le mouvement d'une particule, nous pouvons dire que les
régions de l'espace dans lesquelles la particule a le plus de chance de se trouver sont celles dans lesquelles

est maximum.

Indiquons aussi que la relation antéprécédente s'écrit en utilisant la notation ket-bra, que nous introduirons
un peu plus tard, de la manière très raffinée (et très courante...) suivante:

(42.178)

ou suivante (c'est simplement la racine carrée de la précédente):

(42.179)

où le module au dénominateur disparaît puisque, pour rappel, l'intégrale est un nombre réel. Il ne faut par
ailleurs jamais oublié que les physiciens, pour la grande majorité, notent de manière identique la fonction de
Schrödinger non-normalisée et normalisée comme nous le rappel cette dernière relation.

Comme nous l'avons déjà dit, nous verrons de nombreux exemples détaillées de cette normalisation dans ce
chapitre avec des espaces unidimensionnels et dans le cadre de volumes dans le chapitre de Chimie
Quantique.

Indiquons encore une chose en ce qui concerne la normalisation. Si vous observez l'expression de
l'Hamiltonien des équations de Schrödinger vues jusqu'à présent, alors si est une constante réelle ou
complexe nous avons toujours:

(42.180)

Si nous posons que est une solution de l'équation de Schrödinger, nous voyons alors que est aussi
solution de l'équation. En effet, nous obtenons:

(42.181)

En prenant en compte le fait que la fonction est normalisée, nous obtenons alors:

(42.182)

d'où (certains livres se restreignent à ces solutions pour des raisons pédagogiques):

ou (42.183)
ou rigoureusement nous avons plus généralement:

(42.184)

où est un nombre réel. C'est ce que nous appelons "l'arbitraire de phase" dont nous avions déjà fait
mention au début de ce chapitre sans démonstration.

Ces solutions sont normalisées et correspondent à la même valeur d'énergie E ainsi qu'à la même densité de
probabilité. Ceci montre qu'il n'est pas utile de cherche la signification d'une valeur négative de (si nous

prenons le cas particulier pédagogique ), car est réel et n'est pas négatif. Seul le carré d'une
fonction d'onde, qui correspond à la densité de probabilité, est significatif d'un point de vue physique.

ÉTATS LIÉS ET NON LIÉS

Supposons que décroisse assez rapidement à l'infini, de telle sorte que l'intégrale:

(42.185)

converge. Il est alors possible de profiter de l'arbitraire régnant sur la fonction d'onde (le fait que et
décrivent le même état) pour rendre cette intégrale égale à l'unité. Nous disons alors que est une
"fonction d'état de champ normée":

(42.186)

Notons qu'il règne encore un arbitraire sur par un nombre complexe de module 1, , sans que la
condition de normalisation soit altérée. Nous appelons cela "l'arbitraire de phase" et en verrons un exemple
plus tard.

Un tel état dynamique est dit "état lié" ou "niveau lié", parce que la particule se manifeste dans une région
limitée de l'espace à cause d'un potentiel. Lorsque, par exemple, l'atome d'hydrogène est situé sur un niveau
fondamental, il est dans un état lié. Nous savons qu'il n'y a aucune chance de trouver l'électron à plus de
quelques angströms du proton, traité comme infiniment lourd et placé à l'origine comme nous l'avons vu lors
de l'étude du modèle de Bohr. Voici une bonne vision schématique de la chose (état lié):
(42.187) (Source: Pour la Science)

Un exemple d'état par défaut non lié est la particule libre qui peut se propager indéfiniment dans toutes les
directions de l'espace (au fait pour ce dernier exemple c'est un peu plus compliqué... mais nous le traiterons
plus loin).

Remarque: Il est bon de noter que ces concepts d'états liés ont des analogues classiques. Ainsi, les niveaux
liés de l'atome d'hydrogène correspondent aux orbites elliptiques, les niveaux non liés (énergie positive)
correspondent aux orbites hyperboliques.

ÉQUATION D'ÉVOLUTION CLASSIQUE DE SCHRÖDINGER

Nous savons qu'en mécanique classique l'état dynamique d'un système évolue, en général, dans le temps.
Cela veut dire que la position et la quantité de mouvement (par exemple) sont fonctions du temps. Pour un
système d'Hamiltonien donné, la connaissance de l'état dynamique initial permet de prévoir exactement
l'évolution ultérieure de ce système du fait des propriétés bien connues des équations de Hamilton.

En physique quantique, les états dynamiques évolueront, en général, dans le temps. La fonction d'onde
décrivant un état dynamique ne sera alors pas seulement fonction des coordonnées des particules constituant
le système, mais elle dépendra donc aussi du temps et s'écrira:

(42.188)

Il est tout naturel d'admettre, ne serait-ce que par analogie avec la mécanique classique, que pour un système
donné, d'Hamiltonien connu, la connaissance de l'état dynamique initial à l'instant , permet de prévoir quel
sera l'état dynamique du système à un instant ultérieur .

Notons en passant que cela revient à dire qu'un ensemble initialement "pur" reste un ensemble pur au cours
de l'évolution ultérieure des systèmes qui le constituent sans action extérieure. Cela cesserait donc d'être vrai
si tous les systèmes de l'ensemble n'avaient pas exactement le même Hamiltonien.

Indiquons qu'il existe deux approches possibles pour déterminer les fonctions dépendantes du temps:
- La première, courante dans de nombreux domaines d'application de la physique quantique, consiste à
utiliser un "opérateur d'évolution" et permet de faire apparaître de manière explicite l'équation d'évolution de
Schrödinger. Nous commencerons par celle-ci même si c'est la plus compliquée.

- La deuxième, très utilisée à des fins pédagogiques, permet d'obtenir les fonctions dépendantes du temps
par l'intermédiaire de la techique de séparation des variables des équations différentielles mais nécessite
d'admettre l'équation d'évolution de Schrödinger comme un postulat.

OPÉRATEUR D'ÉVOLUTION

Soit la fonction d'onde normée décrivant l'état dynamique du système à l'instant t (nous n'écrivons pas
les autres variables dont dépend par souci de simplification, à savoir les coordonnées spatiales des
particules du système). D'après ce qui précède, si est connue, l'est aussi. Nous avons une
correspondance:

(42.189)

et nous admettrons qu'elle est linéaire! Il existe donc un opérateur , appelé "opérateur d'évolution",
tel que:

(42.190)

La fonction dépend linéairement de . Il en est alors de même de:

(42.191)

Il existe donc un opérateur linéaire K, tel que:

(42.192)

le nombre complexe i venant simplement du fait que nous devinons intuitivement que le résultat sera une
fonction d'onde complexe.

Ce qui a aussi amené les physiciens à poser cette dernière égalité ainsi étaient les résultats connus de
l'équation d'onde décrivant un état dynamique d'après l'idée de De Broglie. Nous allons donc tout de suite
montrer que poser l'égalité ainsi est justifiée.

Nous devons déterminer K puisque la connaissance de l'Hamiltonien H commande l'évolution du système, K


doit donc dépendre de H. Pour préciser la loi qui lie K à H, nous examinerons un cas particulier, celui de la
particule libre (dont nous ferons une étude détaillée plus loin). Dans ce cas, H s'identifie à l'énergie cinétique
uniquement.

D'après les idées de De Broglie, il est naturel d'admettre que la fonction d'onde décrivant un état dynamique
dans lequel la quantité de mouvement est bien déterminée, soit (relation démontrée pendant l'étude de la
particule libre), et où l'énergie totale est donc également bien déterminée, soit:

(42.193)

est une onde plane de la forme classique:


(42.194)

où k est le vecteur d'onde de l'onde et ses coordonnées spatiales.

Nous voyons très bien à l'arbitraire de phase près (pris comme étant négatif) que:

(42.195)

Mais nous avons la relation entre opérateur et valeur propre suivante:

(42.196)

Les deux équations précédentes conduisent à écrire:

(42.197)

En comparant cette dernière relation avec:

(42.198)

nous sommes amenés à poser:

(42.199)

Les physiciens supposent que cette relation entre K et H est générale. Alors, l'équation:

(42.200)

dans laquelle K est remplacé par son expression:

(42.201)

devient alors:

(42.202)

Cette équation constitue "l'équation d'évolution classique de Schrödinger".

En particulier, pour une particule sans spin soumise à une énergie potentielle , en maintenant toujours
que la relation entre K et H est générale, l'équation d'évolution s'écrit alors:

(42.203)
où les termes entre paranthèses correspondent donc à l'expression de l'hamiltonien. Il convient maintenant de
résoudre l'équation différentielle d'évolution de Schrödinger. Pour cela, nous avons nous servir de la
condition de normalisation de De Broglie.

Rappelons que cette condition s'écrit:

(42.204)

et généralisons à une étude multidimensionnelle et temporelle de cette condition telle que (selon les
propriétés des complexes) :

(42.205)

Cette intégrale n'est certainement pas égale à l'unité si nous n'introduisons pas une fonction de normalisation
assimilé à un observable que nous noterons X et telle que nous ayons bien:

(42.206)

D'après cette condition, cette intégrale doit nécessairement rester constante en fonction du temps et de fait
égale à l'unité.

Calculons la dérivée par rapport au temps de l'intégrale de normalisation et X. Nous avons donc
nécessairement:

(42.207)

et utilisons l'équation d'évolution de Schrödinger:

(42.208)

ce qui nous donne pour notre intégrale après substitution:

(42.209)

Démontrons maintenant que nous pouvons écrire:

(42.210)
Cela revient à démontrer que H peut agir identiquement "en arrière" tel que :

(42.211)

H pouvant être (ou contenir si vous préférez) un opérateur (différentiel par exemple).

Cette relation est démontrable si et seulement si est une fonction décroissante vers l'infini. Démontrons
cela sur un cas particulier (mais fréquent en physique) et pour voir comment cela peut se faire, considérons
dans H, un terme de la forme (ce qui est le cas comme nous l'avons vu plus haut):

(42.212)

ce qui nous amène à écrire:

(42.213)

Par intégration par partie (cf. chapitre de Calcul Différentiel Et Intégral) sur le terme de gauche de l'égalité
nous avons:

(42.214)

Donc cela ne fait aucune différence de considérer que l'opérateur différencie tout ce qui est à droite ou tout
ce qui est à gauche, dans la mesure où il est bien entendu que ce dernier cas implique un changement de
signe.

Donc nous pouvons bien nous permettre d'écrire :

(42.215)

ce qui nous amène également à écrire :

(42.216)

Ceci ne peut être satisfait uniquement si et dans le domaine mathématique traitant des opérateurs
nous avons vu que nous devions noter cette égalité :

(42.217)

Ce qui nous amène à:

(42.218)

soit en utilisant la notation des représentatives (ket-bra):

(42.219)
Pour revenir à la résolution de:

(42.220)

il est évident qu'une solution possible est alors:

(42.221)

qui est donc constituée d'une partie purement spatiale (indépendante du temps) et une exponentielle
complexe dépendante du temps. Vérifions :

(42.222)

C'est ce qu'il fallait démontrer (...).

Remarquons également qu'une fois les solutions purement spatiales déterminées, les solutions dépendantes
du temps et de l'espace s'obtiennent aisément.

De même, grâce à la relation que nous avons démontrée avant, nous pouvons écrire :

(42.223)

Finalement, la relation :

(42.224)

devient:

(42.225)

avec "l'opérateur d'Heisenberg" défini par :

(42.226)

Remarque: Il se peut très bien que X soit parfois une simple constante (nous en verrons un exemple plus
bas).

SÉPARATION DES VARIABLES

Voyons également une manipulation mathématique intéressante et un peu similaire à la précédente de


l'équation d'évolution de Schrödinger. Cette manipulation va nous permettre de voir que la séparation des
variables fonctionne très bien avec l'équation d'évolution et qu'elle va nous permettre de retomber sur un
résultat obtenu précédemment (c'est toujours bien pédagogiquement de voir plusieurs approches).

Nous avons donc dans un cas particulier :

(42.227)

Récrite sous forme traditionnelle (selon la littérature) et à une dimension, pour un potentiel constant dans le
temps, cette relation s'écrit alors :

(42.228)

Supposons maintenant que la fonction d'onde puisse se séparer en deux fonctions dont elle est le produit
telle que :

(42.229)

Nous aurions alors :

et (42.230)

Ce qui injecté dans l'équation d'évolution unidimensionnelle donne :

(42.231)

ce qui donne après simplification :

(42.232)

Le terme de gauche ne dépend que de t, celui de droite que de x. Puisqu'ils sont égaux, ils sont
nécessairement égaux aussi à une constante qui a la dimension d'une énergie (U(x) est une énergie
potentielle pour rappel).

Donc pour le terme de gauche:

(42.233)

alors :

(42.234)

et pour le terme de droite :


(42.235)

qui peut s'écrire :

(42.236)

après factorisation :

(42.237)

Soit avec les notations du site :

(42.238)

nous retrouvons donc l'équation de Schrödinger classique unidimensionnelle ce qui est pas mal du tout
comme résultat!

Maintenant, puisque nous avions posé :

(42.239)

Alors nous avons finalement :

(42.240)

ce que nous pouvons écrire sous les notations des paragraphes précédents :

(42.241)

Nous trouvons également cette dernière relation sous plusieurs formes différentes dans la littérature dont
voici quelques trois échantillons:

(42.242)

COMBINAISON LINÉAIRE DES ETATS

Il faut remarquer avant que nous passions à un autre sujet quelque chose de très important que nous avions
juste mentionnée dans le deuxième postulat!
Effectivement, toute équation de la forme suivant vue précédemment:

(42.243)

est donc solution de l'équation évolutive de Schrödinger et comme dans les systèmes quantiques
l'hamiltonien peut prendre (ou être associé à) plusieurs valeurs propres discrètes notées traditionnellement
nous avons alors, comme mentionné au début de ce chapitre, par le principe de combinaison linéaire des
équations différentielles la solution générale suivante:

(42.244)

dont nous aurons plusieurs exemples pratiques (de la discrétisation des états d'énergie et que ceux-ci sont en
nombre infini) dans le présent chapitre et celui de Chimie Quantique.

Si nous écrivons la constante de normalisation de de la relation précédente, nous avons alors:

(42.245)

Cette dernière relation s'écrirait sous la forme ket-bra traditionnelle suivante:

(42.246)

où le coefficient constant est assimilé à (avouez que c'est plus simple non?).

Nous disons alors que l'état est une combinaison linéaire d'états élémentaires. représente donc
aussi une particule d'onde comme étant simultanément en plusieurs sous-états différents.

Il est intéressant de remarquer que chaque solution:

(42.247)

décrit un "état stationnaire". Voyons (enfin!) rigoureusement de quoi il s'agit.

En effet, nous avons:

(42.248)

qui est donc indépendant du temps d'où l'origine du nom "état stationnaire" (nous avions promis d'en définir
l'origine en début de chapitre... donc voilà qui est fait!).

Les fonctions étant normalisées nous avons donc:


(42.249)

Les calculs nous ont montré plus haut (nous avions fait la démonstration de deux manières différentes) que
les fonctions propres ont les propriétés suivantes:

(42.250)

quand et:

(42.251)

quand . C'est cette propriété qui nous avait amené dans le troisième postulat à parler de "base
orthogonale des fonctions propres stationnaires".

Continuons notre calcul qui peut s'écrire en utilisant le symbole de Kronecker (cf. chapitre de Calcul
Tensoriel):

(42.252)

Nous pouvons alors interpréter le terme comme le poids de la fonction propre dans l'état quantique

, la probabilité d'être en fait dans l'état propre vaut alors et la normalisation impose alors:

(42.253)

Retenons donc qu'un état quantique quelconque peut toujours être interprété comme étant une combinaison
linéaire d'états propres. Le coefficient d'une fonction/état propre est alors associé à une probabilité

C'est ce résultat mathématique, super important!, qui est à l'origine du paradoxe du chat de Schrödinger
(parmi d'autres...) et de nombreux débats.

Pour clore ce petit sujet, remarquons une chose:

Si les coefficients ne sont pas les coefficients déjà normalisés, mais non-normalisés, les physiciens
notent alors leur normalisation ainsi:

(42.254)
car très souvent ils utilisent la même notation pour le coefficient normalisé et le non-normalisé dans leurs
développements...

L'écriture de la dernière relation se justifie aisément car rappelons que nous devons avoir:

(42.255)

et nous avons effectivement après réarrangement:

(42.256)

Notons enfin qu'avec la notation ket-bra traditionelle, la relation:

(42.257)

se note souvent dans certains ouvrages spécialisés:

(42.258)

qui donne donc toujours la probababilité de trouver l'état n à la positions x.

ÉQUATION DE CONTINUITÉ

Considérons maintenant l'exemple important de l'équation d'évolution pour une particule libre, c'est-à-dire
avec . Nous avons donc:

(42.259)

La probabilité de trouver la particule dans un volume V est comme nous l'avons vu, donnée par :

(42.260)

d'où :

(42.261)

En tenant compte de l'équation d'évolution de la particule libre, le second terme de l'égalité s'écrit :
(42.262)

où nous avons posé :

(42.263)

D'après le théorème d'Ostrogradsky (cf. chapitre de Calcul Vectoriel), il vient donc :

(42.264)

où l'intégrale de droite est effectuée sur la surface S qui limite le volume V. La relation précédente exprime
donc bien que la variation par unité de temps de la probabilité de trouver la particule dans V est égale au flux
traversant la surface S et le vecteur peut être interprété comme une densité de courant de probabilité qui
satisfait l'équation de continuité telle que nous l'avons déterminée en thermodynamique :

(42.265)

d'où :

(42.266)

En mécanique quantique, il y aurait donc conservation du flux de particules : Il n'y a ni création ni


disparition de particule, alors que dans la nature (les observations expérimentales) nous observons pourtant
de tels phénomènes... il y donc contradiction entre l'expérience et la théorie ce qui invalide nos
développements.

Par contre, cette équation exprime la conservation de la probabilité aussi! Donc de la propriété d'existence
de la particule et des caractéristiques qu'elle transporte. Par exemple, si nous multiplions cette dernière
relation par la cher de la particule, nous exprimons alors la continuité du courant.

IMPLICATIONS ET APPLICATIONS

Les différentes définitions et outils qui ont été vus précédemment, vont nous permettre d'étudier certains cas
fondamentaux qui débouchent sur des résultats splendides.

Dans un premier temps, nous allons voir comment traiter le cas de la particule libre (état non lié) et quels
sont les problèmes que pose cette configuration simple.

Ensuite, nous allons résoudre l'équation de Schrödinger avec une particule sans spin dans un puits de
potentiel à parois rectilignes et montrer que nous retrouverons avec la formalisme de la physique quantique
les mêmes résultats que le modèle de Bohr (plus généralisé même!).

Après quoi, nous allons introduire l'étude de l'oscillateur harmonique en repassant au préalable brièvement
sur la résolution de l'équation de Schrödinger d'une particule libre. Cet exemple constitue une forme
d'introduction quantique à l'étude théorique de systèmes atomiques. C'est dans cet exemple, que nous
utiliserons toute la puissance des opérateurs linéaires fonctionnels. Il sera donc important de ne pas brûler
les étapes lors de sa lecture.
Il nous faudra également étudier un autre phénomène fameux, l'effet tunnel! Evidemment, nous avons
décidé de faire une introduction d'un cas particulier afin que le lecteur puisse voir le raisonnement qui a
amené à la découverte de ce phénomène épatant (mais logique). Encore une fois, cet exemple appuiera la
validité de la théorie quantique et démontrant la valeur des constantes de désintégration des isotopes
nucléaires!

En ce qui concerne les cas relativistes, avec ou sans spin nous renvoyons le lecteur au chapitre de Physique
Quantique Relativiste et en ce qui concerne le modèle atomique simple, nous le renvoyons au chapitre de
Chimie Quantique.

Enjoy!

PARTICULE LIBRE

Curieusement la résolution de l'équation de Schrödinger pour une particule libre (où le potentiel est nul) est
le cas simple... le plus complexe... mathématiquement parlant car les bornes d'intégration de la normalisation
sont infinies.

Voyons cela:

Rappelons d'abord que nous avons démontré de manière simplifiée dans le chapitre de Suites et Séries que la
transformée de Fourier d'une fonction f et son inverse étaient données par:

(42.267)

Soit sous forme unidimensionnelle:

(42.268)

Procédons maintenant au changement de variable qui relie le nombre d'onde k à la quantité de mouvement
(relation introduite au début de ce chapitre):

(42.269)

Ce qui nous donne:

(42.270)

Revenons maintenant à l'équation de Schrödinger d'évolution:

(42.271)

Si la particule est libre il n'y pas de potentiel et à une dimension nous avons alors:

(42.272)
Cette équation différentielle admet des solutions en ondes planes monochromatiques du type (cf. chapitre
d'Électrodynamique):

(42.273)

avec bien évidemment la petite nuance que nous avons à utiliser la relation (sinon ça joue pas par contre!):

(42.274)

Sans oublier que (cela nous sera utile par la suite):

(42.275)

La courbe de l'énergie E en fonction du vecteur d'onde k est parfois appelée "courbe de dispersion" et c'est
une parabole (puisque k est au carré) pour une particule libre!

Bien évidemment la densité de probabilité de cette solution vaut:

(42.276)

mais cela ne peut pas correspondre à la réalité car nous ne pouvons pas normaliser la probabilité sur des
distances infinies! Une onde plane monochromatique de module constant dans tout l'espace n'étant pas de
carré sommable : elle ne peut donc pas représenter un état physique d'une particule libre.

Au fait la solution vient du fait que la vraie solution utilise le principe de superposition des toutes les ondes
monochromatiques de toutes les fréquences tel que:

(42.277)

et nous retrouvons donc ici une relation très similaire une transformée de Fourier inverse. Une telle
superposition d'ondes planes est appelée : "paquet d'ondes unidimensionnel".

Ce que nous pouvons récrire:

(42.278)

Or, nous voyons de suite que nous ne pourrons pas non plus normaliser suivant:

(42.279)

Dès lors, il n'y a plus de solution générale. Il faut donner une enveloppe porteuse aux ondes imposant une
normalisation possible. Cette enveloppe porteuse peut être un Dirac ou une Gaussienne ou d'autres fonctions
de distributions plus ou moins complexes. Ensuite les physiciens doivent utiliser une propriété des
transformées de Fourier qui font naturellement apparaître les incertitudes de Heisenberg. Ainsi, ces dernières
sont une condition à la normalisation des particules libres utilisant les transformées de Fourier.

A ce jour, nous n'avons pas de démonstration pédagogique et simple à proposer sur ce dernier point. Cela
viendra peut-être plus tard.

Par contre, nous pouvons prendre comme solution triviale les modes propres de la particule tel que:

(42.280)

Effectivement:

(42.281)

C'est ce que nous utiliserons comme situation lors de notre étude plus bas de l'oscillateur harmonique.

Avant d'étudier le cas particulier du paquet d'ondes quasimonochromatiques, nous allons rappeler quelques
résultats concernant la somme de deux ondes planes.

Commençons par sommer deux ondes planes monochromatiques de fréquences voisines:

et (42.282)

avec:

et (42.283)

et:

et (42.284)

A noter que nous imposons donc:

et (42.285)

L'onde résultante a pour expression :


(42.286)

Soit en utilisant les relations trigonométriques remarquables (cf. chapitre de Trigonométrie):

(42.287)

qui est une onde plane se propageant selon x avec la pulsation et le vecteur d'onde moyen et , et donc à
la vitesse de phase:

(42.288)

Le terme en cosinus s'interprète alors comme l'amplitude lentement variable de cette onde plane.

Remarquons un point assez important!: La vitesse de phase n'est pas conforme à la vitesse que nous
obtenons en utilisant l'énergie cinétique d'un particule libre. Effectivement:

(42.289)

Dès lors la vitesse de phase ne répresente pas la vitesse dans le sens classique habituel mais se déplace à la
vitesse de groupe :

(42.290)

où nous retrouvons donc la formulation classique de la vitesse à partir de l'énergie cinétique (pas mal....)!

Nous pouvons représenter aisément tout cela avec Maple:

>restart:with(plots):
>lambda[0]:=1; T[0]:=1; k[0]:=2*Pi/lambda[0]; w[0]:=2*Pi/T[0];
>delta_k:=k[0]/8: k[1]:=k[0]-delta_k; k[2]:=k[0]+delta_k;
delta_w:=w[0]/10: w[1]:=w[0]-delta_w; w[2]:=w[0]+delta_w;
> P1:=animate(cos(k[1]*x-w[1]*t)+cos(k[2]*x-w[2]*t), x=0..1*2*Pi/delta_k, t=0..2*Pi/delta_w,
numpoints=200, frames=15, color=red):
> P2:=animate({2*cos(-1/2*k[1]*x+1/2*w[1]*t+1/2*k[2]*x-1/2*w[2]*t), -2*cos(-
1/2*k[1]*x+1/2*w[1]*t+1/2*k[2]*x-1/2*w[2]*t)}, x=0..1*2*Pi/delta_k, t=0..2*Pi/delta_w, numpoints=100,
frames=15, color=blue):
> display(P1,P2);

Ce qui donne:

(42.291)

A la différence de l'onde plane harmonique, cette onde n'a pas un module constant : son module est nul dans
certaines zones. Par contre, elle s'étend toujours sur une distance infinie, donc a une norme (somme de la
probabilité sur tout l'espace) infinie. Elle ne possède donc pas de sens physique.

L'étude précédente peut être étendue en sommant un nombre N de plus en plus grand d'ondes planes au
voisinage de et . Une telle superposition conduit à une fonction de plus en plus localisée dans
certaines zones de l'espace (en particulier vers par exemple pour ), la distance entre ces zones
augmentant proportionnellement avec N. A la limite , alors seule la zone vers demeure, les
autres étant rejetées à l'infini. Le passage à cette limite s'effectue en remplaçant la somme discrète
sur les ondes planes par une sommation continue c'est-à-dire par une intégrale de la forme :

(42.292)

avec:

(42.293)

avec donc :

et (42.294)

Un tel paquet est donc appelé "paquet d'ondes quasimonochromatiques".

Cette expression peut se réécrire :

(42.295)
Il importe de comprendre que est une fonction de k, donnée par l'équation de dispersion. Nous allons
faire le calcul de cette expression en utilisant le fait que .

implique que . Il est possible d'effectuer un développement limité au voisinage de


:

(42.296)

où est la vitesse de groupe. Alors :

(42.297)

Posons :

(42.298)

Calculons l'intégrale:

(42.299)

avec:

(42.300)

Soit:

(42.301)
Le dernier terme s'interprète à nouveau comme une onde plane se déplaçant à la vitesse de phase:

(42.302)

L'amplitude de cette onde plane est donnée par une fonction type sinus cardinal. A , cette fonction sinc
n'a des valeurs importantes que dans la zone:

(42.303)

Il s'agit donc d'une fonction bien localisée. En conséquence, est une fonction de carré sommable. Le
calcul donne:

(42.304)

La fonction peut donc être normalisée en posant donc:

(42.305)

Nous avons donc réussi à obtenir une fonction satisfaisant à la fois l'équation de Schrödinger et la condition
de normalisation, grâce à l'emploi d'une somme infinie d'ondes harmoniques. L'exemple que nous avons
traité n'est qu'un cas particulier. D'autres types de paquets d'ondes peuvent être obtenus en prenant d'autres
distributions pour les amplitudes des ondes planes qui composent le paquet (nous avons supposé ici qu'elles
avaient toutes la même amplitude). Dès lors, la vitesse de groupe est associée classiquement à la vitesse de
la particule de masse m et d'impulsion p.

Ainsi, Le paquet d'ondes se déplace globalement à la vitesse de groupe, qui s'identifie à la vitesse donnée par
la mécanique classique.

Les relations d'incertitude ont déjà été introduites au début de ce chapitre de deux manières différentes. Mais
dans l'exemple du paquet d'ondes étudié au paragraphe précédent, nous avons vu que la fonction est
localisée dans une zone d'extension (largeur à mi-hauteur) :

(42.306)

Nous avons donc la relation :

(42.307)

Nous retrouvons ici une expression de type incertitude. Le coefficient numérique pourrait être légèrement
différent suivant la définition choisie pour et , ou le type de paquet. Il pourrait en particulier être
nettement plus grand dans certains cas. Nous avons donc en fait une inégalité du type:

(42.308)

En physique quantique, ces inégalités s'expriment en fonction de l'impulsion p, reliée à k par . Nous
avons donc :
(42.309)

Il ne s'agit donc pas d'incertitudes au sens de la mesure, et qui serait limitées par les appareils de mesure,
mais d'une propriété fondamentale intrinsèque, liée à la représentation quantique d'une particule selon le
modèle mathématique proposé. Le modèle de l'atome de Bohr est donc à rejeter pour les niveaux d'énergie
qui sont proche de cette égalité.

PUITS DE POTENTIEL A PAROIS RECTILIGNES

Prenons pour premier exemple, très important pour le chapitre de Physique Nucléaire et pour les spécialistes
des semiconducteurs, la résolution sous forme classique du puits de potentiel à parois rectilignes, également
appelé "puits rectangulaire" (cet exemple est vraiment très important, prenez vraiment votre temps afin de le
comprendre et de la maîtriser au mieux).

C'est l'exemple le plus simple d'une fonction , nulle à l'intérieur du puis et infiniment grande sur les
parois, distantes d'une longueur L.

Remarque: Lorsque nous disons que les parois sont parfaitement réfléchissantes.

Nous supposons une particule piégée dans ce puits. Elle ne peut s'en échapper puisque les parois (c'est-à-dire
le potentiel U) ont une hauteur infinie. Mais à l'intérieur, elle est libre de se déplacer sans faire d'interaction
avec les parois.

Cette configuration se traduit par les conditions aux limites où l'énergie potentielle électrostatique est notée
U:

si

si ou

(42.310)

Il existe deux manières d'aborder problème. Voyons les deux types de traitements car le premier permet
d'avoir une approche simpliste alors que le deuxième permet d'avoir une approche avec une plus générale
qui nous sera utile par la suite lors de notre étude de l'effet Tunnel :

1ERE APPROCHE

L'équation de Schrödinger (classique) :

(42.311)

a donc une solution simple respectant les conditions initiales en une dimension du type :

(42.312)

dont la dérivée seconde est :


(42.313)

Introduits dans l'équation de Schrödinger nous obtenons après quelques simplifications d'algèbre
élémentaire:

(42.314)

Donc finalement la solution s'écrit:

(42.315)

à propos de laquelle il faut appliquer les conditions aux limites (la solution en cosinus est en tout point
similaire).

Si nous voulons pouvoir, par la suite, faire un parallèle avec un (ou des) électron(s) piégé(s) dans le puits du
potentiel du noyau de l'atome (qui n'est par rectangulaire lui!), nous sommes amenés aux considérations
suivantes:

La stabilité des atomes suggère l'existence d'une onde stationnaire électronique dans le puits. De plus,
l'observation montre que seuls certains niveaux d'énergie semblent autorisés dans ce dernier.

Si nous faisons une similitude avec les cordes vibrantes, la fonction d'onde de l'électron doit être telle que:

1. Pour et il doit y avoir un noeud de vibration. Donc:

2. La fonction d'onde doit présenter un nombre entier de demi-longueur d'onde sur la longueur L

3. Dans la boîte donc

4. Si aux extrémités ( et ) alors l'argument du sinus vaut

Donc nous devons avoir :

(42.316)

d'où puisque l'énergie potentielle est nulle :

(42.317)

L'énergie totale de la particule présente donc une suite discrète de valeurs, les seules permises. La valeur de
L est quant à elle déterminée à l'aide du modèle de Bohr ou de Sommerfeld en fonction des cas (cf. chapitre
Physique Quantique Corpusculaire).

L'énergie totale de la particule ci-dessus sont les "valeurs propres" de l'énergie dans le puits de potentiel.
Donc l'équation de Schrödinger permet de faire abstraction du 3ème postulat de Bohr dans le sens où elle
explicite directement la notion de quantification des niveaux par des valeurs entières (discrètes) solution des
conditions aux limites d'un puits de potentiel considéré comme parfait.

Les fonctions d'onde correspondantes dans le puits où sont donc:

(42.318)

Soit après simplification :

(42.319)

C'est l'expression d'une des solutions de l'équation pour le puits de potentiel rectangulaire idéal. Ainsi, il
existe une suite discrète de fonctions d'onde solutions. Ce sont les "fonctions propres" de la particule.

La constante dans cette expression est déterminée par la normalisation de De Broglie (dont nous avions
parlé au début de ce chapitre), c'est-à-dire par la condition:

(42.320)

Nous trouvons alors (calcul d'intégration normelement élémentaire):

(42.321)

et l'expression finale de la fonction d'onde associée à la valeur propre se lit donc:

(42.322)

Certains physiciens ont pour habitude de noter cela sous forme complexe en ne prenant que la partie réelle
de l'expression (nous utilisons la "formule d'Euler" vue lors de l'introduction aux complexes dans le chapitre
des Nombres):

(42.323)

avec:

(42.324)

Nous disons alors que nous avons des "conditions de quantification" sur k imposées par les conditions aux
limites.
Cette notation est parfois utile et nous l'utiliserons lors de l'étude de l'effet tunnel dans le chapitre de
Physique Nucléaire.

Nous pouvons déduire de l'expression obtenue, les propriétés principales des fonctions d'onde décrivant les
états stationnaires de la particule dans une boîte:

1. La figure ci-dessous représente des fonctions et des densités de probabilités pour les premiers
niveaux d'énergie :

(42.325)

Nous remarquons que (évidemment nous pourrions analyser ceci de façon analytique et non graphique si
nous le désirions), en plus des points et , a (n-1) zéros situés en:

avec (42.326)

Ces points, où la fonction d'onde et la densité de probabilité sont nulles, sont appelés "points nodaux" ou
simplement "noeuds" de la fonction d'onde. Le nombre de noeuds augment quand n augmente, c'est-à-dire
quand l'on passe à des états de plus en plus excités. La fonction d'onde de l'état fondamental à:

et donc (42.327)

n'a pas de noeuds, celle du premier état excité d'énergie:

(42.328)
a un point nodal, celle du deuxième état excité a deux points nodaux, etc... La variation des propriétés
nodales des fonctions d'onde quand n varie traduit l'orthogonalité des états stationnaires d'énergie différente.
En effet, nous vérifiions aisément que est nul quand :

(42.329)

2. Comme nous pouvons le voir sur la figure précédente, la densité de probabilité associée à tout état
stationnaire de la particule est symétrique par rapport au point médian

Nous anticipons donc que la valeur moyenne de x sera exactement égale à L/2 dans un tel état. En effet nous
avons vu dans le chapitre de Statistique que l'espérance (moyenne) d'un événement de probabilité P(x) est
définie par:

(42.330)

où x, E(x) et P(x) n'ont pas d'unités (attention nous allons faire une analyse dimensionnelle).

Or, en physique quantique E(x) et x sont des grandeurs dimensionnelles identiques. Ce qui signifie que les
dimensions de P(x) doivent annuler celles de dx. Ainsi, nous devinons suite à l'étude des conditions de
normalisation de De Broglie que:

(42.331)

qui est une probabilité linéique de présence de la particule.

Le domaine d'intégration étant [0; L] nous avons finalement:

(42.332)
Egalement sans démonstration car ce résultat est trop évident (si jamais il ne l'est pas pour vous dites-le nous
et nous ajouterons le développement comme pour tout autre chose dans ce site d'ailleurs), la quantité de
mouvement le long x est nulle:

Nous pouvons par ailleurs vérifier sans trop de peine que ce nous avons vu lors de l'énoncé du 2ème postulat
se vérifie bien dans cet exemple. C'est-à-dire que les fonctions propres de l'onde sont reliées à l'opérateur
hamiltonien via les valeurs propres de l'énergie :

(42.333)

Effectivement, dans notre exemple, cela donne:

(42.334)

voilà... pour la première approche du problème. Voyons maintenant la deuxième :

2EME APPROCHE

Nous avons donc l'équation de Schrödinger dans le cas unidimensionnel :

(42.335)

Dans les régions situées en dehors de la boîte où le potentiel est infini, nous avons :

(42.336)

Soit :

(42.337)

ce qui donne :
(42.338)

Ainsi, les fonctions d'onde sont nulle dans les régions où le potentiel est infini.

Considérons maintenant le cas du puits où puisque le potentiel électrostatique est nul l'équation de
Schrödinger se réduit à:

(42.339)

C'est donc une équation différentielle linéaire d'ordre 2 avec des coefficients constants, équation qu'il est
relativement aisé de résoudre dans le cas général (cf. chapitre de Calcul Différentiel Et Intégral). Soit
l'équation :

(42.340)

En nous aidant des résultats obtenus lors du traitement de la solution particulière, supposons que la fonction
y qui satisfait cette équation différentielle soit de la forme . Nous avons alors :

ou (42.341)

pourvu, bien sûr, que . Cette dernière relation est donc l'équation quadratique auxiliaire de l'équation
différentielle (polynôme caractéristique). Elle a deux solutions/racines (c'est une simple résolution d'un
polynôme du deuxième degré) que nous noterons dans le cas général . Ce qui signifie que :

et (42.342)

est satisfait pour les deux racines. Si nous faisons la somme puisque les deux sont égales à la même
constante :

(42.343)

Ainsi, il est immédiat que la solution générale de y est du type :

(42.344)

où le lecteur devrait normalement sans peine pouvoir vérifier que l'ajout des constantes A et B ne changent
en rien les développements des paragraphes précédents.

Dans le cas qui nous occupe :

(42.345)

L'équation quadratique est :


(42.346)

soit :

(42.347)

Donc finalement la solution générale est de la forme :

(42.348)

Posons maintenant :

(42.349)

Nous avons alors :

(42.350)

avec :

et (42.351)

Il faut maintenant déterminer A' et B' en utilisant les conditions aux limites. Ainsi, en x=0 et x=L nous
devrions avoir et nous avons pour x=0 :

(42.352)

Le coefficient A' doit donc être nul. Et en x=L nous devrions avoir :

(42.353)

Mais dans ce cas, B' doit être différent de zéro. En effet, s'il était nul, la fonction d'onde serait nulle dans tout
le puits ce qui est contraire à la réalité physique du problème. Il faut donc que ce soit le sinus qui soit nul, ou
encore que son argument soit égal à un multiple d'un nombre entier non nul d'angle tel que :

(42.354)
Donc :

(42.355)

Nous retrouvons donc exactement le même résultat que la méthode précédente.

Il reste à déterminer B et la méthode est exactement identique à la première méthode de résolution que nous
avons vu plus haut. Ainsi, nous avons bien :

(42.356)

Ce qui est important surtout dans cette méthode c'est de se souvenir pour plus tard de la forme générale de la
solution :

(42.357)

OSCILLATEUR HARMONIQUE

L'étude de l'oscillateur harmonique correspondant à celle d'une fonction d'onde coincée dans un puits de
potentiel parabolique. Ce qui est assimilable grosso modo aux atomes où les parois du puits de potentiel ne
sont naturellement pas rectangulaires et infinies... L'étude qui va suivre est donc ce qui est le plus proche de
ce qui est disponible dans la Nature au atomique.

Dans le cas d'une particule libre en déplacement rectiligne, nous avons vue que l'énergie potentielle est nulle
et l'équation de Schrödinger devient alors:

(42.358)

Cependant pour une particule libre (en l'absence de champ de potentiel) l'énergie totale est donc égale à
l'énergie cinétique :

(42.359)

Mais nous avons :

(42.360)

Le rapport :

(42.361)

étant la longueur d'onde associée de De Broglie. En introduisant le nombre d'onde (cf. chapitre de
Mécanique Ondulatoire), nous avons :
(42.362)

appelée "relation de De Broglie". Finalement :

(42.363)

Dès lors, l'équation de Schrödinger peut s'écrire:

(42.364)

Nous voyons par substitution directe que cette équation différentielle admet pour solutions les fonctions
d'onde:

et (42.365)

Ces deux différentes solutions représentent le déplacement d'une même particule une fois dans la direction
+x et l'autre dans -x. Si nous avons :

(42.366)

Le fait que ce résultat soit égal à l'unité, signifie que la probabilité de trouver la particule est la même en tout
point. En d'autres termes, décrit une situation dans laquelle l'incertitude sur la position est
totale. Ce résultat est en accord avec le principe d'incertitude puisque décrit une particule dont
nous connaissons avec précision la quantité mouvement : c'est-à-dire que , ce qui implique
.

En analyse nous avons montré que la solution la plus générale d'une équation différentielle est la somme de
ces solutions. Autrement dit dans notre exemple :

(42.367)

avec:

(42.368)

Au fait, nous pouvons remarquer que si alors le résultat est le même à la différence que nous
aurons :

(42.369)

Lorsque la particule qui nous intéresse se trouve dans un puits de potentiel décrit par la fonction (parabole):
(42.370)

nous parlons alors "d'oscillateur harmonique".

Ce système est très important car l'Hamiltonien de l'équation intervient dans tous les problèmes mettant en
jeu des oscillations telles que vibrations moléculaires et cristallines (cf. chapitre de Chimie Quantique).

Prenons d'abord comme exemple l'oscillateur harmonique classique qui consiste en un corps assujetti à se
déplacer le long d'un axe et soumis à une force de rappel proportionnelle à la distance à un point situé sur cet
axe.

L'équation de ce corps est régie par l'équation de la dynamique:

(42.371)

Nous avons vu en mécanique classique que la solution générale de cette équation est:

(42.372)

avec comme pulsation:

(42.373)

L'énergie totale du système étant l'Hamiltonien classique nous écrivons :

(42.374)

Maintenant revenons à notre cadre quantique. De ce point de vue nous avons pour Hamiltonien (ou énergie
totale):

(42.375)

En utilisant ce que nous définissons comme une "écriture réduite", nous écrivons :

(42.376)

où les opérateurs réduits sont :

et (42.377)
et où nous avons remplacé la constante par identiquement à l'oscillateur harmonique classique
(cf. chapitre de Mécanique Classique).

Il est plus ou moins facile d'obtenir la relation de commutation:

(42.378)

Démonstration:

Rappelez-vous de la relation ci-dessous que nous avons vue lors de notre étude des opérateurs linéaires
fonctionnels au début de ce chapitre :

(42.379)

Etudions les propriétés des commutateurs avec la quantité de mouvement. Nous avons démontré également
plus haut la relation ci-dessous:

(42.380)

En multipliant cette dernière par , il vient:

(42.381)

que nous pouvons également écrire:

(42.382)

Si vous vous rappelez de la définition des commutateurs , nous avons :

(42.383)

Nous avons donc pour notre oscillateur:

et (42.384)

écrivons la définition le commutateur :

(42.385)

Donc:
(42.386)

c'est ce qu'il fallait démontrer...

Nous avons maintenant intérêt pour résoudre l'équation différentielle d'utiliser les opérateurs non
hermitiques définis (c'est une définition donc ne cherchez pas trop loin):

(42.387)

Ce qui nous définit donc les opérateurs (en posant temporairement ):

(42.388)

Nous retrouvons ces deux opérateurs très fréquemment en mécanique quantique et les physiciens parlent
alors de "l'opérateur de destruction" et de "l'opérateur de création" a.

Compte tenu de la relation de commutation, nous vérifions :

et (42.389)

Démonstration:

(42.390)

et :

(42.391)

et d'autre part:

(42.392)

Démonstration:
(42.393)

et donc en divisant pas 2 des deux côtés de l'égalité nous avons :

(42.394)

Revenons à la relation:

(42.395)

Utilisons :

(42.396)

Donc:

(42.397)

Nous faisons maintenant l'hypothèse que est une fonction propre de N associée à la valeur propre n, telle
que :

(42.398)

Cette hypothèse est très importante car nous allons nous en servir comme principe d'induction pour trouver
toutes les fonctions propres à partir de la fondamentale!

Etablissons maintenant des relations de commutation entre N et les opérateurs a ou . Pour cela
multiplions d'abord le tout par , nous obtenons:

(42.399)

De même en multipliant par a, nous obtenons:

(42.400)

Puisque selon notre hypothèse et n sont respectivement fonction et valeur propre de N, nous pouvons
écrire:

(42.401)

Or, nous avons :

(42.402)
qui multipliée à droite par la fonction d'onde donne la relation :

(42.403)

Cette équation entraîne les conséquences suivantes:

- Ou bien tel que

- Ou bien est fonction propre de N pour la valeur propre n-1 !!

Le même raisonnement établirait que est fonction propre de N pour la valeur propre n+1, si elle n'est
pas nulle (nous verrons plus loin que n'est jamais nulle):

(42.404)

Cette relation est importante car si n'est pas nulle pour une fonction propre donnée elle ne le sera pas
non plus pour les autres fonctions propres de valeur propre n+1 !!

Nous savons qu'il existe une valeur propre plus petite que toutes les autres correspondant au niveau
fondamental (d'après le modèle de Bohr-Sommerfeld cette valeur propre existe toujours).

Nécessairement, sa fonction propre obéit à la relation (le lecteur pourra vérifier avec les résultats plus
loin) :

(42.405)

sinon quoi serait valeur propre et il y aurait contradiction.

En multipliant cette dernière relation par nous obtenons:

(42.406)

ce qui montre que la valeur propre minimale est nulle. Nous connaissons donc le niveau fondamental de
l'oscillateur:

(42.407)

Remarque: Il faut noter que l'oscillateur n'est jamais dans un état de repos (mettre n = 0 dans l'expression de
l'énergie plus haut) ce qui veut aussi dire que le zéro absolu ne peut pas être accessible puisque la
température "chiffre" l'agitation atomique, or le repos n'existe pas!

Pour obtenir la fonction propre correspondante, nous avons besoin de l'expression explicite de a. D'après:

et (42.408)
nous avons :

et (42.409)

ce qui nous donne:

(42.410)

car rappelons-le:

d'où:

(42.411)

Mais d'après :

(42.412)

d'où:

(42.413)

soit (résolution d'une simple équation différentielle):

(42.414)

Nous devons envisager, en réalité, comme fonction de x par le biais de la coordonnée réduite Q.

D'après:

(42.415)

en introduisant la longueur A :

(42.416)

avec :
(42.417)

Nous allons fixer maintenant la constante en utilisant la condition de normalisation de De Broglie:

(42.418)

et donc :

(42.419)

Il est loisible de choisir la constante réelle et positive, nous avons finalement:

(42.420)

Corollaire... : D'après ce que nous avons vu précédemment, en faisant agir sur (explicitement nous

faisions référence au résultat ), nous obtenons les fonctions propres de N pour les
valeurs propres entières 1, 2, etc. Nous vérifierons plus loin que nous épuisons ainsi toutes les valeurs
propres de N.

Il reste à construire les autres fonctions propres et à les normer. En effet, si est fonction propre normée
associée au niveau , nous avons vu plus haut que est fonction propre associée au niveau n+1, mais
il n'y a pas de raison de la normer à nouveau puisqu'elle est justement associée à une fonction propre déjà
normée.

Nous pouvons écrire:

(42.421)

étant un coefficient à déterminer. Exprimons le fait que est déjà normée:

(42.422)

Soit en tenant compte de la relation nous avons:

(42.423)

Rappelons que donc:

(42.424)
Nous venons de vérifier au passage que n'est jamais nul (fait que nous avions supposé plus haut).

Toutes les fonctions (sauf déjà fixée) ont un facteur de phase arbitraire (notion que nous avons vu
lors de la définition des états liés et non liés), indépendamment les unes des autres, l'argument de reste
donc à notre disposition et nous choisirons réel positif. Cela fixe toutes les :

(42.425)

En itérant cette relation sur la fonction d'onde nous obtenons aisément (algèbre élémentaire):

(42.426)

soit en tenant compte des relations suivantes (que nous avons déjà démontrées précédemment):

et (42.427)

Nous avons :

(42.428)

Cette équation prend une forme plus simple, en s'appuyant sur la relation:

(42.429)

Vérification:

(42.430)

soit, en langage d'opérateurs:

(42.431)

Ainsi:

(42.432)
Nous obtenons ainsi l'expression de :

(42.433)

Par ailleurs, dans la théorie mathématique des familles de polynômes orthogonaux, nous rencontrons les
"polynômes d'Hermite" définis par:

(42.434)

Ce sont des polynômes de degrés n, pair ou impairs ( ). En les employant,


nous allégeons la relation précédente qui devient:

(42.435)

Ces polynômes constituent donc une base orthonormée de l'état quantique global et apparaîssent donc
naturellement dans l'expression générale des fonctions/états propres.

Finalement nous avons :

Tableau: 42.1- Fonctions et énergies propres de l'oscillateur harmonique pour n=1..3

Avec la non moins fameuse représentation graphique avec à gauche les fonctions propres associées et à
droite la probabilité de présence :
(42.436)

En analysant ces fonctions d'ondes, nous retrouvons de nombreux résultats classiques : la particule dans le
puits de potentiel a une probabilité de présence plus élargie si elle a une énergie plus haute (une bille au fond
d'un puits va monter plus haut sur les bords si elle a plus d'énergie), la particule a plus de chance se
retrouver sur ces positions éloignées du centre du puits (la bille a une vitesse d'autant plus petite qu'elle est
haut dans le puits : elle va donc passer beaucoup plus de temps en hauteur qu'au fond du puits).

Pour tous les calculs où des particules sont dans un puits de potentiel, l'approximation harmonique est très
intéressante. Par exemple, si nous souhaitons étudier un "piège harmonique" à deux dimensions, soit
condensat de Bose-Einstein 2D (cf. chapitre de Mécanique Statistique) nous pourrons poser pour
l'hamiltonien suivant pour débuter l'étude (en analogie avec celui à une dimension utilisé plus haut) :

(42.437)

EFFET TUNNEL

L'effet tunnel désigne la propriété que possède un objet quantique de franchir une barrière de potentiel,
franchissement impossible selon la mécanique classique. Généralement, la fonction d'onde d'une particule,
dont le carré du module représente l'amplitude de sa probabilité de présence, ne s'annule pas au niveau de la
barrière, mais s'atténue à l'intérieur de la barrière, pratiquement exponentiellement pour une barrière assez
large comme nous le démontrerons. Si, à la sortie de la barrière de potentiel, la particule possède une
probabilité de présence non nulle, elle peut donc traverser cette barrière.

L'étude théorique de ce phénomène est d'une importance cruciale dans la théorie des semiconducteurs et de
la désintégration en physique nucléaire. Il convient donc d'y accorder une attention bien particulière!

La barrière quantique de largeur L sépare dans les cas simples l'espace en trois, dont les parties gauche et
droite sont considérées comme ayant des potentiels constants jusqu'à l'infini. La partie intermédiaire
constitue la barrière, qui peut être compliquée, révélant un profil doux, ou au contraire formé de barrières
rectangulaires, ou autres éventuellement en séries.
Etudions maintenant le cas de systèmes où l'énergie potentielle (implicitement le potentiel y relatif)
tend vers des limites finies, non forcément égales quand . Il s'agit donc d'un problème d'états non
liés.

D'abord, nous définissons une région I loin à gauche où sera noté :

(42.438)

une région III loin à droite où sera noté :

(42.439)

En se bornant aux situations les plus simples, il y a trois possibilités relativement aux relations données
précédemment : puits de potentiel (a), marche de potentiel (b), barrière de potentiel (c) comme représentés
dans l'ordre énoncé sur la figure ci-dessous:

(42.440)

Maintenant, écrivons l'équation de Schrödinger :

(42.441)

Dans les régions I et III de la barrière de potentiel, l'idée est que est constant et positif donc
l'équation différentielle peut s'écrire en une dimension:
(42.442)

nous obtenons ainsi très simplement l'expression analytique de dans ces régions sous forme générale :

(42.443)

Nous trouvons ces deux expressions de façon identique lors de notre étude du puits de potentiel à parois
rectangulaires, à la différence que nous avons écrit ci-dessus les solutions générales de l'équation
différentielle (cf. chapitre de Calcul Différentiel et Intégral) sans en déterminer les coefficients (car nous
nous intéressons ici à une généralisation).

Ainsi, dans l'étude du puits à parois rectangulaires plus haut nous avions déjà déterminé que:

et (42.444)

Remarque:

R1. Nous voyons que les nombres d'ondes k sont donc proportionnels à la racine de l'énergie cinétique. Et
comme l'énergie cinétique est proportionnelle à la vitesse au carré des particules il vient alors que la vitesse
est proportionnelle au nombre d'onde (et réciproquement)!

R2. Dans certains ouvrages, pour simplifier les notations, le potentiel dans les régions I et III et posé comme
référence et donc égalisé à 0. Il disparaît donc des deux expressions précédentes et cela a pour effet
d'égaliser les deux nombres d'ondes qui sont alors notés simplement k.

Dans la région II, l'idée est que est négatif et constant donc l'équation différentielle peut s'écrire
en une dimension:

(42.445)

et comme nous l'avons vu lors de notre étude du puits de potentiel rectangulaire infini selon la 2ème
approche, la solution est alors de la forme:

(42.446)

avec:

(42.447)

Remarque: La parenthèse sous la racine de la relation précédente doit donc être positive. Or cela signifierait
que l'énergie cinétique de la particule est négative... Pour palier à ce problème dans le cadre de ce modèle
simplifié, on dit que la particule n'a pas le droit d'exister dans la barrière et qu'elle empreinte de l'énergie au
vide. Mais il y a d'autres modèles plus complexes qui ne nécessitent pas ce genre de fantaisies.
Nous obtenons ainsi très simplement l'expression analytique de dans les trois régions sous forme générale
:

(42.448)

Supposons maintenant que nous ayons à (région I), une source de particules (qui les envoie vers la
droite), avec une énergie cinétique valant évidemment .

Ainsi, ces particules ont une énergie et la fonction d'onde qui les décrit obéit à l'équation de
Schrödinger. Dans la région III, il sera supposé qu'il ne peut exister que des particules allant vers la droite
(pas de source à , par hypothèse).

La région III, comme du reste la région I, est d'étendue infinie, donc le principe d'incertitude nous permet de
parler en théorie d'une quantité de mouvement parfaitement déterminée que nous noterons p'.

Nous savons que (c'est de la mécanique classique!) dans la région III nous avons alors :

(42.449)

Si alors p' est positif, donc grâce à la relation précédente et à la relation de De Broglie nous
avons :

(42.450)

Soit:

(42.451)

Les nombres d'onde étant maintenant connus formellement revenons à l'interprétation de la solution III :

(42.452)

L'hypothèse comme quoi les particules viennent de la gauche nous impose pour que la solution
décrive uniquement des particules qui vont vers la droite. Ensuite, il est loisible, pour celles venant de la
gauche, de prendre . La région III est donc relativement simple d'analyse...

Remarque: Les conditions et hypothèses utilisées précédemment sont souvent appelées "conditions de
scattering".

Les constantes A et B de la région I vont être elles complètement déterminées en effectuant le raccord des
solutions d'une région à l'autre.

Intéressons-nous donc maintenant à l'interprétation de l'équation dans la région I:


(42.453)

Il est évident que décrit des particules qui, dans la région I, se dirigent vers la droite alors
décrit des particules qui, dans cette même région, se dirigent vers la gauche. Comme nous le savons,
les premières sont les particules incidentes, les secondes sont les particules réfléchies.

Ce que nous demandons à la physique quantique apparaît maintenant d'une façon claire: une particule
arrivant de la gauche (incidente) peut soit :

1. Continuer vers la droite, c'est-à-dire franchir la région II et devenir une particule transmise

2. Retourner vers la gauche et devenir une particule réfléchie.

Nous sommes amenés à définir un "coefficient de transmission" T assimilé à la probabilité qu'à la particule
incidente de franchir la région II et un "coefficient de réflexion" R, probabilité qu'à la particule incidente
d'être réfléchie. Nous devons avoir:

(42.454)

Dans le cas d'une barrière de potentiel, T est également appelé la "transparence de la barrière".

Pour calculer R et T, nous définirons les flux courants des diverses catégories de particules (incidentes,
transmises, réfléchies).

Par exemple, puisque les particules incidentes sont décrites par , le nombre moyen de ces particules,

par unité de longueur dans la région I, doit certainement être proportionnel à un facteur près à .

Soit leur vitesse, nous voyons que le courant des particules incidentes , est alors proportionnel à un

facteur près à (analyse dimensionnelle). Ainsi, le coefficient de proportionnalité étant de même nature
pour les trois catégories de particules (incidentes i, réfléchies j, transmises t) et du fait que et sont
proportionnels à et , il s'ensuit que (courants incidents et réfléchi) et (courant transmis) sont

respectivement proportionnels (donc toujours à un facteur dimensionnel près!) à , et


(puisque rappelons que pour la région III nous avons trouvé A'=1 et B'=0).

Nous déduisons de là très simplement, par un simple rapport, les expressions des coefficients de réflexion R
et de transmission T :

(42.455)

et comme dans notre cas particulier et comme il vient:

(42.456)

Une autre façon d'écrire les choses est dire que puisque l'onde incidente se résume à:
(42.457)

et l'onde transmise à :

(42.458)

alors:

(42.459)

Dans toutes ces situations, la théorie quantique conduit, en général, à des valeurs de R et T petites, mais pas
nulles !

Exemples:

Déterminons l'expression explicite de la transparence pour notre exemple de barrière rectangulaire.

Pour cela, nous savons que nous devons imposer la continuité de en et , ainsi que la
continuité de en et .

Donc rappelons d'abord que nous avons les trois relations (en mettant la référence du potentiel à 0):

(42.460)

avec donc:

et (42.461)

Nous avons alors pour la continuité de en et :

(42.462)

ainsi que la continuité de en et :

(42.463)

Puisque B' est nul nous avons un système de 4 équations à 5 inconnues:


(42.464)

Nous allons choisir d'exprimer toutes les constantes à partir de A. Pour cela nous écrivons nous multiplions
la première ligne par ik et la sommons à la deuxième ligne. Nous avons alors:

(42.465)

et ensuite nous multiplions la troisième ligne par -ik et la sommons à la quatrième ligne. Nous avons alors:

(42.466)

Nous avons donc les deux relations:

(42.467)

ou en posant :

(42.468)

De la deuxième relation il vient:

(42.469)

et injecté dans la première:

(42.470)

Soit:

(42.471)

Nous avons alors:


(42.472)

ou:

(42.473)

et notons:

(42.474)

Il vient alors:

(42.475)

De même en repartant de:

(42.476)

De la deuxième relation il vient:

(42.477)

et injecté dans la première:

(42.478)

Soit:

(42.479)

Nous avons alors:

(42.480)

ou:
(42.481)

et notons toujours:

(42.482)

Il vient alors:

(42.483)

Notez que nous avons aussi:

(42.484)

Nous pouvons maintenant exprimer les constantes A' et B en fonction de A à l'aide des relations précédentes:
(42.485)

et:

(42.486)

Donc finalement nous avons:

(42.487)

Et donc alors:

(42.488)

en utilisant les propriétés du module complexe (cf. chapitre Nombres):


(42.489)

Il nous reste donc qu'à calculer:

(42.490)

Donc:
(42.491)

Nous avons donc:

(42.492)

Or, comme:

(42.493)

si (donc à l'échelle atomique c'est plutôt K qui est immense relativement à L) nous avons:

(42.494)

Donc:
(42.495)

relation qu'on retrouve très souvent (sans démonstration détaillée) dans de nombreux ouvrages. Ci-dessous
nous avons tracé:

(42.496)

de la relation:

(42.497)

Nous constatons que le coefficient T est très sensible (exponentiellement) à une faible variation la largeur de
la barrière, a, lorsque le potentiel de cette barrière est faible. Nous pourrons donc visualiser des sites
atomiques, par exemple dans du silicium, en utilisant une pointe très proche du matériau à observer. C'est le
principe du microscope à effet tunnel où en approchant une pointe conductrice taillée très finement
(quelques atomes seulement) à une proximité d'environ 5 Angströms d'une surface conductrice, et en
imposant une différence de potentiel de quelques mV, on mesure un courant que de quelques nano-ampères.
Le nombre d'électrons qui passent à travers la barrière de potentiel (ici c'est le vide entre les deux électrodes
conductrices) diminue de manière exponentielle avec la largeur de la barrière. En analysant le signal d'erreur
d'un asservissement sur le courant passant dans le circuit, on peut avoir accès à une cartographie très précise
de la surface mesurée de l'ordre de 0.1 Angströms en vertical.

Nous remarquons également selon la relation obtenue que les particules légères comme les électrons ont une
probabilité plus grande de faire un effet tunnel que les particules plus lourdes à cause du terme de masse.

En utilisant la relation obtenue précédemment, on peut assez simplement calculer la probabilité qu'a un être
humain de masse m de traverser un mur avec une hauteur h (donc facile de calculer l'énergie potentielle) et
une épaisseur a. La probabilité est de l'ordre de ....
Ceci dit, l'exemple le plus célèbre d'effet tunnel pouvant être traité est celui de l'émission de particules
par des noyaux lourds radioactifs dont l'explication a été donnée par le physicien russe G. Gamov en
1928.

La démonstration est relativement simple mais comme elle constitue un cas pratique particulier que nous ne
souhaitons pas exposer dans ce chapitre mais dans celui de Physique Nucléaire. Cependant, pour résoudre ce
problème il faut utiliser une méthode d'approximation connue sous le nom de méthode W.K.B. du nom des
physiciens Wentzel, Kramers et Brillouin.

Les résultats donnent dès lors un facteur de transmission T pour la particule de:

(42.498)

pour l'atome d'Uranium . Par ailleurs, dans l'approximation semi-classique, la particule a, dans le
puits, une vitesse de l'ordre de et elle effectue des aller-retours dans un noyau dont le rayon est de
l'ordre de . Elle effectue donc environ oscillations par seconde où chaque fois elle a une
probabilité T de franchir la barrière de potentiel. Cette probabilité par unité de temps est ainsi déterminée
par:

(42.499)

Expérimentalement, nous trouvons:

(42.500)

le modèle présenté donne donc des résultats assez satisfaisants.

Outre cet exemple technique, nous rencontrons le phénomène d'effet tunnel aussi dans un cas beaucoup plus
accessible et très pédagogique. Ainsi, lorsque sous condition de réflexion totale d'un faisceau de lumière,
nous approchons un autre prisme (sur la face du prisme ou aucun rayon de lumière ne sort ni ne rentre) de
manière à produire une lame d'air suffisamment mince, un faible rayon transmis est observé.

PRINCIPE DE SUPERPOSITION

La notion d'état dynamique d'un système classique joue un rôle capital dans la dynamique analytique
classique.

Est-il possible de retrouver cette notion lorsque nous avons affaire à un système quantique, c'est-à-dire un
système tel qu'un atome, un noyau ou une molécule, bref un système de la microphysique?

A première vue non, car nous savons que l'on définit l'état dynamique d'un système classique par la donnée
des coordonnées généralisées et des moments conjugués à un instant donné (cf. chapitre de
Mécanique Analytique). Or, le principe d'incertitude s'oppose à cette procédure dès que nous sommes dans
le domaine de la microphysique, vu l'impossibilité de mesurer avec précision les et . Cela est
particulièrement clair lorsque le système se réduit à une seule particule que nous décrivons par ses
coordonnées cartésiennes et les composantes de sa quantité de mouvement .

Fort heureusement, il existe une autre définition de l'état dynamique d'un système qui s'applique
indifféremment aux systèmes classiques et quantiques et qui, dans le cas des premiers, s'identifie avec la
définition habituelle. Nous allons donner cette définition en nous appuyant sur une brève théorie des
ensembles de systèmes identiques.

Si nous avons un ensemble (E) d'un très grand nombre de systèmes identiques, nous ferons une enquête
statistique pour caractériser cet ensemble de la façon suivante : nous prenons un système de l'ensemble, nous
mesurons une variable dynamique (coordonnée, composante de quantité de mouvement, énergie cinétique,
etc.) et nous rejettons le système (qui perturbé par le mesure, ne doit pas être réincorporé à l'ensemble).
Nous dressons ainsi un bilan qui se traduit par des fonctions de distribution de toutes les variables
dynamiques possibles. Cela permet de définir sans ambiguïté la notion d'identité :

Définition: Deux ensembles sont identiques, si les bilans des résultats de mesure sont les mêmes pour les
deux.

Considérons maintenant un ensemble unique (E). Est-il possible de le réaliser par juxtaposition de deux
ensembles non identiques et ? Ce qui permettrait d'écrire:

(42.501)

Si oui, nous dirons que (E) est un mélange. Inversement, au moyen d'un tri convenable, un mélange peut être
décomposé en deux sous-ensembles différents. Si non, nous dirons que (E) est un ensemble pur. Tout tri
décomposera l'ensemble pur en deux sous-ensembles identiques entre eux et nécessairement avec (E) ! Nous
convenons alors de dire que tous les systèmes d'un ensemble pur sont dans le même état dynamique et que
deux ensembles purs différents donnent lieu à des états dynamiques différents. Il va de soi que les systèmes
constituant un mélange seront eux dans des états dynamiques différents.

Supposons maintenant que les systèmes étudiés obéissent aux lois de la mécanique classique. Si les systèmes
d'un ensemble présentent des jeux différents, nous les trions en groupant par systèmes ayant tous un
même jeu . Nous vérifions bien que la nouvelle définition de l'état dynamique coïncide avec la
définition habituelle. Notons ce fait évident, mais important (par opposition avec les systèmes quantiques) :
dans un ensemble pur de systèmes classiques, c'est-à-dire pour un état dynamique donné, toute variable
dynamique est bien déterminée. En effet, en mécanique analytique classique, une telle variable est une
fonction des et et, de ce fait, présente une valeur unique.

Passons aux systèmes quantiques. Il est maintenant possible de définir pour ceux-ci un état dynamique, mais
tout de suite nous voyons une distinction fondamentale avec la mécanique classique. En effet, dans un
ensemble pur de systèmes quantiques, c'est-à-dire pour un état dynamique donné, une variable dynamique
n'est pas, en général, bien déterminée. Quand nous la mesurons sur des systèmes extraits de l'ensemble pur,
on ne trouve généralement pas comme résultat, une valeur unique, mais une distribution de valeurs.

L'indétermination qui règne sur la valeur d'une variable dynamique dans un état dynamique donné est donc
de nature purement quantique et il convient de bien la distinguer de l'indétermination d'origine statistique qui
se manifeste dans un mélange, qu'il s'agisse de systèmes classiques ou quantiques.

Le formalisme de la physique quantique ne peut s'édifier que si nous savons décrire mathématiquement les
états dynamiques et les variables dynamiques. Nous avons vu que nous ne pouvons attendre de ce
formalisme un prédiction précise comme en mécanique classique, mais, simplement les probabilités
d'obtenir telle ou telle valeur, lorsque nous mesurons une variable dynamique sur un système dont l'état
dynamique est donné.

Toute la théorie que nous avons vu jusqu'ici nous permet de conclure jusqu'ici que les états dynamiques d'un
système d'une particule sans spin sont décrits par des fonctions d'onde complexes, non nulles partout.

Si nous appliquons cette condition aux systèmes dynamiques nous avons alors le postulat suivant:
Soient deux états dynamiques différents, décrits par des fonctions d'onde et , nécessairement non
proportionnelles. étant des nombres complexes non simultanément nuls, nous construisons la
combinaison linéaire:

(42.502)

est alors une fonction d'onde décrivant un état dynamique possible du système.

Ce postulat paraît assez naturel du fait de l'aspect ondulatoire que présente la physique des microsystèmes.
En effet, dans les phénomènes ondulatoires de la physique classique les équations d'onde sont, le plus
souvent, linéaires homogènes et il s'ensuit que l'on peut superposer les ondes. Or, le grand intérêt de ce
postulat est qu'il contient en germe l'explication de ce fait capital qu'est l'indétermination quantique (appelée
aussi parfois "cohérence quantique").

Voyons-le sur un cas très simple où nous supposons qu'une variable dynamique A, a une valeur bien définie
dans l'état dynamique , et une valeur bien définie dans l'état dynamique avec . Cela
signifie que si nous répétons la mesure de A sur des systèmes tous dans l'état dynamique décrit par ,
nous trouvons chaque fois comme résultat , de même pour et .

Une question vient naturellement à l'esprit : si nous mesurons A sur des systèmes tous dans l'état dynamique
qu'allons nous obtenir? Une idée naïve serait de croire que A prendra une valeur bien définie
intermédiaire entre et .

Ces deux hypothèses sont fausses et nous le savons bien. Premièrement, A n'est pas bien déterminée en
physique quantique (incertitude) et n'est mathématiquement pas nécessairement située entre et .
L'interprétation correcte est la suivante:

Si nous mesurons A sur le système dans l'état dynamique , nous trouvons comme résultat de mesure,
tantôt , avec une probabilité , tantôt , avec une probabilité . Bien entendu, et
devront pouvoir être calculés en fonction de et .

Remarque: Il ne faut surtout pas confondre l'ensemble pur des systèmes décrits par , avec le mélange
que nous obtiendrions en juxtaposant deux ensembles purs de systèmes respectivement et .

Il convient donc de mettre en garde le lecteur contre cette confusion, d'autant que dans la littérature courante
utilisant la physique quantique, on dit souvent que la fonction d'onde est un mélange de et . C'est
par exemple dans ce sens que nous parlons de "mélange de configurations" pour traduire le fait que la
fonction d'onde d'un atome à plusieurs électrons est une combinaison linéaire de fonctions d'onde
appartenant à diverses configurations. Cette terminologie ne doit pas cacher le fait que les systèmes décrits
par constituent un ensemble pur et non un mélange.

En fait, l'interprétation que donne la théorie de De Broglie (associer une fonction d'onde à une particule) aux
principes d'incertitudes est l'exemple le plus frappant et le plus connu de la physique quantique au niveau
des superpositions d'états (chat de Schrödinger mis à part):

Considérons une onde de De Broglie se propageant dans le sens de l'axe X, mais limitée à un intervalle
à un instant donné ( si nous voulons). Donc à l'onde s'écrit, en laissant tomber la
constante multiplicative :
(42.503)

Si nous mesurons la coordonnée de la particule, nous devons la trouver là nécessairement où n'est pas
nulle (sinon nous ne pourrions rien mesurer). Nous pouvons dire que avec une incertitude
(l'intervalle où nous sommes sûrs de trouver la particule par rapport à l'ordonnée à l'origine divisé par
deux)

Si nous mesurons p, que trouvons-nous ? Nous ne devons pas trouver (relation que nous avons déjà
démontrée plus haut), car ceci serait vrai pour une onde plane indéfinie, ce qui n'est pas le cas ici. Alors,
nous allons décomposer l'onde en ondes planes au moyen de la transformation de Fourier (cf. chapitre de
Suites et Séries) :

(42.504)

Comment interpréter cette relation? Une des ondes planes élémentaires (que nous pouvons aussi interpréter
comme un état), , dont la somme redonne (x), conduit à une valeur de la quantité de
mouvement. Or, les valeurs de k forment un continuum. Nous sommes conduits à dire que les valeurs
possibles de p forment dès lors aussi un continuum et qu'il y a donc une incertitude sur la valeur de p. Pour
aller plus loin, il faut évaluer a(k) (qui doit être considéré comme variable de la probabilité de présence de
chaque onde plane provenant de la décomposition de (x)) au moyen de la relation (selon les propriétés des
transformations de Fourier) :

(42.505)

qui donne ici:

(42.506)

Posons , l'intégrale devient alors :

(42.507)

Le graphique de la fonction montre que prend des valeurs qui peuvent êtres considérées
comme négligeables pour .
(42.508)

Il s'ensuit que dans l'intégrale :

(42.509)

ce sont les k voisins de qui sont effectifs, et plus précisément les k tels que:

(42.510)

puisque :

(42.511)

Il s'ensuit que les valeurs à retenir de p sont celles voisines de aussi, plus précisément nous avons :

(42.512)

Cette relation montre que les incertitudes et obéissent à la relation:

(42.513)

De manière similaire, si nous nous proposons de déterminer la coordonnée x d'un électron en le faisant
passer à travers une fente de largeur 2b percée dans un écran:
(42.514)

La précision avec laquelle nous connaissons la position de cet électron est limitée par la taille de la fente,
soit . D'autre part, la fente perturbe l'onde associée. Il en résulte une modification du mouvement de
l'électron qui se traduit par le diagramme de diffraction de l'onde (qui est en fait une représentation de la
superposition linéaire de ses états intrinsèques).

L'incertitude sur la composante dynamique de la quantité mouvement de l'électron est déterminée par
l'angle correspondant au maximum central de la figure de diffraction. D'après la théorie de la diffraction
(cf. chapitre d'Optique Ondulatoire) produite par une fente rectangulaire, nous avons puisque
l'intensité s'écrit:

(42.515)

Donc est compris entre et , p étant l'impulsion de l'électron incident. Ainsi l'incertitude
est de:

(42.516)

Ce résultat simple est assez extraordinaire si nous le mettons en relation, en ordre de grandeur, avec le
résultat que nous avions obtenu juste plus haut :
(42.517)

Nous pouvons en tirer plusieurs conclusions de la première importance:

1. L'onde associée de De Broglie est étroitement liée au principe d'incertitude et la physique quantique doit
tenir compte simultanément de ces deux propriétés.

2. Si nous tenons compte que la répartition de l'intensité est obtenue à partir du comptage des électrons (ou
particules en fonction de l'angle et que nous obtenons la même répartition quelle que soit l'intensité du
faisceau d'électrons monocinétiques qui arrive sur la fente et ce, même si les électrons sont envoyés un par
un. Nous observons alors que le mouvement des particules n'est plus déterministe mais probabiliste. Ainsi,
la fonction d'onde de l'électron peut être considérée comme une superposition linéaire des états définis
chacun comme nous l'avons fait précédemment, par sa décomposition spectrale possible par la transformée
de Fourier.

Que pouvons-nous conclure de tout ce que nous avons vu jusqu'ici:

1. Les équations de la physique quantique nous donnent une densité de probabilité de trouver une particule
dans un certain volume de l'espace-temps.

2. La superposition linéaire des états peut s'interpréter comme le fait qu'il est possible de trouver une
particule en plusieurs points de l'espace-temps à un instant donné, et avec pour chacun de ces points une
certaine probabilité de l'y trouver (par décomposition possible de l'équation d'onde).

Si le point (1) a été largement étudié jusqu'à maintenant sur ce site, le point (2) est quant à lui nouveau et
découle d'une simple opération mathématique de décomposition ou de superposition.

Mais dès lors, que se passe-t-il si nous cherchons à mesurer l'énergie d'un atome qui se trouve dans une
superposition d'états d'énergie? Nous ne détecterons jamais cette superposition, mais seulement l'une des
énergies qui la constituent, l'action de mesurer fait disparaître la superposition des états au profit d'un seul -
nous parlons alors de "décohérence quantique" (il s'agite de l'interprétation de Copenhague dont nous avons
fait mention au tout début de ce chapitre). Mais lequel? La physique quantique ne peut tout bonnement
répondre à cette question. Le choix s'effectue au hasard! En revanche, à défaut de prédire l'état précis qui
sera mesuré parmi tous ceux qui constituaient la superposition, la théorie quantique peut donner la
probabilité qu'on a de mesurer chaque état (ce que l'on a déjà fait maintes fois jusqu'ici). Si l'on effectue de
nombreuses mesures, on trouve finalement les proportions prédites par la théorie (même si chaque mesure
est imprévisible).

Erwin Schrödinger, avait souligné l'absurdité (selon lui) de ces superpositions en ayant recours à une
expérience de pensée devenue célèbre : Imaginez un chat enfermé dans une boîte hermétique. Dans la boîte
se trouve aussi un atome radioactif et un dispositif capable de répandre du poison. Quand l'atome radioactif
se désintègre, il déclenche le dispositif mortel: le poison se répand dans la boîte et le chat meurt.

Mais la désintégration radioactive est un phénomène quantique: tant que nous ne l'avons pas détecté, l'atome
est dans une superposition d'états "désintégré et pas désintégré". Dans la boîte, le système chat-dispositif à
poison-atome doit donc lui aussi, se trouver dans une superposition des deux états "atome désintégré-chat
mort" et "atome intact-chat vivant". Bref, si nous prenons la physique quantique au pied de la lettre, le chat
est à la fois mort et vivant tant que la mesure n'a pas été effectuée.

L'absurdité de cette expérience est manifeste... mais difficile à démontrer, du moins tant que nous n'avons
pas compris ce qui distingue un chat d'une particule. Toujours le problème de la frontière quantique-
classique...
Il faudra attendre les années 80 pour que la situation progresse enfin, à la fois sur le front de l'expérience et
sur celui de la théorie. En 1982, Wojciech Zurek, chercheur au laboratoire national de Los Alamos
(Nouveau-Mexique), reprend une idée fort simple mais géniale : dans une mesure, ce qui produit la
décohérence, c'est l'interaction du système avec son environnement. Plus généralement, les objets
quantiques ne sont jamais complètement isolés de leur environnement - nous entendons par là tout ce qui
interagit avec le système: un appareil, des molécules d'air, des photons lumineux. Si bien qu'en réalité les
lois quantiques doivent s'appliquer à l'ensemble constitué de l'objet et de tout ce qui l'entoure. Or, Zurek
démontre que les multiples interactions avec l'environnement entraînent une destruction très rapide des de la
cohérence quantique des superpositions d'états (appelée également "interférence quantique" puisque
mathématiquement l'on traite des fonctions d'onde). En détruisant les interférences, l'environnement
supprime les superpositions d'états et le comportement quantique du système, de sorte qu'il ne reste plus que
des états simples et qu'on retrouve le comportement classique.

Dans un objet macroscopique - un chat par exemple... - chacun des atomes est environné de nombreux autres
atomes qui interagissent avec lui. Toutes ces interactions provoquent spontanément un brouillage des
interférences quantiques qui disparaissent très vite. Voilà donc pourquoi la physique quantique ne s'applique
pas à notre échelle: les systèmes ne sont jamais isolés!

La vitesse de la décohérence augmente avec la taille du système: un chat qui compte 1027 particules,
"décohère" en 10-23 secondes, ce qui explique pourquoi on n'a jamais vu de chats morts-vivants jusqu'à
aujourd'hui!

La physique quantique est donc une théorie:

- non-déterministe (probabiliste) d'où le fait qu'elle soit considérée comme une théorie de l'information

- non-locale: les objets quantiques peuvent avoir simultanément plusieurs positions

- non-séparable: plusieurs objets quantiques peuvent êtes superposés au point de ne pouvoir être considérés
séparément.

Un autre excellent exemple de la superposition linéaire des états est une application remarquable au principe
de moindre action.

Considérons une particule quantique allant d'un point à l'instant au point à l'instant . Nous savons
que la probabilité de trouver une particule en un point et en un instant donnés est reliée au carré du module
de la fonction d'onde qui lui est associée. Plaçons-nous dans le cas le plus simple où la fonction d'onde de la
particule est une onde plane donnée par la fonction solution de l'équation d'évolution de
Schrödinger:

(42.518)

où et v sont respectivement la longueur d'onde et la fréquence de l'onde associée à la particule.

La particule peut emprunter une infinité de chemins pour se rendre de . Choisissons l'un
quelconque de ces chemins que nous appellerons C. Nous pouvons découper le chemin C en un nombre
entier de tronçons de durée dt.
(42.519)

Après le parcours du premier tronçon, la fonction d'onde a la valeur suivante:

(42.520)

D'où nous tirons que:

(42.521)

Or, Planck et De Broglie ont établi (postulés) les relations suivantes comme nous l'avons montré :

et (42.522)

d'où, en remplaçant et v dans la relation précédente nous obtenons :

(42.523)

En appliquant la même technique pour le tronçon suivant nous obtenons:

(42.524)

Procédant ainsi de tronçon en tronçon, tout le long du chemin C nous obtenons alors la valeur de la fonction
d'onde en pour la particule venant de en suivant le chemin C:

(42.525)

Maintenant, faisons tendre la durée dt de chaque tronçon de trajectoire vers zéro. La quantité tend
alors vers la vitesse instantanée de la particule que nous noterons . La relation précédente devient alors:
(42.526)

Dans le chapitre de Mécanique Analytique, nous avons montré que la quantité est égale au
lagrangien. En substituant le lagrangien dans la relation précédente, nous obtenons :

(42.527)

où est l'action de la particule ayant parcouru le chemin C.

Notons (sans démonstration) que le module de prend la même valeur pour:

(42.528)

pour tout n. La constante de Planck trouve alors une signification physique directement liée à l'action de la
particule !

Rappelons la condition de normalisation de De Broglie:

(42.529)

qui donne donc la probabilité pour que la particule, partant de à l'instant , se trouve en à l'instant en
ayant emprunté le chemin C.

La probabilité totale est donc :

(42.530)

pour trouver la particule partie de à l'instant en à l'instant nécessite de calculer la somme des
contributions de chaque chemin soit (en appliquant le principe de superposition linéaire puisque nous
effectuons un somme des fonctions d'onde) :

(42.531)

Cette intégrale fut découverte par Richard Feynman. En première analyse elle semble diverger dans la
mesure où il existe une infinité de chemins possibles entre deux points. Regardons de plus près ce qui se
passe. Plaçons-nous dans le cas où la trajectoire est macroscopique. La valeur de l'action est alors
beaucoup plus grande que et varie beaucoup d'un chemin à un autre, sauf pour les chemins proches du
chemin physique classique pour lesquels la variation est quasiment nulle (application de l'énoncé
variationnel du principe de moindre action).

Comme les actions des chemins interviennent comme une phase dans l'intégrale de chemin, leurs
contributions sont destructives et donc tendent à s'annuler, sauf dans le cas des chemins proches du chemin
physique classique où les contributions s'ajoutent. Il s'ensuit que l'intégrale de chemin prend la valeur de
l'action classique, indiquant que la physique quantique permet de retrouver les lois de la mécanique
classique à l'échelle macroscopique.

(42.532)

La situation devient très différente à l'échelle quantique, c'est-à-dire pour des valeurs de l'action dont l'ordre
de grandeur est celui de la constante . Une infinité de chemins apporte alors des contributions non
destructives. Feynman a pu montrer que l'intégrale de chemin convergeait mais d'un autre côté, il n'est plus
possible de prédire quel chemin la particule va emprunter au point que la notion même de chemin s'évanouit.
Ainsi à l'échelle quantique la particule semble chercher son chemin parmi tous ceux qui sont possibles mais
à l'échelle macroscopique, ce tâtonnement quantique semble avoir permis à la particule de trouver le "bon
chemin".

Le formalisme de l'intégrale de chemin constitue une façon très originale d'aborder et d'interpréter la
physique quantique qui s'est ajouté à ceux qui avaient été développés par Schrödinger.

THÉORÈME D'EHRENFEST

Ce théorème permet de connecter la mécanique classique de Newton à la physique quantique en établissant


des relations similaires en ce qui concerne la quantité de mouvement et la force.

Pour cela, nous partons l'exemple particulier d'une particule massive se déplaçant à une vitesse non
relativiste dans un potentiel. Nous avons alors l'équation de Schrödinger d'évolution à une dimension:

(42.533)

d'où nous tirons (utile pour plus loin):

(42.534)

Si nous prenons en toute généralité le conjugué complexe des deux côtés de l'égalité:

(42.535)
d'où nous tirons (utile aussi pour plus loin):

(42.536)

Prenons la variation temporelle de la position moyenne de la particule (5ème postulat):

(42.537)

Nous avons:

(42.538)

d'où:

(42.539)

Utilisons cette dernière relation:

(42.540)

Utilisons maintenant la relation:

(42.541)

et injectons la dans la relation antéprécédente:

(42.542)
Le premier terme à droite de l'égalité est facile à intégrer... (puisqu'il n'y pas besoin de l'intégrer):

(42.543)

et comme la fonction d'onde doit valoir 0 à (sinon l'énergie est infinie) alors cette dernière relation
est nulle. Il nous reste alors:

(42.544)

Soit:

(42.545)

et finalement:

(42.546)

ce qui est l'équivalent en mécanique classique de:

(42.547)

et qui reconfirme l'existence de l'être mathématique:

(42.548)

comme étant l'opérateur de quantité de mouvement et que nous avions détermine plus haut en retrouvant la
deuxième loi de Newton. Pour cela, prenons la dérivée de

Mais nous pouvons faire un peu mieux au niveau de l'analogie classique/quantique en dérivant:

(42.549)

Ce qui donne:

(42.550)

d'où:
(42.551)

En utilisant:

(42.552)

Il vient:

(42.553)

Concentrons-nous sur:

(42.554)

Intégrons par partie le premier terme la première intégrale deux fois selon la relation démontrée dans le
chapitre de Calcul Différentiel et Intégral:

(42.555)

Nous avons alors:

(42.556)

et encore une fois:

(42.557)
Donc finalement:

(42.558)

Il nous reste alors:

(42.559)

Or, nous avons démontrée dans le chapitre de Mécanique Classique que:

(42.560)

Il vient donc que:

(42.561)

Ce résultat extraordinairement simple constitue le "théorème d'Ehrenfest". Nous retrouvons donc la loi
fondamentale de la dynamique classique au sens des valeurs moyennes de position et de la force, calculées à
l'aide de la probabilité de présence!
42. PHYSIQUE QUANTIQUE ONDULATOIRE (2/2)

MOMENT CINÉTIQUE ET SPIN

Tout comme l'oscillateur harmonique, la notion de moment cinétique (ou moment angulaire) est d'une
importance capitale en théorie quantique et possède des applications nombreuses dans tous les domaines de
la physique : physique atomique et moléculaire, physique nucléaire et sub-nucléaire, physique de l'état
condensé, etc. Ainsi, il joue un rôle essentiel dans l'étude du mouvement d'une particule dans un potentiel à
symétrie sphérique, comme nous le verrons en chimie quantique (qui en est un excellent exemple pratique).
Le moment cinétique est également à la base du groupe des rotations qui satisfait à l'algèbre des opérateurs
de moment cinétique (cf. chapitre d'Algèbre Ensembliste). De ce fait, il permet non seulement de construire
la fonction d'onde d'un système quantique de symétrie donnée, mais aussi de prédire si une transition optique
est permise et d'en déterminer son intensité (par exemple, lors de l'étude des transitions optiques entre états
d'impureté (en état solide), états moléculaires (chimie quantique), en physique nucléaire, etc.).

Enfin, nous verrons que la méthode algébrique appliquée à l'étude du moment cinétique nous permettra
d'introduire tout naturellement la notion de moment cinétique intrinsèque d'une particule, le "spin", qui n'a
pas d'équivalent classique.

Les développements qui vont suivre peuvent paraître assez déconcertent dans le sens qu'il ne faut plus du
tout se fier à l'intuition mais uniquement aux propriétés et résultats des mathématiques. Comme d'habitude,
si vous avez besoin de compléments d'informations n'hésitez pas à nous contacter.

Ainsi, rappelons que le moment cinétique d'une particule par rapport à l'origine est donné par (cf. chapitre de
Mécanique Classique) :

(42.1)

La quantité de mouvement étant quantifiée (c'est une valeur propre rattachée à la l'énergie d'une façon ou
d'une autre), le moment cinétique l'est nécessairement aussi (le moment cinétique est donc aussi une valeur
propre) et l'expérience a appuyé ce résultat (Stern-Gerlach).

Soit la composante en z du produit vectoriel résultant:

(42.2)
(cycl.)

Cette relation étant cyclique, nous pouvons changer les indices pour obtenir les autres coordonnées.

Comme x et y commutent (dans le sens que leur commutateur est nul) et que nous avons démontré :

(42.3)

nous avons alors :

(42.4)

Ce qui donne :
(42.5)
(cycl.)

En utilisant le gradient (nous retrouverons cette relation dans le chapitre de Physique Quantique Relativiste
lors de notre étude de l'équation de Pauli!!):

(42.6)

et en posant pour "l'opérateur du moment cinétique" :

(42.7)

Ce qui nous amène à écrire:

(42.8)

Avec :

(42.9)

Remarque: Le plus souvent dans la littérature le moment cinétique est noté (nous avions déjà fait cette
remarque dans le chapitre de Mécanique Classique) mais nous avons évité cette notation ici afin de
différencier le moment cinétique orbital et le moment cinétique orbital total.

Nous allons établir certaines relations de commutation concernant qui joueront un rôle essentiel dans
l'étude du spin. En faisant usage des relations (démontrées lors de notre étude des principes d'incertitudes) :

(cycl.) et (42.10)
(cycl.)

Nous avons la relation (il est de tradition de faire l'analyse sur la composante la projection de en z):

(42.11)

Donc :

(42.12)
(cycl.)

et en procédant de la même manière:

(cycl.) et (cycl.) (42.13)


Remarque: Nous trouvons des relations analogues avec la quantité de mouvement:

(42.14)

Évaluons maintenant la quantité:

(42.15)

soit après simplification (c'est assez embêtant pour l'expérience que cela ne commute pas) :

(42.16)
(cycl.)

par ailleurs, à ce stade, si le lecteur à déjà parcouru au préalable le chapitre de Calcul Spinoriel il remarquera
que les matrices de Pauli satisfont aux relations précédentes si nous nous mettons en unités naturelles (la
constante de Planck réduite valant alors 1) :

Ce constat sera utile pour notre étude de la physique quantique relativiste (voir chapitre du même nom).
Effectivement, nous savons de par notre étude du calcul spinoriel (cf. chapitre de Calcul Spinoriel) que le
groupe des matrices 2 par 2 complexes unitaires de déterminant 1 dont les matrices Pauli sont les
générateurs forme un groupe des rotations dans l'espace SU(2). Fondamentalement, l'origine du spin vient du
lien qui existe entre SU(2) et le groupe des rotations de notre espace ordinaire, SO(3) (cf. chapitre d'Algèbre
Ensembliste).

Maintenant, considérons la norme :

(42.17)

Etudions son commutateur avec une composante:

(42.18)

en utilisant la relation cyclique :

(42.19)

Donc nous avons enfin quelque chose d'intéressant qui commute :


(42.20)
(cycl.)

Conclusions des résultats obtenus jusqu'à maintenant : comme le commutateur est nul (les quantités
commutent) il est donc possible de mesurer simultanément avec précision une composante ainsi que le carré
du moment cinétique (sa norme au carré), mais il est impossible de faire la même chose pour deux
composantes !

Notons enfin que la relation que peut s'écrire :

(42.21)

et donc d'une façon un peu curieuse:

(42.22)

Si nous avons un système de particules numérotées par l'indice k, chacune a un moment cinétique individuel
et le moment cinétique orbital total du système (ne pas confondre la notation avec le Lagrangien
!!!), est défini par (en unitées naturelles ) :

(42.23)

Mais n'est pas encore le moment cinétique total du système; un particule peut posséder un moment
cinétique intrinsèque, ou "spin". Nous pouvons donner une image simple du spin en disant qu'il traduit une
rotation de la particule sur elle-même (attention !!! ce n'est qu'une image car au fait la particule ne tourne pas
sur elle-même !). Nous noterons le moment cinétique de spin de la k-ème particule (en unité naturelles
) et la relation :

(42.24)

sera le spin total et enfin :

(42.25)

sera le moment cinétique total du système (ne pas confondre la notation avec le moment cinétique orbital ou
la densité de courant !!!) et nous démontrerons lors de notre étude du couplage spin-orbite que ce moment
cinétique est une constante du mouvement en présence de ce couplage.

Nous allons supposer (mais c'est facile à démontrer une fois, entre autre, les spineurs connus) que chaque
et obéit aussi aux lois de commutation vues précédemment :

(cycl.) et (cycl.) (42.26)

Ce qui s'écrit sous forme tensorielle en utilisant le symbole de Levi-Civita (cf. chapitre de Calcul Tensoriel)
:
et (42.27)

Ce qui entraîne (aussi) :

(42.28)
(cycl.)

avec bien évidemment la relation:

appelée par les mathématiciens "élément de casimir" (un simple développement parfaitement similaire à
celui obtenu plus haut suffit à la démontrer).

Définissons maintenant de façon purement formelle l'opérateur non hermitique (les matrices de Pauli
satisfont toujours à ces relations!):

(42.29)

commutent avec , puisque celui-ci commute avec et . Ce qui nous permet d'écrire le produit :

(42.30)

Par ailleurs:

(42.31)

Donc:

(42.32)

De même:

(42.33)

Enfin, évaluons les produits et :

(42.34)

De même:

(42.35)
Puisque les deux opérateurs hermitiques et commutent ils ont donc des états et valeurs propres
communes et, plus précisément, ils ont une base propre complète commune. Lorsque des observables
commutent et ont une base propre commune, rappelons que nous avons pour habitude de parler d'un
"ECOC" (Ensemble Complet d'Opérateurs qui Commutent).

Pour étudier leur état propre posons:

(42.36)

Les valeurs propres K et M (appartenant à , la valeur nulle y comprise donc comme nous allons le voir un
peu plus loin !) ne sont pas indépendantes puisque nous avons:

(42.37)

La moyenne étant notée par les crochets , nous avons:

(42.38)

Ce qui peut s'écrire:

(42.39)

Nous voyons que le membre de gauche de la relation ci-dessus est égal à:

(42.40)

Par ailleurs nous avons vu lors de l'étude des représentatives avec le formalisme de Dirac que:

(42.41)

Cette dernière relation implique donc que:

(42.42)

Ce qui apporte les informations suivantes:

(42.43)

C'est de la relation ci-dessus que nous voyons que:

(42.44)

La valeur nulle y compris donc! Ce dernier point fait exception avec les nombres quantiques radials et
azimutal que nous avions par exemple en physique quantique corpusculaire (cf. chapitre de Physique
Quantique Corpusculaire).
A partir de , nous bâtissons l'état , nous allons montrer que si cet état n'est pas identiquement

nul, il est état propre de et de . De la relation:

(42.45)

déjà démontrée précédemment, nous posons:

(42.46)

commutent avec , puisque celui-ci commute avec et . Ce qui nous donne que la relation
précédente est nulle telle que:

(42.47)

De la relation nous posons de façon identique:

(42.48)

Toujours avec:

(42.49)

Nous avons finalement le paquet de relations:

(42.50)

Donc et sont identiquement nuls ou et sont des états propre de pour la


valeur propre K, et de pour la valeur propre .

Puisque le moment cinétique est quantifié, ses valeurs propres doivent donc avoir un minimum et un
maximum avec pour chacune la fonction propre associée.

Posons que M ' et sont la valeur et fonction propre associée minimale et m'' et la valeur et
fonction propre maximale.

Etant donné les trois relations:

, , (42.51)

Nous écrivons:
(42.52)

Ce qui intuitivement n'est pas évident à poser mais qui mathématiquement est tout à fait justifiable.

A partir des deux dernières relations ci-dessus, nous pouvons écrire:

(42.53)

soit:

(42.54)

M ' étant le maximum, M '' le minimum d'un même ensemble, nous avons:

(42.55)

Ce qui nous donne:

(42.56)

Appelons J la valeur m' (qui correspond à la valeur propre de la quantité ) puisque nous avons:

(42.57)

donc:

(42.58)

qui est un nombre entier positif ou nul.

Conclusion : Comme 2J est un nombre entier positif ou nul, cela implique que J ne peut être qu'un nombre
entier, demi-entier ou nul tel que :

(42.59)

Enfin, comme:

et (42.60)

Donc:

et (42.61)

Donc finalement:

(42.62)

Ce qui nous donne puisque et (les notations se mélangent un peu...):


(42.63)

Sous forme plus explicite et moins confuse:

(42.64)

et définitive, en multipliant à gauche et à droit par , nous avons pour la composante verticale du moment
cinétique, la valeur :

(42.65)

Comme et si la particule n'a pas de spin ( ) alors nous avons :

(42.66)

Si nous avons qu'une seule particule alors :

(42.67)

Donc le moment cinétique s'écrit en se rappelant (cf. chapitre de Physique Quantique Corpusculaire) que l
est quantifié :

(42.68)

Si nous avons , alors dans ce cas :

(42.69)

Nous retrouvons donc le résultat obtenu au début de notre étude du moment cinétique.

Grossièrement, si nous posons maintenant , nous retrouvons à partir du modèle ondulatoire l'hypothèse
de quantification du moment cinétique postulée par Bohr vue dans le chapitre de Physique Quantique
Corpusculaire.

Remarque: Rappelons que réellement

Cette constatation justifie maintenant physiquement l'utilisation du nombre quantique l dans l'utilisation du
tableau périodique des éléments tel que nous l'avions vu et défini (sans aucune justification réelle) dans le
chapitre précédent.

Le moment cinétique total vaut donc approximativement :

(42.70)

Par analogie (c'est vraiment une analogie douteuse...), nous pouvons écrire :

(42.71)
Mais comme le spin peut avoir que deux orientations possibles, les valeurs de j seront :

(42.72)

D'où une classification possible des électrons atomiques tenant compte de leur spin :

Type d'orbitale s p d f
l 0 1 2 3

notation
Tableau: 42.1- Types d'orbitales et spin

etc... Soit sous forme schématique avec les niveaux d'énergie correspondants:

(42.73)

Ce tableau nous amène à constater que nous pouvons finalement écrire :

(42.74)

Pour revenir à des considérations plus pratiques... nous avons finalement obtenu pour la norme du moment
cinétique total (dans le cas d'une particule seule et sans spin):

(42.75)

où l est une entier. Nous savons également du chapitre de Physique Quantique Corpusculaire que le moment
magnétique est lui donné par:

(42.76)
et que le nombre quantique secondaire l et le nombre quantique magnétique sont d'une certaine manière
indissociables.

De la même manière nous obtenons:

(42.77)

où nous avons vu dans le chapitre de Physique Quantique Relativiste que s ne peut prendre que les valeurs:

(42.78)

pour une particule de type proton, neutron ou électron.

Maintenant, ce que nous savons de nos résultats obtenus dans le chapitre de Physique Quantique
Corpusculaire c'est que lorsque l vaut 1 nous avons le moment magnétique qui peut prendre trois valeurs
différentes suivant si un champ magnétique est appliqué ou non:

(42.79)

A ce moment, bien que la norme du moment cinétique total reste constante (car conservative). Ses
composantes doivent forcément changer. Comme nous ne pouvons connaître qu'une seule des composantes
du moment cinétique en connaissant sa norme (opérateurs commutant) nous choisissons de nous intéresser
par convention à .

Nous choisissons un référentiel tel qu'un des composantes soit nulle (c'est toujours possible). Il suffit ensuite
dans ce référentiel X,Z plan d'avoir la norme de J qui vaut pour :

(42.80)

et idem avec S:

(42.81)

Il y a alors trois possibilités si une des composantes est toujours nulle c'est que nous ayons:

(42.82)

Ce que nous pouvons aussi écrire:

(42.83)

Ce que les physiciens aiment bien représenter de manière très simplifiée par le schéma suivant:
(42.84)

De la même façon avec le spin nous pouvons écrire:

(42.85)

Ce que les physiciens aiment aussi bien représenter de manière très simplifiée par le schéma suivant:

(42.86)

Nous avons donc les seuls éléments variables mesurables expérimentalement qui sont:

et (42.87)
qui sont donc des observables discrets (bivalué en ce qui concerne donc le spin).

Donc en appliquant un champ magnétique, l'hamiltonien de Pauli (cf. chapitre de Physique Quantique
Relativiste) prendra des sauts équivalents à la relation :

(42.88)

Ce résultat signifie que les niveaux d'énergie pour une énergie donnée (couche n) sont séparés en plusieurs

niveaux distants de quand l'atome est placé dans un champ magnétique. Ce résultat et l'effet Zeeman
dont nous avons parlé plusieurs fois.

Tout cela permet de mieux comprendre l'origine mathématique des 4 nombres quantiques (nombre
quantique principal, nombre quantique secondaire ou azimutal, nombre quantique magnétique, spin):

(42.89)

notés aussi (puisque dans le cas particulier des particules étudiées sur ce site le nombre quantique
magnétique de spin à la même valeur que le spin):

(42.90)

COUPLAGE SPIN-ORBITE

Nous avions fait remarquer dans le chapitre de physique quantique corpusculaire que quand nous analysons
à haute résolution les raies spectrales de l'hydrogène en l'absence d'un quelconque champ extérieur, nous
voyons qu'elles sont en fait constituées de doublets très serrés, séparés de . Ce phénomène étant
du à un soit disant couplage spin-orbite. Il est temps maintenant de voir d'où cela vient. Rappelons que nous
avons obtenu précédemment :

(42.91)

Dès lors, la norme (ce qui est mesuré) nous amène à écrire :

(42.92)

ce qui nous donne après regroupement :

(42.93)

Le terme est appelé "couplage spin-orbite". C'est lui qui lors des mesures très précises fait apparaître
un dédoublement des raies du au couplage entre le spin de l'électron et le moment cinétique orbital (ce n'est

pas car ce terme est toujours positif).

Remarque: Lorsque nous avons deux corps en interaction le moment cinétique total est une constante du
mouvement. Il peut donc y avoir un transfert de moment cinétique entre ces deux corps (c'est le couplage
spin-orbite). L'un perd du moment l'autre en gagne. A noter qu'un corps étendu possède un moment
cinétique de rotation autour d'un point et un moment cinétique de rotation sur soi-même. C'est ce dernier que
nous appelons par une analogie abusive : le spin.

L'écart mesuré est donc attribué à l'interaction du spin de l'électron avec son moment orbital. L'électron
tourne autour du noyau, mais si nous nous plaçons sur l'électron nous voyons le noyau tourner (sur la Terre
le soleil tourne autour de la Terre !). Tout se passe comme si le noyau créait un champ magnétique au niveau
de l'électron, et ce champ interagit avec le moment magnétique de l'électron, le spin, et ceci différemment
selon que le spin est dans le sens du champ ou opposé, c'est cette différence qui ajoute ou retranche un peu
d'énergie au niveau.

Voici un schéma qui résume le tout :

(42.94)

Montrons de fait que tel que défini, est une constante du mouvement. Nous avons (inutile de préciser
qu'en mettant au carré, il s'agit des composantes du vecteur que nous mettons au carré et non le vecteur lui-
même!) :

(42.95)

d'où :

(42.96)

Faisons le développement pour une composante :

(42.97)

Or, par définition (de notation) donc :


(42.98)

Or, nous savons que (car un opérateur commute toujours avec lui-même) et en ce qui concerne

, nous en avons fait mention dans le chapitre de calcul spinoriel (cf. chapitre de Calcul Spinoriel) et
nous le démontrerons dans le cadre de l'étude de l'équation de Dirac libre classique (cf. chapitre de Physique
Quantique Relativiste), que le spin est totalement décrit par les matrices de Pauli qui sont des opérateurs
linéaires. Ecrivons alors à un facteur constant près (dont nous devrons encore déterminer l'expression) :

(42.99)

et nous verrons que cela est bien conforme à l'équation de Pauli que nous verrons dans le chapitre de
Physique Quantique Relativiste (et inversement)!!!

Donc en faisant abstraction de la constante multiplicative :

(42.100)

ce qui était de toute façon 100% prévisible puisque de toute façon, encore une fois, un même opérateur
commute toujours avec lui-même.

Donc finalement :

(42.101)

Dès lors :

(42.102)

d'où finalement :

(42.103)

est bien le moment cinétique total qui, même en présence d'interaction spin-orbite, est une constante du
mouvement (une obligation pour un système isolé).
Remarque: Une autre manière de lire la chose consiste à dire que la mesure sur un des éléments du
commutateur précédent adapte l'autre immédiatement pour que leur commutation soit nulle donc par
extension le moment cinétique total est une constante du mouvement.

DIMENSIONS DE PLANCK

Il convient d'ouvrir une petite paranthèse pour finir sur la constante de Planck (car beaucoup d'ouvrages font
mention de ce que nous allons voir sans les précautions de rigueur). Nous venons de voir que la mesure des
objets dépend du principe d'indétermination de Heisenberg. Cette précision joue tant sur les mesures du
temps que sur la trajectoire des particules ou la densité d'énergie de l'Univers. Voyons que cela à par
extension... d'autres éventuelles implications.

Nous avons démontré précédemment au début de ce chapitre qu'une des relations d'incertitudes est donnée,
en prenant le module, par (de l'ordre de la constante de Planck donc à un facteur près) :

(42.104)

Grossièrement, nous pouvons donc dire qu'à une fluctuation de l'espace (à ne pas confondre avec la
notation de la longueur d'onde), nous pouvons associer la quantité de mouvement :

(42.105)

À celle-ci correspond, d'après nos résultats du chapitre de Relativité Restreinte, la relation


l'énergie , ou la masse équivalente (en divisant par ) p/c. En désignant par M cette masse
associée à la perturbation , nous avons donc :

(42.106)

La gravitation due à cette masse est caractérisée par une longueur R que nous déterminerons en ordre de
grandeur en écrivant que l'énergie potentielle qui lui est associée (cela suppose que la gravitation classique et
quantique sont régies par les mêmes lois...), (cf. chapitre de Mécanique Classique), est égale à la
masse-énergie . Cela donne:

(42.107)

ou, en remplaçant M par son expression précédente :

(42.108)

Pour qu'il n'y ait pas auto-amplification (et donc divergence) du phénomène de fluctuation quantique du
vide, nous devons avoir de préférence . En écrivant l'égalité entre ces deux grandeurs, nous
aboutissons donc à une quantité qui représente la dimension minimale (en ordre de grandeur) que puisse
concevoir la physique. C'est la fameuse "longueur de Planck" :

(42.109)
pour laquelle il correspond la période ou "temps de Planck" d'où :

(42.110)

Nous pouvons maintenant revenir à une autre expression plus intéressante de la masse fluctuante. Puisque :

et (42.111)

nous avons dès lors la "masse de Planck" :

(42.112)

L'analyse dimensionnelle nous donne à une constante près et selon le théorème du Viriel (cf. chapitre de
Mécanique Des Milieux Continus):

(42.113)

et donc :

(42.114)

d'où la "température de Planck" :

(42.115)

et encore "l'énergie de Planck" :

(42.116)

Après tout cela, nous obtenons facilement la "densité de Planck" :

(42.117)

Nous pouvons nous amuser à obtenir encore d'autres valeurs de Planck encore mais qui ne veulent plus dire
grand chose à force (et nous pourrions continuer ainsi longtemps avec énormément d'autres grandeurs) :

La "force de Planck" :
(42.118)

La "puissance de Planck" :

(42.119)

La "pulsation de Planck" :

(42.120)

En procédant avec le même raisonnement initial fait avec la masse mais en utilisant l'énergie potentielle
électrostatique au lieu de l'énergie potentielle gravitationnelle nous pouvons obtenir la "charge de Planck" :

(42.121)

Dès lors nous pouvons calculer un "courant de Planck" :

(42.122)

ainsi que la "tension de Planck" :

(42.123)

et "l'impédance de Planck" (...) :

(42.124)

Remarque: Certains physiciens se sont servis (et se servent toujours) des résultats ci-dessus pour des
raisonnements farfelus et dangereux qui ne sont que interprétation. Il convient donc de prendre avec des
pincettes toutes les informations relatives aux dimensions de Planck que vous pourriez trouver (même si
celles-ci sont fort semble sympathiques). L'exemple le plus connu est donné par la longueur d'onde de
Compton (cf. chapitre de Physique Nucléaire) qui dépend de la masse-énergie du photon. Si cette
longueur d'onde est égale au rayon de Schwarzschild classique pour la même masse-énergie (cf. chapitre
d'Astrophysique), alors dans ce cas sa valeur est celle de la longueur de Planck et sa masse est égale à la
masse de Planck. Il est alors tentant de dire que la particule forme alors un trou noir. Mais il s'agit d'une
analogie car dans ce cas, rien ne nous dit que l'expression du rayon de Schwarzschild s'applique à la
physique quantique...
INTERPRÉTATION DE COPENHAGUE

En 1930, l'interprétation probabiliste de l'amplitude de l'onde d'une particule et le principe d'incertitude


d'Heisenberg constituent les éléments de l'interprétation "standard " non déterministe de la physique
quantique comme nous en avons déjà fait mention au début de ce chapitre. Cette interprétation est souvent
appelée "interprétation de Copenhague", car Niels Bohr qui y contribua largement y dirigeait un institut de
physique renommé à cette époque. Pourtant de nombreux physiciens tels Einstein et Schrödinger, qui
acceptaient la formulation mathématique de la physique quantique, n'étaient pas à l'aise avec l'interprétation
de Copenhague et la critiquaient. Et jusqu'à nos jours, la question de l'interprétation correcte de la
formulation mathématique reste un problème.

En effet, nous pouvons nous poser la question suivante : Où se trouve la réalité? Y-a-t-il une réalité? Niels
Bohr répond non : il n'y a rien au niveau quantique, la réalité n'existe ou n'apparaît que lors d'une mesure.
Cette vision partagée par la plupart des physiciens (interprétation de Copenhague), implique que la mesure
"crée" la position de l'électron (voir le sous-chapitre traitant du principe de superposition linéaire des états)

Einstein pensait que la physique quantique, bien que très efficace et très impressionnante, n'est pas complète
et ne donne qu'une image imparfaite du monde quantique. Pour lui, il y aurait autre chose, au-delà, qui
clarifierait et affinerait notre présente vision.

Ainsi, dans l'interprétation de Copenhague de la mécanique quantique le principe d'incertitude signifie qu'à
un niveau élémentaire, l'univers physique n'existe plus de manière déterministe, mais plutôt comme une
série de probabilités ou de potentiels. Par exemple le motif produit par des millions de photons passant à
travers une fente de diffraction peut être calculé à l'aide de la mécanique quantique, mais le chemin de
chaque photon ne peut être prédit par aucune méthode connue. L'interprétation de Copenhague dit qu'il ne
pourra être calculé par aucune méthode. C'est cette interprétation qu'Einstein mettait en doute lorsqu'il disait
: "je ne peux pas croire que Dieu joue aux dés avec l'Univers". D'un point de vue physique autant que
philosophique, le principe d'incertitude implique la réfutation du déterminisme universel défendu par
Laplace au début du 19ème siècle.

Une réduction instantanée des états se produit dès l'observation du système. Cette décision aléatoire de l'état
observé respecte les probabilités, correspondant au carré des amplitudes des états. De surcroît,
l'interprétation de Copenhague stipule que lors d'une mesure, un processus de réduction, originaire de l'objet
macroscopique, élimine les superpositions d'états quantiques.

L'interprétation de l'école de Copenhague conduit donc au problème de la mesure, l'expérience de pensée du


chat de Schrödinger stipulant que lorsqu'on mesure une quantité, telle que la position ou l'impulsion, nous
intervenons dans le processus de mesure en provoquant un changement radical de l'état quantique, de la
fonction d'onde. Nous modifions les quantités mesurées de façon imprévisibles et cet état ne peut être décrit
par l'équation déterminée de Schrödinger. Les physiciens et les philosophes ont réagit de plusieurs manières
à cette interprétation :

- Soit nous considérons comme Bohr et Heisenberg que ce principe fait loi et qu'il est préférable de ne pas
rechercher l'interprétation ultime. C'est une attitude qui est admise par la plupart des physiciens.

- Soit nous considérons que la physique quantique est une théorie incomplète et certains, tel Einstein,
Eugene Wigner ou David Bohm n'ont pas hésité à rechercher d'autres solutions, stériles jusqu'à présent.

- Enfin, Hugh Everett III et bien d'autres prennent l'équation de Schrödinger très au sérieux, la considérant
comme une représentation de la réalité. Ils considèrent que l'interprétation de l'école de Copenhague
représente réellement l'évolution de la fonction d'onde. Les différents termes de l'équation correspondraient
aux différents niveaux d'énergie dans lesquels se trouve le système. La réduction du paquet d'ondes
s'interpréterait comme une division totale de l'objet et de l'instrument de mesure dans des univers parallèles.
Aujourd'hui le débat reste ouvert mais plusieurs expériences réalisées depuis les années 1930 nous
permettent, pas à pas, de dissiper l'épais brouillard qui recouvre le fond de la réalité et de répondre à
quelques questions. Cela dit, toutes ces expériences confirment néanmoins que l'époque des certitudes est
bien révolue.
43. PHYSIQUE QUANTIQUE RELATIVISTE

L e lecteur attentif aura noté que la mécanique quantique (physique quantique ondulatoire) est une théorie
non relativiste : elle n'incorpore pas les principes de la relativité restreinte d'Einstein (cf. chapitre de
Relativité Restreinte). Nous allons donc nous efforcer à combler ce manque.

ÉQUATION D'ÉVOLUTION RELATIVISTE DE SCHRÖDINGER

La physique des particules ne peut être correctement et totalement décrite dans le cadre de la mécanique
quantique. Comme les énergies sont généralement supérieures aux masses des particules, il est nécessaire,
en plus, de travailler dans le contexte de la théorie de la relativité restreinte. Voyons comment inclure celle-
ci par une première approche basique.

L'énergie-impulsion d'une particule libre de masse m, satisfait comme nous l'avons vu dans le chapitre de
Relativité Restreinte à l'équation:

(43.1)

Nous cherchons à quantifier cette équation. Pour cela, nous allons revenir à des relations que nous avons
démontrées lors de l'étude des opérateurs linéaires fonctionnels et de l'équation évolutive de Schrödinger.

Rappelons que la quantité de mouvement est décrite par la relation (utilisant l'opérateur de divergence) :

(43.2)

et l'énergie totale par:

(43.3)

Ces deux relations ayant été démontrées dans le chapitre de Physique Quantique Ondulatoire!

Les substitutions des deux relations précédentes appliquées à la relation et multipliée par
l'équation d'onde (cf. chapitre de Physique Quantique Ondulatoire) des deux côtés de l'égalité conduisent au
développement :

(43.4)

En utilisant le d'alembertien (cf. chapitre d'Électrodynamique), nous pouvons écrire cette dernière relation
sous la forme condensée finale suivante appelée "équation d'évolution relativiste de Schrödinger" ou plus
fréquemment "équation de Klein-Gordon libre" (en l'absence de champ magnétique!) :

(43.5)
Remarque: En physique des particules élémentaires, cette équation est nommée "équation relativiste
covariante des bosons".

L'équation de Klein-Gordon libre est aussi souvent donnée sous la forme suivante (plus esthétique) :

(43.6)

Il est important de remarquer que l'équation de Klein-Gordon fait intervenir des scalaires et caractérise donc
des particules de spin zéro.

Remarques:

R1. Nous pouvons vérifier que les ondes planes de la forme:

(43.7)

sont des solutions de l'équation de Klein-Gordon libre (nous y reviendrons plus en détail dans le chapitre de
Physique Des Particules Élémentaires).

R2. Nous reviendrons lors de notre étude de l'équation de Dirac et du spin des fermions sur l'équation de
Klein-Gordon libre (afin de la généraliser).

ANTI-MATIÈRE

Lors de la démonstration de l'équation de Klein-Gordon libre, nous avons laissé exprès de côté un cas très
intéressant du développement que nous avons effectué.

Peut-être ne l'avez vous pas remarqué, mais l'équation peut prendre deux valeurs pour une
impulsion donnée:

(43.8)

l'une positive et l'autre négative. La valeur de l'énergie, pourrait donc prendre toutes les valeurs de

Jusqu'ici, nous avions implicitement admis en mécanique classique que les solutions négatives n'étaient pas
physiques et devaient donc simplement êtres écartées. Cela ne peut se faire en théorie des champs quantifiés
sans conduire à des incohérences graves. Plutôt que d'ignorer ces solutions d'énergie négative, il convient de
leur trouver une interprétation physique.

Nous observons d'abord, que toutes les énergies négatives sont autorisées par la relation précédente (aussi
bien que pour l'énergie positive). Nous disons que les états d'énergie négative sont tous occupés mais non
observables; les électrons sont dits "électrons virtuels".

Imaginons un paquet d'onde constitué par une superposition d'ondes planes sur un intervalle étroit en
impulsion. Ce paquet se déplace dans l'espace. Dans le cas unidimensionnel, il se propage à la vitesse:

(43.9)
Démonstration:

En nous nous basons toujours sur l'hypothèse que le champ de potentiel est nul, nous avons donc:

(43.10)

et:

(43.11)

donc démonstration effectuée que:

(43.12)

Considérons d'abord une particule d'énergie positive . Sa position en fonction du temps est donné par:

(43.13)

Une particule d'énergie négative se déplace selon:

(43.14)

En d'autres termes, et ce sera notre première conclusion, nous pouvons dire qu'une particule d'énergie

négative est équivalente à une particule d'énergie positive se déplaçant à l'envers dans le
temps et ceci est ce que nous nommons une "antiparticule".

Il nous reste maintenant à voir quelle est l'interprétation d'une particule se déplaçant à l'envers dans le temps
:

Pour simplifier, nous considérons une particule non relativiste de charge électrique (-q) plongée dans un
champ électrique et magnétique statiques. Elle satisfait à l'équation du mouvement:

(43.15)

Nous avons étudié dans le chapitre d'Électrodynamique que les champs et pouvaient être construits à
partir du quadripotentiel . Donc nous pouvons récrire l'équation précédente à partir des deux relations
déterminées en électromagnétisme:
et (43.16)

Cependant, il est toujours possible d'imposer la jauge suivante (nous laissons le soin au lecteur de faire la
vérification en utilisant exactement la même méthodologie que celle utilisée en dans le chapitre
d'Électrodynamique):

(43.17)

L'équation du mouvement devient:

(43.18)

ou encore:

(43.19)

Comparant les deux dernières équations nous arrivons à notre seconde conclusion: une particule de charge q
se déplaçant à l'envers dans le temps obéit aux mêmes équations du mouvement qu'une particule de charge
opposée -q se déplaçant vers l'avant dans le temps. L'interprétation physique de la deuxième particule est
évidente.

La physique quantique relativiste implique donc l'existence d'antiparticules, qui sont effectivement
observées.

Tout cela pour en arriver où exactement?

- Premièrement, la découverte théorique de l'antimatière permet d'avoir une possible explication de


l'existence de l'Univers qui violait précédemment le principe de conservation de l'énergie. La théorie que
nous venons de voir, prédit donc que l'Univers devrait contenir autant de matière que d'anti-matière. Les
scientifiques sont également à la recherche de la présence de cette antimatière.

- Deuxièmement, si nous considérons dans le vide un photon d'énergie , il est capable de porter
un électron virtuel vers un état d'énergie positive, où il devient réel. Il apparaît alors une lacune, ou un "trou"
dans la région des énergies négatives. D'après le principe de la conservation de la charge, on voit apparaître
un électron positif, ou positon, particule antimatérielle symétrique de l'électron.

Ainsi, le photon se matérialise sous la forme d'une paire , avec:

(43.20)

Remarque: Certains résultats expérimentaux semblent montrer que les antiparticules ne sont pas les parfaits
miroirs des particules que nous connaissons. Effectivement, la symétrie droite/gauche et temporelle ne
semble pas être respectée (il y a brisure de symétrie). Nous n'avons encore rien rédigé à ce sujet sur le
présent site mais nous le ferons dès que nous le pourrons.

ÉQUATION DE KLEIN-GORDON GÉNÉRALISÉE


L'équation de Klein-Gordon libre que nous avons initialement présentée plus haut ne prend pas en compte
l'influence du champ magnétique sur l'observation du dédoublement des raies du spectre des atomes (constat
expérimental). C'est pour cette raison que Klein et Gordon intégrèrent dans leur équation le champ
magnétique. Cependant, ils le firent sans prendre en compte le spin de l'électron. C'est seulement après leur
travail que Pauli développa son équation (dite "équation de Pauli") qui amena ensuite à l'équation de Dirac
(voir plus loin).

Pour déterminer l'expression de l'équation de Klein-Gordon d'une particule chargée dans un champ
magnétique et un potentiel électrostatique, utilisons la puissance du formalise Lagrangien :

L'équation classique du mouvement admise (cf. chapitre de Mécanique Analytique), comme valable aussi en
relativité, est donnée nous le savons par (équation d'Euler-Lagrange) :

(43.21)

Dans le chapitre de Relativité Restreinte, nous avons vu que le lagrangien d'une particule libre a pour
expression :

avec (43.22)

et dans le chapitre d'Électrodynamique que le lagrangien total était :

(43.23)

Pour des besoins ultérieurs, commençons par calculer :

(43.24)

Calculons le premier terme :

(43.25)

Comme le potentiel ne dépend pas de la vitesse, le terme est nul.

Le potentiel vecteur ne dépend pas de la vitesse de la particule dès lors :

(43.26)

Il vient dans ce cas:

(43.27)

L'hamiltonien classique s'écrit (cf. chapitre de Mécanique Analytique) :


(43.28)

Nous avons donc démontré précédemment que :

(43.29)

Nous pouvons donc écrire avec cette relation l'hamiltonien sous la forme :

(43.30)

Le produit scalaire a pour expression (puisqu'ils sont colinéaires) :

(43.31)

L'hamiltonien s'écrit alors :

(43.32)

En travaillant sur les deux premiers termes :

(43.33)

Or :

(43.34)

Dès lors :

(43.35)

Finalement, nous obtenons (pour un système conservatif) :

(43.36)

Toujours dans le cas d'une particule se déplaçant dans un champ électromagnétique, la relation entre
l'énergie et l'impulsion (qui est différente de la quantité de mouvement par la présence d'un terme
comprenant le potentiel vecteur) se calcule comme suit:

Nous connaissons la relation relativiste suivante :


(43.37)

Comme :

(43.38)

alors en substituant et en passant un terme de l'autre côté de l'égalité la relation précédente devient (nous
changeons de notation pour l'hamiltonien):

(43.39)

Si nous récrivons cette relation en faisant usage des opérateurs correspondants (cf. chapitre de Physique
Quantique Ondulatoire) de l'énergie et de la quantité de mouvement (quantification canonique):

et (43.40)

Alors finalement nous pouvons écrire en analogie avec l'équation de Klein-Gordon libre (en l'absence de
champ) "l'équation de Klein-Gordon généralisée":

(43.41)

Cette équation est celle de Klein-Gordon qui s'applique à une particule de charge q sans spin se déplaçant
dans un champ électromagnétique.

Si alors la relation précédente s'écrit :

(43.42)

Nous retrouvons donc l'équation de Klein-Gordon d'une particule libre mais sans spin !

Il serait intéressant de regarder maintenant l'expression de l'équation de continuité (qui exprime rappelons-le
: la conservation de l'énergie) avec la prise en compte du champ magnétique (parce que au fait elle posera
toujours problème... et même un très gros). Pour cela, considérons le cas d'une particule libre se déplaçant
avec une quantité de mouvement et ayant une énergie E. Nous avons vu que nous pouvions lui associer
une onde plane de la forme :

(43.43)

Soit l'équation Klein-Gordon libre et son expression en conjugué complexe (nous travaillons avec les unités
naturelles )
(43.44)

Nous multiplions (1) par et (b) par

(43.45)

Soit :

(43.46)

Par différence (1)-(2) :

(43.47)

Le calcul des dérivées par rapport à t des fonctions suivantes :

(43.48)

Par différence (1)-(2)

(43.49)

Ce qui nous donne finalement :

(43.50)

Soit f un champ scalaire et et un champ vectoriel. L'analyse vectorielle donne :

(43.51)

Posons :

(43.52)

Dès lors :

(1)
(43.53)
Posons maintenant :

(43.54)

Dès lors :

(2)
(43.55)

Soustrayons (1)-(2) :

(43.56)

Comme :

(43.57)

En changeant les signes :

(43.58)

Cette dernière relation et :

(43.59)

donnent :

(43.60)

A nouveau, rapprochons cette relation avec l'équation de continuité :

(43.61)

Rappelons que lors de notre première étude de l'équation de Klein-Gordon nous avons vu qu'en mécanique
quantique son équivalent est donné par la même équation mais avec les significations suivantes : est la
densité de probabilité, est la densité du flux de particules.

Nous avons donc :

(43.62)

Si la fonction d'onde associée et sa conjuguée complexe :

(43.63)
Les dérivées par rapport au temps de ces fonctions

(43.64)

Les gradients se calculent comme suit :

(43.65)

En reprenant l'expression de la densité de probabilité et compte tenu de différentielles précédentes, il vient :

(43.66)

La densité de probabilité a donc pour expression :

(43.67)

En reprenant l'expression de la densité de courant et compte tenu de des différentielles, il vient :

(43.68)

La densité de courant a pour expression :

(43.69)

En se plaçant dans la situation des connaissances de l'époque, l'équation de Klein-Gordon présente plusieurs
pathologies et inconvénients.

- La densité de probabilité peut devenir négative (puisque comme nous l'avons vu, l'énergie peut
l'être aussi), ce qui est inexplicable. Une telle situation n'existe pas avec l'équation de Schrödinger.

- L'équation de Klein-Gordon a l'inconvénient d'être du second ordre en (l'équation de Schrödinger est elle
du premier ordre). L'évolution temporelle nécessite dont la connaissance non seulement de mais

également de sa dérivée

- Si nous appliquions cette équation à l'atome d'hydrogène, nous ne retrouverions pas les mêmes niveaux
d'énergie en structure fine.

Tout ceci a conduit à l'époque qui précède les travaux de Dirac, à un rejet de cette équation qui, de plus, ne
tenait pas compte du spin.

ÉQUATION DE DIRAC LIBRE CLASSIQUE


Jusqu'à présent, toute particule a été considérée comme ponctuelle et sans aucune structure ou degré de
liberté interne. Dans cette optique, toute l'information sur l'état du système à l'instant t est alors réputée
entièrement contenue dans la connaissance de la fonction d'onde .

Une telle description est insuffisante, comme nous allons le voir. Cette insuffisance provient des preuves
expérimentales démontrant qu'une particule telle que l'électron possède un moment magnétique propre,
indépendamment de tout mouvement de rotation dans l'espace autour d'un centre. L'existence de ce moment
magnétique entraîne à son tour l'existence d'un moment cinétique propre, ou intrinsèque, qui a été baptisé
"spin" car on croyait au début que ce degré de liberté était lié à une rotation de la particule sur elle-même.
Ce degré de liberté est "interne" - bien que l'électron continue à être considéré comme une particule
ponctuelle ; c'est, au même titre que la charge ou la masse, un attribut intrinsèque, donné une fois pour
toutes. Il s'avère impossible de donner du spin une image classique! Se représenter l'électron comme une
petite bille de rayon non-nul qui tourne sur elle-même conduit à des absurdités (par exemple, on trouve
qu'un point situé à la périphérie de l'électron a une vitesse très supérieur à c). Il reste cependant que le spin
d'une particule massique est son moment cinétique dans le référentiel où elle est au repos. L'hypothèse du
spin de l'électron a été formulée par Uhlenbeck et Goudsmit en 1925 pour rendre compte des atomes
complexes comme nous l'avons vu en physique quantique corpusculaire.

Le spin d'une particule est toujours demi-entier ou entier, c'est un fait d'expérience. Le caractère entier ou
demi-entier du spin définit deux grandes de particules, les bosons (spin entier) et les fermions (spin demi-
entier), obéissant à des statistiques très différentes telles que celles que nous avons présentées dans le
chapitre de Mécanique Statistique (d'où l'existence d'une relation appelée "théorème spin-statistique").

Revenons au cas de l'électron. Les deux valeurs possibles révélées par une mesure de S (le que nous
avions en physique quantique corpusculaire) sont donc (cf. chapitre de Physique Quantique
Ondulatoire) associée aux deux valeurs possibles d'un nombre quantique lui même associé donc à
l'état libre ( ) au moment cinétique :

(43.70)

Donc :

(43.71)

Une description complète de l'état de l'électron contient donc nécessairement une fonction d'onde donnant
comme d'habitude la densité de probabilité de présence, mais prenant également en compte le degré de
liberté du spin, d'où la notation . Si les coordonnées d'espace prennent des valeurs réelles
continues, en revanche la variable de spin est donc essentiellement discrète.

En maintenant l'interprétation usuelle, la quantité est la probabilité de présence autour


du point choisi avec la valeur pour le spin. La condition de normalisation des probabilités introduit
comme toujours une sommation, qui porte non seulement sur les degrés orbitaux (sommation continue, c'est-
à-dire intégration) mais également sur les degrés de spin (sommation discrète) :

(43.72)
exprimant notamment le fait que nous épuisons toutes les possibilités du spin en sommant sur les deux
valeurs possibles. En tout état de cause, l'électron n'a plus une mais deux fonctions d'onde, une pour chaque
valeur de .

La notation précédente n'est pas forcément la meilleure pour les particules libres de spin supérieur à 1/2
comme nous l'avons vu lors de notre étude du moment cinétique. S'agissant d'une variable prenant des
valeurs discrètes, il est tout aussi légitime de mettre en indice et de poser . Enfin, il est
commode d'utiliser une notation matricielle, rangeant en colonne les différentes fonctions correspondant aux
valeurs possibles de la variable discrète . Ainsi, pour l'électron, nous admettrons désormais que toute
l'information au sens de la physique quantique ondulatoire est contenue dans un vecteur-colonne à deux
lignes appelé "spineur" (cf. chapitre de Calcul Spinoriel) et noté :

ou (43.73)

Revenons maintenant sur l'équation de Klein-Gordon libre (plus générale que l'équation de Schrödinger bien
évidemment mais moins que celle comportant le champ magnétique) :

(43.74)

Cette équation est comme nous le savons malheureusement incomplète car elle ne contient aucune
information sur le spin de l'électron.

Nous pouvons cependant, pour tenter de trouver une solution à ce problème, faire un parallèle avec le champ
électromagnétique. Celui-ci comporte aussi un spin, résidant dans la polarisation du champ (cf. chapitre
d'Électrodynamique). Cette polarisation est étroitement liée à la nature vectorielle du champ
électromagnétique et transparaît dans les équations de Maxwell, qui sont du premier ordre en dérivées.
Cependant en combinant les équations de Maxwell, nous avons vu dans le chapitre d'Électrodynamique que
nous pouvions obtenir les équations d'onde :

et (43.75)

qui sont (coïncidence très pertinente!) un cas particulier de l'équation de Klein-Gordon quand :

(43.76)

Les équations d'onde recèlent cependant moins d'informations que les équations de Maxwell originales :
elles ne contiennent explicitement aucune relation entre les différentes composantes des champs et ,
comme par exemple le fait que, dans une onde électromagnétique de vecteur d'onde donné, les champs et
sont mutuellement perpendiculaires et tous les deux perpendiculaire au vecteur d'onde. Pour établir ces
contraintes, il faut retourner aux équations de Maxwell et donc à des équations avec des dérivées du premier
ordre.

Il en est de même pour les fermions (les électrons en font partie). L'équation de Klein-Gordon, quoiqu'elle
ne soit pas fausse, est incomplète. Il faut tenter ici d'établir une équation du premier ordre en dérivées qui
décrive bien le spin 1/2 des électrons des fermions. Cette dernière condition signifie que cette équation doit
donc faire intervenir les deux composantes d'un spineur (en analogie avec celui que nous nous déterminé
plus haut) :

(43.77)

Nous écrirons alors cette équation que nous cherchons comme :

(43.78)

où D est une matrice faisant intervenir des dérivées du premier ordre (un opérateur différentiel de
premier ordre).

Pour donner un exemple avant d'aller plus loin, regardons comment l'équation de Klein-Gordon peut
s'exprimer sous une telle forme.

Nous avons donc (équation de Klein-Gordon libre) :

(43.79)

ou (équation de Klein-Gordon généralisée) :

(43.80)

Ce qui s'écrit aussi pour l'équation de Klein-Gordon libre :

(43.81)

ou pour l'équation de Klein-Gordon généralisée :

(43.82)

Restreignons-nous maintenant au cas de l'équation de Klein-Gordon libre (le raisonnement étant similaire
pour la version généralisée).

La dernière expression de l'équation de Klein-Gordon libre suggère d'introduire les deux combinaisons :

(43.83)

d'où résulte :
(43.84)

Dès lors :

peut s'écrire de deux façons :

(43.85)

Soit, sous forme matricielle :

(43.86)

ou encore :

(43.87)

Ce que nous pouvons écrire:

(43.88)

Donc par rapport à notre idée initiale d'avoir une relation sous la forme:

(43.89)

nous pouvons faire la similitude avec l'équation antéprécédente:

et (43.90)

où D est bien un matrice .


Mais nous, nous recherchons toujours (en faisant le parallèle avec les équations de Maxwell) un système
d'équation avec des différentielles du premier ordre. Dans l'objectif de chercher une forme plus générale
incluant sous forme naturelle le spin, nous allons poser en analogie avec le résultat ci-dessus :

(43.91)

où A est un scalaire, un vecteur et un matrice symétrique (en lisant la suite vous verrez que poser
cela permet de trouver ce que nous cherchons...).

Rappelons que la multiplication entre et constitue un produit scalaire tel que celui défini dans notre
étude du chapitre de Calcul Spinoriel.

Remarque: Il faut être très prudent dans les développements qui vont suivre car les notations traditionnelles
dans le domaine rendent très difficiles les distinctions entre produit, produit scalaire, et produit de
composantes de vecteurs formant un vecteur.

Posons (au fait nos prédécesseurs ont fait de nombreux essais avant de poser cela...):

(43.92)

Ainsi, , et reste (imaginons...) inconnu. Il nous faut également déterminer .

Toujours par analogie avec l'exemple fait plus haut, tentons de retrouver l'équation d'onde pour déterminer la
constante :

(43.93)

Pour que nous retrouvions l'équation d'onde il faut que :

1.

Effectivement:

(43.94)

2. :

(43.95)
Il y a donc deux possibilités qui peuvent s'appliquer à des champs différents que nous noterons . Nous
avons donc une sorte de double spineur tel que :

(43.96)

Ces équations sont appelées "équations de Weyl".

Il nous faut maintenant généraliser les équations de Weyl au cas d'un fermion de spin demi-entier avec
masse. Cette nouvelle équation doit respecter les contraintes suivantes :

C1. Elle doit se réduire aux équations de Weyl quand la masse tend vers zéro

C2. Elle doit mener à l'équation de Klein-Gordon libre

C3. Elle doit décrire des particules possédant un spin

La solution consiste alors à coupler les deux équations de Weyl par un terme proportionnel à la masse :

(43.97)

Pour vérifier que les facteurs ont été correctement choisis, nous appliquons sur la première
équation et nous y substituons la deuxième. Nous trouvons :

(43.98)

ou encore :

(43.99)

à comparer avec :

(43.100)

Ce qui est bel et bien l'équation de Klein-Gordon libre (nous démontrons la même correspondance pour la
composante ) et renforce donc la validité des hypothèses et développements faits jusqu'à maintenant.

Il est usuel de rassembler les deux spineurs dans un seul spineur (cela devient alors un "bi-spineur") de
quatre composantes (un spineur à quatre composantes dont deux sont en fait associées aux particules et deux
antiparticules comme nous allons le verrons) :
(43.101)

et de définir les deux matrices suivantes (sous une forme dite "forme chirale") :

(43.102)

où est la matrice unité traditionnelle définie par :

(43.103)

et:

(43.104)

où les sont les "matrices de Pauli" données par (cf. chapitre de Calcul Spinoriel) :

(43.105)

qui doivent satisfaire rappelons-le (démontré plus haut):

(43.106)

Les matrices de Pauli sont donc de bonnes candidates pour résoudre notre problème!

Remarques:

R1. Comme nous l'avons vu dans le chapitre de Calcul Spinoriel (section d'Algèbre), n'est pas vraiment
une matrice de Pauli en soi. Cependant, dans certains ouvrages elle est indiquée comme en étant une (c'est
aussi notre choix ici).

R2. Comme nous l'avons également vu dans le chapitre de Calcul Spinoriel, rappelons que les matrices de
Pauli représentent implicitement des rotations spatiales infinitésimales d'un spineur.

Ceci nous permet, enfin, de combiner les équations :

(43.107)
en une seule (ne pas oublier l'association des opérateurs ):

(43.108)

en utilisant la notation d'usage en calcul tensoriel et en choisissant les unités naturelles nous
avons :

(43.109)

ce qui constitue la forme habituelle de "l'équation de Dirac" ou "équation relativiste de l'électron" avec la
"dérivée covariante":

(43.110)

Remarque: En physique des particules élémentaires, la relation antéprécédente est appelée "équation
relativiste covariante des fermions" car elle décrit les particules de spin 1/2.

Les matrices sont appelées "matrices de Dirac". Sous forme encore plus condensée (en utilisant le "slash
de Feynam") l'équation de Dirac s'écrit parfois :

(43.111)

Nous avons ainsi, comme en analogie avec les équations de Maxwell, des équations différentielles du
premier ordre qui ont comme propriété :

P1. De permettre de retomber sur l'équation de Klein-Gordon, in extenso sur l'équation d'onde (comme pour
les équations de Maxwell)

P2. De prendre en compte (décrire) explicitement le caractère spinoriel des fonctions d'onde comme nous
allons le voir en nous penchant de plus près sur les matrices de Pauli.

Remarque: Comme l'équation de Dirac s'applique aux particules de spin 1/2 elle s'applique aussi aux
neutrinos dont la masse au repos est nulle (donc la résolution de l'équation de Dirac se simplifie largement).

Dans le but maintenant d'interpréter le contenu physique de l'équation de Dirac, nous allons utiliser une
représentation différente des matrices de Pauli. Nous avons vu que la représentation :

(43.112)

était dite "représentation Chirale" alors que nous allons utiliser maintenant la "représentation de Dirac"
définie par :

(43.113)
Nous vérifions facilement (algèbre linéaire élémentaire) que cette représentation s'obtient par la
transformation (n'hésitez pas à nous demander les détails si vous n'y arrivez pas):

où (43.114)

Rappelons que est la matrice adjointe (la conjuguée de la matrice transposée) de U. Or, lorsque tous les
éléments sont des réels comme c'est le cas ci-dessus et que la matrice est carré alors (cf. chapitre d'Algèbre
Linéaire) nous savons que .

Démonstration:

(43.115)

et:

(43.116)

Cherchons maintenant les solutions particulières à l'équation de Dirac sous la forme :

(43.117)

En substituant dans l'équation de Dirac et après simplification par nous trouvons facilement:

(43.118)

Effectivement en unités naturelles:


(43.119)

Avec la représentation de Dirac nous obtenons après développement (calcul trivial) :

(43.120)

Effectivement:
(43.121)

Pour que cette équation matricielle ait des solutions non nulles, il faut comme d'habitude que le déterminant
de la matrice soit nul (cf. chapitre d'Algèbre Linéaire). Nous vérifions facilement que :

(43.122)

Ce qui implique (ne pas oublier que nous sommes en unités naturelles!):

(43.123)

Avec la représentation de Chirale nous aurions obtenus:


(43.124)

et nous ne serions pas tombés sur une condition aussi esthétique et physique pour qu'il y ait des solutions!

La masse étant toujours positive, l'équation de Dirac comporte donc quatre solutions linéairement

indépendantes, dont deux avec une énergie positive et deux avec une énergie négative
.

Il s'agit donc bien des antiparticules que nous avions déterminées lors de notre étude de l'équation de Klein-
Gordon libre mais avec le spin en plus d'où le doublage des solutions supplémentaires (deux orientations du
spin possibles par particule et par antiparticule). Avec la représentation Chirale nous ne serions pas retombés
sur ce résultat. D'où la nécessité de l'utilisation de la représentation de Dirac des matrices de Pauli.

Nous savons donc qu'il existe des solutions à l'équation de Dirac. Déterminons maintenant celles-ci. Posons :

(43.125)

où sont les deux doubles composantes du spineur. Nous écrivons ainsi le système d'équations :

(43.126)

ce qui nous donne:

et (43.127)
Ainsi, nous avons :

(43.128)

Nous savons qu'il existe des solutions et la physique quantique nous impose que ses solutions soient
linéairement indépendantes. Ainsi, choisissons les solutions pour comme étant proportionnelles à :

ou (43.129)

et comme (cf. chapitre de Calcul Spinoriel):

(43.130)

nous avons alors les possibilités suivantes :

(43.131)

La question est maintenant... devons-nous utiliser ou ? Eh bien, pour (1)


et (2) nous devons utiliser sinon devient une singularité pour . Pour (3) et (4) nous
devons utiliser sinon devient une singularité pour .

Remarque: Le terme est souvent appelé "solution particule" dans la littérature et le terme
"solution antiparticule".

En reprenant

(43.132)

et en notant les spineurs (nous changeons de notation) :

(43.133)
Nous avons finalement en utilisant (1) et (2) et en notant N( ) la partie de solution que nous devrions
normaliser les solutions suivantes possible et qui sont indépendantes:

(43.134)

avec ainsi que :

(43.135)

avec .

Ce qui peut s'abréger :

(43.136)

ÉQUATION DE DIRAC LIBRE LINÉARISÉE

Nous avons vu tout au début de notre étude la physique quantique ondulatoire que l'équation de Schrödinger
classique d'évolution était :
(43.137)

soit une équation différentielle d'un premier ordre par rapport au temps et du second par rapport aux
coordonnées spatiales.

Nous avions ensuite déterminé l'équation d'évolution relativiste de Schrödinger (équation de Klein-Gordon
libre) donnée par :

(43.138)

Nous remarquons qu'en passant à une forme relativiste nous avons maintenant une équation différentielle du
second ordre dans le temps et dans l'espace.

Ensuite en passant par l'équation de Klein-Gordon généralisée contenait également une équation
différentielle du second ordre en temps et en espace :

(43.139)

et dans l'équation de Dirac libre, nous obtenons de même une équation différentielle matricielle de premier
ordre en temps et de deuxième ordre en espace :

(43.140)

Ces changements d'ordre des différentielles d'un modèle relativiste ou non impose bien sûr dans le cas d'un
premier ordre de connaître les conditions initiales en temps et en espace de l'équation d'onde, ce qui est
faisable. Cependant, lorsqu'un second ordre apparaît, il faut alors en plus connaître les conditions initiales
des dérivées des fonctions d'onde (cf. chapitre de Calcul Différentiel Et Intégral). De plus, même si
mathématiquement la rigueur nous a amené naturellement aux différents ordres obtenus, il est étrange en
passant d'un modèle relativiste que nous changions d'ordre. Pourquoi ? : pour la simple raison qu'en
approximant les équations relativistes, nous n'arrivons pas avec le facteur de la constante de Planck à faire
des approximations (développement en série de ) qui nous ramèneraient à du premier ordre. Les
équations relativistes et non relativistes sont donc à priori incompatibles dans les limites non relativistes !

La méthode de Dirac pour résoudre ce problème aura été la suivante :

Les ordres de l'équation différentielle de Klein-Gordon venant à la base de la relation (voir les débuts de nos
développements de l'équation de Klein-Gordon libre) de l'énergie totale en l'absence de tout champ :

(43.141)

Dirac à donc l'idée géniale de linéariser cet hamiltonien en posant :

(43.142)
dont nous devrons déterminer les paramètres qui pourront être des scalaires, des vecteurs ou
des matrices (attendons un peu... la réponse viendra).

Ainsi, l'équation d'onde d'évolution relativiste la plus simple que nous pourrons construire sera :

(43.143)

Sous une forme beaucoup plus commune dans la littérature :

(43.144)

Comme ici :

(43.145)

nous retrouvons alors au la relation antéprécédente aussi sous la forme :

(43.146)

Si la quantité de mouvement venait à être nulle, nous retrouverions ainsi l'énergie au repos pour
l'hamiltonien :

(43.147)

où comme nous allons le voir plus loin .

La validité de cette linéarisation devra être vérifiée en retrouvant les résultats obtenus lors de notre étude
précédente de l'équation de Dirac.

Elevons maintenant l'opérateur au carré soit :

(43.148)

et posons :

(43.149)

A ce stade, il est important de remarquer que nous travaillons peut-être avec des opérateurs (des matrices
typiquement) qui pourraient ne pas commuter car les sont inconnus. Dès lors, l'élévation au carré sera
effectuée comme suit :

(43.150)

Nous développons ainsi le hamiltonien de Dirac


(43.151)

En effectuant les produits des termes entre parenthèses et en respectant l'ordre des opérateurs, il vient :

(43.152)

En groupant certains termes :

(43.153)

Pour être conforme à nos hypothèses de linéarisation, nous devons avoir :

(43.154)

Ecrit sous forme de commutateurs, nous avons les trois conditions suivantes à satisfaire :
(43.155)

Nous observons ce qui suit :

- Le carré de chaque opérateur et est égal à 1 (ou à la matrice unitaire s'il s'agit de matrice...).

- est un anti-commutateur.

- est un anti-commutateur.

ces trois relations peuvent se résumer comme suit :

(43.156)

A ce stade, nous devons rechercher quels sont les objets mathématiques répondant au trois conditions ci-
dessus. Nous pourrions montrer qu'une matrice carrée de dimension 2 ou 3 ne répond pas aux trois
conditions et un scalaire encore moins!

Dirac a alors adopté par analogie aux développements antérieurs, des matrices carrées de dimension 4
incluant des matrices de Pauli (comme par hasard...) et a admis pour une matrice unité (ce choix fait par
Dirac est particulier, il y a d'autres choix possibles).

Donc ce que nous notions "1" avant est au fait une matrice unitaire carrée de dimension 4!

Les matrices considérées par Dirac sont donc pour :

(43.157)

Dans lesquelles, nous avons les matrices de Pauli et la matrice unitaire suivantes:

(43.158)

Ce qui conduit aux matrices :


(43.159)

On peut vérifier que les conditions de linéarisation sont vérifiées par les matrices précédentes :

- Première condition :

(43.160)

De même pour les :

(43.161)

La première condition est donc bien remplie!

- Deuxième condition (attention aux notations qui dérapent un peu par tradition entre matrices et scalaires!):
(43.162)

et :

(43.163)

Donc:

(43.164)

la deuxième condition est bien remplie.

- Troisième condition :

(43.165)

La troisième condition est bien remplie.

En se référant à l'équation de début écrite avec le formalisme de Dirac

(43.166)

Avec :
(43.167)

Ce qui donne finalement :

(43.168)

Nous nous retrouvons devant une fonction d'état possédant 4 composantes dans laquelle :

et (43.169)

sont des spineurs et l'ensemble :

(43.170)

est donc un "bispineur de Dirac" et nous notons :

(43.171)

la "fonction d'état de Dirac". Le lecteur remarquera que nous retrouvons les mêmes concepts que lors de
notre étude de l'équation de Dirac libre non linéarisée.

En développant, il vient :
(1)
(43.172)

Pour un électron libre, nous savons que la solution est :

(43.173)

Avec le bispineur de Dirac, nous avons :

(43.174)

avec :

(43.175)

avec à sont les composantes du bispineur de Dirac.

Nous noterons :

avec (2)
(43.176)

En calculant leurs dérivées par rapport à t:


(3)
(43.177)

Avec (2) et (3) dans (1), il vient

(43.178)

Soit un système d'équations dont les inconnues sont :

(4)
(43.179)

Nous aurons des solutions non toutes nulles si et seulement si le déterminant des coefficients est nul (pour en
connaître les raisons, voir le chapitre d'Algèbre Linéaire) et donc une infinité de solutions (pour les
composantes du spineur de Dirac) possibles. Soit :

(43.180)

En simplifiant par c:
(43.181)

La division dans le déterminant précédent permet le calcul des déterminants partiels (cf. chapitre d'Algèbre
Linéaire) :

(43.182)

En résolvant le déterminant précédent, il vient :

(43.183)

D'où la relation suivante :

(43.184)

Les valeurs de l'énergie données par l'équation de Dirac sont donc :

(43.185)

Soit :

(43.186)
Si nous adoptons pour , deux valeurs constantes pour et , nous disposons de deux relations pour
calculer et soit :

- Avec (4c) :

(43.187)

Soit :

(43.188)

- Avec (4d) :

(43.189)

Soit :

(43.190)

N.B : En adoptant , il vient :

(43.191)

En prenant les unités naturelles :

(43.192)

En adoptant , il vient :

(43.193)

En prenant les unités naturelles :

(43.194)

Si nous adoptons pour , deux valeurs constantes pour nous disposons de deux relations pour
calculer soit :
- Avec (4a) :

(43.195)

Soit :

(43.196)

- Avec (4b) :

(43.197)

Soit :

(43.198)

Notons, qu'en adoptant , il vient :

(43.199)

Avec les unités naturelles :

(43.200)

En adoptant , il vient :

(43.201)

Soit avec les unités naturelles :

(43.202)

Bien que la méthode soit différente, nous retrouvons donc les coefficients des spineurs que nous avions
obtenus dans notre étude de l'équation de Dirac libre classique. Cela nous rassure donc dans les hypothèses
posées au début de cette linéarisation et valide ces résultats. De plus, les relations précédentes indiquent
aussi une dégénérescence d'ordre deux de l'énergie pour chaque valeur de l'impulsion. En l'absence de
champ extérieur, l'électron libre n'est donc pas influencé par l'orientation de son spin. Nous retrouvons donc
les mêmes résultats que ce soit pour l'équation de Dirac libre classique ou linéarisée.
Cependant, l'explication donnée par Dirac pour expliquer les énergies positives et négatives est que son
équation s'applique non seulement à l'état d'une particule à énergie positive (en l'occurrence l'électron) mais
également à l'état d'une particule à énergie négative (son antiparticule soit le positron). La valeur absolue de
ces deux énergies étant strictement égales.

La présence du signe négatif affectant l'énergie à posé problème à l'époque pour son interprétation (dans le
cadre où nous omettons la variable du temps puisque nous avions vu lors de l'étude de l'équation de Klein-
Gordon libre qu'une particule à énergie négative peut être vue comme une particule qui remonte le temps).

Si nous raisonnons dans le cas où le terme est faible comparé à , nous nous posons la question :
comment et quels sont les conséquences d'une transition entre un état d'énergie à celui de l'état
d'énergie avec un saut ("gap") de (nous retrouverons cette valeur lors de notre étude de la
matérialisation dans le chapitre de Physique Nucléaire).

Dirac a recours à l'image d'une mer d'énergie négative (puisque rappelons-le, le nombre de solutions à notre
système matriciel est infini, d'où l'analogie avec une mer plus qu'un contexte discret) dans laquelle tous les
états d'énergie négatives sont occupés par les électrons et les états d'énergie positives seraient vides. Si un
électron est soumis à une transition (via, par exemple un photon d'énergie supérieure à ), il quitte
cette mer en laissant derrière lui une lacune (le fameux "trou" de charge positive auquel les électroniciens
font parfois référence....). Cette lacune devient une charge positive, d'énergie . L'apparition de cette
lacune est assimilée à l'apparition d'une particule ayant une charge positive. Bien évidemment, nous pouvons
nous imaginer le cas inverse, ce n'est qu'une question de conventions.

ÉQUATION DE DIRAC GÉNERALISÉE

Dans le cas de l'électron libre, nous avons donc maintes fois vus et démontrés que l'hamiltonien a comme
expression

(43.203)

Dans le cas d'un électron se déplaçant dans un champ électromagnétique, nous avons aussi démontré lors de
notre étude de l'équation de Klein-Gordon au début de ce chapitre:

(43.204)

Soit :

(43.205)

Bref fini pour le rappel!

Si maintenant, nous reprenons l'hamiltonien de Dirac pour l'électron libre démontré plus haut:

(43.206)

En tenant du fait que nous avions démontré plus haut que dans le cas particulier d'une particule plongée dans
un champs magnétique et un potentiel électrostatique nous avions:
(43.207)

avec:

(43.208)

et du fait qu'il faille rajouter à l'hamiltonien le terme de l'énergie potentielle électrostatique:

(43.209)

Nous obtenons alors l'hamiltonien de Dirac généralisé :

(43.210)

Nous avons donc sous une autre forme connue:

(43.211)

ÉQUATION DE PAULI

Considérons maintenant une représentation à deux composantes du spineur:

(43.212)

et rappelons que:

et (43.213)

Il vient alors:

(43.214)

Soit:

(43.215)

Ce qui après simplification donne:

(43.216)
Avant de continuer, ouvrons une parenthèse importante sinon quoi nous n'arriverons pas à trouver une
solution à ces deux équations.

Rappelons qu'un des spineurs solutions de l'équation de Dirac libre était donné par (nous l'avons démontré
plus haut et nous enlevons l'indice i ainsi que le symbole du produit scalaire pour simplifier les écritures):

(43.217)

Soit en unités S.I.:

(43.218)

Afin de simplifier le calcul des équations antéprécédentes nous abaisserons la situation à un cas non
relativiste, c'est-à-dire lorsque l'énergie de masse est beaucoup plus grande que l'énergie cinétique. Donc la
solution précédente devient (on oublie la deuxième qui poserait problème...):

(43.219)

L'idée est alors de trouver une solution telle à:

(43.220)

qui lorsque nous faisons une approximation non relativiste et que nous annulons le champ magnétique (in
extenso le potentiel vecteur), nous retombons sur:

(43.221)

L'idée est simple mais il fallait y penser!

Après maints tâtonnements (eh oui la physique quantique ne c'est pas faite en un jour...) nous trouvons
qu'une solution particulière satisfaisant à notre idée précédente est:

(43.222)

Effectivement:
(43.223)

Nous avons finalement deux équations:

(43.224)

Maintenant, considérons uniquement la deuxième équation:

(43.225)

En supposant (gratuitement! après quoi il faudra comparer aux résultats expérimentaux) que le terme

est beaucoup plus petit que nous pouvons écrire:

(43.226)

En faisant la même hypothèse avec nous avons:

(43.227)

Nous avons alors:

(43.228)

Or, nous voyons bien que si le champ magnétique (in extenso le potentiel vecteur) s'annule, nous retombons
sur bien notre idée de départ! Le pari est donc bon!
A cause de toutes ces approximations vers le bas, la composante est souvent prise comme étant la
"petite" composant de la fonction d'onde , relativement à la grosse composante .

La première équation:

(43.229)

peut maintenant être simplifiée facilement en prenant la solution précédente tel que:

(43.230)

Soit:

(43.231)

En utilisant l'identité remarquable démontrée dans le chapitre de Calcul Spinoriel:

(43.232)

Nous avons:

(43.233)

Détaillons le produit vectoriel en se rappelant qu'il agira comme opérateur sur :

(43.234)

Or, nous avons:

(43.235)
Intéressons nous juste à la composante dans le coin supérieur gauche (sinon les calculs sont trop longs) de
cette somme de matrices. Il ne faut pas l'oublier que cette composante de la matrice agira sur la première
composante en tant qu'opérateur sur (notée de même...):

(43.236)

Or:

(43.237)

Donc:

(43.238)

Or, nous reconnaissons ici la troisième composante d'un produit vectoriel n'agissant pas comme opérateur.
Finalement, il vient:

(43.239)

Soit:

(43.240)

Ainsi, la relation de la composante principale:

(43.241)

Devient:

(43.242)

Après réarrangement:

(43.243)
ce qui constitue "l'équation de Pauli" et décrit donc de manière relativiste les deux composantes de
liberté du spin de l'électron.

Le terme:

(43.244)

est appelé "terme de Stern-Gerlach" et représente l'énergie d'interaction du champ magnétique avec le
moment intrinsèque de l'électron.

L'équation de Pauli, et donc celle de Dirac (puisque cette dernière est plus générale), donnent le facteur
gyromagnétique correct de pour un électron libre. Pour vérifier ceci, prenons comme il a été fait
expérimentalement, un champ magnétique constant:

Nous vérifions facilement que le choix d'un potentiel vecteur correspondant à un champ magnétique
constant est alors:

(43.245)

Ce choix va avoir pour effet de faire disparaître le potentiel vecteur au profit du champ magnétique dans
l'équation de Pauli ce qui fera apparaître l'interaction entre le moment angulaire orbita et le champ
magnétique comme nous allons le voir:

Effectivement, nous avons:

(43.246)

Démonstration:

(43.247)

Nous avons alors dans l'équation de Pauli:

(43.248)

Or, rappelons que nous avons vu dans le chapitre de Calcul Vectoriel que:
(43.249)

Cela nous donne donc:

(43.250)

où:

(43.251)

noté aussi (cf. chapitre de Mécanique Classique/Physique Quantique Corpusculaire) est donc un
opérateur représentant le moment cinétique.

Nous avons donc:

(43.252)

En définissant l'opérateur spin comme étant (oh! on retrouve quelque chose de connu et vu dans le chapitre
de Physique Quantique Ondulatoire!! c'est magnifique non?):

(43.253)

Cette relation nous sera très utile dans le chapitre d'Informatique Quantique.

L'équation de Pauli s'écrit alors:

(43.254)

ou encore:

(43.255)

ou encore en plus condensé en faisant bien attention à bien différencier ce qui est un opérateur, d'un vecteur
et ce qui est un produit d'un produit scalaire et ce qui est une fonction d'un spineur... (que du bonheur...):

(43.256)

avec étant donc le "moment magnétique orbital", le "moment magnétique de spin" et avec tout cela
le terme de Stern-Gerlach devient donc:
(43.257)

où le "facteur de Landé" ou "facteur gyromagnétique" de l'électron qui est une grandeur physique
sans dimension qui permet de relier le moment magnétique au moment cinétique d'un état quantique. Nous
retrouvons par ailleurs le rapport:

(43.258)

qui est le magnéton de Bohr que nous avions introduit dans le chapitre de Physique Quantique
Corpusculaire.

Donc la théorie de Dirac dans le cadre non relativiste prédit en bonne approximation que les particules de
spin 1/2 ont un facteur gyromagnétique de 2, et cette prédiction conforme à l'expérience est le plus grand
triomphe de l'équation de Dirac.

Les valeurs suivantes ont été mesurées pour les particules de spin ½ tel que l'électron, le proton et le neutron
(attention le signe peut changer suivant la manière dont est notée l'équation de Dirac!):

(43.259)

Remarques:

R1. Le facteur gyromagnétique est pris parfois comme étant négatif mais ce n'est qu'une question de
convention.

R2. Les déviations de la valeur théorique sont parfaitement expliquées dans le cadre de l'électrodynamique
quantique. Mais ces déviations montrent que la structure du proton et du neutron sont plus complexe qu'une
particule ponctuelle de spin 1/2 alors que dans le cas de l'électron, il semblerait qu'il n'y ait pas de sous-
structure.

C'est par ailleurs le terme :

(43.260)

de l'hamiltonien de Pauli qui donne les valeurs mesurées par l'effet Zeeman!

Nous savons que cette dernière relation peut aussi s'écrire pour toute particule (cf. chapitre de Physique
Quantique Corpusculaire):

(43.261)
où est la "rapport gyromagnétique" et le "magnéton de Bohr" (mais nous avons vu lors de la
démonstration de cette relation que le magnéton de Bohr n'est qu'un cas particulier du moment magnétique
de spin avec le facteur de Landé égal à celui de l'électron.)

Supposons maintenant que le noyau d'un atome n'a que deux orientations de spin possible (il
existe plusieurs valeurs de spin pour tous les noyaux existants) alors nous avons vu dans le chapitre de
Physique Quantique Corpusculaire et Ondulatoire que:

(43.262)

soit 3 états différents mais deux variations d'énergies possibles à spin égal (entre {-1,0} et {0,+1} pour le
premier et {-1,+1} pour le deuxième).

Intéressons nous maintenant seulement à la variation d'énergie entre deux états. Il sera alors toujours à spin
égal de la forme:

(43.263)

Cette variation d'énergie sera restituée sous forme d'ondes électromagnétiques correspondant à:

(43.264)

d'où:

(43.265)

qui est la "relation de Larmor" (à ne pas confondre avec la "rayon de Larmor" vu dans le chapitre de
Magnétostatique). Mais dans la pratique nous utilisons surtout la relation:

(43.266)

qui donne ce que nous appelons la "fréquence de résonance".

Cette étude de variation d'énergie due à l'application d'un champ magnétique est à la base de la résonance
magnétique nucléaire (RMN) qui ne marche donc que pour les particules possédant le moment magnétique
de spin (par construction de l'hamiltonien de Pauli!).

La RMN consiste à modifier le moment magnétique nucléaire, autrement dit à faire passer le noyau d'un
niveau d'énergie à un autre, en appliquant des champs magnétiques à l'échantillon qu'on veut étudier.
Lorsque l'énergie des photons qui constituent ces champs magnétiques correspond à l'énergie de transition
d'un niveau d'énergie à l'autre, ces photons peuvent être absorbé par le noyau : nous disons alors qu'il y a
"résonance nucléaire".

Nous pouvons caractériser l'énergie de transition du moment magnétique de spin nucléaire en donnant la
fréquence de l'onde électromagnétique qui permet la résonance. Pour les champs usuels (de l'ordre du tesla),
la résonance du proton a lieu dans le domaine des ondes radio (100 [MHz] environ) : 42 [MHz] dans un
champ de 1.0 [T] et 63 [MHz] dans un champ de 1.5 [T].
44. PHYSIQUE NUCLÉAIRE

L'ARME NUCLÉAIRE

Sans souhaiter faire d'amalgame, nous considérons qu'il est indispensable, à l'époque ou l'arme nucléaire sert
de moyen de dissuasion et donc d'élément de stabilité planétaire, à la culture générale de l'ingénieur de
connaître certaines propriétés élémentaires de la bombe atomique à fission. Nous allons donc
exceptionnellement dans ce petit sous-chapitre sans mathématiques (celles de l'arme nucléaire et des
centrales nucléaires seront vus lors de notre étude de la neutronique à la fin de celui-ci) parler un petit peu de
cette arme de destruction massive qui fascine souvent les étudiants des les aulas de cours.

Certes, nous étudierons plus tard théoriquement, comment provoquer une réaction en chaîne divergente dans
un volume donné. Cependant, il ne faudra évidemment pas s'attendre à acquérir les connaissances
nécessaires à la fabrication d'une telle arme puisque cela ne fait pas appel uniquement à des connaissances
de la physique, mais également à de l'électronique, mécanique, chimie, mathématiques, etc.

S'agissant d'une explosion, l'usage s'est immédiatement introduit de comparer l'énergie d'une arme nucléaire
à celle d'un explosif courant: le Trinitrotoluène (T.N.T). Ce T.N.T fournit 4'200'000 Joules par Kilo, mais les
énergies des armes nucléaires sont telles qu'il est plus parlant de les évaluer en milliers de tonnes - ou
kilotonnes de T.N.T (ultérieurement les armes thermonucléaires représentèrent un nouveau bond dans les
énergies explosives: l'unité pratique de comparaison est le million de tonnes - Mégatonne de T.N.T).

La fission de 56 grammes d'Uranium 235 ou de Plutonium 239 donne l'équivalent de 1 Kilo-tonne avec la
fission de atomes (ce n'est même pas une valeur entière du nombre d'Avogadro!!).

La première explosion nucléaire expérimentale, à Alamogordo le 16 juillet 1945 - fut évaluée à 20 Kt, avec
une bonne précision car il avait été possible de mettre en place de multiples dispositifs de mesure.

Celles du 6 août, sur Hiroshima (à Uranium 235) puis du 9 août sur Nagasaki (au Plutonium 239) furent
d'abord estimées aussi à 20 Kt. Ultérieurement, et par étude fine sur les effets de souffle, leurs énergies
furent respectivement ramenées à environ 17 et respectivement 15 Kt. Cela n'en représentait pas moins
l'équivalent d'un chargement en T.N.T. d'un convoi de l'ordre de 6000 camions de l'US Army.

Voici un schéma à la fois intéressant et persuasif des effets d'une bombe atomique (pour information à partir
d'une vitesse de 220 [km/h] un être humain moyen est soulevé du sol) :
(44.1) Source: Pour la Science

Donc en d'autres termes voici en résumé et en approximations les effets d'une arme à fission de 1 Mt
explosant à 2'450 mètres d'altitude (tout en sachant qu'aujourd'hui les américains et les russes ont des armes
nucléaires à fusion dont la puissance de feu dépasse les 50 Mégatonnes...):

Jusqu'à 1.3 [km], tout est rasé, même les bâtiments en béton armé. Jusqu'à 4.8 [km], la plupart des usines et
des bâtiments commerciaux sont détruits; les habitations faites de briques et de bois sont anéanties, et leurs
débris éparpillés. Jusqu'à 7 [km], les ensembles commerciaux de structure légère et les résidences privées
sont démolis. Les constructions plus lourdes sont sérieusement endommagées. Jusqu'à 9.5 [km], les murs des
bâtiments légers sont renversés, les résidences privées gravement détériorées. Le souffle (ou surpression) est
encore assez puissant pour tuer les personnes qui se trouvent à l'extérieur (explosion des poumons). Jusqu'à
18.6 [km], différents édifices sont endommagés, les rues sont jonchées de débris de vitres et de tuiles. 10 à
20 minutes après la déflagration, les débris aspirés dans la dépression de la tige du champignon atomique,
retombent au sol. Suivent 1 à 2 heures après, les débris se situant dans le champignon (sa tête).

La plupart des effets représentés sur le schéma ne sont pas proportionnels à l'énergie. Il n'y a donc pas lieu
de faire une simple multiplication pour une arme de 30'000 mégatonnes!

Remarque: Pour un petit calcul sympathique sur les bombes nucléaires utilisant l'analyse dimensionnelle le
lecteur pourra se référer au chapitre des Principes de la mécanique où nous donnons l'expression de l'énergie
d'une bombe en fonction du rayon de sa boule de feu.

RADIOACTIVITÉ

Lorsque nous analysons expérimentalement la radioactivité, nous nous apercevons d'abord que le noyau
n'émet pas ses constituants. Ensuite, nous découvrons de nouvelles forces, qui luttent et dominent à tour de
rôle. Enfin, de nouvelles particules de matière, et même d'antimatière apparaissent. Le décryptage de ces
énigmes a fourni une image cohérente du monde infiniment petit dont la radioactivité a révélé l'existence, un
monde où les lois physiques échappent à une intuition issue de la pratique quotidienne de notre monde
macroscopique.

D'emblée, la radioactivité a surpris. Dès 1900, il était connu que les rayonnements émis par l'Uranium et ses
descendants avaient trois composantes, baptisées : "alpha" , "bêta" et "gamma" séparables par
l'actions d'un champ magnétique comme indiqué symboliquement dans l'image ci-dessous :
(44.2) Source: Pour la Science

Plus tard, il fût montré que la radioactivité alpha était l'émission de noyaux d'hélium, la radioactivité bêta
l'émission d'éléctrons. De ces observations, il était logique de déduire que le noyau était constitué de ces
trois types de particules, ce qui n'est pas le cas : les constituants du noyau n'ayant été découvert par J.
Chadwick qu'en 1932.

Alors, pourquoi les noyaux radioactifs n'émettent-ils pas des protons ou des neutrons? Comment les noyaux
éjectent-ils autre chose que leurs constituants? Ces questions doivent être précédées d'une autre, sans doute
plus fondamentale pourquoi certains noyaux sont-ils radioactifs? La réponse est la même pour tous les
phénomènes physiques spontanés. La pomme tombant de l'arbre, par exemple : c'est parce que le système
peut rejoindre un état plus stable en perdant de l'énergie potentielle, l'excédant d'énergie s'échappant sous
forme d'énergie cinétique, c'est-à-dire sous la forme de mouvement.

Cette raison explique aussi pourquoi les isotopes n'émettent pas de protons ou neutrons seuls car souvent au
niveau de la structure quantique du noyau il est plus favorable au niveau énergétique d'émettre un petit
noyau ou de changer un neutron en neutron (l'étude quantique du noyau dépasse le cadre mathématique des
sujets traités sur ce site web).

Avant de continuer dans la description détaillée de ces phénomènes, donnons quelques définitions:

D1. Tout élément chimique (cf. section de chimie) est caractérisé par son nombre de protons Z appelé
"nombre atomique".

D2. Le "nombre de masse" A est par définition le nombre de proton Z sommé du nombre de neutrons N de
l'élément chimique donné. Ainsi, ce dernier se trouve entièrement caractérisé si nous connaissons son nom
ou son nombre atomique Z et son nombre de neutron N ou son nombre de masse. Nous notons usuellement
n'importe quel élément sous la forme:

(44.3)

Les éléments chimiques d'une même espèce (même Z) peuvent avoir différents nombres de neutron N, c'est-
à-dire différents nombres de masse A, nous parlons alors "d'isotopes" ou de "nucléides". Evidemment,
l'énergie nucléaire (du noyau) associée à un même élément chimique diffère selon le nombre de masse et il
existe nous le verrons un nombre A pour lequel l'énergie est minimale. Les isotopes pour lesquels l'énergie
n'est pas minimum pourront, pour certains d'entre eux et de façon spontanée, libérer l'excès d'énergie en se
désintégrant.

D3. La propriété qu'ont certains atomes de modifier spontanément la structure de leurs noyaux pour
atteindre un niveau d'énergie inférieur, plus fondamental, est appelé "radioactivité". Nous parlons alors de
"radio-isotopes" pour les atomes concérnés.
Les propriétés chimiques d'un atome dépendent (cf. section de chimie) du nombre et la disposition des
électrons dans son nuage. Ainsi tous les isotopes d'un même élément chimique ont les mêmes propriétés
chimiques (c'est cette caractéristique chimique qui à la base de la médecine nucléaire). Ce sont en quelque
sorte des atomes "frères". Cependant, la légère différence de masse de leur noyau fait que leurs propriétés
physiques se différencient quelque peu.

D4. Enfin, les "isotones" sont les isotopes de différents éléments chimiques (différent Z) ayant le même
nombre de neutron N.

La petitesse des atomes pose un problème évident de mesure de masse. C'est pourquoi il a été préféré par les
physiciens et les chimistes de mettre en place un système de masse atomique qui est un système de nombres
proportionnels à la masse réelle des atomes.

Comme il y a une infinité de systèmes de nombres, un a été choisi judicieusement comme référence et c'est
le chiffre 12 pour l'isotope 12 du Carbone:

(44.4)

où "uma" est l'abréviation de "unités de masse atomique".

Ceci a pour conséquence intéressante de conférer au proton et au neutron des masses atomiques très voisines
de l'unité.

Nous pouvons donc relier le système S.I. (cf. chapitre Principes) avec le système des unités de masse
atomique (uma).

D5. "L'unité de masse atomique" est par définition la masse du 1/12 de l'atome de Carbone , nous avons
(la masse des électrons est négligée car très faible par rapport à celle des nucléons):

(44.5)

Donc la masse du proton en uma vaut:

(44.6)

Attention, cependant la masse molaire d'un isotope différent que le ne peut pas être calculée par
addition des masses des nucléons (protons et neutrons) qui compose son noyau car il faut tenir compte du
défaut de masse (notion que nous verrons plus loin).

Les masses peuvent être aussi exprimées en unités d'énergie puisqu'il y a équivalence masse-énergie comme
nous l'avons vu en relativité restreinte d'après la relation (cf. chapitre de Relativité Restreinte).
L'unité d'énergie en physique nucléaire souvent utilisée est "l'électronvolt".

D6. Un "électronvolt" noté [eV] est l'énergie acquise par une charge élémentaire soumise à une différence de
potentiel de 1 [V].

Ainsi, d'après la relation entre l'énergie et le potentiel électrostatique (cf. chapitre


d'Électrostatique), nous avons :
(44.7)

Nous en tirons puisque la vitesse de la lumière dans le vide vaut :

(44.8)

DÉSINTÉGRATION

Certains noyaux possèdent donc la propriété de modifier spontanément leur structure interne pour atteindre
un niveau d'énergie plus fondamental. Cette transformation s'accompagne de l'émission de particules et/ou
de rayonnements électromagnétiques. Le noyau résiduel peut être lui aussi radioactif et subir d'autres
transformations par la suite ou être stable.

La désintégration radioactive d'un isotope est un phénomène aléatoire et nous ne pouvons jamais dire à quel
moment un noyau va se désintégrer (probabilité sans effet de mémoire).

Remarque: Pour la démonstration de cette affirmation, le lecteur peut se reporter au chapitre de Techniques
De Gestion dans la partie traitant de la théorie des files d'attentes et en particulier la modélisation des
arrivées. Effectivement, le développement est tout point identique mais seulement l'objet d'étude change (ce
ne sont alors plus des appels téléphoniques mais des désintégrations). Ainsi, on y démontre que sous
certaines hypothèses le phénomène suit une loi de Poisson et nous y démontrons que celle-ci n'a pas de
mémoire.

Nous ne pouvons donner que la probabilité de désintégration par unité de temps. Cette probabilité est
donnée par la "constante radioactive" et a pour unité l'inverse du temps tel que . Cette constante
peut être calculée comme nous l'avons déjà vu lors de l'étude de l'effet tunnel en physique quantique
ondulatoire.

La constante radioactive varie pour tous les isotopes connus:

(44.9)

Soit N(t) le stock d'atomes d'un isotope radioactif au temps t. Le nombre d'atomes se désintégrant durant le
temps infinitésimal dt est donc égal à :

(44.10)

conduisant à une diminution du stock égale à :

(44.11)

L'équation différentielle (cf. chapitre de Calcul Intégral Et Différentiel) s'écrit donc:

(44.12)

ou :

(44.13)
qui a pour solution très simple (cf. chapitre de Calcul Différentiel Et Intégral):

(44.14)

avec le stock de noyaux au temps .

Remarque: N(t) ne représente pas le nombre d'atomes restant au temps t mais le nombre le plus probable
d'atomes radioactifs restant au temps t!!

Dans la pratique, la mesure de la constante radioactive se fait à l'aide de la décroissance de l'activité (voir
plus loin) de l'isotope intéressé.

DEMI-VIE D'ISOTOPE

Définition: La "période radioactive" ou de "demi-vie" d'un isotope est le temps moyen qu'il faut
attendre pour que 50% du stock de noyaux radioactifs d'un isotope donné soit désintégré:

(44.15)

Nous avons ainsi une relation très important entre la période de demi-vie et la constante radioactive!

Si le radio-isotope a le choix de se désintégrer selon deux voies de désintégration distinctes caractérisées de


deux périodes radioactives distinctes et , la demi-vie de ce nucléide est définie par la moyenne:

(44.16)

et nous calculons le nombre de nucléides restant par la relation :

(44.17)

ACTIVITÉ RADIOACTIVE

Définition: L'activité A d'une source radioactive est le nombre de désintégrations par unité de temps.

Remarque: Son unité de mesure est le "Becquerel" est est noté . 1 Becquerel correspondant donc
à une désintégration par seconde.

L'ancienne unité de mesure de la radioactivité était le "Curie" [Ci] . Le Curie avait été défini dans un premier
temps comme l'activité d'environ un gramme de radium, élément naturel que nous retrouvons dans les sols
avec l'Uranium. Cette unité est beaucoup plus grande que la précédente car par définition 1 [Ci] correspond
à 37 milliards de désintégrations par seconde:

(44.18)

L'activité s'obtient par la dérivation temporelle du stock d'atomes d'un échantillon donné:
(44.19)

La relation dite "équation d'activité" :

(44.20)

montre ainsi que l'activité d'un nombre donné d'atomes N d'un isotope radioactif est proportionnelle à ce
nombre et inversement proportionnelle à la demi-vie de l'isotope (de par la relation vue plus haute entre la
constante radioactive et la période de demi-vie).

Exemple:

Un gramme de contient :

(44.21)

donc l'activité de ce gramme vaut connaissant :

(44.22)

Par le même raisonnement, mous montrons que l'activité au cours du temps suit la même loi exponentielle
que la diminution du nombre de nucléides:

(44.23)

avec :

(44.24)

Expérimentalement pour déterminer la période de demi-vie d'un isotope radioactif nous procédons de la
manière suivante :

1. Nous choisissons un échantillon pur d'un isotope dont nous souhaitons déterminer la période de demi-vie.

2. Au temps nous mesurons à l'aide d'un détecteur pendant un intervalle de temps fixé le nombre de
désintégrations. Nous avons alors le nombre de désintégrations pendant un intervalle de temps en début
d'expérience (l'unité de la mesure est alors les désintégrations et non pas le nombre de désintégrations par
seconde).

3. Ensuite, pendant chaque consécutif (l'intervalle de temps est fixé) nous mesurons le nombre de
désintégrations pendant cet intervalle de temps. Cela nous donne donc une série des mesures du nombre de
désintégrations observées pour

4. A l'ensemble des mesures de désintégrations effectuées, nous enlevons le bruit de fond du laboratoire

Puisque :
(44.25)

En prenant le logarithme népérien nous avons :

(44.26)

Soit :

(44.27)

Il s'agit donc de l'équation d'une droite de pente et d'ordonnée à l'origine . Ainsi, la


constante radioactive est immédiatement mesurée et l'on en déduit rapidement la période de demi-vie à l'aide
de la relation démontrée plus haut :

(44.28)

DATATION AU CARBONE 14

Certains éléments radioactifs naturels constituent de véritables chronomètres pour remonter dans le temps.
Des méthodes de datation ont été mises au point, fondées sur la décroissance progressive de la radioactivité
contenue dans les objets ou vestiges étudiés. On peut ainsi remonter jusqu'à des dizaines de milliers d'années
dans le passé avec le carbone 1, voire bien d'avantage avec d'autres méthodes telles que la
thermoluminescence ou la méthode uranium-thorium. La datation au carbone 14 permet d'aborder l'étude de
l'histoire de l'homme et de son environnement pendant la période de 5'000 à 50'000 ans à partir du temps
présent.

Le carbone naturel est composé de deux isotopes stables: le (98.892%) et (1.108). Il n'existe donc
pas de dans le carbone naturel. Ce dernier est produit en haute atmosphère par l'action de neutrons
cosmiques sur le . Nous parlons alors de "capture neutronique" (voir plus loin) ou "activation
". Ainsi, continûment du est produit en haute atmosphère et se désintègre naturellement
avec une période de 5'700 ans. Nous nous imaginons aisément que la concentration en s'équilibre
lorsque le taux de production est égal au taux de disparition suite au processus de désintégration radioactif
(sinon quoi il n'y aurait plus que du partout).

Il se forme environ 2.5 atomes de par seconde et par de surface Terrestre (ce chiffre est cependant
dépendant de beaucoup de facteurs mais en amplitude négligeable sur le très long terme. Vous pouvez
trouver des ouvrages entiers traitant du sujet), la contribution positive au nombre d'atome de vaut:

(44.29)

R étant le rayon de la Terre.

Ou encore en débit de masse cela représente:

(44.30)
Le taux de disparition est égal au taux de production radioactif, c'est-à-dire:

car (44.31)

Comme le taux de disparition vaut:

(44.32)

Nous en déduisons qu'il y a atomes de en permanence dans l'atmosphère, soit environ


77.8 tonnes.

Ce radio-isotope se retrouve sous la forme chimique et pénètre par photosynthèse et métabolisme dans
le règne végétal et animal. A la mort de la plante ou de l'animal, la teneur en reste figée et commence à
décroître par désintégration radioactive au cours des âges.

(44.33)

La datation n'est donc qu'une simple comparaison entre la concentration en de la matière vivante et de la
matière morte. De fait, on détermine les activités spécifiques

(44.34)

Les archéologues peuvent ainsi aisément dater ce qu'ils veulent avec une relativement bonne approximation.

FILIATION RADIOACTIVE

Définition: Une filiation radioactive (dite aussi "série de décroissance radioactive" ou encore "décroissance
multiple") est par définition la stabilisation d'un noyau appelé "noyau mère" en une succession de
désintégrations. Chaque étape est caractérisée par un état intermédiaire correspondant à un radionucléide
appelé "nucléide fille" de l'élément mère. Nous avons :

(44.35)

où * désigne un isotope radioactif donné, l'isotope stable de la filiation radioactive de l'élément mère
(les éléments entre deux étant tous des nucléides instables).

Exemple:

Considérons le problème à 2 corps (nous ne nous intéresserons pas aux cas supérieurs excepté sur
demande). Supposons qu'à l'origine des temps, le premier descendant n'existe qu'en quantité négligeable:

Conditions Initiales (C.I.) à :

(44.36)
La variation de l'élément mère (1) n'est donnée que par une contribution négative, la désintégration de 1.

Nous avons:

(44.37)

avec pour solution tenant compte des conditions initiales :

(44.38)

La variation de l'élément descendant (2), c'est-à-dire la fille de 1, est donnée par une contribution positive
(les atomes de 1 désintégrés) et une négative, la désintégration de 2. On a:

(44.39)

il faut donc résoudre cette équation différentielle (cf. chapitre de Calcul Différentiel et Intégral).

Nous avons comme solution homogène (équation caractéristique ECAR):

(44.40)

Nous tirons la solution de l'équation homogène comme:

(44.41)

avec la lettre h pour signifier qu'il s'agit de la solution "homogène".

Déterminons maintenant la solution particulière de:

(44.42)

La démarche consiste à poser que avec la lettre p pour "particulière".

En substituant nous trouvons :

(44.43)

Car si nous avions nous aurions une égalité nulle ce qui est absurde et nous avons dès lors:

(44.44)

d'où nous tirons que :


(44.45)

Finalement la solution générale est la somme de la solution homogène et de la particulière, ainsi:

(44.46)

Appliquons les conditions initiales:

(44.47)

Finalement nous avons :

(44.48)

Nous laisserons le soin au lecteur de tracer les graphiques de:

et (44.49)

pour voir l'allure que cela à s'il en ressent le besoin.

étant nul pour et pour , obligatoirement il passe, comme l'activité , par un maximum.
Soit le temps ou le maximum est observé, nous avons:

(44.50)

d'où:

(44.51)

La connaissance de est importante en particulier en médecine nucléaire où nous désirons administrer le


produit 1 à des fins radiodiagnostics et minimiser les effets néfastes du/des produit(s) fille(s) de 1. Nous
choisissons alors des produits tel que le temps soit supérieur au temps d'élimination biologique (voies
d'élimination naturelle de l'organisme) de sa fille. Nous y reviendrons d'ici quelques paragraphes après avoir
étudié les trois scénarios classique de la filiation radioactive:

ÉQUILIBRE SÉCULAIRE
Ce type de relation entre activité mère et fille intervient quand la demi-vie du noyau mère est beaucoup plus
grande que celle du noyau fille. En d'autres termes, la décroissance du noyau mère est négligeable et
l'activité du descendant tend vers celle du parent.

Nous avons alors dans ce cas particulier:

(44.52)

Donc nous avons pour l'activité en utilisant la relation précédemment démontrée:

(44.53)

Donc:

(44.54)

Nous voyons aussi que dans le cas où et , nous avons:

(44.55)

en d'autres termes, les activités mère et fille, deviennent équivalentes après un certain temps suffisamment
grand. Par exemple, après un temps d'une demi-vie de l'isotope fille, nous avons déjà l'activité fille qui est
égale à 50% de celle de l'activité mère:

(44.56)

Si nous avons le cas où l'approximation suivante est acceptable:

(44.57)

nous aurons alors:

ÉQUILIBRE TRANSITOIRE

Ce type de relation entre activité mère et fille intervient quand la demi-vie du noyau mère est plus grande
que celle du noyau fille (mais pas beaucoup beaucoup plus grand contrairement au cas de l'équilibre
séculaire). En d'autres termes, la décroissance du noyau mère et l'activité des descendants sont égales à un
facteur constant près (en d'autres termes, leurs courbes de décroissance radioactives sont parallèles après un
temps suffisamment long).

Nous avons alors dans ce cas particulier:


(44.58)

Donc nous avons pour l'activité en utilisant la relation précédemment démontrée:

(44.59)

Après un temps suffisamment long il vient:

(44.60)

où nous voyons que le facteur:

(44.61)

et supérieur à l'unité. Donc après un temps suffisamment long, non seulement l'activité de l'isotope fille est
parallèle à celle de la mère mais en plus elle lui est supérieure.

NON-ÉQUILIBRE

Ici le temps de demi-vie de l'élément-fils est supérieur à celui de l'élément mère. En d'autres termes nous
avons l'hypothèse:

(44.62)

L'activité de l'isotope fille croît alors dans l'échantillon suivant la relation démontrée au début:

(44.63)

Finalement, après un temps suffisamment long, seule l'activité de l'élément fille restera, puisque l'activité de
l'élément mère disparaît à un taux plus élevé selon:

Après un temps , l'activité de l'élément fille atteindra une valeur maximale pour:

(44.64)

Soit:
(44.65)

Ce qui se simplifie en:

(44.66)

Il vient alors immédiatement le résultat déjà démontré lors de l'exemple présenté plus haut:

(44.67)

Enfin, considérons le cas extrême de la situation de non-équilibre qui consiste à considérer le cas où:

(44.68)

En d'autres termes que l'élément fille n'est pas radioactif. Nous tombons alors sur le cas classique:

(44.69)

PHÉNOMÈNES RADIOACTIFS

Lorsque nous "pesons" un noyau, nous constatons expérimentale un fait très important!: sa masse est
inférieure à la somme des masses de ses constituants. Cette différence est appelée le "défaut de masse" et est
relativement bien déterminée avec des modèles théoriques simplificateurs..

Le défaut de masse est alors donné par définition:

(44.70)

avec étant la masse du noyau dans son état fondamental, la masse du proton et la masse du
proton.

La masse d'un ensemble de nucléons liés est inférieure à la somme des masses des nucléons isolés
(suffisamment éloignés en tout cas pour ne pas interagir). Nous tirons de la relativité restreinte (voir chapitre
du même nom) que:

(44.71)

où est l'énergie de liaisons des nucléons composant le noyau (>0).

est donc positif pour tous les éléments (émission d'énergie et donc de masse vers le système extérieur).
Si tel n'était pas le cas, les nucléons n'auraient aucune raison de se mettre ensembles afin de former
naturellement des noyaux stables (ou plus stables...).

Soit l'énergie moyenne par nucléon d'un atome donné. Nous avons :
(44.72)

qui est donc par convention un valeur positive!

Remarquons que la masse du noyau est reliée à la masse de l'atome par:

(44.73)

De même, la masse du noyau ajouté à la masse de ses électrons isolés est supérieure à celle du noyau
entouré de son cortège électronique. Notons que l'énergie de liaison électronique peut être souvent négligée
à celle d'origine nucléaire et c'est une règle que nous adopterons tout au long de ce chapitre.

Cette énergie dégagée lors de la fusion, c'est-à-dire lors de la constitution de l'atome à partir de ses
constituants, s'appelle aussi "énergie de liaison" (appellation qui pose souvent des problèmes
d'interprétations aux jeunes étudiants) car c'est elle qu'il faut fournir si nous voulons, en sens inverse, séparer
les éléments. Il ne faut jamais oublier que derrière le terme "énergie de liaison" il y a donc la variation
d'énergie entre les éléments isolés et les éléments combinés d'un élément atomique.

L'expression générale pratique de l'énergie moyenne par nucléon d'un atome donné exprimée en unités de
masse atomique est alors:

(44.74)

Les principes de production d'énergie nucléaire de la fission ou de la fusion résultent de la forme de l'énergie
moyenne par nucléon en fonction de A.

Nous avons en réalité la courbe suivante reliant l'énergie moyenne par nucléon (c'est-à-dire la variation
d'énergie moyenne entre le nucléon seul et accompagné...) et le nombre de nucléons appelée "courbe
d'Aston":

(44.75)

où nous voyons qu'à partir du Fer (élément qui est donc le plus "collé" et le plus stable en termes
énergétiques car ayant la plus forte énergie de liaison moyenne) l'énergie moyenne diminue à nouveau. Cette
diminution étant dûe au fait qu'à partir d'environ 70 nucléons il semblerait que la force électrostatique à
l'intérieur du noyau commence à prendre le dessus sur une autre force qui règne dans les noyaux à très petite
échelle (cette force sera nommée plus tard la "force forte" ou "interaction forte").

Au fait, ce qui est vraiment très important de remarquer dans le graphique ci-dessus c'est qu'il y a un point
de flexion et que c'est celui-ci qui permet d'obtenir de l'énergie aussi bien avec la fusion, qu'avec la fission
nucléaire! Nous voyons également que la variation est beaucoup plus grande sur la gauche que sur la droite,
d'où le fait que la fusion libère des énergies beaucoup plus considérables.

Des phénomènes de radioactivité nous en distinguons 8 dont certains sont qualifiés de "secondaires" car
n'étant que les effets secondaires possibles des 6 premiers. Certains de ces phénomènes sont provoqués par
l'homme, d'autres sont naturels et les autres sont purement probabilistes.

Voici un diagramme représentant en-haut la "vallée de stabilité" des atomes et isotopes et en bas la même
vallée mais mettant en évidence le type de désintégration :
(44.76)

Voyons donc les types de désintégrations ou modifications de la structure de l'atome/noyau qui sont
possibles dans les détails :

FUSION NUCLÉAIRE (1)


Si nous assemblons deux noyaux légers et pour former un atome "lourd" , alors
conformément à la partie gauche de la courbe d'Aston vue plus haut, nous augmentons le défaut de masse
puisque l'énergie moyenne par nucléons augmente. En effet:

- l'énergie de X vaut:

(44.77)

- l'énergie de Y vaut:

(44.78)

- l'énergie de Z vaut:

(44.79)

Comme :

(44.80)

alors :

(44.81)

est strictement positive.

La fusion nucléaire est quasi exclusivement provoquée par l'homme (sur Terre en tout cas... car les étoiles le
font toutes seules). La probabilité d'observer une fusion nucléaire naturelle dans des conditions normale de
température de pression est tellement faible qu'il est inutile d'en parler.

FISSION NUCLÉAIRE (2)

De même, si nous cassons avec des moyens adéquats (souvent avec des neutrons car pour s'approcher du
noyau et vaincre sa répulsion électrostatique c'est le moyen adéquat... c'est celui qu'utilisent les centrales
nucléaires et les bombes nucléaires) un atome lourd en deux atomes légers et
nous augmentons aussi le défaut de masse et l'énergie gagnée vaut:

(44.82)

Que ce soit dans le cas de la fission ou de la fusion, l'énergie dégagée se répartit alors en énergie cinétique
des produits de fission, des neutrons émis et enfin des divers rayonnements.

Remarque: Un atome est dit "fissible" quand il faut des neutrons rapides pour produire la fission et "fissile"
quand il suffit d'avoir des neutrons lents pour la fission (ce qui est plus rare).

L'énergie nucléaire est de loin une forme d'énergie beaucoup plus concentrée, puisque 1 kilogramme
d'uranium naturel fournit une quantité de chaleur de 100'000 [kWh] dans une centrale électrique courante,
alors que 1 kilogramme de charbon fournit en brûlant 8 [kWh]. C'est pourquoi on ne manipule que d'assez
faibles masses de combustible nucléaire pour la production d'électricité: une centrale électronucléaire d'une
puisse de 1000 [MW] électriques consomme par an 27 tonnes d'uranium enrichi, le quart de son chargement,
alors qu'une centrale thermique de même puissance consomme par an 1'500'000 tonnes de pétrole. Pour
comparaison dans le soleil, 1 kilogramme d'hydrogène produit, par réactions nucléaires le transformant en
hélium, 180 millions de kWh! Mais attention, industriellement nous ne savons extraire qu'une faible part de
l'énergie nucléaire emmagasinée dans la matière. Sur les 27 tonnes d'uranium enrichi consommé en une
année par une centrale, seule une petite quantité de noyau a été réellement consommé (d'où la nécessité
économique de retraiter l'uranium après utilisation).

Nous nous rendons vite compte que le pouvoir calorifique de la fission est gigantesque par rapport à celui
des énergies fossiles. Une estimation donne un rapport d'énergie dégagée par atome de 50'000 millions !!!

Nous trouvons pour information en Suisse, rien que 5 centrales nucléaires (au début du 21ème siècle) pour
une population de ~6 millions d'habitants (figure ci-dessous):

(44.83)

Dans le cas de la fission spontanée (ou naturelle) nous avons émission de deux produits de fission et de w
neutrons

Notation:

(44.84)

Exemple:

) (44.85)

DÉSINTEGRATION ALPHA (3)

Définition: Lorsqu'un noyau lourd contient trop de protons et de neutrons (comme l'Uranium 238 par
exemple), il va vider son trop-plein de nucléons en émettant une particule alpha (noyau d'hélium composé de
2 protons et deux neutrons) et le système final qui sera un nouveau noyau aura une masse plus faible et
éventuellement stable. Ce mode de désintégration est la "radioactivité alpha".

La probabilité de désintégration est gouvernée par le mécanisme de barrière de pénétration (effet Tunnel)
comme nous allons le démontrer un peu plus loin après la petite introduction.

La décroissance radioactive selon la radioactivité alpha, peut être schématisée comme:

où (44.86)
Exemple :

) (44.87)

L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse:

(44.88)

avec étant la masse du noyau initial, la masse du noyau final et la masse du noyau d'Hélium.

en négligeant l'énergie de liaison des électrons nous avons :

et et (44.89)

Finalement :

(44.90)

Cette expression montre que l'énergie des particules est bien définie pour des noyaux initiaux et finaux
donnés. De fait, nous observons en réalité un spectre énergétique discret. Nous en concluons que ces
émissions mènent le noyau à des niveaux d'énergies intermédiaires correspondantes à des états excités du
noyau final. Nous pouvons expliquer ces observations par une structure nucléaire en couches. La
désexcitation de se dernier se faisant par émission de photons .

La conservation de l'énergie impose que l'énergie de la désintégration se répartit entre l'énergie cinétique
des deux produits résiduels.

(44.91)

La conservation de la quantité de mouvement nous donne:

(44.92)

et donc:

(44.93)

que nous remplaçons dans l'équation de conservation de l'énergie:

(44.94)

et on en tire que l'énergie de la particule vaut:


(44.95)

vu que les masses du noyau et de la particule sont environ proportionnelles à leurs nombres de masse,
soit A et 4 respectivement.

Voyons les détails du mécanisme de la désintégration avec une approche scolaire, simplifiée à l'extrême
et donc approximative (mais suffisante quand même). Pour cette approche, nous allons utiliser les
développements sur l'effet tunnel que nous avons effectué dans le chapitre de Physique Quantique
Ondulatoire.

Pour des noyaux ayant un nombre de nucléons devenant trop important, la répulsion coulombienne entre
protons prend des valeurs significatives par rapport à l'interaction force qui assure la cohésion du noyau. On
assiste alors au phénomène de saturation, qui donne lieu à la désintégration qui est un cas particulier
d'une fission spontanée.

Gamow a proposé une explication théorique à ce phénomène en 1928. Il suppose que la particule
préexiste dans le noyau et cogne sur les parois. Elle a alors une probabilité non nulle de franchir la
barrière de potentiel du noyau par effet tunnel.

Si par la pensée nous débranchons les interactions coulombiennes, une telle particule est liée au reste du
noyau par un potentiel nucléaire de courte portée et de profondeur correspondant à une énergie potentielle
que nous allons déterminer.

Schématiquement dans le cas de l'Uranium 238 la situation est considérée comme la suivante:

(44.96) Source: Pour la Science

En physique classique on représenterait l'émission comme la fuite du noyau à partir du noyau. Cette
représentation n'est pas valable, car elle implique que la particule , subissant la répulsion électrostatique
du noyau résiduel de Thorium 234 s'en éloignerait avec une énergie d'environ 25 [MeV]. Or on retrouve la
faible valeur observée expérimentalement (de seulement 4.2 [MeV]) qu'en faisant appel à la physique
quantique.
Bon passons à la partie mathématique:

Branchons la répulsion coulombienne entre la particule de charge +2e (deux protons et deux neutrons) et
le reste du noyau, alors de charge +(Z-2)e à l'extérieur du puits de potentiel nucléaire.

Nous obtenons alors l'expression de l'énergie potentielle (cf. chapitre d'Électrostatique):

(44.97)

où r est la distance entre le centre du noyau et la particule . L'énergie potentielle diminue donc avec la
distance puisque la force est répulsive.

Maintenant, ayons une approche qualitative du phénomène. Nous allons maintenant noter la probabilité T de
passage comme étant proportionnelle, selon nos résultats dans le chapitre de Physique Quantique
Ondulatoire, à:

(44.98)

en sachant qu'il s'agit suite à nos approximations à une borne inférieure indicative.

Si nous modélisons la barrière de potentiel du noyau par un profil non rectangulaire tel que présenté ci-
dessous:

(44.99)

où nous remplaçons le profil réel de la courbe par une série de barrières d'épaisseur et où le potentiel est
égal à au point .

La probabilité de passer une barrière sera donc proportionnelle à:


(44.100)

et nous savons (cf. chapitre de Probabilités) que la probabilité de passer une des barrières est un événement
indépendant (mutuellement exclusifs). Nous pouvons donc multiplier les probabilités tel que:

(44.101)

et en passant à la limite il vient:

(44.102)

et si x est assimilé à un rayon d'une configuration à symétrie sphérique:

(44.103)

Dans le cas d'un noyau , la barrière de potentiel va de où elle commence jusqu'à valeur où la barrière
est considérée comme négligeable.

Or, l'énergie potentielle du noyau en tout point distant r du a l'extérieur du bord du noyau de l'atome
radioactif sera égal, comme nous l'avons vu un peu plus haut à:

(44.104)

Nous avons donc pour :

(44.105)

Pour déterminer du noyau émis, il faut savoir que son énergie totale est supposée conservée dans ce
modèle simplifié. Elle est donc la même avant son passage dans la barrière de potentiel nucléaire lorsque
, pendant, et après .

De plus, dans ce modèle, l'énergie cinétique aussi est supposée constante lorsque . Autrement dit,
puisque le noyau préexiste dans le noyau de l'atome radioactif il a déjà la vitesse finale qu'il aura lors du
point de franchissement de la barrière du potentiel nucléaire...

Donc sous toutes ces hypothèses très simplificatrices... si nous savons déterminer l'énergie totale du noyau
en (par exemple), à la sortie de la barrière, nous avons son énergie totale lors de l'ensemble du
phénomène de traversée de la barrière.
Réciproquement, son énergie totale nécessaire pour sortir en de la barrière de potentiel par effet tunnel en
partant du noyau (et partir ensuite loin à l'infini et gagner en énergie cinétique et perdre toute son énergie
potentielle coulombienne) est la même par hypothèse que l'énergie totale obtenue en calculant le travail de la
force qui d'une distance infinie du noyau de l'atome radioactif ramènerait le noyau à la vitesse précitée au
point de sortie minimal (rayon minimal de sortie pris comme constant car très éloigné en ordres de
grandeur par rapport au noyau de l'atome radioactif).

Ce qui correspond alors à la différence d'énergie potentielle entre un point à l'infini et . Et comme
l'énergie potentielle est nulle à l'infini pour un système répulsif, il ne reste plus que le terme:

(44.106)

Et finalement:

(44.107)

valable toujours que pour (c'est comme si pendant la traversée de la barrière, le noyau
restituait de l'énergie cinétique au vide au fur et à mesure de son approche du point , ceci dit, en
mécanique quantique on ne peut pas utiliser l'interprétation de la mécanique classique).

Or, très souvent dans les laboratoires, est exprimé comme une constante suffisamment loin du noyau de
l'atome radioactif. Il est alors relativement naturel (même si c'est du bricolage) de prendre r comme variable
d'intégration tel que:

(44.108)

et il est de tradition de prendre ensuite :

(44.109)

ce qui nous amène à:

(44.110)

Faisons maintenant le changement de variables (la dérivation du est détaillée dans le chapitre de
Calcul Différentiel Et Intégral):

(44.111)
d'où:

(44.112)

et en notant:

(44.113)

L'intégrale:

(44.114)

devient:

(44.115)

Concernant les bornes nous avons pour rappel:

(44.116)

Donc si r vaut nous écrivons la borne comme étant et si r vaut alors:

(44.117)

Il vient alors:

(44.118)

Nous avons vu dans le chapitre de Calcul Différentiel Et Intégral:

(44.119)

Donc:
(44.120)

Alors:

(44.121)

Ce qui fait:

(44.122)

Or, nous avons aussi (cf. chapitre de Trigonométrie):

(44.123)

Donc:

(44.124)

Rappelons à nouveau que:

(44.125)

Or, donc .

Si nous développons en série de MacLaurin (cf. chapitre de Suites et Séries) jusqu'au troisième ordre:

(44.126)

Alors:

(44.127)
Nous avons alors:

(44.128)

Si on prend le développement de MacLaurin au premier ordre:

(44.129)

Donc:

(44.130)

Donc tout cela pour écrire finalement:

(44.131)

Soit explicitement:

(44.132)

Relation à laquelle nous pouvons remettre le coefficient de l'exponentielle que nous avions déterminé dans
le chapitre de Physique Quantique Ondulatoire.

Typiquement pour le noyau d'Uranium , nous prenons les valeurs dans les tables des constantes
physiques et universelles qui sont dans la relation précédente pour obtenir une certaine valeur de T (je
m'abstiendrai de montrer le calcul car les tables ne sont pas toutes d'accord entre elles...).

Ensuite, dans l'approximation semi-classique, le noyau a, dans le puits, une vitesse de l'ordre de:
(44.133)

et il effectue des allers-retours dans un noyau dont le rayon est de l'ordre de .

Ces allers-retours correspondant donc à un certain nombre d'oscillations par seconde. Effectivement, si nous
notons la durée moyenne entre deux chocs successifs, nous avons alors:

(44.134)

Donc la fréquence vaut:

(44.135)

A chaque fois elle a une probabilité T de franchir la barrière de potentiel. Cette probabilité par unité de
temps est ainsi détermine par :

(44.136)

et donne la constante de désintégration de l'isotope par émission avec une relativement grosse erreur si on
fait le calcul avec les valeurs numériques mais l'ordre de grandeur est par contre exact ce qui pas mal du
tout! Le modèle (scolaire) présenté donne donc des résultats satisfaisants.

Ce qui est impressionnant dans ce résultat c'est que puisque T est très très sensible à , les ordres de
grandeurs de varient énormément pour de petites variations de l'énergie. Et le modèle reste aussi
satisfaisant sur environ 30 ordres de grandeurs!!!

DÉSINTEGRATION BETA- (4)

Définition: Lorsqu'un noyau est instable à cause d'un trop plein de neutrons (comme le Carbone 14 par
exemple) il n'émettra pas de neutrons. En revanche il aura la faculté de changer un de ses neutrons en un
proton. Lors de cette transformation, pour conserver la charge électrique totale du système, un électron sera
créé. Cette transformation est la "radioactivité bêta-" (- car l'électron à une charge négative dans cette
désintégration).

La désintégration dite est donc une caractéristique des noyaux ayant un excès de neutrons. Les isotopes
concernés se rendent plus stables en transformant un neutron en un proton avec émission d'un électron et
d'une particule appelée "antineutrino" dont nous justifierons l'introduction plus loin.

Nous avons alors pour le neutron concerné:

(44.137)

Nous avons mis en suffixe droite le spin de la particule concernée et en indice droite le signe de charge de la
particule. Ainsi, nous observons que le spin est une quantité conservée, ainsi que la charge.

Nous avons pour l'isotope concerné:


(ex: ) (44.138)

L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse:

(44.139)

en négligeant l'énergie de liaison des électrons nous avons :

et (44.140)

Attention! le Z dans l'égalité de est le même que celui que nous trouvons dans l'expression de d'où
le Z + 1.

Nous avons alors:

(44.141)

Chaque désintégration pure est caractérisée par une énergie fixe de décroissance Q. Du fait que l'énergie
cinétique du noyau est négligeable de par sa masse à celle du l'électron et de l'antineutrino réunis, l'énergie
dégagée Q est partagée entre les énergies cinétique du et de . La masse de l'antineutrino étant très loin
inférieure à celle de l'électron, l'énergie cinétique de l'antineutrino peut donc être négligée. Ainsi, l'énergie
du n'est cependant pas fixe et peut avoir n'importe quelles valeurs entre 0 et Q. Nous observons donc un
spectre d'énergie contrairement aux autres types de radioactivité (car l'antineutrino peut avoir une énergie
cinétique variable).

La forme des distributions observées permet de donner une valeur d'énergie moyenne aux qui se situe
autour de Q/3:

(44.142)

L'existence de l'antineutrino a été postulée en 1933 (3 ans après le neutrino que nous verrons plus loin) par
Wolfgang Pauli afin de satisfaire la conservation de spin. L'introduction d'une particule aussi étrange fut très
controversée et mal acceptée (charge nulle, spin non nul, masse négligeable) et elle continue à poser
quelques problèmes dans la physique contemporaine du 21ème siècle.

Indépendamment du neutrino d'électron (noté habituellement) accompagnant les particules et (ce


dernier ayant plusieurs noms "positon", "positron", "électron positif") il existe un neutrino de méson ou
appelés: et pour ne pas les confondre. Par la suite, n'étant pas confronté aux neutrinos de méson,
nous noterons simplement à la place de .

Remarque: Au début de sa découverte, la désintégration était vue comme une transmutation du noyau...,
dans les petites classes, encore aujourd'hui, on la voit comme la transformation d'un neutron en proton. Dans
les théories contemporaines, elle est vue comme d'un quark d en quark u et elle a amené les physiciens à
développer la théorie de l'interaction faible pour en expliquer l'origine.

DÉSINTEGRATION B+ (5)
Définition: Lorsqu'un noyau est instable à cause d'un trop plein de protons il n'émettra pas de protons. En
revanche, il aura la faculté de changer un de ses protons en neutron, soit par capture d'un électron,
phénomène appelée "radioactivité par capture électronique" (voir plus bas), soit par émission d'un électron
positif (positon) ce qui correspond à la "radioactivité bêta+".

Cette transformation a une probabilité ridiculement faible puisque l'inverse de l'émission d'un électron et
d'un antineutrino serait la capture simultanée de ces deux particules... et une telle rencontre serait un miracle.
Pour surmonter cette difficulté, le noyau utilise un subterfuge quantique: l'émission d'une particule équivaut
à la capture de sont antiparticule. Ce joker offre alors les possibilités susmentionnées au noyau excédentaire
en protons.

Lors de la désintégration un proton est dissocié en un neutron, un électron positif ("positon" noté et
un neutrino dont nous justifierons l'introduction un peu plus bas) et un neutrino.

Effectivement, pour effectuer l'inverse de la désintégration , la solution consiste pour le noyau à utiliser
la conservation de l'énergie et du spin en émettant un positon et en capturant dans l'énergie quantique du
vide un antineutrino et d'émettre en échange un neutrino.

Nous écrivons cela:

(44.143)

ou:

(44.144)

L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse:

(44.145)

en négligeant l'énergie de liaison des électrons nous avons :

et (44.146)

Attention! le Z dans l'égalité de est le même que celui que nous trouvons dans l'expression de d'où
le

Nous avons ainsi :

(44.147)

La désintégration ne peut donc avoir lieu que si , c'est-à-dire si:

(44.148)

L'énergie massique de l'électron est importante car c'est l'énergie d'un des deux photons résultant
d'une annihilation d'un avec un électron.
Comme pour la désintégration , l'énergie du n'est pas fixe et peut avoir n'importe quelles valeurs
entre 0 et Q. Nous observons donc un spectre d'énergie.

CAPTURE ÉLECTRONIQUE (6)

Définition: Lorsqu'un noyau est instable à cause d'un trop plein de protons par rapport aux neutrons, nous
savons donc qu'une solution favorable du point de vue de son énergie est de transformer un de ses protons en
neutrons c'est à dire de réaliser l'inverse de la radioactivité . Nous avons vu tout à l'heure qu'une
possibilité était pour le noyau via la désintégration d'attraper un antineutrino du vide et d'émettre un
positon (perte de sa charge électrique) et un neutrino. Mais il peut aussi capturer un électron du cortège
électronique (neutralisation de sa charge électrique) en lieu et place d'émettre un positon.

Le plus souvent un électron de la couche K. Ce qui se note :

(44.149)

L'énergie dégagée lors de la transmutation se calcule au moyen du défaut de masse:

(44.150)

en supposant que l'énergie de liaison de l'électron K et celle de recul du noyau sont négligeables.

C'est donc le neutrino d'électron qui emporte tout l'énergie, d'où la nécessité qu'avait eu Wolfgang Pauli
d'introduire cette nouvelle particule (ce qu'il lui avait fait horreur...!). Comme l'électron capturé occupait un
niveau d'énergie précis dans l'atome, les neutrinos issus de la désintégration d'un isotope par capture
électronique ont une énergie déterminée et présentent donc un spectre de raies.

En négligeant l'énergie de liaison des électrons nous avons :

et (44.151)

donc:

(44.152)

La désintégration par capture électronique est en concurrence avec la désintégration que si

(44.153)

Dans le cas où

(44.154)

seule la désintégration par capture électronique est possible.

Cependant, le trou laissé par l'électron absorbé nécessite un réarrangement du cortège atomique et à
l'émission d'un rayonnement.

ÉMISSION GAMMA (7)


Définition: Pour le noyau, l'émission d'un rayonnement électromagnétique est une possibilité de gagner
en stabilité. Cette émission suit généralement un phénomène de désintégration ou de capture
électronique. On peut donc s'imaginer que lors de tels types de désintégration, la topologie des nucléons
dans le noyau n'est pas idéale et que le réarrangement de ces derniers s'accompagnera d'une diminution
d'énergie; cette dernière émise sous forme d'un ou de plusieurs photons .

Nous avons donc un schéma:

(44.155)

puis:

(désintégration ) (44.156)

où le m signifie "métastable" ou "isomère" (on utilise de dernier terme lorsque l'émission du rayonnement à
lieu longtemps après la désintégration).

Remarque: "Isomère" veut dire que le noyau est excité. Il se désexcitera avec une période .
Généralement est extrêmement petit et les photon(s) sont émis immédiatement après l'électron dans le
cas de notre exemple d'une désintégration . Nous parlons alors d'état métastable ou isomère. Notons que
ces radio-isotopes isomères sont particulièrement intéressants en imagerie médicale.

L'énergie du photon vaut:

(44.157)

Il est évident que dans cet exemple, nous avons considéré le cas le plus simple; soit la désexcitation de
noyau en une seule étape avec émission d'un seul photon qui emporte toute l'énergie. De fait, selon le
radio-isotope, cette désexcitation peut s'effectuer avec de plusieurs photons en cascade.

CONVERSION INTERNE (8)

La conversion interne I.C. est un processus lié aussi à l'émission d'un photon . En effet, il se peut que
l'énergie soit transmise directement à un électron du cortège électronique, généralement de la couche K, que
se trouve éjecté de l'atome. Cet électron est appelé "électron de conversion". La place laissée dans le cortège
électronique est par la suite comblée par un électron des couches supérieures et ainsi de suite. On a donc,
comme dans le cas d'un processus de désintégration de capture électronique, un réarrangement du cortège
électronique caractérisé par l'émission de rayons-X caractéristique de l'élément Y.

L'énergie transmise vaut:

(44.158)

avec étant l'énergie cinétique de l'électron émis, l'énergie du photon percutant l'électron, , l'énergie
de liaison de l'électron considéré (K, L, M,...)

L'énergie du photon est transmise directement à un électron qui est éjecté; le processus est suivi du
réarrangement des électrons (s'ensuivra un émission de rayons X). L'électron éjecté est appelé "électron
Auger".
Si nous représentons sur un graphique tous les isotopes avec en ordonnées leur nombre atomique Z et en
abscisse leur nombre de neutron nous pouvons observer que les éléments stables existants dans la nature se
trouvent tous dans la région nommée "vallée de stabilité". Les autres étant radioactifs. Nous pouvons
remarquer que la ligne est située presque partout en-dessus de la zone de stabilité.

Ces résultat ont été obtenus expérimentalement car il est encore aujourd'hui même avec les ordinateurs les
plus puissants et ce en connaissant la théorie quantique, de simuler le comportement de noyaux ayant des
nombres atomiques élevés.

L'émission d'un électron du cortège électronique appelé "électron Auger" est donc un processus similaire au
processus de conversion interne (IC), mais le rayonnement électromagnétique ne provient pas d'une
désexcitation du noyau (ce n'est pas un photon ) mais d'un rayon-X produit lors du réarrangement du
nuage électronique. Dans un processus radioactif, ce réarrangement électronique peut provenir soit d'une
capture électronique EC soit d'une conversion interne (IC).

L'électron Auger éjecté provient principalement d'une orbitale externe et son énergie est l'énergie
caractéristique du rayon-X moins son énergie de liaison. L'énergie des électrons Auger est donc faible
(quelques [keV]) par rapport à une particule ou IC et sont souvent et sont souvent réabsorbés à l'intérieur
de la source. Le processus d'émission d'un électron Auger est favorisé pour des éléments à faible numéro
atomique à cause de leurs faibles énergies de liaison électronique.

Lors d'un réarrangement du nuage électronique tel que le passage d'un électron de la couche Là la couche K,
l'énergie du rayon-X émis vaudra . Cette différence d'énergie étant supérieur à l'énergie de liaison
d'un autre électron se trouvant sur la couche L, ce dernier sera alors émis avec l'énergie cinétique:

(44.159)

A leurs tours, les 2 vacances laissées sur la couche L sont comblées par des électrons des couches
supérieures. Fluorescence et électron Auger sont en compétition. Il se peut même que plusieurs électrons
Auger soient émis lors de la désexcitation de l'atome. On parle alors de "cascade Auger" laissant l'atome
considéré fortement ionisé, ce qui peut le conduire à l'explosion coulombienne de la molécule dont il fait
partie.

RADIOPROTECTION

En physique nucléaire il est très important de connaître la façon dont les divers rayonnements alpha, gamma,
rayons-X ou neutroniques interagissent avec la matière (en gros les rayonnements non chargés ou chargés).
Cela permet de connaître la façon dont leur l'énergie cinétique se répartit ou se dissipe dans la matière qu'ils
rencontrent sur leur chemin et de s'en protéger de façon adaptée.

FORMULE DE BETHE-BLOCH

Une particule chargée lourde ayant une énergie de un ou plusieurs MeV perd son énergie principalement par
collisions avec les électrons des cortèges atomiques, électrons qui lui apparaissent comme quasi-libres. Le
processus par lequel des électrons sont ainsi éjectés lors du passage d'une particule ionisante est appelé
"ionisation primaire". Un électron pourra s'échapper s'il reçoit une énergie supérieure à son énergie de
liaison.

Le transfert maximum d'énergie qui peut se produire dans une collision non relativiste et élastique (où
l'énergie du système est conservée car il n'y a par définition pas de dissipation de chaleur) est calculée
simplement en utilisant le principe de conservation de la quantité de mouvement et l'énergie:
Soit et les masses et vitesses respectives de la particule incidente et de l'électron. Nous
supposerons que l'électron est immobile sur son orbite et que sa vitesse initiale est nulle . Après le
choc, nous supposerons que la particule incidente aura transférée toute son énergie cinétique à l'électron et
se trouvera à son tour au repos tel que .

Posons les équations:

(44.160)

La conservation de l'énergie nous permet d'écrire:

(44.161)

d'où après regroupement et simplification:

et (44.162)

Ensuite, après division de la deuxième équation par la première on déduit l'expression des vitesses après le
choc:

(44.163)

relativement à nos hypothèses initiales nous avons donc :

(44.164)

Manipulons un petit peu cette relation:

(44.165)

Pour une particule lourde, avec , nous pouvons écrire:

(44.166)

Une ionisation ne pourra se produire que si est au moins égale au seuil d'ionisation de l'électron que
l'on notera et que l'on a vue comment calculer lors de l'étude du modèle de Bohr.

L'énergie de la particule incidente devra donc au minimum être égale à:


(44.167)

Donc, lors de son passage à travers la matière, le corps chargé de charge et de vitesse cède son
énergie en de nombreuses collisions avec les électrons des atomes rencontrés. L'interaction est
coulombienne et à chaque fois, une diffusion se produit. L'énergie de recul de l'électron, supposé libre, peut
se calculer de manière précise. Pour faire une estimation de la perte d'énergie, nous ferons ici
l'approximation que la quantité de mouvement transférée est égale au produit de la force d'interaction à
la distance r multipliée par le temps nécessaire au projectile pour parcourir le trajet 2r. Nous avons la force
F de coulomb donnée par:

(44.168)

et la quantité de mouvement:

(44.169)

L'énergie cinétique transférée à un électron de masse sera:

(44.170)

La perte d'énergie totale sera obtenue en intégrant sur tous les électrons rencontrés. A la distance comprise
entre r et r + dr de la trajectoire et sur le parcours dx, se trouvent:

(44.171)

électrons, où N est le nombre d'atomes de nombre atomique Z' par unité de volume. La perte d'énergie par
unité de distance est donc:

(44.172)

La valeur de est évaluée en remarquant que ce paramètre d'impact correspond au transfert d'énergie
maximum. En utilisant les équations que nous avons démontrées précédemment:

(44.173)

Avec , on peut obtenir le paramètre par:


(44.174)

et nous obtenons :

(44.175)

Lorsque r devient très grand, le transfert d'énergie est plus petit que l'énergie moyenne d'ionisation notée
des électrons et le processus n'est plus efficace. Nous devons donc avoir la relation suivante:

(44.176)

Nous en tirons une valeur pour :

(44.177)

En remplaçant les valeurs de et des équations précédentes dans l'équation:

(44.178)

nous obtenons :

(44.179)

Un traitement quantique plus rigoureux montrerait qu'il faudrait supprimer la racine de l'argument du
logarithme en prenant en compte les effets relativistes ainsi que les propriétés intrinsèques de l'électron
(constante de structure fine). Nous obtiendrions alors la formule de Bethe-Bloch:

(44.180)

où . est quant à lui un terme de correction qui dépend de l'énergie et de Z lorsque nous tenons
compte de la structure complète des noyaux (modèle en couche) de la matière.

Nous voyons finalement que la perte d'énergie linéique est proportionnelle au numéro atomique du
rayonnement incident et de la matière pénétrée. Donc, des protections composées de matériaux à numéro
atomique élevés (masse volumique élevée) auront un fort pouvoir de ralentissement et seront avantageux en
radioprotection.

EFFET COMPTON
Au cours de l'effet Compton, le photon est diffusé inélastiquement sur un électron à qui il cède une partie de
son énergie. L'électron est éjecté hors de l'atome. Cet effet a lieu indifféremment sur les électrons de toutes
les couches électroniques et aussi sur des électrons libres. L'énergie du photon et celle de l'électron
dépendent de la direction d'émission de ces particules. Étant donné que cet effet dépend du nombre
d'électrons disponibles par atome cible, la probabilité de diffusion Compton augment linéairement avec le
nombre atomique Z de l'absorbant. Mais comme cet effet est en concurrence avec la production d'une
paireélectron - positron que nous verrons plus loin, l'effet Compton est surtout important aux énergies et aux
numéros atomiques moyens.

Nous avons vu démontré dans le chapitre de Relativité Restreinte, la relation d'Einstein :

(44.181)

et rappelons que nous avons ainsi pour la quantité de mouvement d'un photon :

(44.182)

et nous y avons aussi démontré que la quantité de mouvement est donnée par :

(44.183)

d'où la relation, dont nous allons faire usage plus loin :

(44.184)

Avant l'interaction, photon-électron, nous avons (nous considérons grossièrement l'électron comme étant au

repos) et après la collision . La conservation de l'énergie, nous amène donc à


écrire :

(44.185)

En ne considérant que les énergies cinétiques, nous avons en négligeant celle de l'électron avant le choc :

(44.186)

Soit la figure ci-dessous :


(44.187)

La conservation de la quantité de mouvement nous donne :

Selon l'axe x :

(44.188)

Selon l'axe y :

(44.189)

La somme de ces deux relations élevées au carré nous donne la quantité de mouvement totale :

(44.190)

Puis en substituant :

(44.191)

et comme :

(44.192)

Lorsque l'énergie du photon est assez élevée, , celle du photon diffusé tend vers une limite
donnée par (voir le règle de l'Hospital dans le chapitre de Calcul Différentiel Et Intégral):

(44.193)
L'énergie acquise par l'électron Compton vaut finalement :

(44.194)

Il est intéressant de remarquer que nous ne pouvons avoir . Effectivement cela supposerait que :

(44.195)

et nous voyons bien que quelque soit , nous avons toujours .

La fréquence du photon diffusé est inférieure à celle du photon incident car son énergie est toujours plus
faibles et dons sa longueur d'onde plus grande. Donc :

(44.196)

et puisque :

(44.197)

Nous avons :

(44.198)

ce qui s'écrit aussi en utilisant la définition de la constante de Planck et les relations trigonométriques
habituelles :

(44.199)

Nous appelons la facteur la "longueur d'onde de Compton" et elle vaut :

(44.200)

EFFET PHOTOÉLECTRIQUE
L'effet photoélectrique est l'éjection d'électrons (dits alors "photoélectrons") de la surface de divers métaux
exposée à une énergie de rayonnement. Ce rayonnement peut provenir du réarrangement du noyau de
l'atome aussi bien que d'un rayonnement externe.

Par ailleurs, Einstein proposa d'éprouver la validité de la théorique quantique de la lumière au moyen des
mesures quantitatives de l'effet photoélectrique.

Exposons d'abord l'expérience mise en oeuvre : l'émission d'électrons par un métal ne contredit pas la
théorique électromagnétique de la lumière. Si nous considérons un faisceau uniforme, son énergie est
uniformément répartie sur tout le front d'onde. Plus la lumière est intense, plus grandes sont les amplitudes
des champs électrique et magnétique en chaque point du front d'onde et plus l'énergie transmise par l'onde
en une seconde est grande. Ces champs exercent des forces sur les électrons dans le métal et peuvent même
en arracher de sa surface.

Voici l'expérience mise en place :

(44.201)

Si l'anode collective est à un potentiel positif relativement à la cathode émettrice, les photoélectrons
parcourent le tubent et constituent le courant mesuré par l'ampèremètre. Nous observons alors une
proportionnalité entre l'intensité du faisceau incident et le courant.

Cependant, au moins trois problèmes persistent entre le modèle théorique et l'observation expérimentale:

1. La notion ondulatoire de la lumière ne convient pas pour expliquer le temps nécessaire à l'absorption de
l'énergie d'extraction.

Effectivement, supposons une lampe de 100 [W], rendement lumineux 15% placée à 0.5 [m] d'une plaque
revêtue de potassium K d'énergie d'extraction minimal 2.25 [eV] en admettant un diamètre de pour
l'atome de Potassium.

Nous avons alors :

(44.202)

La puissance lumineuse absorbée par l'atome est alors :

(44.203)
La durée nécessaire pour l'absorption est alors :

(44.204)

Ce qui est en contradiction avec l'expérience où l'on observe que le phénomène est quasi-instantané (le
temps à la lumière pour se propager jusqu'au métal)

2. Si nous inversons les bornes, les électrons émis par le métal sont repoussées par l'électrode négative, mais
si la tension inverse est faible les plus rapides pourront quand même l'atteindre et il se produira un courant.
A un potentiel négatif, spécifique pour chaque métal, appelé potentiel d'arrêt , tous les électrons émis
sont repoussés et le courant est nul. L'énergie cinétique maximale de ces photoélectrons est alors :

(44.205)

Or, nous trouvons expérimentalement que ce potentiel d'arrêt est indépendant de l'intensité du rayonnement.
Dans la théorie ondulatoire, l'augmentation de l'intensité devrait augmenter le nombre d'électrons extraits
(quelque soit leur niveau énergétique) et leur énergie cinétique maximale. Une plus grande intensité suppose
une plus grande amplitude du champ électrique : . Ainsi, un champ électrique plus grand devrait
éjecter les électrons à plus grande vitesse toutes couches confondues au fur à mesure que l'intensité
augmente.

3. Lorsque nous varions la fréquence v de la lumière incidente et que nous mesurons , nous observons
que l'effet photoélectrique n'a pas lieu si ( est appelé le seuil de fréquence) et ceci quelque soit
l'intensité de la lumière. Ce qui est plutôt gênant... parce que dans la théorie ondulatoire, nous devons
toujours pouvoir éjecter des électrons quelque soit la fréquence, il suffit d'augmenter l'intensité.

Chaque problème peut être résolu en adoptant le point de vue suivant :

1. Dans l'aspect ondulatoire, la source est vue comme se propageant comme un front d'onde sphérique dont
la densité superficielle d'énergie décroît comme . Alors que pour expliquer l'observation expérimentale,
il faut voir l'expérience d'un point de vue corpusculaire où le front est un front de corpuscules dont la densité
superficielle de photons décroît en mais où l'énergie de chaque photon reste hv (selon la loi de Planck).

2. Si nous pensons en termes de photons, que nous augmentons l'intensité, nous augmentons le nombre de
photons, mais l'énergie par photon , reste inchangée. Ainsi, que peut avoir chaque photon ne
change pas. D'où le fait que le potentiel d'arrêt est indépendant de l'intensité du champ.

3. Si nous pensons en termes de photons à nouveau, les électrons dans la cible sont retenus par les forces
d'attraction, l'extraction d'un électron de la surface requiert une énergie minimale qui dépend de chaque
matériau ( est aussi appelé "travail d'extraction" qui est de l'ordre de quelques électronvolts). Si l'énergie
du photon incident est supérieure à , un électron peut être arraché, par contre si elle est inférieure,
aucun électron ne peut être arraché. L'apport d'énergie est égal à l'énergie cinétique de sortie de l'électron
plus l'énergie requise pour l'extraire du métal, soit :

(44.206)

Ainsi, si l'on augment la fréquence de la lumière, l'énergie cinétique maximale des électrons augmente
linéairement. R.A. Millikan fit entre 1913-1914 des expériences rigoureuses dont les résultats corroborèrent
parfait la théorie d'Einstein. Ce dernier reçut le prix Nobel en 1921 pour ses apports à la physique théorique,
et surtout sa découverte de la loi de l'effet photoélectrique.

La lumière se propage d'un endroit à un autre comme si elle était une onde. Mais la lumière interagit avec la
matière dans des processus d'absorption et d'émission comme si elle était un courant de particules. C'est ce
que nous appelons la "dualité onde-corpuscule". Ainsi, celle-ci se trouvant dans les particules massives
comme le suggère l'hypothèse de De Broglie que nous avons vue en physique quantique ondulatoire, se
retrouve finalement également pour la lumière

(44.207)

Un photon d'énergie incidente qui interagit avec un électron d'un atome cible peut éjecter cet électron de
son orbite en lui communiquant une énergie cinétique :

(44.208)

où est l'énergie de liaison de l'électron éjecté sur son orbite (cette relation est indiquée sous la forme
dans la figure ci-dessus).

Si l'énergie du photon incident est inférieure à l'énergie de liaison de l'électron K (cf. chapitre de Physique
Quantique Corpusculaire), l'effet photoélectrique se fait avec un électron de la couche L, etc...

Dans le cas ou le rayonnement est absorbé, l'atome est dit "excité", car son état d'énergie n'est pas l'état
minimal. Il s'ensuit donc une "relaxation" (ou "désexcitation") : un électron d'une couche supérieure vient
combler la case quantique laissée vacante par l'électron éjecté.

Si l'énergie de transition est modérée (c'est-à-dire si le rayonnement incident avait une énergie modérée), la
relaxation provoque l'émission d'un photon de faible énergie (visible ou ultra-violet), c'est le phénomène de
fluorescence. Si l'énergie de transition est élevée, on peut avoir deux cas :

(44.209)
1. Il y a émission d'un photon fluorescent, qui du fait de son énergie, est un photon X, nous parlons alors de
"fluorescence X"

2. Ce photon X peut être recapturé par l'atome lui-même et provoquer l'éjection d'un électron périphérique,
c'est "l'émission Auger" dont nous avons déjà parlé plus haut.

Pour résumer, nous avons vu jusqu'ici :

(44.210)

DIFFUSION DE RUTHERFORD

Considérons la diffusion qu'une particule chargée subit quand elle est soumise à une force électrostatique
répulsive inversement proportionnelle au carré de la distance entre la particule mobile et un point fixe ou
centre de force. Ce problème est particulièrement intéressant en raison de son application à la physique
atomique et nucléaire. Par exemple, quand un proton, accéléré par une machine telle qu'un cyclotron, passe
près d'un noyau de la matière de la cible, il est dévié sous l'action d'une force de ce type, provenant de la
répulsion électrostatique du noyau (c'est la raison pour laquelle nous parlons aussi de diffusion
coulombienne).

(44.211)
Soit O un centre de force et A une particule lancée contre O d'une grande distance avec la vitesse (voir
figure ci-dessus). Nous choisirons l'axe des X passant par O et parallèle à . La distance b, appelée
"paramètre de choc", est la distance l'axe X des abscisses et le point A. En supposant que la force entre A et
O est répulsive et centrale, la particule suivra AMB. La forme de la courbe dépend de la manière dont la
force varie avec la distance. Si la force est inversement proportionnelle au carré de la distance, c'est-à-dire si
:

(44.212)

la trajectoire est une hyperbole. Avec bien évidemment (cf. chapitre d'Électrostatique):

(44.213)

Quand la particule est en A son moment cinétique est . Dans une position quelconque telle que M, son
moment cinétique, est (cf. chapitre de Mécanique Classique) aussi donné par . Comme le
moment cinétique doit rester constant puisque la force est centrale :

(44.214)

L'équation du mouvement dans la direction OY est obtenue en combinant l'équation par :

(44.215)

En éliminant à l'aide de l'avant dernière équation nous pouvons écrire :

(44.216)

Pour trouver la déviation de la particule, nous devons intégrer cette équation depuis l'une des extrémités de
la trajectoire jusqu'à l'autre. En A la valeur de est nulle car le mouvement initial est parallèle à l'axe des X
et nous avons aussi . En nous avons et . Remarquons qu'en B la vitesse est de
nouveau car, par symétrie, la vitesse perdue quant la particule s'approche de O doit être regagnée quand
elle s'en éloigne. Alors :

(44.217)

Ce qui donne :

(44.218)

Rappelons (cf. chapitre de Trigonométrie) que :


(44.219)

Ce qui nous donne :

(44.220)

Soit de manière plus détaillée :

(44.221)

Cette relation donne l'angle de déviation en fonction du paramètre de choc b.

Ce qui nous donne aussi :

(44.222)

Bien évidemment, dans les cas scolaires on pose souvent Q=q ce qui simplifie un peu la lourdeur de la
relation mais on perd en généralisation.

Cette équation est appliquée à l'analyse de la déviation de particule chargée par les noyaux. Remarquons que
ce résultant n'est valable que pour une force inversement proportionnelle au carré de la distance. Si la force
dépend de la distance selon une autre loi, l'angle de déviation satisfait à une autre équation. Les expériences
de déviation sont donc très utiles quant nous voulons déterminer la loi de force dans les interactions entre
particules.

(44.223)

Dans les laboratoires de physique nucléaire, on fait des expériences de diffusion en accélérant des électrons,
des protons ou d'autres particules au moyen d'un cyclotron, d'un accélérateur de Van de Graaf ou de quelque
autre dispositif semblable, et en observant la distribution angulaire des particules déviées.

Il est clair qu'une particule incidente dans une surface définie par un rayon comprise entre b et b + db sera
respectivement compris dans l'angle solide de diffusion :
(44.224)

avec (cf. chapitre de Trigonométrie) .

(44.225)

La "section efficace" étant définie par :

(44.226)

En combinant cette relation avec :

, (44.227)

Nous avons donc pour la "section (différentielle) efficace de Rutherford (ou de Coulomb)":

(44.228)

A l'aide de la diffusion de Rutherford/Coulomb, Rutherford a pu déterminer une approximation de la taille


du noyau de l'atome comme nous l'avons fait remarque au début du chapitre de Physique Quantique
Corpusculaire. Le raisonnement appliqué est le suivant pour déterminer une borne inférieure du rayon du
noyau :

L'énergie totale d'un système en rotation est l'énergie cinétique de translation sommée à l'énergie cinétique
de rotation, sommé à l'énergie potentielle. Ce qui nous donne :

(44.229)

en notant L le moment cinétique donné par nous avons :

(44.230)
d'où :

(44.231)

Il en résulte donc :

(44.232)

D'où l'angle associé à deux distance radiales est donné par :

(44.233)

La figure ci-dessous montre un processus de collision par un potentiel centre U(r). La particule incidente
possède une vitesse initiale :

en avec et (44.234)

par symétrie à nouveau.

(44.235)

L'angle est l'angle de déflexion lorsque la particule incidente approche le diffuseur à la distance minimum
.

Revenons-en à nos équations où le moment cinétique est lié au paramètre d'impact par la relation
ou encore :

(44.236)

Nous pouvons donc écrire après simplifications :


(44.237)

où nous avons posé (l'énergie de rotation et du potentiel considérés comme négligeables par rapport
par rapport à l'énergie cinétique) et:

(44.238)

La distance minimale d'approche est donc déterminée par la plus grand zéro du dénominateur :

(44.239)

c'est-à-dire (trivial) :

(44.240)

Nous avons donc :

(44.241)

Comme nous le voyons dans cette dernière relation, la particule incidente subira une collision frontale
lorsque . Dès lors, la valeur de l'approche maximale est :

(44.242)

L'expérience de Rutherford permit d'estimer la taille du noyau atomique. En effet, les particules a qui ont
rebondi sur le noyau avec un angle de diffusion de 180° (nous parlons alors de "rétrodiffusion"), sont celles
qui se sont approchées le plus près de ce dernier. Puisque nous avons :
(44.243)

avec une énergie cinétique initiale de 7.7 [MeV], Rutherford trouva pour le rayon de l'atome d'or (Z=79)
avec des particules alpha (Z=2) une valeur de :

(44.244)

RAYONS-X ET GAMMA

La différence fondamentale de ce type de rayonnement, par rapport aux , est qu'il n'est pas porteur
de charge électrique et n'a donc pas d'interaction coulombienne avec le cortège électronique du milieu
traversé. Par conséquent, le photon suit un chemin rectiligne sans perte d'énergie jusqu'à ce qu'il rencontre
sur sa trace une particule (électron, noyau) où il va faire une interaction modifiant profondément son état.

Le rayonnement gamma est une radiation électromagnétique de haute énergie produite par un phénomène
nucléaire, alors que les rayons-X sont des radiations électromagnétiques de haute énergie produites lors de
phénomènes atomiques ou moléculaires. Le photon est la particule élémentaire qui est associée à ces ondes
électromagnétiques. Les photons gamma et X sont donc de même nature mais d'origines différentes, ils ont
donc des propriétés identiques qui dépendent de leur énergie.

Rappelons que :

(44.245)

En traversant la matière un photon peut interagir avec :

- Un des électrons de l'atome rencontré

- Le noyau de l'atome

- Le champ électrique des particules atomiques chargées

- Le champ mésique des nucléons (interaction forte)

Le résultat de l'interaction peut être schématisé comme :

- le photon est dévié en conservant son énergie, il y a alors "diffusion totale" de l'énergie et le processus est
dit "cohérent" (élastique)

- le photon est dévié et son énergie diminuée, il y a alors "diffusion partielle" de l'énergie, l'autre partie est
absorbée par la matière, les processus est dit alors "incohérent" (inélastique)

- le photon disparaît, il y a "absorption (totale)" de son énergie par la matière.

Nous pouvons démontrer que les caractéristiques macroscopiques de ces interactions dans le cadre d'un
faisceau fin et collimaté conduisent à une loi exponentielle d'atténuation du rayonnement photonique dans la
matière. Cela signifiant que pour les photons il n'y a pas de parcours fini (!) comme pour les particules
chargées; on ne pour jamais assurer qu'à une distance donnée tout les photons d'un faisceau aient subi une
interaction.
Le nombre de particules interagissant avec la matière dépend évidemment de l'intensité I et du type de
matière traversée (caractérisée par le "coefficient d'atténuation linéique" ) et de son épaisseur x.

Nous avons :

(44.246)

le signe "-" étant là pour mettre en évidence une diminution. Nous résolvons facilement cette équation
différentielle (c'est simplement la loi de Beer-Lambert que nous avons déjà vu dans le chapitre d'Optique
Géométrique) :

(44.247)

avec l'intensité initiale ou "débit de fluence" et le coefficient d'atténuation linéique qui tient
compte de toutes les effets d'atténuation possible.

Remarque: Souvent dans les tables, nous trouvons le coefficient d'atténuation massique exprimé en
. Nous avons alors :

(44.248)

Dans le cas d'un absorbant contenant plusieurs éléments chimiques homogènement distribués, le coefficient
d'atténuation vaut :

ou (44.249)

où est le coefficient d'absorption de l'absorbant, le coefficient d'absorption de l'élément i, la masse


volumique de l'absorbant, la masse volumique de l'élément i, étant la fraction massique de l'élément i
dans l'absorbant.

Faisons maintenant un approche microscopique : soit un faisceau de frappant


perpendiculairement la surface d'un matériau d'épaisseur dx et de densité atomique . Si
nous considérons les particules frappant la surface A, ces dernières peuvent théoriquement rencontrer
atomes cibles dans cette couche. Le nombre de particules interagissant sera proportionnel à
l'intensité fois ce nombre et nous aurons :

(44.250)

où est la constante de proportionnalité, appelée "section efficace microscopique". Ces unités sont souvent
exprimées en "barn" ( ).

Remarques:

R1. La densité atomique N est égale à où es la densité en de la cible, le nombre


d'Avogadro ( ) et M est la masse molaire de la cible exprimée en .
R2. Si nous admettons que les centres de diffusion sont les électrons et non pas les atomes cibles, alors il
faut remplacer N par .

D'où nous obtenons :

(44.251)

En identifiant l'aspect macro et microscopique, nous voyons que joue le même rôle que et
que nous trouvons que la section efficace peut s'écrire comme :

(44.252)

et dans l'hypothèse où l'électron constitue une "sphère d'action" présentant une surface frontale , étant
le rayon de la sphère d'action alors :

(44.253)

et nous avons :

(44.254)

Par définition, nous appelons coude de demi-atténuation CDA l'épaisseur du matériau le débit de fluence I
d'un facteur deux. Ainsi :

(44.255)

En radiprotection, nous utilisons parfois la notion de couche d'atténuation aux dixième TVL (Tenth Value
Layer) donnée par :

(44.256)

Nous faisons usage parfois aussi de la "longueur de relaxation", qui représente l'épaisseur à partir de laquelle
l'intensité d'un faisceau monoénergétique est diminuée d'un facteur e, et qui est donc donnée par :

(44.257)

Cette valeur est beaucoup plus utile que les autres car c'est aussi la distance moyenne à laquelle a lieu la
première collision du photon.

Remarque: L'irradiation gamma est anecdotiquement utilisée dans le cadre de la conservation du patrimoine
des objets organiques. Effectivement, lors de la découverte des archéologues d'oeuvres ou vestiges anciens,
ces derniers sont attaqués par des micro-organismes qui vont détruire ces objets avec le temps. Le
rayonnement gamma va permettre, sans détruire les objets, de tuer par irradiation gamma tous ces micro-
organismes. L'exemple le plus connu étant l'irradiation de la momie de Touthankamon pendant 10 heures
dans les laboratoires du CEA.

Les causes microscopiques connues de l'atténuation d'un faisceau de photons (neutre au point de vue
coulombien) qui méritent notre attention dans la détermination de leur dans le domaine d'énergie des
photons gamma ou rayons X sont au nombre de sept :

- Diffusion cohérente de Thomson

- Diffusion cohérente de Rayleigh

- Diffusion cohérente de Delbruck

- Diffusion cohérente de Compton (déjà vu partiellement plus haut)

- Absorption photoélectrique (déjà partiellement vu plus haut)

- Réaction photonucléaire

- Création de paire d'électron-positrons (déjà partiellement vu plus haut)

Bien que nous pussions à ce jour parler de ces effets, il nous est impossible dans l'état actuel du site de
présenter le formalisme mathématique permettant de déterminer la section efficace de chacune des ces
diffusions.

CRÉATION PAIRES ÉLECTRON-POSITRON

Au cours de la création de paires, le photon absorbé dans le champ électrique du noyau peut générer une
paire électron-positron. Pour que l'interaction puisse avoir lieu, il faut que l'énergie du photon soit supérieure
à (1.02 [MeV]), soit l'énergie au repos de la paire électron-positron.

Cet effet est important pour les hautes énergies et les numéros atomiques élevés. Le positron créé est freiné
dans la matière tout comme un électron et, en fin de parcours, il s'annihile avec un électron pour donner lieu
à deux photons de 0.511 [MeV] (photons d'annihilation) émis presque à 180° (tout la quantité de mouvement
est transformée en énergie d'où la valeur de l'angle, ainsi la quantité de mouvement finale est nulle).

La création de paire coûte évidemment au moins l'énergie de masse de l'électron et du positron, soit .
Le solde d'énergie se répartit ensuite dans l'énergie cinétique des deux particules :

(44.258)

La nécessité de satisfaire simultanément aux conditions de conservation de l'énergie masse et de la quantité


de mouvement d'autre part imposent à l'effet de matérialisation d'avoir lieu au voisinage d'une particule
matérielle qui participe au phénomène. En effet, dans le vide, les deux conditions sont contradictoires ! La
quantité de mouvement de chaque électron vaut :

(44.259)
où est l'énergie totale de chacun des électrons, c'est-à-dire :

(44.260)

Le photon d'origine à :

et (44.261)

que nous introduisons dans l'équation de conservation de l'énergie et avec l'aide la relation donnant de
nous avons :

(44.262)

ce qui montre bien que par le terme que le noyau doit emporter une partie de la quantité de
mouvement puisque :

(44.263)
45. PHYSIQUE QUANTIQUE DES CHAMPS

A vant la formulation de la physique quantique, les particules et les champs étaient considérés comme des
entités distinctes mais liées; les particules possèdent certaines caractéristiques intrinsèques (comme la masse
et la charge électrique) et produisent les champs (gravitationnels et électromagnétiques). Chaque champ de
force émane des particules et remplit l'espace autour d'elles. Les champs emmagasinent et peuvent
transporter de l'énergie; ils sont, en ce sens, des milieux continus réels qui lient les particules et
communiquent les interactions entre elles. On considérait que les particules étaient composées de matière et
les champs étaient composés d'énergie. La notion de champ de force était l'alternative du 19ème siècle à
l'ancienne action à distance assez mystérieuse. Des particules qui ne réagissent à aucun champ de force ne
sont pas observables et physiquement n'ont aucun sens. De même, des champs de force qui n'agissent pas sur
aucune particule sont également sans signification. Les notions de particules et de champs n'ont donc un
sens que lorsqu'elles sont reliées.

La notion de champ a commencé à être modifiée fondamentalement avec l'introduction par Albert Einstein
du concept de photon. Selon cette nouvelle conception, le champ électromagnétique n'a pas son énergie
distribuée d'une façon continue dans l'espace. Le photon est le "quantum du champ électromagnétique". Il
transporte l'énergie et la quantité de mouvement du champ. L'interaction électromagnétique de deux
particules chargées et le transfert de l'énergie et de la quantité de mouvement d'une particule à l'autre doivent
avoir donc lieu par l'échange des quanta d'énergie électromagnétique, les photons. La théorie de telles
interactions (entre particules chargées), appelée "électrodynamique quantique" (Q.E.D.), a été la première
application réussite de ces idées (elle permet de démontrer la structure fine du modèle de Sommerfeld,
expliquer le spin de l'électron..) et c'est à elle que nous allons nous intéresser ici.

Remarque: La théorie quantique des champs est l'application de la mécanique quantique aux champs. Elle
fournit un cadre largement utilisé en physique des particules et en physique de la matière condensée. Les
bases de la théorie quantique des champs furent développées entre 1935 et 1955, principalement par Paul
Dirac, Wolfgang Pauli, Sin-Itiro Tomonaga, Julian Schwinger, Richard Feynman, et Freeman Dyson.

Avant de nous lancer dans des calculs complexes (voir plus loin), montrons que l'approche proposée
précédemment peut-être considérée à l'aide d'un formalisme fort simple comme exploitable. Considérons à
ce titre la figure ci-dessous (représentation de la collision élastique de deux électrons) :

(45.1)

Cette figure est appelée un "diagramme de Feynmann" (nous n'allons pas plus dans les détails
mathématiques pour l'instant). Supposons que les deux électrons se déplacent initialement à la même vitesse.
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
Ils s'approchent d'abord puis s'éloignent l'un de l'autre le long d'une droite dans l'espace qui est projetée sur
l'axe des temps, dans le sens des temps croissants. L'électron à gauche émet un photon (la ligne ondulée), et
pendant un certain temps , il y a deux électrons et un photon. L'électron à droite absorbe ensuite le photon
et l'interaction est momentanément terminée; d'autres photons feront par la suite l'aller et retour entre les
électrons. La force moyenne est proportionnelle au taux de transfert de la quantité de mouvement due à
l'échange des photons. La probabilité de l'émission ou de l'absorption de photons par une particule est reliée
à sa charge. La force doit donc être proportionnelle au produit des charges en interaction (en accord avec la
loi de Coulomb). Pensez à la force de répulsion entre deux astronautes flottant dans l'espace et échangeant
une balle dans un sens puis dans l'autre. Cependant, le phénomène inverse d'attraction ne peut être visualisé
de cette manière mais uniquement sous forme mathématique formelle.

La collision présentée dans la figure ci-dessus est élastique; l'énergie de chacun des électrons est inchangée
dans la collision. Malgré cela, pendant un temps , le système contient une quantité d'énergie
supplémentaire hv correspondant au photon. Pendant ce temps , la conservation de l'énergie est
apparemment violée! Peut-on tolérer cette situation? La réponse, donnée par la physique moderne, est oui;
mais elle ne peut jamais être observée. Autrement dit, il y a toujours une certaine incertitude sur la
valeur mesurée de l'énergie d'un système. Le principe d'incertitude de Heisenberg impliquant (voir
démonstration dans le chapitre de Physique Quantique Ondulatoire) que :

(45.2)

Une violation de la loi de conservation de l'énergie jusqu'à une quantité sera cachée par l'incertitude sur
l'énergie à condition que le temps disponible pour faire l'observation soit suffisamment grand tel que

(45.3)

évidemment une valeur inférieure à satisfait également la condition. Nous pouvons donc écrire:

(45.4)

L'incertitude sur l'énergie dépasse l'énergie d'un photon d'énergie hv si le photon existe pendant un temps
plus court que:

(45.5)

Ce photon est alors observable sur une distance maximale de :

(45.6)

et comme la fréquence peut être arbitrairement petite, la portée de la force transmise par le photon sans
masse est illimitée. Il peut paraître dans cette relation que la portée est limitée pour un photon libre. Mais ce
serait oublier (cf. chapitre de Physique Quantique Ondulatoire) qu'un photon libre n'existe pas car il aurait
une fréquence totalement indéterminée. Donc la distance d'interaction le serait aussi.

Ces quanta d'échanges, qui sont inobservables, sont appelés des "photons virtuels". Comme les photons ne
sont pas chargés nous disons aussi que l'interaction s'effectue par "courant neutre".

Une approche beaucoup plus satisfaisante et celle qui consiste à utiliser la masse comme terme d'énergie:
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
(45.7)

à l'aide de cette relation, il est possible de connaître le temps pendant lequel une particule virtuelle peut
parcourir une distance qui correspondrait à :

(45.8)

Nous verrons plus loin comment déterminer approximativement la masse des particules virtuelles qui
interviennent dans les forces nucléaires ce qui nous permettra d'estimer la durée des interactions comme
étant de l'ordre de .

Vers la fin des années 1920, il était devenu clair qu'on pouvait considérer chacune des particules connues
(proton, électron, etc.) comme le quantum d'un champ spécifique. Dans cette vision, il y a un champ
d'électron, un champ de proton, et ainsi de suite comme nous le démontrerons plus loin (l'Univers serait
donc un ensemble de champs unifiés). Un objet quelconque est en réalité un ensemble de manifestations
observables des quanta des champs.

Par ailleurs, nous avons vu que l'écriture des équations d'onde pour des particules relativistes (équation de
Dirac et équation de Klein-Gordon vue en physique quantique relativiste) amènent des problèmes insolubles
classiquement, notamment des énergies négatives. En fait, cette approche n'est pas justifiée car d'après
l'équation d'Einstein masse et énergie sont équivalentes et si l'on rajoute à cela le principe d'incertitude
d'Heisenberg énergie-temps nous constatons qu'un nombre infini de particules peuvent être créées ou
annihilées, d'où la nécessité d'un modèle ne prenant plus en compte les propriétés d'une seule particule mais
d'un ensemble de particules, aussi bien réelles que virtuelles.

Remarque: Quand Fermi formula sa théorie des interactions faibles en 1932, il la fonda sur les mêmes
principes que l'électrodynamique quantique (c'est une des raisons pour laquelle la QED est appelée "bijou de
la physique" - le modèle standard est calqué sur cette théorie par ailleurs). Deux ans plus tard, le physicien
japonais H. Yukawa proposa que l'interaction faible était due à l'échange d'un boson virtuel massif.

POTENTIEL DE YUKAWA

Le meilleur pour argumenter l'exemple des quantums reste la "démonstration" de la loi de Coulomb (et de
Newton) à partir des résultats que nous avons obtenu en physique quantique ondulatoire (nous devons ces
développements à Yukawa).

Soit l'équation de Klein-Gordon libre (cf. chapitre Physique Quantique Ondulatoire):

(45.9)

cette équation décrit la dynamique d'amplitude de présence d'une particule sans spin dans le temps dans un
potentiel donné.

Considérons une composante de statique (indépendante du temps) à symétrique sphérique:

(45.10)

L'équation de Klein-Gordon se réduit alors à:

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.11)

Si nous divisons des deux côtés de l'égalité par :

(45.12)

Rappel (cf. chapitre de Calcul Vectoriel) de notation du Laplacien du champ scalaire:

(45.13)

et soit son expression en coordonnées sphériques où est identifié à l'origine du champ (cf. chapitre de
Calcul Vectoriel):

(45.14)

Comme le champ U(r) est à symétrie sphérique (dépendant de r uniquement) le Laplacien se réduit à:

(45.15)

Donc l'équation du champ U(r) s'écrit:

(45.16)

Cette équation différentielle à pour solution (on devine assez facilement que l'exponentielle est une solution
possible):

(45.17)

où C est une constante d'intégration.

Dans le cadre de l'utilisation des unités naturelles (ce qui est le plus fréquent à ce niveau dans la littérature
scientifique) ce potentiel s'écrit :

(45.18)

et se nomme "potentiel de Yukawa".

Le lecteur remarquera que mise à part la distance r, l'autre variable dans l'exponentielle est la masse (les
autres termes étant des constantes universelles). Conséquence : le potentiel de Yukawa est aussi bien un
"champ scalaire" dans le cas où la masse est nulle (voir l'exemple ci-après) qu'un "champ massique" dans le
cas où la masse est non nulle !

Cela nous amène à l'hypothèse suivante : si c'est le champ électrique qui maintient les particules chargées
entre elles dans l'atome (voir le traitement du champ non-massique ci-dessous), c'est le champ massique qui
maintient les particules non chargées entre elles dans l'atome.
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
Autrement dit, si des particules interagissent par l'intermédiaire d'un champ massique de masse (au lieu
d'interagir avec des photons de masse nul), leur force mutuelle va décroître exponentiellement (ce qui est
très rapide).

CHAMPS MASSIQUES

Le physicien H. Yukawa proposa donc en 1935 que la force nucléaire devait sa très courte portée au fait
qu'elle était transmise par des particules massives (plus la masse du quanta échangé est grande plus la portée
de l'interaction est réduite), décrites par le champ massique ci-haut.

Remarque: Dans le cadre historique de l'époque ces particules hypothétiques étaient les "mésons". Mais
nous verrons que cette hypothèse ne tiendra pas la route très longtemps.

Voyons cela de plus près. Notons le potentiel de Yukawa sous la forme suivante :

(45.19)

avec :

(45.20)

Cette notation n'est pas innocente car comme nous le verrons en détails plus loin, lorsque (cas de
l'interaction électromagnétique et gravitationnelle) alors et nous retrouvons alors la loi
fondamentale de l'électrodynamique ou de la gravitation où la particule d'interaction est le photon (masse
nulle) pour la première et respectivement le graviton pour la deuxième.

Ainsi, en supposant que le rayon de l'interaction nucléaire forte (cohésion des nucléons entre eux) est
et celui de l'interaction nucléaire faible (qui serait à l'origine de la désintégration bêta
comme nous l'avons précisé dans le chapitre de Physique Nucléaire) , nous avons alors les
énergies de liaisons des interactions ainsi leur masse approximative immédiatement :

- Pour "l'interaction nucléaire forte" :

(45.21)

soit environ 220 fois la masse de l'électron et 1/9 de la masse du proton.

Deux ans après cette prédiction de Yukawa, les physiciens découvrirent une particule correspondant à cette
masse : le méson . Il s'avérera plus tard que ce n'était pas la bonne particule mais une particule de même
type que l'électron, soit un lepton et donc un fermion (ce ne peut donc être une particule messagère). De
plus, les expériences de diffusions et de collisions avec des protons, deutérons, etc... à des énergies de plus
en plus hautes ont montrées qu'il y avait une modification de l'intensité/forme de l'interaction forte
incompatible avec l'hypothèse d'un seul méson. De plus les résonnances hadroniques montraient qu'il
existait des états excités des mésons ce qui est difficile à imaginer pour des particules considérées comme
fondamentales en analogie avec le photon!!
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
Les particules détectées dans les laboratoires et qui semblaient être les meilleures candidates à l'époque (car
il y en avait plusieurs...) de l'interaction nucléaire forte étaient les "pions" (ou "mésons pi") qui se présentent
sous trois formes :

(45.22)

et qui sont 270 fois plus massifs que l'électron. Donc cette différence de masse indique bien que le modèle
de Yukawa n'est pas tout à fait exact.

Avant la découverte des quarks (dont sont constitués les mésons), les mésons étaient donc considérés
comme les vecteurs de l'interaction forte.

- Pour "l'interaction nucléaire faible" :

(45.23)

Il s'agit donc d'une masse colossale, une centaine de fois la masse du proton! Les vecteurs d'interactions ont
des candidats qui ont été mis en évidence en 1983 dans les accélérateurs du CERN. Ces particules
messagères de l'interaction nucléaire faible se nomment les "bosons intermédiaires" .

Ces observations amenèrent l'hypothèse que la théorie de Yukawa n'était pas une théorie assez fondamentale
quoiqu'elle représente bien certaines de ses propriétés...

CHAMPS NON-MASSIQUES

Imaginons maintenant un champ scalaire à symétrique sphérique statique, dont le photon (particule sans
spin) est l'hypothétique quantum d'échange.

Comme la masse du photon est nulle, l'expression de U(r) se réduit à:

(45.24)

Si nous interprétons U(r) comme le potentiel électrostatique source d'une quantité de charges
élémentaires q alors la constante C dans notre système métrique vaut:

(45.25)

Tel que:

(45.26)

Comme nous avons:

(45.27)
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
Il en découle:

(45.28)

Ce qui nous donne:

(45.29)

Conclusion: Si un particule se trouve dans un champ de potentiel à symétrique sphérique U(r) dont le photon
est supposé être initialement le quantum d'interaction alors nous avons affaire à un champ électrostatique
dont l'expression est identique à la loi Coulomb (ceci valide donc encore une fois de façon magistrale la
théorie de la physique quantique ondulatoire).

Remarque: Le photon est donc bien le quantum d'interaction du champ électrique à symétrie sphérique
(lorsque les charges ont une vitesse relativiste le champ électrique n'est pas à symétrie sphérique et les
équations deviennent un peu plus compliquées - voir le chapitre de Relativité Restreinte) et nous ne devrions
plus parler de charge électrique mais de "transparence" aux photons. Effectivement, le neutron étant neutre
globalement celui-ci ne devrait pas interagir avec le champ électrique, mais comme il est composé de
particules chargées (les quarks) les expériences mettent en évidence une affluence en présence du champ
électromagnétique (dont le photon est le quantum d'interaction).

Ceci dit, en appliquant le même raisonnement nous pouvons de même retrouver le potentiel gravitationnel
de Newton :

(45.30)

Ce qui impliquerait que le quantum d'interaction du champ gravitationnel est aussi sans masse (dans le cas
des petites masses du moins étant donné que nous savons que le potentiel de Newton n'est qu'une
approximation de la relativité générale dans le cas des petites masses) et sans spin. Etant donné que le
champ gravitationnel ne semble pas interagir avec la présence d'un champ magnétique ou électrostatique,
cela nous amène à émettre l'hypothèse que le quantum d'interaction n'est pas le photon et à supposer qu'une
autre particule, que nous appellerons "graviton", en est le messager.

ÉQUATION D'EULER-LAGRANGE DES CHAMPS

La façon dont la théorie des champs fut introduite à partir des particules élémentaires par Dirac est connue
pour des raisons historiques sous l'appellation de "deuxième quantification".

Il est peut-être utile de mettre en évidence une possible source de confusion : les champs ne sont pas liés à la
dualité onde-corpuscule. Ce que nous entendons par "champ" est un concept qui permet la création ou
l'annihilation de particules en tout point de l'espace comme nous le verrons dans les développements
mathématiques.

Rappelons que nous avons défini en physique quantique ondulatoire lors de l'étude de l'équation d'évolution
de Schrödinger l'opérateur d'Heisenberg, nécessaire à la condition de normalisation de De Broglie :

(45.31)

En dérivant cet opérateur par rapport au temps, nous avons trivialement :

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.32)

où rappelons-le, le commutateur de deux opérateurs est donné (comme nous l'avons déjà vu lors de notre
étude des opérateurs adjoints et hermitiques en physique quantique ondulatoire) par définition par :

(45.33)

C'est l'hamiltonien H qui fait interruption en premier dans la relation précédente. Mais nous pouvons tout
aussi bien lui substituer un hamiltonien dépendant du temps H(t) tel que:

(45.34)

Maintenant, nous pouvons substituer par des observables connus tels que:

(45.35)

dites "équations du mouvement de Heisenberg". Ce qui est intéressant dans les deux relations obtenues
précédemment, c'est la façon avec laquelle se réalise la jonction entre la physique quantique et la mécanique
classique. Effectivement, nous avions démontré au chapitre de Mécanique Analytique que les relations ci-
dessous sont et seront toujours valables quelque soit le domaine étudié :

(45.36)

ainsi que :

(45.37)

et:

(45.38)

La généralisation à plusieurs degrés de liberté est immédiate et nous donne l'ensemble les relations (nous
allégeons les écritures en omettant l'écriture de la dépendance à la variable temporelle):

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.39)

Nous avons encore besoin de deux autres relations importantes que nous allons de suite déterminer. D'abord,
d'après les définitions des commutateurs, il est inutile de démontrer que (trivial) :

(45.40)

Par contre, il est un peu plus subtil de démontrer la valeur de (nous plaisantons...). Rappelons que
nous avions démontré lors de notre étude des opérateurs linéaires fonctionnels que (nous nous restreignons
au cas de la coordonnée x ici):

(45.41)

et que q représente une coordonnée généralisée (x par exemple...). Nous avons donc (résultat déjà démontré
dans le chapitre de Physique Quantique Ondulatoire...):

(45.42)

Les deux dernières relations peuvent être généralisées à toutes les composantes voulues telles que:

(45.43)

avec rappelons-le (cf. chapitre de Calcul Tensoriel):

(45.44)

qui est le symbole de Kronecker.

Pour en arriver enfin à la théorie quantique des champs, il nous faut encore généraliser à une infinité
continue de degrés de liberté. En effet, même le plus simple des champs est caractérisé, à un instant t, par
une infinité continue de quantités :

(45.45)

pout tout . Nous pourrions donc imaginer représenter la fonction par ses valeurs en un
ensemble discret de points que nous rendrons en fin de compte infiniment dense (prenez garde au fait que
nous utilisions la notion de densité !). Nous pouvons aussi travailler, pour commencer, non pas dans tout
l'espace, mais dans un volume fini que nous finirons par rendre très grand. En procédant ainsi, nous pouvons
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
trouver comment généraliser le formalisme canonique et le processus de quantification. Au niveau formel,
nonobstant de subtiles questions de convergences (voir les parties mathématiques du site), la généralisation
aux systèmes continus consiste principalement à remplacer les sommes sur des indices n par des intégrales
sur des arguments , et les deltas de Kronecker par des deltas de Dirac (sur l'espace-temps) :

(45.46)

En considérant alors le principe variationnel comme nous l'avons étudié en mécanique analytique:

(45.47)

et le principe de moindre action nous imposant :

(45.48)

où le lagrangien sera maintenant une fonction du champ et de dérivée par rapport au


champ (puisqu'il n'y a pas de notion de quantité de mouvement pour un champ !).

Si nous divisons la relation précédente par nous obtenons :

(45.49)

ce qui nous donne le droit d'écrire:

(45.50)

et en imposant une analogie avec un concept de champ :

(45.51)

où et .

Finalement, comme tous les termes suivants sont nuls, ils sont égaux (nous faisons intervenir l'équation
d'Euler-Lagrange démontrée en mécanique analytique) :

(45.52)

en analogie avec le champ nous obtenons:

(45.53)
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
Cette écriture étant peu commode, on prend pour habitude décrire les différentielles partielles (en utilisant
les unités naturelles de la physique) aux composantes sous la forme ce qui nous
donne finalement :

(45.54)

et qui nous amène aussi à écrire le principe de moindre action sous la forme suivante :

(45.55)

Avec l'action des champs notée plus traditionnellement :

(45.56)

ou encore pour différencier lagrangien et densité lagrangienne (nous "stylisons" parfois de le L):

(45.57)

à comparer à l'action de la particule :

(45.58)

En analogie avec nous écrirons:

(45.59)

et en analogie avec nous écrirons :

(45.60)

mais un champ est un milieu continu. La somme sigma n'est donc plus adaptée et il faut passer à une
intégration sur tout l'espace-temps telle que:

(45.61)

En analogie avec les équations du mouvement de Heisenberg, nous écrivons:

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.62)

Passons maintenant à la théorie quantique en postulant des champs d'opérateurs de Heisenberg


correspondants. Rappelons que nous avions obtenu plus haut que:

et (45.63)

ce qui nous donne:

et (45.64)

Si nous résumons un peu le tout et que nous affichons la comparaison avec la physique quantique
ondulatoire, nous avons finalement :

1. En physique quantique ondulatoire (c'est joli à regarder non?) :

(45.65)

2. Et l'équivalent en physique quantique des champs (alors là... ça devient de l'art!) :

(45.66)

Et le tour est joué! Nous venons de passer les paramètres de la physique quantique où les corps ponctuels
sont décrits par des fonctions d'onde, à une physique quantique ou les corps ponctuels deviennent des
champs continus.

Il ne reste plus qu'à appliquer ce schéma général à des exemples concrets :

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


Nous allons commencer par un premier exemple en tenant compte de l'aspect relativiste. Ainsi, la densité
lagrangienne non triviale que nous puissions construire est de la forme (vous allez de suite voir à quoi elle
va mener, ce qui confirmera sa validité - par ailleurs, le développement qui va suivre aurait très bien pu être
présenté dans l'autre sens) :

(45.67)

que les physiciens appellent "champ scalaire pour une particule libre et sans spin" ou "lagrangien de Klein-
Gordon" pour une particule sans spin où nous utilisons les notations condensées habituelles :

(45.68)

et les unités naturelles :

(45.69)

calculons l'équation d'Euler-Lagrange y relative (trivial):

(45.70)

d'où l'équation du mouvement :

(45.71)

Rappelons qu'en physique quantique ondulatoire nous avions obtenu pour l'équation de Klein-Gordon libre :

(45.72)

En adoptant les unités naturelles, nous avons donc :

(45.73)

et en travaillant dans l'espace de Minkowski comme cela se fait souvent en relativité tel que :

(45.74)

L'équation de Klein-Gordon libre s'écrit alors :

(45.75)

Nous avons donc finalement à comparer l'équation du mouvement du champ et l'équation de Klein-Gordon
libre :

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


et (45.76)

et c'est ici qu'on peut éventuellement ressentir un frisson dans le dos et rester admiratif face à la puissance du
formalisme mathématique ouvrant de nouvelles perspectives sur la manière de voir les rouages de
l'Univers....

Et encore... mieux...vous allez voir, nous allons le faire un peu à l'aveugle et... alors là ! Considérons
maintenant le lagrangien suivant (que nous supposerons obtenu par bricolage successifs... mais à nouveau
nous aurions pu faire le développement dans l'autre sens) se voulant exprimer "l'interaction d'un champ
électromagnétique avec une densité courant" :

(45.77)

où nous y reconnaissons les tenseurs du champ électromagnétique démontrés et déterminés dans le chapitre
d'Électrodynamique et pour lesquels, rappelons-le :

(45.78)

Dans ce lagrangien, traitons le potentiel vecteur comme le champ tel que :

(45.79)

Dès lors en décomposant les développements, nous obtenons très facilement :

et et (45.80)

Dans un premier temps, le lecteur vérifier en faisant un peu de calcul tensoriel élémentaire que :

(45.81)

Puis :

(45.82)

Dès lors, l'équation du champ s'écrit :

(45.83)

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


d'où :

(45.84)

Aïe que c'est beau mais que c'est beau!!! Nous retrouvons donc l'équation de Maxwell avec sources avec le
même lagrangien du champ (cf. chapitre d'Électrodynamique). Ainsi, ce lagrangien sans masse est assimilé
au lagrangien du champ vectoriel de spin 1 assimilé aux bosons.

Rappelons maintenant que nous avions obtenu dans le chapitre d'Électrodynamique l'action suivante pour
une particule chargée dans un champ électromagnétique (avant un long développement qui nous avait amené
au tenseur du champ électromagnétique) :

(45.85)

et en se rappelant que (cf. chapitre d'Électrodynamique) :

(45.86)

il vient :

(45.87)

Donc la densité lagrangienne correspondante est donc :

(45.88)

Nous avons donc finalement :

1. Le lagrangien (densité lagrangienne) d'une particule chargée dans un champ électromagnétique (que nous
venons d'obtenir) :

(45.89)

2. Le lagrangien (densité lagrangienne) de tout à l'heure (qui nous a permis de retomber sur les équations de
Maxwell sans source) :

(45.90)

Remarque: Attention, par construction, ce n'est pas un problème de retomber seulement sur les équations de
Maxwell sans sources avec ce lagrangien car implicitement, le tenseur sous-tend toutes les équations de
Maxwell comme nous l'avons vu en électrodynamique et sa présence dans le lagrangien suffit donc à ce que
toutes les propriétés du champ électromagnétique soient pris en compte.

Dès lors, il est naturel d'écrire le "lagrangien (densité lagrangienne) total du champ électromagnétique" :

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.91)

Continuons maintenant notre bonhomme de chemin avec l'équation de Dirac libre! Rappelons que nous
avions obtenu dans le chapitre de Physique Quantique Relativiste l'équation de Dirac libre sous la forme
(fondamentalement rappelons qu'il s'agit d'une équation relativiste) :

(45.92)

Maintenant rappelons (cf. chapitre d'Algèbre Linéaire) que . Dès lors, il vient :

(45.93)

Or, et il est super facile de vérifier (ne pas oublier que nous utilisons la forme représentative de
Dirac des matrices de Pauli !!!) ce qui nous amène à écrire :

(45.94)

Il est alors commode d'introduire "l'adjoint de Dirac" :

(45.95)

Remarque: Rappelons que est une matrice colonne et une matrice ligne. Il vient donc que est aussi
une matrice ligne!

Utilisant le fait que dans la représentation de Dirac nous pouvons écrire :

(45.96)

en simplifiant les il vient l'équation de Dirac libre adjointe :

(45.97)

Ce que nous notons traditionnellement:

(45.98)

La notation signifiant que l'opérateur opère sur vers la gauche tel que :

(45.99)

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


Remarque: Certains auteurs écrivent mais ceci est faux car est une matrice ligne comme
nous l'avons fait remarquer plus haut!!!

Finalement nous avons pour les équations de Dirac libres:

(45.100)

Supposons maintenant que le "lagrangien du champ spinoriel de Dirac libre" soit de la forme (parce que
finalement c'est le lagrangien qui nous intéresse) :

(45.101)

où nous avons posé . Il s'agit donc du lagrangien du champ spinoriel pour les particules de spin
1/2 qui sont donc des fermions libres.

En considérant les quantités comme indépendantes (c'est ce qu'elles sont de toute façon puisque
orthogonales) et choisissant le champ spinoriel comme , nous avons :

(45.102)

Le deuxième terme est nul puisque le lagrangien de Dirac ne contient pas de termes en . De fait il reste
:

(45.103)

Nous retombons donc bien sur l'équation de Dirac libre (le même développement pouvant être fait pour
l'équation de Dirac libre adjointe)! Ainsi, dans ce cadre, la seule manière d'expliquer les propriétés
quantiques de la matière comportant des particules avec spin est de faire intervenir des champs
représentant des particules chargées électriquement, les électrons et positrons comme nous le savons.
Nous appelons alors ces entités des "champs (spinoriels) de Dirac".

THÉORIES DE JAUGE

Nous allons voir maintenant une approche simple d'un outil qui a révolutionné l'approche de la physique
moderne des particules au milieu du 20ème siècle et qui a valu plusieurs prix Nobel a ceux qui y ont
contribué.

Nous conseillons très fortement avant de lire ce qui va suivre que le lecteur aille jeter aussi un coup d'oeil
préalable sur le sous-chapitre de théorie des Jauges du chapitre d'Électrodynamique car c'est un premier
exemple d'une invariance de jauge faisant apparaître un champ (le potentiel vecteur) indispensable pour
expliquer certains phénomènes à l'échelle quantique comme l'explicite clairement l'équation de Pauli (cf.
chapitre de Physique Quantique Relativiste).

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


Depuis le début des années 80, les magazines de vulgarisation parlent beaucoup en physique quantique des
théories de jauge. Les interactions électromagnétiques et les interactions faibles sont décrites conjointement
par une théorie de jauge élaborée par Glashow, Weinberg et Salam. Les interactions fortes semblent aussi
correctement décrites par une théorie de jauge. C'est dans le cadre de ces théories de jauge que les
physiciens théoriciens tentent d'unifier les diverses interactions fondamentales de la nature. Il convient donc,
même dans un site qui traite de manière élémentaire de physique quantique, de parler de théorie de jauge
dans le cadre de ce domaine.

Pour ce faire, nous considérerons déjà comme connu le contexte qui mena à la découverte de l'invariance de
jauge dans le cadre de l'électrodynamique (voir chapitre du même nom pour les détails) et ferons un
rapprochement avec certains développements vus dans le chapitre de Relativité Générale et le rôle qu'a joué
Weyl dans la mise en évidence des principes fondamentaux d'une théorie de jauge.

Rappelons que la relativité restreinte et générale reposent sur le postulant qu'il n'existe dans l'univers aucun
référentiel absolu. Nous avons vu dans le chapitre de Relativité Restreinte en long et en large que les
relations qui permettent de passer les lois de la physique d'un repère à l'autre ne dépendent que da la vitesse
relative entre les référentiels. Ainsi, la relativité restreinte est une théorie à symétrie globale. Nous avons
également vu en long et en large dans le chapitre de Relativité Générale que la connexion affine est le lien
entre les référentiels de la théorie locale (approximation des champs faibles) qu'est la relativité générale.

En 1919 eut lieu la première observation expérimentale de la déviation de la lumière d'une étoile par le
champ gravitationnel du Soleil. Cette confirmation spectaculaire de la théorie de la relativité générale inspira
Hermann Weyl, qui proposa la même année une conception révolutionnaire de l'invariance de jauge: Si les
effets d'un champ gravitationnel peuvent être décrits par une connexion exprimant l'orientation relative entre
des référentiels locaux de l'espace-temps, d'autres forces de la nature telles-que l'électromagnétisme peuvent-
elles être associées aussi à des connexions similaires?

Nous considérons deux types de symétrie de jauge: l'une dite "jauge globale" et l'autre dite "jauge locale".
Elles se distinguent par le paramètre caractérisant le changement de phase de la fonction d'onde (nous
verrons cela en détails un peu plus loin).

INVARIANCE DE JAUGE GLOBALE

Nous allons donc étudier l'invariance de jauge à partir de l'équation de Schrödinger et montrer que même si
les résultats peuvent paraître déroutants (dans le cadre d'applications complexes) il n'en reste pas moins
mathématiquement corrects.

Remarque: L'invariance de jauge globale est rigoureusement nommée "symétrie globale".

Considérons donc l'équation de Schrödinger:

(45.104)

avec comme nous l'avons montré:

(45.105)

avec . Soit dans le cas d'une particule libre:

(45.106)
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
Cette équation est manifestement invariante dans la transformation qui fait passer de à avec:

(45.107)

où g est une constante de couplage (pour assurer l'homogénéité des unités et l'amplitude) étant considérée
comme un nombre réel et un paramètre réel indépendant des coordonnées (dans un premier temps...)
d'espace et de temps.

(45.108)

devient:

(45.109)

et comme ne dépend ni de alors:

(45.110)

Soit après simplification:

(45.111)

La forme de l'équation est restée la même lorsque nous avons fait le changement de en .

Ainsi, la description d'un système libre n'est pas affectée par le changement de phase globale. En langage de
la théorie des groupes (cf. chapitre d'Algèbre Ensembliste), nous parlons d'invariance sous le groupe U(1)
des phases.

En d'autres termes pour parler comme les physicens...:

(45.112)

définit une transformation de jauge par la rotation (le paramètre au sens des groupes de Lie).

L'ensemble des rotations forment un groupe nommé U(1) que l'usage appelle le groupe de jauge (isomorphe
de SO(2)).

L'ensemble des forment une représentation monodimensionnelle du groupe U(1) que nous appelons la
représentation g. Il y a bien entendu une infinité de représentation g (autant qu'il y a de valeurs de g!).

Comme le paramètre ne dépend pas de la position et du temps, nous disons que le système est invariant
par transformation de jauge globale (partout en même temps) ou simplement un invariant de U(1) dans le
temps et l'espace.

INVARIANCE DE JAUGE LOCALE

Mais mais... soit l'invariance de jauge globale montre que nous avons une équation qui reste valable dans le
cadre d'un changement de phase fixe. Mais maintenant dans un laboratoire cette équation de Schrödinger
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
doit être valable même si la phase dépend de la position et de du temps. Cette contrainte s'appelle une
"invariance locale".

Nous considérons ainsi que est une fonction et l'idée bien évidemment est de vérifier si l'équation
de Schrödinger reste invariante dans la transformation:

(45.113)

Il est dès lors évident que l'équation de Schrödinger:

(45.114)

n'est plus invariante. Effectivement nous voyons rapidement que rien que l'opérateur dans l'hamiltonien
va poser problème en faisant apparaître des termes gênants qui ne s'annuleront pas:

(45.115)

Pour contourner ce problème nous introduisons le champ de force associé au potentiel vecteur et au potentiel
électrique et nous verrons qu'il garantit l'invariance locale (dons il est impossible de différencier un
changement de phase de la présence d'un champ de force de ce type). Donc l'invariance locale impose que la
particule ne soit plus libre (il n'existe donc pas de particules chargées libres!).

Pour cela reprenons l'hamiltonien de l'équation de Pauli (cf. chapitre de Physique Quantique Relativiste):

(45.116)

et négligeons l'interaction entre le spin et le champ magnétique tel que l'hamiltonien devienne:

(45.117)

Soit:

(45.118)

Nous avons donc l'équation de Schrödinger suivante:

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.119)

Ce qui par rapport à l'équation de Schrödinger libre:

(45.120)

fait intervenir les correspondances suivantes:

(45.121)

Considérons la transformation de jauge (cf. chapitre d'Électrodynamique) en notant dorénavant le potentiel


électrique par la lettre V :

(45.122)

où .

D'abord, nous voyons alors immédiatement que les opérateurs sont invariants. Effectivement:

(45.123)

Or, si g est posé comme étant et f comme étant alors nous avons:

(45.124)

Soit tout simplement:

(45.125)

De même en sachant maintenant que f est :

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.126)

Nous avons donc:

(45.127)

Soit:

(45.128)

La relation:

(45.129)

devient alors avec les nouvelles correspondances:

(45.130)

et avec les développements antérieurs nous avons donc:

(45.131)

Soit:

(45.132)

Ce qui donne après simplification:

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.133)

Ainsi, en demandant l'invariance de jauge nous avons fait apparaître une interaction... et nous savons bien
qu'elle est cette interaction!

L'équation de Schrödinger d'une particule se déplaçant dans un champ électromagnétique est donc invariante
sous la transformation locale de phase. La phase d'une fonction d'onde est bel et bien une nouvelle variable
locale au sens de Weyl et le potentiel électromagnétique peut être interprété, suivant Weyl, comme une
connexion reliant les phases en différents points.

Nous en concluons que le champ électromagnétique est une conséquence de l'invariance de jauge locale
fondée sur le groupe U(1), groupe des matrices unitaires à une dimension (cf. chapitre d'Algèbre
Ensembliste). L'intérêt qui existe est de construire des théories de jauge sur des groupes plus compliqués
(non-abéliens): ces théories sont appelées "théories de Yang-Mills".

Maintenant allons un tout petit peu plus loin mais sans trop approfondir... Nous avons montré plus haut que
le lagrangien de l'équation de Dirac libre était:

(45.134)

Or, cette équation ne faisant pas apparaître le champ électromagnétique on se doute très fortement qu'elle
n'est pas invariante à une jauge locale...

Or, l'équivalent de l'opérateur divergence dans l'équation de Schrödinger libre est la dérivée covariante
. Donc au même titre que nous avons associé pour l'invariance locale de jauge de l'équation de
Schrödinger libre:

(45.135)

Il est tentant de combiner le tout en un nouvel opérateur:

(45.136)

avec :

Le lagrangien de l'équation de Dirac libre s'écrirait alors:

(45.137)

Soit:

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(45.138)

avec:

(45.139)

Il ne reste plus qu'à rajouter le terme du champ pour et nous avons le lagrangien total de l'équation de Dirac
(cela aurait été relativement dur de le trouver d'une autre manière...):

(45.140)

qui correspond aux équations de Dirac-Maxwell et qui est le "lagrangien de l'électrodynamique quantique
des champs" ou à gauche nous avons le terme des fermions et à la droite la partie d'interaction des bosons de
masse nulle (photons).

Donc le fait d'avoir rajouter sur le lagrangien libre une condition d'invariance par des transformations
locales, nous a amené à une théorie avec interaction que nous pouvons écrire avec plus de rigueur et sous
forme développée:

(45.141)

ou encore en unités naturelles et avec la charge de l'électron:

(45.142)

L'électrodynamique a fait défaut cependant dans les années 1940 pour décrire bon nombre de particules
mises en évidence par les accélérateurs. Certes, d'une certaine manière elle a été étendue pour décrire de
nouvelles particules. Mais beaucoup d'entre elles semblaient jouir de propriétés dont l'électrodynamique
quantique ne pouvait rendre compte.

Au fait la raison est simple... c'est une théorie dans laquelle aucune solution exacte n'est connue, une
situation qui perdure jusqu'à nos jours (2008). La seule méthode de calcul disponible est appelée
développement perturbatif. L'idée est essentiellement la même que celle du développement limité que l'on
pratique dans le domaine de calcul différentiel. En l'occurrence, si nous ne savons pas calculer la valeur
d'une fonction, nous la décomposons en une séquence de polynômes et l'approximation s'affine au fur et à
mesure que nous prenons en compte des termes de degrés de plus en plus élevés. Un tel développement en
série commence par un terme d'ordre zéro, qui est juste la valeur de la fonction inconnue en un certain point
où l'on sait calculer cette fonction.

Dans le cas du développement perturbatif de l'électrodynamique quantique, le terme d'ordre zéro représente
la propagation pure, sans interaction (l'intensité de l'interaction entre l'électron et le champ magnétique est
mise à zéro). Dans cette approximation, l'électrodynamique quantique est une théorie des particules libres et
elle est exactement calculable. Nous avons des électrons, des positons et des photons mais ils se croisent
sans s'influencer. Le terme suivant dans le développement en série, celui du premier ordre, est aussi
exactement calculable. Dans cette approximation, la théorie semble refléter assez fidélement le monde réel.
PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com
Des phénomènes physiques très intéressants apparaissent dans cette approximation de premier ordre de la
théorie réelle de l'interaction photon-électron et la théorie s'accorde bien avec les résultats expérimentaux.

Malheureusement on eu tôt fait de découvrir que le calcul des termes de second ordre et des termes plus
élevés semblait dénué de sens jusqu'à donner des valeurs infinies... aujourd'hui il n'existe encore que des
méthode de résolution approximatives et non totalement satisfaisantes dès lors il a été obligé de chercher une
autre technique d'approximation se basant sur une renormalisation des équations... et les résultats sont
extraordinairement bons mais au fond cela sent un peu le bricolage sur mesure quand même...

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


46. PHYSIQUE DES PARTICULES ÉLÉMENTAIRES

N ous avons déjà mentionné dans le chapitre de Physique Nucléaire que nous constatons donc
expérimentalement que les noyaux radioactifs n'émettent pas des neutrons ou des protons. Mais nous
pouvons nous interroger : comment font-ils pour synthétiser une particule alpha, ou transformer un neutron
en proton, ou vice et versa? Pour répondre à ces questions, examinons les forces en présence.

Avant la découverte de la radioactivité, les physiciens avaient identifié deux forces fondamentales : la force
de gravitation et la force électromagnétique. La découverte de la radioactivité et les études concernant le
noyau atomique ont conduit les physiciens à introduire non pas une mais deux nouvelles forces
fondamentales!

Avant même de connaître la composition exacte des noyaux, pour expliquer l'existence de ces systèmes
minuscules et portant parfois de fortes charges positives, les physiciens avaient pressenti la nécessité d'une
force de cohésion puissant capable de dominer la répulsion électrostatique s'exerçant entre ces charges
(rappelons que nous avons vu en mécanique classique que la force gravitationnelle entre deux corps de
masses équivalentes à celles de particules est totalement négligeable). Comme le noyau est petit, cette "force
nucléaire" devait s'exercer à très courte distance. Quand J. Chadwick découvrit le neutron, il fut démontré
expérimentalement que force attractive s'exerçait aussi bien entre deux neutrons, deux protons et entre un
neutron et un proton. Dès 1935, H. Yukawa en élabora une théorie dont les grandes lignes sont encore
acceptées mais qui doivent être améliorées suites aux défauts qui ont été mis en évidence (cf. chapitre de
Physique Quantique Des Champs).

Cependant, comme nous le savons déjà, cette force nucléaire n'expliquait pas la transformation d'un neutron
en proton, qui a lieu dans la radioactivité bêta-. Il fallut introduire une quatrième force fondamentale,
d'intensité plus faible, baptisée pour cette raison "interaction faible", la force nucléaire devenant ipso facto
"l'interaction forte".

Ainsi, en principe, la radioactivité met en jeu les quatre forces fondamentales de la Nature : la gravitation et
la force électromagnétique, puisque les particules alpha et bêta possèdent une masse et une charge, et les
deux interactions nucléaires, forte et faible (en fait, la gravitation, d'intensité bien moindre que les trois
autres aux échelles subatomiques est souvent négligée).

Nous avons partiellement abordé dans le chapitre de Physique Quantique Des Champs les interactions
fondamentales et leurs vecteurs d'interactions. Avant de nous lancer dans des calculs ardus, il est souhaitable
d'abord d'acquérir un certain vocabulaire d'usage courant chez les physiciens théoriciens.

Le concept le plus simple à aborder dans le domaine de la physique des particules élémentaires est la
comparaison des quatre forces élémentaires via leur constante de couplage respective (c'est un truc que les
physiciens aiment bien...).

Remarque: Hubert Reeves et ses collègues astrophysiciens ont démontré qu'à l'époque de la genèse de
l'Univers, la moindre déviance des constantes de couplage des valeurs nominales actuelles aurait provoqué
l'instabilité des nucléons et aurait condamné l'évolution cosmique.

CONSTANTES DE COUPLAGES

Nous allons ici essayer de classer les quatre forces selon leur intensité via l'utilisation de "constantes de
couplage".

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


Pour cela, il faut calculer les quatre interactions pour deux mêmes particules, par exemple deux protons, à
des distances identiques, donc de type nucléaire, et les comparer à une grandeur commune de même
dimension de sorte que leur rapport fournisse un nombre sans dimension.

Cette grandeur commune sera choisie comme étant le produit :

(46.1)

Nous trouvons ainsi :

1. Pour la force de gravitation (cf. chapitre d'Astronomie) où :

(46.2)

avec la masse du proton tel que . La constante de couplage de la force de


gravitation vaut alors par définition :

(46.3)

2. Pour la force électrique (cf. chapitre d'Électrostatique) où :

(46.4)

avec les charges des protons tel que . La constante de couplage de la force
électrique vaut alors par définition :

(46.5)

Remarque: Nous retrouvons ici la "constante de structure fine" que nous avions vu déjà dans le chapitre de
Physique Quantique Corpusculaire. On comprend ainsi mieux le choix de départ pour la comparaison
relative des interactions.

3. Pour la force nucléaire forte ("strong" en anglais), où F représente la "charge nucléaire forte", la constante
de couplage forte vaut (attention la valeur dépend du modèle théorique choisi!) :

(46.6)

d'où son nom.

4. Pour la force nucléaire faible ("weak" en anglais) responsable de la désintégration des particules, f
représente la "charge nucléaire faible", et sa constante de couplage faible vaut (attention la valeur dépend du
modèle théorique choisi!):

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(46.7)

Ainsi tout cela peut se résumer dans le tableau phénoménologique suivant :

Les 4 interactions Descipriont Phénomènes


Intensité
fondamentales phénoménologique macroscopiques

Gravitationnelle
Newton/Einstein
Centrale hydraulique

Electromagnétique

Maxwell Groupes turbines-alternateurs

Force Faible
Pile thermoélectrique avec
Yukawa isotope radioactif

Forte

Yukawa Centrale nucléaire


Tableau: 46.1- Résumé des 4 interactions fondamentales avec lois et constantes associées

ou encore avec le diagramme suivant (plus intéressant) où nous retrouvons, en tenant compte des résultats
que nous avons tiré lors de notre étude des champs massiques et non massiques dans le cadre du modèle de
Yukawa (cf. chapitre de Physique Quantique Des Champs) :

1. En ordonnée à l'origine l'intensité des forces tel que calculées précédemment en fonction de la distance
selon le modèle de Yukawa des champs massiques (interactions faible et forte) et non massiques
(interactions électr. et gravitationnelle)

2. Les schémas représentatifs (diagrammes de Feynman) des interactions conformémement aux résultats
obtenus et particules déjà mentionnées dans le chapitre de Physique Quantique Des Champs.

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


(46.8)

Il convient de préciser pour la culture générale que ces quatre forces sont décrites respectivement par quatre
théories :

1. La relativité générale (englobe la mécanique classique)

2. L'électrodynamique quantique (englobe l'électrodynamique)

3. La théorie électrofaible (qui enlobe l'électrodynamique quantique)

4. La chromodynamique quantique

Les trois dernières étant regroupées dans le "modèle standard".

PixelPlanet PdfPrinter version de démonstration - http://pdfprinter.pixelplanet.com


47. ASTRONOMIE (MÉCANIQUE CÉLÉSTE)

L a mécanique céleste est la conséquence de la loi d'attraction universelle de Newton et du principe


fondamental de la mécanique (cf. chapitre de Mécanique Classique), elle a pour principal objectif la
description du mouvement d'objets astronomiques tels que les étoiles et planètes à l'aide des théories
physiques et mathématiques.

Nous allons dans ce chapitre aborder le sujet, comme toujours sur ce site, de la manière la plus élémentaire
possible.

D'abord, nous nous échaufferons avec une loi sympathique sur le vivant dans l'Univers... (l'équation de
Drake). Une fois cet exercice de style accompli, nous commencerons à "énumérer" les lois de Kepler (en
faisant souvent référence au chapitre de Mécanique Classique) pour ensuite étudier en détail les propriétés
des orbitales képlériennes à l'aide de la mécanique et ensuite à l'aide de la relativité restreinte, ce qui nous
amènera à constater une précession théorique des orbitales concernées. Ensuite, nous nous amuserons à
modéliser approximativement la variation de la durée de la journée (et de la nuit) sur la Terre en fonction du
mois et de la latitude. Enfin, pour terminer en beauté, nous nous lancerons dans le calcul détaillé des cinq
points de Lagrange!

EQUATION DE DRAKE

Cette équation a été inventée (...) par F. Drake dans les années 1960 dans l'intention d'estimer le nombre de
civilisations extra-terrestres dans notre galaxie avec qui nous pourrions entrer en contact. Le principal objet
de cette équation pour les scientifiques est de déterminer ses facteurs, afin de connaître le nombre probable
et (très) estimé de civilisations extraterrestres.

Cette équation empirique (qui reste un amusement... et dont le principe peut être appliqué à pas mal de
domaines différents de la physique et de la vie...) s'écrit:

(47.1)

Les termes de cette formule (car s'en est une!) se définissent ainsi:

- représente le nombre d'étoiles dans une seule et unique galaxie

- est le nombre d'étoiles qui auraient une planète en orbite

- est le nombre de planètes par étoile qui remplissent les conditions au développement de la vie

- est la fraction de planètes dont la vie s'est effectivement développée (compris entre 0 et 1)

- est la fraction de celles ou une vie intelligente s'est développée (compris entre 0 et 1)

- est la fraction qui a mis en oeuvre des moyens de communication radio (compris entre 0 et 1)

- est la fraction de temps pendant laquelle les civilisations vivront (compris entre 0 et 1)
Dans la pratique, il faut remarquer que l'équation consiste à essayer de déterminer une quantité inconnue à
partir d'autres quantités qui sont tout aussi inconnues qu'elles..... Mais c'est une équation sympa à sortir et à
évaluer entre amis pour passer le temps...

Il n'existe donc pas de garantie que l'on soit davantage fixé après cette estimation qu'avant (argument
nommé parfois dans la littérature "garbage in, garbage out"...).

La valeur résultante peut motiver que les développements qui vont suivre ne sont pas applicables qu'à un
seul système solaire dans l'Univers.... peut-être... (cela ferait beaucoup de vide gâché sinon...).

LOIS DE KEPLER

En astronomie, les lois de Kepler décrivent les propriétés principales du mouvement des planètes autour d'un
astre principal, sans les expliquer (à l'époque!). Elles ont été découvertes par Johannes Kepler à partir des
observations et mesures (en quantité phénoménale) de la position des planètes faites par Tycho Brahé,
mesures qui étaient très précises pour l'époque.

Les deux premières lois de Kepler furent publiées en 1609 et la troisième en 1618. Les orbites elliptiques,
telles qu'énoncées dans ses deux premières lois, permettent d'expliquer la complexité du mouvement
apparent des planètes.

Peu après, Isaac Newton découvrit en 1687 la loi de l'attraction gravitationnelle (ou gravitation), induisant
celle-ci, par le calcul, les 3 lois de Kepler.

Nous allons maintenant nous efforcer à présenter ces lois de la manière la plus pertinente possible :

PREMIÈRE LOI

La "première loi de Kepler", appelée parfois aussi "loi de conicité" ou encore "loi des orbites" s'énonce ainsi
: Les orbites des planètes sont des coniques (ellipses) dont le Soleil occupe l'un des foyers.

Au fait, il convient de préciser que ce n'est pas vraiment une "loi" dans le sens propre du terme puisque plus
loin vous en trouverez la démonstration telle que :

(47.2)

Remarque: Le lecteur qui aura lu au préalable le chapitre de Géométrie Analytique ne sera pas étranger à
cette relation...

DEUXIÈME LOI

La "deuxième loi de Kepler", appelée parfois aussi "loi des aires", nous dit que le segment qui joint une
planète au Soleil balaie des aires égales en des temps égaux (vitesse aréolaire constante) tel que :

(47.3)

C'est une relation qui découle de la conservation du moment cinétique comme nous l'avons déjà démontré
dans le chapitre de Mécanique Classique. Donc à nouveau, son statut de "loi" est discutable dans le langage
de la physique moderne!
Par ailleurs, rappelons que nous avions aussi obtenu comme résultat que le mouvement est et reste plan sans
aucune action extérieure!

Nous constatons par ailleurs que cette loi nous donne que la vitesse de la planète est variable. Elle est plus
grande au périhélie qu'à l'aphélie :

(47.4)

Ceci se vérifie pour la Terre par exemple. En effet cette dernière est plus proche du Soleil en hiver (pour
l'hémisphère Nord) et elle a alors une vitesse sur trajectoire un peu plus élevée qu'en été; le temps de
parcours est donc plus faible (l'hiver compte moins de jours que les autres saisons).

TROISIÈME LOI

La "troisième loi de Kepler", appelée parfois aussi "loi des périodes", s'énonce ainsi : Les carrés des périodes
de révolution T sont proportionnels aux cubes des demi-grands axes D des orbites:

(47.5)

A nouveau, nous verrons plus loin que le statut de "loi" n'est plus justifiable à notre époque puisqu'il est
possible de démontrer cette relation dont l'expression sera détaillée un tout petit peu plus loin comme étant
réellement :

(47.6)

Bien évidemment, Kepler n'a pas d'emblée publié ses trois lois dans cette provocante simplicité. Leur ordre
actuel n'est d'ailleurs pas celui de leur énonciation... Elles sont en réalité à dénicher au milieu d'un
foisonnement de spéculations physiques et de réflexions sur l'harmonie du monde.

LOI DE LA GRAVITATION DE NEWTON

Pour vérifier l'exactitude de son hypothèse, Newton (relativement longtemps après) retrouva les lois de
Kepler à partir de la loi de la gravitation, donnant ainsi l'explication du mouvement général des planètes.

Newton considéra pour déterminer la loi de gravitation une planète théorique, gravitant autour du Soleil sur
une orbite circulaire à vitesse constante v. Pendant une orbite complète, la planète parcourt une distance
égale à la circonférence du cercle de rayon R, soit , en un temps (sa période) égal à cette distance
divisée par sa vitesse, soit:

(47.7)

Newton s'appuie ensuite sur la troisième loi de Kepler avec toujours l'hypothèse d'une orbite circulaire.

Nous avons donc:


(47.8)

mais puisque :

alors (47.9)

en enchaînant :

et (47.10)

Nous posons maintenant que divisé par la constante est une nouvelle constante (que nous noterons de la
même manière que la première bien qu'elle ne lui soit pas égale) tel que :

d'où (47.11)

Ensuite, nous renversons les termes, cette expression devient (tout en notant que l'inverse de la constante
d'origine est elle aussi une constante):

(47.12)

Par un autre calcul nous avons déjà établi dans le chapitre de Mécanique Classique l'expression de la force
centrifuge:

(47.13)

en rapprochant cette expression à l'expression précédente :

(47.14)

nous obtenons :

(47.15)

Il existerait donc une force opposée à la force centrifuge qui maintient la cohésion orbitale et qui s'écrit:

(47.16)

reste à déterminer la valeur de la constante!

Il est trivial que la masse centrale M du système orbital doit intervenir d'une façon ou d'une autre dans cette
constante. Si la masse du corps secondaire intervient de façon proportionnelle dans la force centrifuge,
l'envie est grande de faire de même avec la masse du corps central. Donc:
(47.17)

maintenant a priori il n'y aurait plus de paramètres à prendre en compte. La constante restante est là pour
satisfaire à l'analyse dimensionnelle de telle façon que l'on ait des "Newtons" (nom donné à l'unité de force)
des deux côtés de l'égalité. Les scientifiques ont déterminé avec grande précision cette "constante
gravitationnelle" notée G qui a priori semble universelle et qui a comme valeur :

(47.18)

Ce qui nous amène à écrire la "loi de la gravitation de Newton" :

(47.19)

Evidemment il ne s'agit nullement d'une vraie démonstration car nous nous sommes basés sur les
observations expérimentales de Kepler. Par contre à partir de la relativité générale il est possible de la
démontrer (sous certaines hypothèses...)!

Remarque: En égalisant force centrifuge et force gravitationnelle il est assez facile d'obtenir une
approximation de la vitesse de rotation des planètes sur leur orbite. Le lecteur qui fera le calcul verra que le
chiffre tourne pour les planètes du système solaire une vitesse de l'ordre de 100'000 [km/h]

A partir de cette dernière relation, revenons brièvement sur notre troisième loi de Kepler et détaillons là un
peu pour montrer qu'elle est valable pour tout type d'orbite conique et afin de déterminer sa l'expression de
sa constante.

Exprimée dans le repère de Frenet (cf. chapitre Géométrie Différentielle), et décomposée en son accélération
normale (centripète) et tangentielle, l'accélération par rapport à un référentiel géocentrique (dans le cas d'un
référentiel situé au centre de masse du système l'expression change un peu) s'écrit :

(47.20)

Des relations obtenues lors des développements précédents :

et (47.21)

la constante de la troisième loi de Kepler prend comme valeur :

(47.22)

Or, puisque :

(47.23)

alors :
(47.24)

d'où :

(47.25)

Finalement la troisième loi de Kepler se retrouve alors fréquemment dans la littérature sous la forme
suivante :

(47.26)

Cet interlude effectué, revenons sur notre loi de la gravitation de Newton :

(47.27)

A partir de cette loi de la gravitation, nous pouvons retrouver toutes les lois de Newton. D'ailleurs nous
l'avons déjà fait pour la deuxième et troisième loi de Newton puisque ce sont ces dernières que nous avons
utilisé pour obtenir cette relation (c'est cependant un peu le serpent qui se mange la queue...).

Sous forme vectorielle nous avons ainsi :

(47.28)

Identiquement au champ électrique (cf. chapitre d'Électrostatique), nous pouvons développer:

(47.29)

Comme le champ électrique dérive d'un potentiel électrique, identiquement, le champ gravitationnel dérive
lui aussi d'un potentiel gravitationnel. En effectuant le même développement qu'en électromagnétisme pour
la première équation de Maxwell (cf. chapitre d'Électrodynamique), nous démontrons que:

(47.30)

où est le "potentiel gravitationnel" et qui varie en raison inverse de la distance relative des corps (ceci
confirmant ce que nous avions démontré lors de notre étude du théorème de Noether dans le chapitre traitant
des Principes) et vaut donc :

Remarque: Nous retrouverons souvent ce potentiel dans le chapitre de Relativité Générale. Il convient donc
de s'en souvenir si possible.
Ecriture qui implique bien évidemment la relation suivante:

(47.31)

Remarque: Evidemment en l'absence de champ nous avons et donc sera nul.

Comme en électromagnétisme à nouveau, nous démontrons comme nous l'avons fait pour la première
équation de Maxwell que:

(47.32)

Si nous exprimons cette équation en fonction d'un potentiel gravitationnel (noté aussi souvent par la lettre
U comme en Électrostatique...), nous obtenons :

(47.33)

ce que l'on note de façon plus esthétique avec le laplacien scalaire :

(47.34)

qui n'est d'autre que "l'équation de Newton-Poisson" que nous retrouverons aussi lors de notre étude de la
relativité générale (elle y a une place importante pour des raisons de validation de la théorie d'Einstein)!

Cette équation signifie que la théorie newtonienne de la gravitation se résume à dire que le champ
gravitationnel est décrit par un seul potentiel engendré par la densité volumique de masse et déterminant
l'accélération d'une particule d'épreuve plongée dans le champ extérieur .

Amusons nous maintenant un peu avec l'équation de la gravitation de Newton pour obtenir quelques
résultants intéressants et curieux :

Soit r la distance d'un objet du centre à l'extérieur de la Terre nous avons :

(47.35)

il vient :

(47.36)

à la surface de la Terre de rayon R nous avons:

(47.37)

Des deux dernières relations il vient donc:

(47.38)
En surface nous avons donc (on s'y attendait...) :

(47.39)

Maintenant, à l'intérieur de la Terre en notant la distance par rapport au centre par la lettre r et la masse
centrale par M ', nous avons :

(47.40)

Introduisons la masse volumique que nous supposerons égale partout.

(47.41)

En combinant ces quatre dernières relations nous obtenons :

(47.42)

Pour de nombreuses personnes ce résultat est assez contre intuitif (faites un petit sondage dans votre
entourage vous verrez).

SPHÉRISATION DES CORPS CÉLESTES

A l'aide de la loi de Newton nous pouvons répondre à pas mal de questions pertinentes de manière
approximative et nous donnant des résultats tout à fait probants.

Un premier exemple et de se demander à quelle échelle il y a une transition du domaine des formes (les
astéroïdes, lunes de Mars, comètes, etc.) au domaine des sphères (planètes et grandes lunes)? Pourquoi les
satellites de Mars, Phobos et Deimos, ont une forme patatoïde tandis que notre lune est à peu près sphérique.
Nous allons voir que ceci est dû à la masse qui est plus important dans le cas de notre lune. Effectivement, à
partir d'une certaine masse, les formes géométriques quelconques ne sont plus possibles.

Pour aborder cette étude nous allons d'abord estimer la hauteur maximale d'une montagne sur une planète.
Le Mont Everest a une altitude de 8.8 [km] tandis que le Mont Olympus sur Mars est de 27 [km]. Pourquoi
de telles montagnes ne peuvent existe sur Terre?
Pour prendre une approche simpliste, nous allons supposer qu'une montagne doit être en équilibre
hydrostatique. Nous connaissons expérimentalement la pression limite type dans un réseau cristallin de
roches au delà de laquelle les roches commencent à "couler" : .

Nous connaissons de par notre étude la mécanique des milieux continus (cf. chapitre de Mécanique Des
Milieux Continus) que la pression à la base d'une montagne de hauteur h sera donnée dans l'approximation
hydrostatique :

(47.43)

Pour que la montagne soit stable, il faut donc que :

et donc (47.44)

Ainsi :

(47.45)

En supposant une densité moyenne de (croûte continentale de la Terre) nous obtenons


:

- Terre :

- Mars :

Ce qui est remarquable comme résultat approximatif...

Pour estimer la taille minimale d'un astre, à partir de laquelle la forme sphérique devient prédominante
par rapport aux déformations de la surface (c'est-à-dire :où la gravitation a pris le dessus sur les forces
interatomique) , nous allons exiger que la taille soit supérieure à la hauteur maximale d'une montagne
. Nous supposons aussi que la densité reste constante à travers l'astre. En reprenant la relation :

(47.46)

nous avons :

(47.47)

d'où :
(47.48)

La limite peut ensuite être estimée en fixant ainsi :

(47.49)

bien évidemment pour nous serons encore plus proche de la forme sphérique.

APLATISSEMENT DES CORPS CÉLESTES

A cause de la symétrie du potentiel gravitationnel une étoile ou une planète devrait avoir une forme
parfaitement sphérique à partir d'une certaine taille comme nous venons de le voir. Or, il n'est pas ainsi.

Dû à la rotation propre de l'astre, un terme centrifuge vient de modifier le potentiel, ce terme dépend de la
latitude ce qi explique la forme ellipsoïdale.

Rappelons que :

(47.50)

où R est le rayon équatorial de l'astre à laquelle vient s'ajouter l'accélération centrifuge à une latitude donnée
de rayon r :

(47.51)

Ainsi l'accélération totale :

(47.52)

explique simplement que la Terre est aplatie aux pôles (ou selon le point de vue : étirée à l'équateur...) et que
plus une planète tourne vide, plus elle sera aplatie aux pôles.

Sur Terre, le rayon équatorial est de 6379 [km] tandis que le rayon polaire est de 6357 [km]. La différence
est de 22 [km]. "L'aplatissement" d'une planète peut être exprimé comme :

(47.53)

soit la différence entre rayon équatorial et le rayon polaire divisé par le rayon équatorial.

Bien qu'un ellipsoïde de révolution soit la meilleure description pour la forme d'une planète :
(47.54)

il y a des imperfections entre le modèle et la réalité pour certains corps du système solaire (en particulier les
planètes telluriques, les satellites, et les petits corps rocheux). Le géopotentiel d'une planète réelle peut avoir
une forme nettement plus compliquée à cause des influences des inhomogénéités visibles de la surface
comme l'atteste cette image satellite de la Terre omettant les parties liquides (les déformations ont été un peu
exagérées sur l'image ci-dessous) :

(47.55)

Les géodésistes tiennent compte de ces inhomogénéités. Ils mesurent et décrivent la forme des planètes
qu'ils appellent "géoïdes".

STABILITÉ DES ATMOSPHÈRES

En comparant les vitesses de libération et les vitesses de divers gaz, nous pouvons expliquer la stabilité de
certaines atmosphères et l'inexistence d'autres. Nous avons démontré dans le chapitre de Mécanique
Classique que la vitesse de libération d'un astre sphérique était donnée par la relation suivante (sur laquelle
nous reviendrons aussi dans le chapitre de Relativité Générale):

(47.56)

Pour la Terre, une application numérique donne et pour la Lune .

Nous pouvons à l'aide des développements effectués dans le chapitre de Mécanique Des Milieux Continus
lors de notre détermination de la température cinétique. Rappelons que nous y avions démontré la relation
suivante :

(47.57)

En utilisant la masse molaire (cf. chapitre de Chimie Thermique) :


(47.58)

Une application numérique donne pour l'azote et pour l'hydrogène avec


une température arbitraire de 300 [°K].

Donc l'azote est nettement piégé dans l'atmosphère terrestre. L'hydrogène, gaz léger, donc rapide l'est moins.
Les deux gaz sont encore moins retenus par la Lune.

Remarque: En fait, la vitesse quadratique moyenne n'est pas la vitesse unique des molécules. Il y a une
distribution des vitesses. Nous avons effectivement vu que la distribution de Maxwell-Boltzmann d'un gaz à
l'équilibre dans le chapitre de Mécanique Statistique.

LIMITE DE ROCHE

La limite de Roche est la distance théorique en dessous de laquelle un satellite commencerait à se disloquer
sous l'action des forces de marée causées par le corps céleste autour duquel il orbite, ces forces dépassant la
cohésion interne du satellite.

Nous pouvons simplifier le problème en considérant le satellite liquide et en le décomposant en deux petites
masses m de rayon r et de masse volumique .

(47.59)

La planète est une sphère de rayon R, de masse M, de masse volumique , située à une distance D du
satellite.

La planète exerce sur le satellite une attraction gravitationnelle :

(47.60)

La différence de force entre les 2 masses est :

(47.61)

Nous pouvons considérer , ce qui donne :


(47.62)

Donc la différence de force est

(47.63)

La force de cohésion du satellite résulte dans l'attraction gravitationnelle entre les 2 masses :

(47.64)

Le satellite est détruit si la différence de force entre les 2 masses est supérieure à la force de cohésion

(47.65)

Or nous avons les relations :

et (47.66)

donc nous obtenons :

(47.67)

et nous en déduisons la "limite de Roche" :

(47.68)

Comme, dans ce calcul, nous avons considéré un satellite constitué de deux masses ponctuelles, et que de
plus nous avons considéré que la cohésion du satellite était assurée exclusivement par les interactions
gravitationnelles, cette valeur n'est qu'un ordre de grandeur (un minimum donc!).

TRAJECTOIRES D'ORBITALES KEPLERIENNES

L'observation (outil principal du physicien pour rappel) semble montrer qu'à première vue, les trajectoires
suivies par les corps célestes en orbite autour d'astres sont bien de type coniques (ouf!). Sachant cela, nous
pouvons afin de faciliter les calculs, anticiper la complexification des calculs et exprimer directement la
dynamique d'un point matériel en des coordonnées polaires.
Comme nous l'avons vu dans le chapitre de Calcul Vectoriel, la vitesse en coordonnées polaires s'exprime
par la relation (nous avons changé la lettre grecque de notation de l'angle pour nous adapter à la tradition):

(47.69)

où pour rappel le premier terme est la composante radiale de la vitesse et le second la composante
tangentielle de la vitesse (angulaire).

Pour l'accélération:

(47.70)

où le premier terme est l'accélération radiale, le second l'accélération centripète, le troisième l'accélération
tangentielle et le quatrième l'accélération de Coriolis (cf. chapitre de Mécanique Classique).

Maintenant que nous avons les outils nécessaires, attaquons nous au cas des orbites képlériennes dans le cas
d'un champ Newtonien.

Nous avons déjà démontré que plus haut :

(47.71)

Cependant, il est peu probable que le corps principal soit une sphère parfaite et homogène... Les
astrophysiciens ont donc l'habitude de noter le potentiel Newtonien U sous la forme:

(47.72)

où est appelée "constante de gravitation de l'astre" et où f est une fonction représentant les
hétérogénéités de l'astre.

S'il est un endroit de l'univers où les lois de la mécanique sont parfaitement vérifiables, c'est bien l'espace,
parce que le frottement ou les causes de dissipation y sont extrêmement faibles. Dans le champ d'une seule
force dérivant d'un potentiel, le mouvement vérifie la conservation de l'énergie mécanique.

Nous aboutissons ainsi à l'équation dite de l'énergie, dans laquelle E désigne "l'énergie spécifique" par unité
de masse (kilogramme) envoyé.

(47.73)

donc :

(47.74)

La force de gravitation newtonienne est centrale, donc de moment nul au centre O du corps principal. Il en
résulte la conservation du moment cinétique en norme et en direction, soit:
(47.75)

Le vecteur est l'unitaire de ou de appelé "moment cinétique réduit". K est la constante des aires (cf.
chapitre de Mécanique Classique) telle que:

(47.76)

Nous rappelons que la norme de la vitesse exprimée en coordonnées polaires plane est donné par la relation
(n'oubliez pas que les deux vecteurs de la base polaire sont orthogonaux et que l'on peut donc appliquer le
théorème de Pythagore pour calculer la norme comme il l'a été démontré dans le chapitre de Calcul
Vectoriel du site):

(47.77)

Ce qui nous permet d'écrire pour K :

(47.78)

Plaçons-nous dans le plan orbital, en coordonnées polaires. Nous possédons deux intégrales premières
dépendant des deux constantes essentielles E et K.

Soit la relation déjà démontrée et sa norme . Or:

(47.79)

Remplaçons dans l'expression de :

(47.80)

En égalant avec l'expression de résultant de la conservation de l'énergie, nous avons:

(47.81)

Ce qui nous donne une équation différentielle assez compliquée:


(47.82)

Et là nous nous demandons comment nous pouvons faire pour nous en sortir. Après quelques heures de
réflexions... nous nous rendons compte qu'il faut faire une substitution. Après une autre heure de chaos
neuronal cela finit par aboutir. Nous décidons de poser (nous en avons tout à fait le droit), sachant que r est
une fonction u de :

(47.83)

Dérivons allégrement par rapport à :

(47.84)

Substituons dans l'équation différentielle:

(47.85)

Après simplification nous obtenons :

(47.86)

Nous séparons les variables pour intégrer:

(47.87)

Nous avons deux solutions suivant le signe que nous choisissons. Cependant à la fin de la résolution, nous
remarquons que le seul choix physiquement intéressant est le signe négatif. Ainsi:

(47.88)

Nous laissons, par approximation, de côté la constante d'intégration qui impliquerait des très faibles
oscillations sur la trajectoire de l'orbite (si vous faites une étude ou un TP sur le sujet, communiquez-moi les
graphiques que vous obtenez avec ou sans la constante, cela m'intéresserait).

Ce qui nous permet d'obtenir :

(47.89)
Or, nous voyons que notre choix du signe pour l'intégration se justifie pleinement puisque maintenant, si
nous faisons un petit rappel sur les coniques, nous voyons que nous avons:

(47.90)

où e est l'excentricité (rapport du petit axe ) et p le paramètre focal ( ) d'une ellipse. Ce


qui correspond bien aux trajectoires que suivent les astres en orbite.

Nous retrouvons donc bien la première "loi" de Kepler....

Dans notre cas, nous avons après simplification :

et (47.91)

où (pour rappel) K est la constante des aires :

(47.92)

et la constante de gravitation de l'astre :

(47.93)

et enfin E l'énergie spécifique :

(47.94)

Le lecteur vérifiera comme nous l'avons vu dans le chapitre de Géométrie Analytique lors de notre étude des
coniques que si :

- nous avons une orbite ouverte sous forme de parabole

- nous avons une orbite ouverte sous forme d'hyperbole

- nous avons une orbite fermée sous forme d'une ellipse ou de cercle.
PÉRIODE ORBITALE KEPLERIENNE

La loi des aires permet comme nous le savons déjà de calculer la période orbitale képlérienne T. En effet,
l'aire S de l'ellipse valant (cf. chapitre sur les Formes Géométriques) et ayant déjà déterminé lors
de la définition du moment cinétique la relation (cf. chapitre de Mécanique Classique):

(47.95)

Il vient naturellement:

(47.96)

Par ailleurs, l'étude des coniques (cf. chapitre de Géométrie Analytique) nous a montré que :

(47.97)

et nous avons défini plus haut :

(47.98)

Nous avons donc la relation :

(47.99)
et nous retrouvons du même coup la troisième loi de Kepler... :

(47.100)

ce qui valide nos calculs précédents.

DÉFLEXION CLASSIQUE DE LA LUMIÈRE

Les calculs effectués précédemment peuvent s'appliquer à un cas intéressant : la déviation de la lumière par
un astre selon une interprétation newtonienne (bien évidemment!).

Nous avons donc montré plus haut que :

(47.101)

Dans le cadre d'un photon nous aurions tendance à poser que et donc que :

(47.102)

en posant les relations trigonométriques élémentaires (cf. chapitre de Trigonométrie) nous


donnent :

(47.103)

et donc en utilisant encore les relations trigonométriques :

(47.104)

soit :

(47.105)

et nous savons que :

(47.106)

donc :

(47.107)
en négligeant l'énergie potentielle du photon puisque , nous avons (attention!!! rappelons que selon
ce que nous avons vu dans le chapitre de Relativité Restreinte, le photon n'a pas de masse rigoureusement!):

(47.108)

Donc :

(47.109)

donc:

(47.110)

après simplification :

(47.111)

et comme est supposé petit, nous avons à l'aide du développement de Taylor de la fonction tangente (cf.
chapitre sur les Suites Et Séries) :

(47.112)

il vient donc finalement :

(47.113)

Or, nous avons par définition :

(47.114)

et nous savons que (cf. chapitre de Mécanique Classique). Ainsi il vient :

(47.115)

Si la particule est un photon passant au ras de la surface du Solaire alors :

(47.116)

un calcul numérique donne alors :


(47.117)

La théorie Newtonienne prévoit donc une déviation de 0.87 secondes d'arc pour un rayon lumineux frôlant la
surface solaire. Ce qui est deux fois moins que ce qui peut être observé expérimentalement et que ce que
donne la relativité générale (cf. chapitre de Relativité Générale)!

PRÉCESSION DU PÉRIHÈLIE

Avant d'étudier la précession des orbites, nous souhaiterions rappeler que le champ gravitationnel et un
champ conservatif et central. Ceci implique donc que le moment cinétique (cf. chapitre de Mécanique
Classique) est constant et que la trajectoire a lieu dans un plan dont le vecteur normal à la surface conserve
toujours la même direction (le vecteur moment cinétique est constant en norme et en direction pour rappel!).

Nous nous attaquerons à l'analyse de la précession du périhélie en prenant en compte les résultats de la
théorie de la relativité restreinte (cela permettant d'être plus fin dans les résultats obtenus et de pouvoir
appliquer ces mêmes résultats aux électrons en orbite autour du noyau de l'atome).

Définitions:

D1. Le "périhélie" est le point de l'orbite d'un corps céleste (planète, comète, etc.) qui est le plus rapproché
de l'étoile autour duquel il tourne.

D2. "L'aphélie" est le point de l'orbite d'un objet (planète, comète, etc.) où il est le plus éloigné de l'étoile
autour duquel il tourne.

D3. "L'équinoxe" est l'instant où le l'étoile centrale traverse l'équateur de l'objet qui est en orbite autour de
lui.

Remarque: Lorsque le Soleil passe de l'hémisphère Sud à l'hémisphère Nord de la Terre (en d'autres termes
que le Soleil se trouve au Zénith à l'équateur à midi), c'est l'équinoxe de printemps (20 ou 21 mars), dans le
sens inverse, c'est l'équinoxe d'automne (22 ou 23 septembre). A ces dates, il y a égalité du jour et de la nuit
sur toute la Terre.

Evidemment, le résultat que nous obtiendrons ne sera pas complet, puisque comme nous le savons, il a fallu
attendre le développement de la relativité générale pour donner avec exactitude la précession du périhélie de
Mercure (nous y reviendrons).

Pour calculer cet effet de précession, nous allons rechercher l'équivalent d'une formule dite "formule de
Binet" sous forme relativiste (nous verrons la forme classique dans le chapitre de Relativité Générale). Nous
procédons comme suit :

Le lagrangien relativiste du système (cf. chapitre de Relativité Restreinte) :

(47.118)

Remarque: Nous soustrayons l'énergie au repos car seulement nous intéresse ici l'étude de l'énergie cinétique
et potentielle.

Avec :
(47.119)

et la masse réduite :

(47.120)

Remarque: Pour déterminer l'expression de la vitesse en coordonnées polaires, nous avons utilisé le résultat
de nos calculs du chapitre de Calcul Vectoriel.

Le moment cinétique :

(47.121)

sous forme relativiste et appliqué à notre étude s'écrit:

(47.122)

En prenant la norme, nous avons sans oublier que dans note étude et donc :

(47.123)

et rappelons que nous avons adopté l'écriture . Ce qui nous donne finalement:

(47.124)

Pour établir l'équivalent relativiste de la formule de Binet:

- nous partons du moment cinétique :

(47.125)

- nous recherchons une relation du type (puisque la trajectoire est une conique):

(47.126)

Effectivement car rappelons qu'en coordonnées polaires la vitesse est donnée par l'expression suivante:

(47.127)

C'est-à-dire que . Cette dernière expression permet d'écrire que:

(47.128)
- nous cherchons ensuite une relation :

(47.129)

Soit:

(47.130)

A partir des équations obtenues précédemment, nous avons successivement:

(47.131)

Rappelons que nous avions défini en relativité restreinte:

(47.132)

Avec les équations précédentes, cela nous donne:

(47.133)

D'autre part:

(47.134)

En introduisant l'avant dernière relation dans cette dernière:

(47.135)

En posant et comme:

(47.136)

L'avant dernière relation devient avec cette dernière expression:


(47.137)

En égalant cette dernière relation avec celle du lagrangien:

(47.138)

En dérivant cette dernière relation par rapport à :

(47.139)

Effectivement, le lagrangien étant constant au cours du temps (le système est conservatif !), nous avons
donc:

(47.140)

et également:

(47.141)

Or, si nous continuons:

(47.142)

En se référant à:

(47.143)

Nous obtenons donc:

(47.144)

Ce qui donne finalement après quelques simplifications:

(47.145)

En multipliant cette dernière par :


(47.146)

Dans un potentiel gravitationnel:

(47.147)

L'équation de Binet en relativité restreinte est alors:

(47.148)

Pour rechercher une solution à cette équation différentielle, nous allons grouper la variable u dans le
membre de gauche:

(47.149)

Nous posons :

et (47.150)

L'équation différentielle s'écrit alors:

(47.151)

Nous posons :

(47.152)

En prenant la dérivée seconde:

(47.153)

Nous trouvons alors une simple équation différentielle dont la solution est bien connue:

(47.154)

Les solutions sont du type:


(47.155)

Ce qui s'écrit encore puisque est une constante:

(47.156)

avec .

Pour déterminer les constantes nous nous plaçons d'abord dans la situation pour laquelle , où
r est minimal et donc par définition u maximal.

Nous dérivons par rapport à :

(47.157)

Donc ce qui fait que la relation:

(47.158)

devient:

(47.159)

Ecrite autrement (en essayant de revenir sur une notation similaire à celle de l'étude des coniques) cela
donne :

(47.160)

Et l'intérêt d'écrire cela ainsi est de remarquer que nous retombons sur l'équation d'une ellipse avec p étant le
paramètre focal de la conique étant aussi donné par (cf. chapitre de Géométrie Analytique):

(47.161)

où a est le demi-grand axe de l'ellipse.


Maintenant posons :

et (47.162)

Au premier passage par le périhélie où :

(47.163)

nous avons donc:

(47.164)

Au deuxième passage par le périhélie , nous avons :

(47.165)

nous avons donc également:

(47.166)

La trajectoire est toujours une ellipse mais l'angle qui était nul au départ est devenu .

Soit si nous avons :

(47.167)

Alors:

(47.168)

Ce qui nous donne:

(47.169)

Etant donné que , un développement en série de Taylor (cf. chapitre sur les Suites Et Séries):

(47.170)

En se limitant à l'ordre 2:
(47.171)

Donc en conclusion, il y a un avancement du périhélie s'effectuant dans le sens de rotation du satellite. Pour
un référentiel situé dans le plan de rotation du satellite, la trajectoire est toujours une ellipse.

Cette avance est de:

(47.172)

par demi-période. Soit en explicitant le moment cinétique donné pour rappel par:

(47.173)

Il vient alors après simplification:

(47.174)

Nous allons maintenant nous permettre une approximation assez grossière (mélange de relativiste et non
relativiste). Soit à considérer la dernière relation, nous avons obtenu lors de nos développements des
trajectoires d'orbitales képlériennes la relation :

(47.175)

Dès lors en injectant ceci dans la relation de nous avons :

(47.176)

Malheureusement, les valeurs numériques pour Mercure ne donnent qu'une précession de 7'' d'angle par
siècle et non pas les 43'' d'angle par siècle attendus (...) il manque un facteur 6 que seulement la relativité
générale (cf. chapitre de Relativité Générale) permet de trouver. Il est néanmoins intéressant de constater
que la relativité, même restreinte, donne déjà une orbite qui précesse là où Newton voit une ellipse stable et
que cette approximation fonctionne pour toutes les planètes exceptées Mercure (planète la plus proche du
Soleil et subissant de plein fouet la courbure de l'espace-temps).

Remarque: En appliquant exactement le même raisonnement pour la physique quantique corpusculaire


(potentiel électrique) mais avec les constantes ad-hoc vues dans le chapitre d'Électrostatique, nous trouvons :

(47.177)

avec étant le moment cinétique et dans le cas de l'atome nous prendrons (cf. chapitres Physique
Quantique Corpusculaire):
(47.178)

avec la masse réduite valant:

(47.179)

Si les positions du périhélie (et donc de l'aphélie) du barycentre Terre-Lune étaient constantes dans le temps,
la durée des différentes saisons serait, elle aussi constante. Mais l'orbite du barycentre Terre-Lune tourne lui
aussi dans son plan dans le sens direct à raison d'environ 12'' par an (soit une révolution en environ 100'000
ans).

La précession des équinoxes s'effectue dans le sens contraire (sens rétrograde) à raison d'environ 50'' par an
(soit une révolution en environ 26'000 ans). La combinaison de ces deux mouvements permet de calculer la
période du passage du périhélie de la Terre par la direction de l'équinoxe de printemps, cette période
d'environ 21'000 ans est appelée précession climatique.

En effet, tous les 10'500 ans (demi-période de la précession climatique) l'aphélie passe de l'été à l'hiver. Or
même si la distance Terre-Soleil n'est pas le facteur prédominant dans la nature des saisons, la combinaison
du passage de la Terre à l'aphélie en hiver donne des hivers plus rudes. La distance Terre-Soleil dépend
également de la variation de l'excentricité de l'orbite terrestre (due aux planètes extérieures et intérieures).
Ainsi, les périodes glacières sont corrélées avec les minima de l'excentricité de l'orbite terrestre.

(47.180)

Les travaux de l'institut de mécanique céleste (France), depuis les années 1970, ont permis de confirmer
définitivement les prédictions théoriques comme quoi la l'excentricité de l'orbite terrestre subit de larges
variations formées de nombreux termes périodiques dont les plus importants ont des périodes voisines de
100'00 ans, et pour l'un d'eux, une période de 400'000 ans. Ces résultats confirment les variations
climatiques de la Terre au cours de l'ère quaternaire. Les paléoclimatologies montrent en effet la corrélation
entre les variations des éléments de l'orbite terrestre et les grandes glaciations du quaternaire.

Remarque: Dans le cas de l'atome d'hydrogène (voir le chapitre de Physique Quantique Corpusculaire
traitant du modèle relativiste de Sommerfeld) avec :

et la constante de structure fine égale approximativement à ~1/137, nous obtenons pour la précession du
périhélie de l'orbite donnée:

(47.181)
selon un point de vue corpusculaire de la matière! (ce qui nous le savons n'est plus à l'ordre du jour).

DURÉE DE L'ARC DIURNE

Nous allons nous intéresser à la durée du jour, plus exactement à la portion de journée où nous sommes
éclairés par le soleil, par rapport à la nuit où nous nous trouvons dans l'ombre.

Remarque: Merci à Xavier Hubaut pour ces très sympathiques développements.

Dans la réalité, la Terre tourne autour du soleil et décrit une orbite presque circulaire en même temps elle
tourne sur elle-même autour de son axe qui est incliné d'environ 23°27' sur le plan de son orbite
(l'écliptique).

(47.182)

Remarque: Il est évident qu'étant donnée la complexité du problème, nous le simplifierons en considérant
une orbite circulaire, sans variations (précession, nutation) de l'axe de rotation de la Terre, nous supposerons
que le soleil est réduit à un point (pas d'aurore, ni de crépuscule, etc.).

Rappelons que la précession est le changement graduel d'orientation de l'axe de rotation d'un objet quand un
couple (de force) lui est appliqué alors que la nutation est un balancement périodique de l'axe de rotation de
la Terre autour de sa position moyenne en plus de la précession.

Représentons la Terre avec son axe de rotation vertical; en conséquence l'équateur sera situé dans un plan
horizontal.

Supposons que ce jour-là, la Terre soit dans une position telle que les rayons du soleil forment un angle
avec le plan de l'équateur (ou que réciproquement la Terre forme un angle avec le plan de l'équateur).
Remarquons que cet angle sera toujours compris selon les mesures actuelles entre -23°27' et + 23°27'.

Pour que les choses soient plus gaies, nous avons choisi de faire notre analyse sur un jour où est positif.
Ainsi, dans l'hémisphère nord nous sommes proches du solstice d'été !

Nous chercherons donc durée du jour à un endroit situé à une latitude ? Pour fixer les idées, plaçons-nous
dans les environs de Bruxelles à 50° de latitude Nord.

Considérons maintenant les figures ci-dessous où la première correspond à une vue de la Terre de côté à un
instant t de son orbite lorsque et la seconde à une coupure cylindrique de rayon NJ (correspond au
rayon du parallèle de Bruxelles) du volume de la Terre à ce même instant :
(47.183)

Sur les figures ci-dessus, C désigne le centre de la Terre, et O le centre du parallèle de Bruxelles.

Fixons un instant t et désignons par M (matin) et S (soir) les deux points du parallèle de Bruxelles où le
soleil se lève et se couche (ces points seront considérés comme fixes quelque soit t pour l'instant, ce qui est
bien évidemment erroné par rapport à la réalité), tandis que J (jour) et N (nuit) seront ceux où il est
respectivement midi et minuit.

P sera le point sur le disque correspondant au parallaxe de Bruxelles où le plan du méridien de midi (le plan
dont un des côtés est NJ) coupe la droite MS.

Enfin, désignera l'angle (où O est donc le centre du disque généré par le parallèle de Bruxelles) qui
sous-tend la partie éclairée par le Soleil et r désignera le rayon .

Pour simplifier le problème, supposons que pendant 24 heures la Terre tourne sur elle-même sans modifier
la position de son axe de rotation par rapport au Soleil.

L'angle peut se calculer en remarquant que OP vaut, en valeur absolue :

(47.184)

où r représente le rayon du parallèle de Bruxelles.

Or, en utilisant les propriétés des fonctions trigonométriques (cf. chapitre de Trigonométrie). Nous avons :

(47.185)
Or, il nous faut encore injecter le paramètre . Connaissant la latitude de Bruxelles, nous avons :

(47.186)

où R est le rayon de la Terre.

Nous avons aussi :

(47.187)

et dans le triangle COP :

(47.188)

Enfin, en comparant les valeurs obtenues pour PO, nous obtenons :

(47.189)

et comme :

(47.190)

Nous obtenons finalement :

(47.191)

et donc :

(47.192)

Aux équinoxes (c'est-à-dire quand l'équateur est confondu avec le plan de l'écliptique), nous avons et
donc :

(47.193)

Or, comme nous l'avons spécifié au début, il faut prendre la valeur absolue donc :

(47.194)

En d'autres, quelque soit la latitude que nous prenons, l'angle formé par la zone de nuit est égale à l'angle
formé par la zone de jour (les deux étant égal à ).
Prenons maintenant le solstice d'été, lorsque en considérant toujours la latitude de Bruxelles
, nous avons :

(47.195)

ce qui, traduit en nombre d'heures :

(47.196)

soit environ

En résumé pour calculer la durée du jour, il suffit de connaître deux choses: la latitude du lieu et l'angle
selon lequel le soleil tombe sur le plan de l'équateur à la date choisie. La valeur de cet angle est bien connue
aux équinoxes (il vaut 0°) et aux solstices (il vaut +23°27' et -23°27').

Mais aux autres dates ?

La réponse est fort simple. Imaginons-nous, assis sur le Soleil regardant tout au long de l'année en direction
du centre de la Terre.

Au cours de sa rotation autour du Soleil, l'axe de rotation de la Terre conserve son inclinaison sur
l'écliptique. Vu du Soleil, cet axe tournera autour d'une normale au plan de l'écliptique et décrira donc un
cône dont le demi-angle au sommet vaut 23°27' (voir figure plus bas).

L'angle d'attaque des rayons solaires sur le plan de l'équateur variera donc en fonction de la date (nous
associons à la date, l'angle parcouru par la Terre sur son orbite, à partir de sa position à l'équinoxe de
printemps)

Par conséquent l'angle variera en fonction de la date de manière sinusoïdale.

Pour ceux qui ne seraient pas convaincus par ce raisonnement semi-intuitif, voici une autre approche :

Pour la lisibilité du schéma, nous avons fortement exagéré l'angle formé par l'axe de rotation de la Terre
avec l'écliptique.

(47.197)
Soit C le centre de la Terre, A l'extrémité d'un vecteur unité dirigé suivant l'axe de rotation de la Terre
(soit perpendiculaire au plan de l'équateur) et un autre vecteur unité dirigé vers le Soleil. Soit
maintenant l'angle du rayon CS avec le plan de l'équateur et l'angle entre les vecteurs unitaires et
. Nous avons alors :

(47.198)

Effectivement, le vecteur étant perpendiculaire au plan de l'équateur il forme un angle droit avec celui-
ci dès lors puisque l'angle est l'angle entre ce vecteur et l'écliptique en est le complémentaire.

Nous avons donc :

(47.199)

Décomposons maintenant en la somme de dirigé perpendiculairement au plan de l'écliptique et de


situé dans le plan de l'écliptique :

(47.200)

Ainsi :

(47.201)

Mais :

(47.202)

Donc finalement :

(47.203)

et comme nous avons démontré que :

(47.204)

Nous obtenons finalement :


(47.205)

A présent le problème est résolu et la durée du jour sera fonction de deux variables: la date et la latitude
.

Il nous suffit donc maintenant de reprendre la relation :

(47.206)

et d'y injecter le nouveau résultat :

(47.207)

Avec les outils informatiques à notre disposition, nous pouvons aisément calculer la valeur de . Nous
avons par exemple ci-dessous les variations de la durée du jour sur une année à des latitudes allant de 0 à
90° réparties de 10 en 10°

(47.208)

A partir de la latitude du cercle polaire, nous observons, en été, des périodes avec soleil ininterrompu (soleil
de minuit) et, en hiver, des journées entières de nuit.

Pour Bruxelles (latitude=50°) nous voyons sur le graphique que la durée du jour varie approximativement
entre les valeurs de 16h (solstice d'été) et 8h (solstice d'hiver).

POINTS DE LAGRANGE
Un "point de Lagrange" (noté L), ou "point de libration", est une position de l'espace où les champs de
gravité de deux corps en orbite l'un autour de l'autre, et de masses substantielles, se combinent de manière à
fournir un point d'équilibre à un troisième corps de masse négligeable, tel que les positions relatives des trois
corps soient fixes.

Nous allons dans les développements qui vont suivre nous attarder à démontrer au mieux que de tels points
sont au nombre de 5 notés respectivement L1à L5.

Il peut être utile de faire une présentation de ces différents points et de leurs propriétés avant de passer à la
partie calculatoire. Cela aidant peut être à la compréhension du sujet.

Nous allons immédiatement considérer le schéma suivant :

(47.209)

Il existe cinq points de Lagrange :

- L1 : Sur la ligne définie par les deux masses, entre celles-ci.

Exemple:

Nous considérons un objet orbitant autour du Soleil, plus près de celui-ci que la Terre mais sur une même
ligne. Cet objet subit une gravité solaire supérieure à celle de la Terre, et tourne donc plus rapidement autour
du Soleil que ne le fait la Terre. Mais la gravité terrestre contrecarre en partie celle du Soleil, ce qui le
ralentit. Plus on rapproche l'objet de la Terre, plus cet effet est important. À un certain point, le point L1, la
vitesse angulaire de l'objet devient exactement égale à celle de la Terre.

- L2 : Sur la ligne définie par les deux masses, au-delà de la plus petite.

Exemple:

Le principe est similaire au cas précédent, de l'autre côté de la Terre. L'objet devrait tourner moins vite que
la Terre parce que la gravité solaire y est moindre, mais le champ gravitationnel supplémentaire dû à la
Terre tend à l'accélérer. À un certain point, le point L2, l'objet tourne exactement à la même vitesse angulaire
que la Terre autour du Soleil.

- L3 : Sur la ligne définie par les deux masses, au-delà de la plus grande.
Exemple:

De manière identique au point L2, il existe un point situé un peu plus loin que l'opposé de la Terre par
rapport au Soleil, où un objet de masse négligeable serait en équilibre.

- L4 et L5 : Sur les sommets des deux triangles équilatéraux dont la base est formée par les deux masses.

Exemple:

Il s'agit d'un subtil équilibre entre la force centripète exercée par les deux masses principales et la force
centrifuge des masses considérées aux points intéressés. L4 est en avance sur la plus petite des masses, dans
son orbite autour de la grande, et L5 est en retard. Ces deux points sont parfois appelés "points de Lagrange
triangulaires" ou "points troyens".

Fait remarquable, ces deux derniers points ne dépendent en rien des masses relatives des deux autres corps
comme nous le verrons.

Pour les trois premiers points de Lagrange, la stabilité n'apparaît que dans le plan perpendiculaire à la ligne
occupée par les deux masses. Par exemple, pour le point L1, si nous déplaçons un objet perpendiculairement
à la ligne entre les deux masses, les deux forces gravitationnelles vont jouer pour le ramener vers la position
initiale. L'équilibre est stable. En revanche, si nous le déplaçons vers une des deux masses, alors le champ de
celle-ci va l'emporter sur l'autre et l'objet tendra à se rapprocher encore plus. L'équilibre est instable. Pour les
points L4 et L5, la stabilité est obtenue grâce aux forces de Coriolis qui agissent sur les objets s'éloignant du
point.

Étant données les questions de stabilité évoquées plus haut, nous ne trouvons pas d'objet naturel autour des
points L1, L2 et L3 dans le système solaire. Cependant, ils représentent tout de même un intérêt pour les
réalisations scientifiques, car ils permettent des économies de combustible pour le contrôle d'orbite et
d'attitude. Ceci n'est pas valable pour le point L3, du fait de son éloignement de la Terre dont la seule
application était que les auteurs de science-fiction et de bande dessinée aimaient y placer une Anti-Terre
d'autant plus utopique que la masse de cette planète-jumelle y était bien trop élevée par rapport à la théorie
énoncée plus haut. En revanche, des missions spatiales utilisent L1 et L2 : c'est le cas de la sonde SoHO
(Solar and Heliospheric Observatory) une station d'observation du Soleil située au point L1.

L4 et L5 étant stables, nous y trouvons de nombreux corps naturels. Dans le système Jupiter-Soleil, plusieurs
centaines d'astéroïdes, appelés astéroïdes Troyens, s'y agglutinent (près de 1800 en avril 2005). Nous en
comptons quelques-uns dans les systèmes Neptune-Soleil et Mars-Soleil. Curieusement, il semblerait que le
système Saturne-Soleil ne soit pas en mesure d'en accumuler, à cause des perturbations joviennes. Nous
trouvons également des objets à ces points dans le système Saturne-satellites de Saturne : Saturne-Téthys
avec Télesto et Calypso aux points L4 et L5, et Saturne-Dioné avec Hélène au point L4 et Pollux au point
L5. Dans le système Terre-Soleil, il n'y a pas d'objet connu de grande taille aux points Troyens, mais on y a
découvert une légère surabondance de poussière en 1950. De légers nuages de poussière sont également
présents pour le système Terre-Lune; cela a fait renoncer à y placer un télescope spatial comme le projet en
avait été envisagé. Le satellite SoHO occupe depuis 1995 le point L1 à 1.5 million de kilomètres de la Terre.
En 2007 le point L2 sera occupé par le satellite Planck chargé d'étudier le fond diffus cosmologique à 2.7
[°K].

A strictement parler ces 5 points existent uniquement pour deux corps en rotation circulaire l'un autour de
l'autre. Dès que l'orbite des deux corps est elliptique, ces points ne sont plus des points d'équilibre. En
pratique, si l'orbite est faiblement elliptique, comme c'est le cas pour les planètes réelles, on peut trouver des
orbites oscillantes stables ne s'écartant pas beaucoup des régions correspondant aux points de Lagrange.

Nous allons donc considérer dans l'espace un système isolé de deux corps A et B, de masse et , en
interaction gravitationnelle. Ces deux corps sont en orbite l'un autour de l'autre, à la manière d'un système de
deux étoiles (système binaire) ou d'un système planète-satellite (Saturne-Titan par exemple). Nous
cherchons à déterminer s'il existe des positions d'équilibre par rapport au système des deux corps en rotation
pour un troisième corps (de masse suffisamment faible pour ne pas perturber le mouvement du système des
deux corps principaux).

(47.210)

Soit O le barycentre (cf. chapitre de Mécanique Classique) de ces deux astres. Considérons un repère
galiléen (en mouvement rectiligne et uniforme donc!) d'origine O. Par rapport à ce repère, nous supposerons
que l'axe AB tourne à une vitesse angulaire constante d'axe fixe (perpendiculaire à la page dans la
figure ci-dessus et dirigé en direction du lecteur) et que les distances et restent également
constantes.

Nous savons par notre étude de la mécanique classique que dans un mouvement circulaire la force centrifuge
est donnée par:

(47.211)

Nous avons donc (équilibre en force centrifuge et centripète) pour assurer l'équilibre :

et (47.212)

En simplifiant et en sommant ces deux relations :

(47.213)

avec dans la suite .


Considérons un repère tournant R' lié à nos astres comme représenté sur la figure ci-dessus : sera un
vecteur unitaire colinéaire à AB, un vecteur unitaire perpendiculaire à et dans le plan de rotation des
planètes et finalement colinéaire à .

Nous considérons dans ce repère tournant (avec les astres) un troisième astre S de masse négligeable m
devant et , soumis à l'attraction gravitationnelle de A et B.

Maintenant notons l'accélération de S par rapport à R', sa vitesse et le vecteur unitaire colinéaire
à où S ' est le projeté de S dans le plan Oxy, et (dans la figure ci-dessus, nous avons supposé S
dans le plan Oxy, et donc S et S ' sont confondus).

S est donc soumis à deux forces, l'une dirigée vers A et l'autre dirigée vers B, forces d'intensités
respectives :

et (47.214)

Dans un repère galiléen, ces deux forces imposent à S une accélération donnée par la loi de composition des
accélérations dans un référentiel circulaire (cf. chapitre de Mécanique Classique) :

(47.215)

Or, dans notre configuration la pulsation est constante et l'accélération d'entraînement est nulle puisque nous
avons posé R ' comme référentiel principal. Il vient donc :

(47.216)

Nous avons également :

(47.217)

où selon schéma toutes les composantes sont positives. Le calcul du produit vectoriel donne (cf. chapitre de
Calcul Vectoriel) :

(47.218)

Donc finalement :

(47.219)
Ecrivons plutôt cette relation sous la forme :

(47.220)

Nous obtenons alors, en projetant sur les trois axes x, y et z, les dérivées prises par rapport au temps t le
système suivant :

(47.221)

avec :

et (47.222)

pour que les coordonnées du point S soit un point d'équilibre, il est bien évidemment que dans le
référentiel tournant avec les astres A et B que :

et (47.223)

Nous obtenons alors le système suivant :

(47.224)

Il vient par ailleurs immédiatement que la troisième équation à pour seule solution et donc finalement
le système se réduit à :

(47.225)

La troisième équation signifie simplement que les positions d'équilibre sont dans le plan Oxy (on pouvait
s'en douter un peu...). La deux autres nous le verrons nous amènent à considérer cinq solution qui sont
simplement nos cinq points de Lagrange L1,...,L5.

Si nous traçons avec un logiciel ad-hoc l'accélération (respectivement la force) avec les isoclines mises en
évidences (courbes sur lesquelles l'accélération à même norme) nous obtenons :
(47.226)

et en demandant au logiciel de tracer que les isoclines projetées sur un plan :

(47.227)

où nous avons mis en évidence les cinq points de Lagrange tels et où les astres sont représentés par des
points bleus et le barycentre du système par un point vert.

Le lecteur remarquera qu'il est difficile de deviner intuitivement cette configuration du potentiel. Dans le
référentiel tournant avec le barycentre des deux corps massifs, le potentiel résultant de la combinaison des
potentiels gravitationnels et rotationnel présente 3 extrema L1, L2 et L3 sur la droite contenant les 2 corps.
L'un de ces maxima se situe entre les 2 corps, ce que l'on attend intuitivement. Les deux autres maxima se
trouvent sur la droite reliant les 2 objets, mais de part et d'autre ...ce qui est plus surprenant. Ils proviennent
au fait de la contribution au potentiel du référentiel tournant ce qui peut être difficile à modéliser
intuitivement.

POSITIONS D'ÉQUILIBRE DU PREMIER TYPE

Ce que nous entendons par les positions d'équilibre du premier type sont simplement les solutions situées sur
la droite AB tel que ce qui revient à étudier seulement :

(47.228)
avec dès lors :

et (47.229)

A cette situation nous allons considérer deux sous-cas possibles correspondant respectivement à L1 et L2
comme nous allons de suite le voir.

POINT L1 DE LAGRANGE

Dans ce premier sous cas, nous considérons :

(47.230)

Ce qui revient aussi à avoir :

(47.231)

Ce qui nous permet d'écrire :

(47.232)

sous la forme simplifiée suivante :

(47.233)

Maintenant pour dire quelque chose sur les solutions possibles de cette équation dérivons le membre de
gauche. Nous obtenons alors :

(47.234)

Ce terme est strictement croissant de à lorsque x décrit . Il y a donc une solution unique et
un point d'équilibre noté L1 (premier point de Lagrange) entre A et B.

Si nous considérons typiquement le cas Terre-Soleil où et donc alors en nous


avons :

(47.235)

ce qui immédiatement négatif. La position d'équilibre sera donc obtenu pour une valeur positive de x que
nous allons devoir déterminer.
Cette valeur peut être obtenu en considérant un cas limite : lorsque tend vers 0 (correspondant à un
astre massif A autour duquel tourne un astre B de masse beaucoup plus petit), A tend alors vers O, vers 0
et donc :

(47.236)

avec . Dès lors, dans ce cas limite :

(47.237)

devient en approximation :

(47.238)

et donc :

(47.239)

Donc la seule valeur de x satisfaisant cette relation sera .

En d'autres termes, le point d'équilibre cherché L1 ici entre A et B se rapproche de B soit de l'astre le moins
massif (ce qui correspond bien à la première figure que nous avons utilisé pour montrer l'emplacement des
cinq points de Lagrange).

De par ce constat voici les développements que nous pouvons effectuer les calculs suivants :

(47.240)

Nous avons d'après la définition du barycentre :

(47.241)

Comme notre étude se fait par rapport au barycentre nous avons et donc :

(47.242)

De la relation précédente en prenant la norme nous avons bien évidemment :


(47.243)

La distance entre les deux astres A et B demeurant constante et égalant nous écrivons :

(47.244)

Nous en déduisons trivialement :

(47.245)

Mais puisque nous pouvons grossièrement la première relation sous la forme approximative
suivante :

(47.246)

et puisque :

(47.247)

nous avons aussi :

(47.248)

Donc avec :

(47.249)

Selon le cas limite étudié précédemment, nous pouvons donc supposer L voisin de A tel qu'abusivement il
soit possible d'écrire :

(47.250)

avec .

Soit en utilisant :
(47.251)

Nous avons alors :

(47.252)

en négligeant les infiniment petits d'ordre 2.

D'où :

(47.253)

Maintenant dans la configuration mentionnée l'équilibre est donné par :

(47.254)

Donc :

(47.255)

Maintenant la troisième loi de Kepler (cf. chapitre de Mécanique Classique) nous donne :

(47.256)

Soit :

(47.257)

Après simplification :
(47.258)

Soit :

(47.259)

Donc :

(47.260)

Puisque est très supérieur à 1 et en admettant que le soit aussi nous avons :

(47.261)

Soit finalement :

(47.262)

et donc :

(47.263)

Si nous prenons le A Soleil et B la Terre, alors :

(47.264)

Nous trouvons que la distance LB vaut à peu près :

(47.265)

qui est le point L1 auquel a été placé le satellite SoHo.

Un cas particulier du point L1 à considérer est lorsque , alors , O est alors le


milieu de AB. Nous avons alors :
(47.266)

Dès lors :

(47.267)

devient :

(47.268)

Parmi les quatre racines évidentes de cette équation la seule solution acceptable est pour satisfaire
. En d'autres termes le point d'équilibre situé entre deux astres de même masse n'est autre que le
barycentre de ces deux astres.

POINT L2 DE LAGRANGE

Dans ce deuxième cas, nous considérons :

(47.269)

Nous cherchons donc les points d'équilibre au-delà de B.

Dès lors nous avons :

(47.270)

qui devient simplement :

(47.271)

Le membre de gauche est une fonction strictement croissante de x de à lorsque x décrit . Il


y a donc une solution unique, et un point d'équilibre au delà de B. Ce point est noté L2.

Cette valeur peut être obtenu en considérant un cas limite : lorsque tend vers 0 (correspondant à un
astre massif A autour duquel tourne un astre B de masse beaucoup plus petit), A tend alors vers O, vers 0
et donc :

(47.272)
avec . Dès lors, dans ce cas limite :

(47.273)

devient en approximation :

(47.274)

et donc :

(47.275)

Donc la seule valeur de x satisfaisant cette relation sera . Le point L2 finit donc par se confondre avec
B.

Connaissant ce cas limite, faisons une étude plus détaillée. Considérons le schéma suivant relativement à
notre situation limite précédente :

(47.276)

et considérons sans oublier que dans ce scénario

Nous avons alors quasiment les mêmes développements que pour L1 à la différence que :

(47.277)

Devient :

(47.278)

et que plutôt que d'avoir :

(47.279)

Nous avons :

(47.280)
et donc :

(47.281)

Toujours avec :

(47.282)

et donc :

(47.283)

ce qui correspond au point de Lagrange L2.

Un cas particulier à nouveau de L2 est lorsque , alors , O est alors le milieu de


AB. Nous avons alors :

(47.284)

Dès lors :

(47.285)

devient :

(47.286)

Il n'est plus possible d'extraire les racines ici. Il faut passer par une approximation numérique. Dans Maple,
il suffit de mettre :

solve(-1/(r+x)^2-1/(x-r)^2=x/(8*r^3),x);allvalues(");

et la seule solution admissible dans est les autres étant dans .

POINT L3 DE LAGRANGE

Dans ce deuxième cas, nous considérons :

(47.287)
Nous cherchons donc les points d'équilibre au-delà de A.

Dès lors nous avons :

(47.288)

qui devient simplement :

(47.289)

Le membre de gauche est une fonction strictement croissante de x de à lorsque x décrit .


Il y a donc une solution unique, et un point d'équilibre au delà de A. Ce point est noté L3.

Cette valeur peut être obtenu en considérant un cas limite : lorsque tend vers 0 (correspondant à un
astre massif A autour duquel tourne un astre B de masse beaucoup plus petit), A tend alors vers O, vers 0
et donc :

(47.290)

avec . Dès lors, dans ce cas limite :

(47.291)

devient en approximation :

(47.292)

et donc :

(47.293)

Donc la seule valeur de x satisfaisant cette relation sera . Le point L3 finit donc par se confondre avec
la position diamétralement opposée à B.

Connaissant ce cas limite, faisons une étude plus détaillée. Considérons le schéma suivant relativement à
notre situation limite précédente :
(47.294)

et considérons toujours sans oublier que dans ce scénario

Nous allons considérer d'abord l'approximation suivante :

(47.295)

et celle-ci aussi (puisque OA tend vers zéro lorsque l'astre A devient très massif) :

(47.296)

Dès lors :

(47.297)

Nous avons aussi (...) :

(47.298)

où à la limite où l'astre A est vraiment massif nous tombons sur le premier terme...

Avec ces deux dernières relations nous avons :

(47.299)

si nous négligeons les termes du deuxième ordre.

Nous avons par ailleurs aussi :

(47.300)

Rappelons la condition d'équilibre :

(47.301)

Et mettons tout ce que nous avons obtenu avant là-dedans :


(47.302)

Ce qui devient après simplifications :

(47.303)

après une petite approximation :

(47.304)

après simplification :

(47.305)

D'où :

(47.306)

et finalement :

(47.307)

Remarque: Chez certains auteurs de science-fiction, ce point L3 à l'opposé de la Terre par rapport au Soleil
nous cacherait une hypothétique planète qui nous serait perpétuellement cachée par le Soleil.

POSITIONS D'ÉQUILIBRE DU DEUXIÈME TYPE

Les positions d'équilibre du deuxième type sont donc celles pour lesquelles . En d'autres termes les
points situés hors de la droite AB, mais dans le plan Oxy.

Ainsi, notre système d'équations reste :

(47.308)
POINT L4, L5 DE LAGRANGE

Pour déterminer les autres points d'équilibre restant, nous pouvons diviser la deuxième équation du système
par y tel que le système devienne :

(47.309)

Retranchons à la première équation la deuxième multipliée par x. Nous obtenons alors pour la première :

(47.310)

Soit :

(47.311)

Mais comme ceci se simplifie encore en :

(47.312)

Reprenons maintenant, en toute généralité, notre schéma du début en rajoutant quelques éléments :

(47.313)

où AB est le distance entre A et B et D est le centre de masse du système donné par :


ou (47.314)

qui sont donc les rayons de giration des corps A et B.

Il est facile de vérifier que la somme des deux distances précédentes est égale à C et leur proportion
. Une autre forme de DB (qui nous sera utile) s'obtient en divisant numérateur et dénominateur par
:

(47.315)

Nous savons selon nos calculs précédents que mais cela est insuffisant. Nous voulons encore
connaître les angles des sommets A, B, S et c'est ce dont à quoi nous allons nous intéresser maintenant.

Dans ce cadre, si un satellite en S est en équilibre, il restera toujours à la même distance de A ou de B. Le


centre de rotation des 3 points est le point D, la masse A elle-même tourne autour de lui. Si le satellite, en S,
reste stabilisé, les trois corps ont la même période orbitale T. Si S est immobile dans ce cadre en rotation il
ne sera pas soumis à la force de Coriolis mais uniquement à la force centrifuge, aussi bien de celle de A que
de B.

Notons la vitesse de rotation de B et la vitesse de rotation de S. Nous avons alors :

et (47.316)

Nous en tirons que :

et (47.317)

Nous pouvons donc égaler ces deux expressions :

(47.318)

Cela exprime simplement le fait bien connu que si deux objets tournent conjointement, le plus éloigné de
l'axe est le plus rapide. Les vitesses sont proportionnelles aux distances de l'axe.

La force centrifuge sur B est en équilibre avec la force gravitationnelle de A s'exprime par :

(47.319)
Soit en simplifiant :

(47.320)

De même, la force centrifuge qui s'applique sur S est :

(47.321)

Elle est équilibrée par les forces d'attraction et des corps A et B. Néanmoins, seules les composantes
de ces forces situées sur la ligne R s'opposent efficacement à cette force centrifuge. D'où :

(47.322)

et comme :

et (47.323)

Nous avons alors :

(47.324)

Il y a aussi les forces s'appliquant à S et perpendiculaires à R doivent s'annuler. Si non, le corps S suivrait la
masse la plus importante et ne resterait pas en position et ne serait donc plus en équilibre. Il faut donc que :

(47.325)

Soit, après substitution et simplification :

(47.326)

De toutes les équations obtenues jusqu'à maintenant les seules qui nous dérangent sont les vitesses et les
angles . Il faut donc que nous arrivions à éliminer ce qui convient pour n'avoir que les deux derniers
paramètres (soit les angles).

Pour cela, nous portons au carré :


(47.327)

Nous multiplions des deux côtés par et divisons par :

(47.328)

qui est à rapprocher de :

(47.329)

Donc en égalisant :

(47.330)

Nous avons donc éliminé la vitesse de B. Maintenant, multiplions les deux côtés par et divisons par
et multiplions par R :

(47.331)

à rapprocher de :

(47.332)

Donc :

(47.333)

En divisant le tout par nous trouvons :

(47.334)

et comme nous avons démontré au début que nous noterons R'. Nous avons alors :
(47.335)

et rappelons que nous avons :

(47.336)

Soit :

(47.337)

Ce qui nous permet d'écrire :

(47.338)

En multipliant par :

(47.339)

Soit :

(47.340)

Nous pouvons maintenant remarquer une chose (faut le voir...). Si (soit que le triangle ABS est
équilatéral) la relation précédente se simplifie en :

(47.341)

Or, si le triangle est bien équilatéral nous avons alors . Dès lors :

(47.342)

Soit ce qui peut s'écrire finalement :

(47.343)
Ce qui n'est d'autre que le théorème des sinus pour le triangle SDB (cf. chapitre de Trigonométrie) et est
donc certain. En reprenant en arrière, nous pouvons maintenant prouver toutes les équations précédentes
sont satisfaites si et seulement si ABS est équilatéral. Si nous n'avions pas posé ABS comme équilatéral, nous
aurions obtenu une relation différente du théorème des sinues, sans vérification possible, et l'ensemble des
équations exigées pour l'équilibre au point S n'auraient pu être satisfaites.

Conclusion de la chose... le système donne comme solution :

(47.344)

ABS (ou ABL peu importe l'écriture), forme alors un triangle équilatéral. Les deux points d'équilibre sont
notés L4 et L5. L4 est situé en avance par rapport à l'astre de masse la plus petite, et L5 en retard.

(47.345)

En 2000, 385 astéroïdes en L4 et 188 astéroïdes en L5 ont été comptabilisés sur l'orbite de Jupiter, mais
situés précisément selon un triangle équilatéral avec le Soleil et Jupiter de part et d'autre de Jupiter : ce sont
les planètes troyennes. Il a également été observé deux objets au point L5 de Mars découverts en 1990 et
1998.
48. ASTROPHYSIQUE

L 'astrophysique est une branche interdisciplinaire de l'astronomie qui concerne principalement la

physique et l'étude des propriétés des objets de l'univers (étoiles, planètes, galaxies, milieu interstellaire par
exemple), comme leur luminosité, leur densité, leur température et leur composition chimique.

Remarque: Actuellement, les astronomes ont une formation en astrophysique et leurs observations sont
généralement étudiées dans un contexte astrophysique, de sorte qu'il y a moins de distinction entre ces deux
disciplines qu'auparavant.

ÉTOILES
Avant d'aborder le formalisme mathématique relatif à la dynamique des étoiles, nous avons souhaité suite à
une demande des lecteurs, écrire une introduction vulgarisée afin de compléter la culture générale relative à
ce domaine.

Les étoiles sont donc des corps célestes gazeux dont la masse va de 0.05 masses solaires à 100 masses
solaires. La luminosité d'une étoile (sa puissance) va de 10-6 à 106 fois celle du Soleil. Grossièrement,
lorsque la masse double, la luminosité décuple. Bien que la plupart des étoiles visibles à l'oeil nu dans notre
ciel soient des géantes bleues de 104 à 105 fois plus lumineuse que le Soleil, les 90% des étoiles qui peuplent
notre galaxie sont moins lumineuses que le Soleil.

Les astronomes ont mis en place une méthode de classification des étoiles basée sur la position dans leur
spectre, des raies spectrales d'absorption. Autrefois classées de A à Q, l'évolution de la spectrométrie a
permis leur regroupement et leur réorganisation. Les classes sont aujourd'hui définies par les lettres
OBAFGKM, et chacune est divisée en 10 sous-classes, notées de 0 à 9. La classification spectrale (tirée d'un
spectre continu dont il ne résulte seulement certaines raies du spectre après le passage de la lumière dans un
milieu donné) peut être croisée avec les classes de luminosité dont nous tirons la température à la surface de
l'étoile (nous démontrerons comment obtenir mathématiquement cette information):

(48.1)
La grande courbe au centre indique l'évolution d'une étoile de même masse que le Soleil. Après un passage
sur la séquence principale, elle devient une géante rouge, éventuellement une nébuleuse planétaire (éjection
du combustible de l'étoile à de grandes distances), puis elle termine sa vie sous la forme d'une naine blanche.
Par comparaison nous avons indiqué l'évolution d'étoiles 10 ou 30 fois plus massives que le Soleil : elles
quittent la séquence principale pour devenir des supergéantes puis elles finissent en supernovae qui ne
peuvent être représentées sur ce diagramme !

Une étoile est dans un premier temps en équilibre hydrostatique. Les forces gravitationnelles dues à sa
masse sont compensées par les forces de pression interne due à la température élevée entretenue par des
réactions thermonucléaires à basse densité et à la pression de dégénérescence des électrons à densité élevée.
Une étoile passe 90% de sa vie à fusionner de l'hydrogène en hélium qui s'accumule en son centre. Durant
cette phase, elle évolue dans ce que nous appelons "la séquence principale" du diagramme de Hertzsprung-
Russel représenté ci-dessous. Ce diagramme met en relation la température de surface (abscisse
logarithmique présenté en ordre opposé) à la luminosité (ordonnée logarithmique) de populations d'étoiles.
La séquence principale apparaît comme une diagonale. La température de surface et la luminosité étant
directement fonction de la masse:

(48.2)

Chacune des étoiles du ciel trouve sa place sur le diagramme introduit par Hertzsprung et Russell
(diagramme H-R ci-dessous) dont les diverses régions permettent d'en repérer le stade d'évolution. Il est
alors possible d'y tracer une courbe représentative de l'évolution d'une étoile donnée à partir de la
connaissance de son état au moment de l'observation.

Ainsi, les étoiles massives évoluent plus vite que les étoiles de faible masse, mais ce résultat est déduit
d'autres considérations que celles permettant de construire le diagramme. Le diagramme sert notamment à
évaluer l'âge moyen d'un amas d'étoiles à partir de celui de ses composants. De même, il permet de
caractériser les étoiles variables et leurs composantes telles les géantes rouges qui deviennent instables et
pulsantes en vieillissant. Cette famille d'objets instables définit une bande d'instabilité sur le diagramme.
Ce diagramme traduit la classification spectrale des étoiles ou leur température de sur face en fonction de
leur magnitude absolue ou de leur luminosité.

Ce diagramme, sur lequel toutes les étoiles trouvent leur place dès que nous connaissons leurs
caractéristiques, fut développé indépendamment en Europe par Ejnar Hertzsprung et aux Etats-Unis par
Henry Norris Russell. L'axe horizontal indique la classification spectrale en partant, à gauche, des étoiles les
plus chaudes, les bleues, pour atteindre les moins chaudes, les rouges, à droite. Les étoiles se positionnent en
groupes spécifiques sur le diagramme : celles qui évoluent sur leur séquence principale se situent sur une
courbe incurvée qui commence en haut, à gauche, et se termine en bas, à droite. C'est sur cette courbe que se
regroupent les étoiles stables qui brûlent leur hydrogène et, parmi elles, le Soleil qui se positionne au centre
du diagramme. Les géantes et les supergéantes apparaissent dans la partie supérieure droite, tandis que les
naines blanches se regroupent dans la partie inférieure gauche. Au fur et à mesure qu'elle évolue, chaque
étoile décrit une courbe particulière : elle commence par suivre la trajectoire de Hayashi jusqu'à ce qu'elle
atteigne sa séquence principale sur laquelle elle évolue tant que son noyau brûle de l'hydrogène. Lorsque
commence la combustion de l'hélium, elle remonte vers le haut où se concentrent les géantes rouges et y
reste jusqu'à ce que la fusion nucléaire s'arrête : elle s'effondre alors sur elle-même pour rejoindre les naines
blanches ou dans le cas d'une certaine valeur de masses solaire, les étoiles à neutrons, Trou Noirs ou encore,
si sa masse est très élevée, explose en supernovae.

Lorsque la masse d'hélium d'une étoile devient suffisante, l'augmentation de pression induit une
augmentation de la température amorçant ainsi la fusion de l'hélium ("flash de l'hélium") en carbone,
oxygène et néon créant un second front de combustion à l'intérieur du premier. Pour une étoile de masse
solaire, les réactions s'arrêtent à ce stade. L'étoile grossit et se refroidit en surface. Elle devient une géante
rouge 104 fois plus lumineuse qu'auparavant. Elle passe par des phases d'instabilité et finit par expulser
progressivement ses couches externes en formant une "nébuleuse planétaire". Son noyau, dont la densité est
de plusieurs tonnes par centimètre cube, se refroidit lentement : c'est la naine blanche (nous aborderons ce
processus sous forme mathématique plus loin). L'équilibre y est maintenu par la pression de dégénérescence
des électrons.

Pour une étoile plus massive, la température interne devient assez importante pour que le carbone et
l'oxygène puissent fusionner en silicium. A son tour, s'il est en masse suffisante, le silicium fusionnera en
fer. Les fronts de combustion se développent dans un schéma dit en pelures d'oignon. Le fer est le nucléotide
le plus stable : il se trouve au fond de la vallée de stabilité (cf. chapitre de Physique Nucléaire). Il ne peut ni
fusionner, ni fissionner. Lorsque la densité atteint une valeur critique (cela correspond à une masse totale de
l'étoile de plus de 8 masses solaires), la pression de dégénérescence des électrons n'arrive plus à maintenir
l'équilibre contre la gravitation. En un dixième de seconde, le noyau de fer s'effondre. Les autres couches du
coeur se précipitent vers le noyau effondré sous forme d'une onde dont le maximum de vitesse correspond
au rayon sonique.

La densité du noyau devient alors énorme. Il se produit des réactions inverse où les protons capturent les
électrons en formant des neutrons et libérant un flot de neutrinos. Lorsque le noyau de l'étoile atteint la
densité nucléaire de , la compaction s'arrête brutalement (rayon d'environ 10km !). Les
couches externes du noyau rebondissent par un choc superélastique et entrent en expansion. Lorsque cette
onde de choc réfléchie rejoint le rayon sonique, la température monte tellement haut que la chiffrer n'a plus
de sens. La matière subit une photodésintégration complète (tous les nucléotides sont désagrégés en gaz de
nucléons). Finalement par un mécanisme pas clairement établis, toutes les couches externes de l'étoile sont
éjectées dans l'espace : c'est une "supernovae de type II".
Le noyau effondré, presque entièrement constitué de neutrons, sera en rotation rapide si l'étoile initiale avait
un moment cinétique non nul (conservation du moment cinétique oblige). Le champ magnétique est
également conservé et dépasse de loin tout ce qui ne sera probablement jamais réalisable en laboratoire. Cela
provoque un rayonnement synchrotron qui donne l'illusion que l'étoile clignote, c'est pourquoi nous appelons
ces jeunes "étoiles à neutron" sous la dénomination de "pulsars".

Les étoiles très massives (plus de 50 masses solaires), la masse totale du coeur qui s'effondre pourrait
dépasser 3 masses solaires. Dans ce cas, la gravité devient telle que sa masse s'effondre au delà des dernières
forces répulsives et se compacte en une singularité. La courbure de l'espace devient telle qu'aucune matière,
rayonnement ou information ne peut plus s'échapper au delà d'un volume appelé horizon ou sphère de
Schwarzschild . C'est un "Trou noir". Tout ce qui y tombe perd son identité. Un trou noir ne présente plus
que trois propriétés : sa masse, son moment cinétique et sa charge électrique. Nous disons qu'un trou noir n'a
pas de chevelure. De plus, une telle singularité devrait toujours être cachée par un horizon, être habillée.

GENÈSE
Nous allons voir maintenant comment des astres nouveaux peuvent naître à partir d'immenses nuages de gaz
qui s'étendent entre les étoiles dans les galaxies. Ce milieu interstellaires est une source potentielle d'étoiles
nouvelles, qui une fois leur vie terminée (sous forme de géant rouge ou de supernova), peuvent réinjecter
une partie de leur matériau dans l'espace intersidéral.

Au fait, personne ne sait vraiment les détails de la façon dont un nuage interstellaire aboutit à une étoile car
il s'agit d'un problème fort difficile, essentiellement à cause de l'apparition de toute une hiérarchie de
structures, sous-structures, etc... dans le nuage à mesure qu'il s'effondre sur lui-même. Des mouvements
turbulents apparaissent, qui ne peuvent être décrits de manière simples par les équations hydrodynamiques
(cf. chapitre de Mécanique Des Milieux Continus). D'autres complications apparaissent lorsque nous
voulons tenir compte du champ magnétique sur le gaz en contraction, ou d'explosions de supernovae dans le
nuage...

Au moins, pouvons nous donner les conditions nécessaires pour qu'un étoile puisse se forme au sein d'un
nuage interstellaire. Pour cela, plusieurs barrières doivent en fait être franchies. Une première barrière est
thermique. Une deuxième barrière est rotationnelle : une proto étoile qui se contracte tourne de plus en plus
vite et peut littéralement exploser si sa vitesse de rotation devient trop importante (conservation du moment
cinétique). Examinons ces deux effets.

EFFONDREMENT D'UN NUAGE INTERSTELLAIRE


Deux forces opposées sont présentes dans un nuage de masse M et de rayon R : une force d'autogravitation,
qui tend à contracter le nuage, et une force de pression thermique, qui tend à le faire exploser.

Nous pouvons quantifier ces deux tendances opposées en terme d'énergie : le nuage possède une énergie
potentielle de gravitation (négative) et une énergie cinétique (positive) du à l'agitation thermique de ses
molécules.

Nous savons (cf. chapitre de Mécanique Classique) que l'énergie potentielle de gravitation de deux
particules de masses m et m' séparées de r s'écrit . Donc l'énergie potentielle d'un nuage sphérique
(...) de masse M et de rayon R est de l'ordre de :

(48.3)

Dans un gaz en équilibre thermodynamique, une particule a une énergie cinétique (cf. chapitre de
Mécanique Des Milieux Continus) de par degré de liberté (translation, rotation, etc...).
Donc, si est la masse moyenne d'une molécule du nuage, l'énergie cinétique totale de cette dernière aura
pour expression :

(48.4)

Le nuage s'effondre alors si son énergie mécanique totale est négative, soit (selon l'approximation
précédente):

(48.5)

L'équation ci-dessus permet de définir la "masse de Jean" (dans l'hypothèse d'une distribution sphérique et
homogène). C'est la masse minimum (limite), à une température T et une masse volumique données, pour
que le nuage commence son effondrement jusqu'à ce qu'un autre processus physique intervienne
éventuellement pour stopper la contraction du gaz.

En éliminant le rayon par:

(48.6)

dans l'équation précédent, nous avons alors :

(48.7)

ce que les astrophysiciens notent à la suite de toutes les approximations faites... :

(48.8)

où C est une constante sans unités. En prenant un nuage composé d'hydrogène uniquement avec n atomes
par mètre cube (c'est donc une densité!), nous aurons et où est la masse du proton.
Nous pouvons alors exprimer la masse de Jeans en masses solaires de la manière suivante :

(48.9)

où nous avons la certitude que .

Nous voyons que la masse de Jeans varie comme . Ceci a une conséquence importante : à mesure que
le nuage se contracte, n augmente, et donc diminue. Autrement dit, le nuage peut se fragmenter en
sous-nuages une fois la masse de Jeans pour ces sous-nuages atteinte.
Ces derniers vont à leur tout se scinder en sous-nuages, etc... Nous avons donc toute une hiérarchie
d'effondrements, depuis les grandes masses vers les petites masses.

La chose importante à notes aussi est que la masse de Jeans d'un nuage est beaucoup plus grande par que les
masses stellaires individuelles (il suffit de voir les constantes contenues de la relation précédente pour se
rendre compote que les facteurs sont relativement conséquents!). Donc, les étoiles naissent en général par
ensemble de plusieurs étoiles : nous nepouvons pas former en principe un Soleil isolé dans une galaxie, à
partir d'un tout petit nuage. Une fois formée, les étoiles se diluent dans la galaxie par les effets de rotations
et de marées galactiques. Ainsi, le Soleil a perdu de vue ses soeurs depuis bien longtemps probablement...

RAYON DE JEANS
Nous pouvons également exprimer la condition d'effondrement en terme de "rayon de Jeans", toujours pour
une température T et une masse volumique données. Il suffit en fait d'éliminer M dans la relation :

(48.10)

Ainsi nous avons :

(48.11)

Soit :

(48.12)

Ainsi, le rayon de Jeans est le rayon minimal d'une sphère de masse donné qui soit stable. Au delà, le nuage
stellaire va s'effondrer sur lui-même selon les mêmes conditions que la masse de Jeans.

Dans l'application numérique, nous pouvons exprimer en parsecs tel que :

(48.13)

Nous voyons alors que les nuages de formation stellaire sont en fait immenses, in extenso ils ont des tailles
de dizaines ou centaines de parsecs. Ces véritables pépinières sont ensuite dispersées dans la galaxie par
effet de marée galactique, comme nous le soulignions plus haut.

TEMPS DE CHUTE LIBRE


Nous avons vu pour l'instant que la masse d'un nuage doit être grand par rapport à celle du Soleil pour que
l'effondrement se produise. Nous allons maintenant estimer le temps que va prendre le nuage pour
s'effondrer sur lui-même.

Au début de l'effondrement, rien n'arrête la chute du nuage, la pression interne est encore très faible et
l'énergie lumineux provenant de l'échauffement progressif du nuage (lié à la contraction de ce dernier) est
immédiatement évacuée car le nuage est encore transparent.
Une parcelle de nuage à la périphérie, in extenso à la distance R du centre du nuage, subit une accélération
de la part de ce dernier. Elle commence donc à tomber vers le centre avec la loi (cf.
chapitre de Mécanique Classique). La parcelle aura atteint le centre quand . Nous obtenons donc :

(48.14)

Nous pouvons exprimer ce temps uniquement en terme de masse volumique, puisque :

(48.15)

Noter que le temps de chute ne dépend pas de la taille de l'objet ni de sa masse, mais uniquement de sa
masse volumique.

Une application numérique pour un nuage d'hydrogène donne alors:

(48.16)

Nous remarquons que ces temps restent petits par rapport à l'âge de l'Univers (13-14 milliards d'années).
Ainsi, la genèse stellaire est un phénomène relativement rapide: plusieurs générations d'étoiles ont pu voir le
jour depuis la formation des galaxies.

durée de vie nucléaire


L'âge des étoiles est principalement un problème de calcul du carburant nucléaire. La résolution de ce
problème a été apportée par la relativité, et en particulier par l'équivalence masse-énergie (cf. chapitre de
Relativité Restreinte).

Même si la description détaillée des réactions nucléaires au coeur du Soleil n'a été fait qu'au milieu des
années 1930 par Hans Bethe, les astrophysiciens ont soupçonné peu après les travaux d'Einstein que cette
équivalence pouvait expliquer l'éclat du Soleil sur des milliards d'années, par exemple via la fusion de
l'hydrogène (proton, p) en hélium (deux protons, deux neutrons) via une succession d'étapes (l'énergie
indiquée est l'énergie cinétique des différents éléments):

(48.17)

Le positron s'annihile immédiatement avec l'un des électrons d'un atome d'hydrogène environnant et leur
masse-énergie est évacuées sous forme de deux photons gamma:

(48.18)

Après ceci, le deutérium produit lors de la première étape peut fusionner avec un nouveau noyau
d'hydrogène pour produire un isotope de l'hélium :

(48.19)
Finalement, deux isotopes de l'hélium peuvent fusionner et produire l'isotope normal de l'hélium

ainsi que deux noyaux d'hydrogène qui peuvent commencer à nouveau la réaction de trois façons
différentes appelées PP1, PP2 et PP3 :

(48.20)

Et encore ces réactions ne se produisent pas toutes selon les mêmes probabilités et les mêmes
températures....

La mesure de la masse du proton donne , alors que l'hélium à une masse de

, soit une perte en masse atomique de (nous négligeons la masse des positrons qui
est 10'000 fois plus petite ainsi que celle du neutrino) :

(48.21)

Donc une perte relative de masse par fusion (c'est la part de la réaction qui s'échappe du Soleil sous forme
d'énergie cinétique):

(48.22)

Nous avons démontré plus haut que le Soleil émettait une puissance de:

(48.23)

Donc sa consommation en masse par seconde est de :

(48.24)

C'est à dire que sa masse diminue de 4.4 millions de tonnes par seconde...

Or nous savons que ce nombre correspond seulement à 0.72% de la masse mise en réaction dans la fusion.
La masse totale mise en réaction est alors (règle de trois):

(48.25)

Ainsi, à chaque seconde 627 millions de tonnes d'hydrogène (ionisé) 1 fusionnent en hélium 4 avec une
perte de masse de 4.4 millions de tonnes qui est transformée en énergie.

En estimant que seulement le centre du Soleil a les conditions thermiques pour la fusion. Ceci nous amène à
déterminer son temps de vie nucléaire:

(48.26)
En transformant cela en années nous avons:

(48.27)

TEMPÉRATURE INTERNE
Les étoiles sont supposées être des amas sphériques d'hydrogène gazeux où les interactions entre molécules
sont régies par l'attraction gravitationnelle.

Une étoile n'a pas de paroi qui la délimite, c'est-à-dire qu'il n'y a pas de forces extérieures donc :

(48.28)

En utilisant le théorème de Viriel vu dans le chapitre de Mécanique Des Milieux Continus :

(48.29)

Nous avons pour un masse sphérique gazeuse de rayon R de masse M composée de N corps :

et (48.30)

Remarque: Pour le calcul de l'énergie potentielle nous renvoyons le lecteur au chapitre de Mécanique Classique du
site.

Donc:

(48.31)

où rappelons-le, k est la constante de Boltzmann.

Ce qui nous donne:

(48.32)

Avec pour une étoile donnée N étant le rapport de la masse totale de l'étoile sur la masse moyenne d'une
molécule.

Pour le Soleil, il vient que .

C'est la température centrale du Soleil. Les mesures optiques mesurées depuis la Terre ne donnent que la
température en surface (chromosphère), soit 6'000 [°K]. La température interne calculée est donc environ
1'600 fois plus élevée qu'à la surface. Des méthodes indépendantes basées sur les réactions nucléaires au
centre du Soleil (mesure du flux de neutrinos solaires) donnent le même ordre de grandeur, mais les valeurs
précises diffèrent d'un facteur 2 à 3.
TEMPÉRATURE EXTERNE
Nous avons démontré dans le chapitre de Thermodynamique que la loi de Stefan-Boltzmann, permet de
calculer la température d'un corps chauffé à partir de son émittance ou de son énergie interne en termes de
densité tel que :

(48.33)

avec :

(48.34)

étant la constante de Stefan-Boltzmann.

Prenons un exemple intéressant qui nous concerne directement :

L'émittance moyenne dite aussi "émittance moyenne bolométrique" reçu par la Terre hors atmosphère
appelé "constante solaire" (qui n'est au fait pas constante... sur une échelle de plusieurs milliards d'années)
est directement mesurable en orbite et vaut .

Connaissant la distance moyenne au Soleil comme étant d'environ (Unité

Astronomique), nous pouvons calculer la surface de la sphère S à et donc la puissance solaire P.


Ainsi :

et (48.35)

Supposant connu le rayon du Soleil comme valant , nous pouvons calculer sa surface
S puis l'émittance radiative solaire M(T). Ainsi :

et (48.36)

Remarque: La surface rayonnante d'une étoile est appelée "photosphère".

A l'aide de la loi de Stephan-Boltzmann, nous pouvons maintenant calculer la température


thermodynamique de la photosphère :

(48.37)

La loi de Planck (cf. chapitre de Thermodynamique) appliqué à cette température nous permettrait de
calculer la distribution spectrale du rayonnement solaire et nous voyons alors que le maximum de l'intensité
est dans le domaine visible (notre visibilité...) du spectre qui va de 400 [nm] à 700 [nm].
LUMINOSITÉ
La "luminosité bolométrique intrinsèque" d'une étoile correspond à sa puissance totale rayonnée dans tout le
spectre électromagnétique dans la direction de l'observateur exprimée de façon relative à la puissance totale
rayonnée par le Soleil. En supposant toutes les étoiles sphériques et isotropes, nous pouvons l'exprimer en
unités solaires :

(48.38)

La puissance rayonnée se calcule elle, en multipliant bien évidemment l'émittance radiative (loi de Stefan-
Boltzman) par la surface de l'étoile :

(48.39)

La luminosité bolométrique intrinsèque d'une étoile est donc proportionnelle au carré de son rayon et à la
quatrième puissance de sa température de surface. En prenant le Soleil comme référence, les constantes
s'annulent. Nous pouvons alors écrire :

(48.40)

avec et d'où

En astrophysique, nous utilisons également une échelle logarithmique pour exprimer la luminosité
bolométrique d'une étoile : la magnitude absolue M. Cette unité a une origine empirique qui sera expliquée
plus bas.

ÉCLAT
"L'éclat" e d'une étoile est sa "luminosité apparente". L'éclat (luminosité apparente) d'une étoile correspond à
la densité de rayonnement reçu par l'observateur c'est-à-dire au flux et vaut le rapport entre la puissance de
l'étoile et la surface de la sphère dont le rayon est égal à la distance d qui sépare l'observateur de l'étoile :

(48.41)

L'éclat diminue ainsi avec le carré de la distance. Il est important de remarquer que cette grandeur n'a aucune
relation directe avec les propriétés intrinsèques physique de l'étoile concernée (contrairement à la luminosité
bologométrique!).

En astrophysique, nous utilisons également une autre échelle où la luminosité apparente est donnée par une
autre grandeur d'origine empirique : la magnitude apparente, qui sera expliquée de suite ci-dessous.
MAGNITUDE APPARENTE
Ptolémée en 137 après J.-C. avait défini une échelle de six grandeurs pour exprimer l'éclat des étoiles, la
première pour les plus brillantes et la sixième pour les étoiles tout juste visibles à l'oeil nu (6 grandeurs et
donc 5 écarts).

Au cours du 19ème siècle, avec l'arrivée de nouvelles techniques d'observations photométriques


(photographiques puis photoélectriques), l'échelle de grandeurs a été remplacée par celle de "magnitude
apparente" qui a été définie de telle sorte à ce que cette nouvelle échelle soit proche de l'ancienne.

La définition est la suivante :

- L'échelle est logarithmique en base 10 (par commodité des grandeurs manipulées)

- Il y a 5 écarts de magnitude correspondant à un rapport de luminosité apparent de 1 pour 100 (1:100)

- L'échelle est inverse (une magnitude élevée correspond à un faible éclat/luminosité apparente).

A l'aide de ces définitions, nous pouvons construire une règle liant de façon relative les éclats de deux
étoiles à leur magnitude apparente m.

Pour une étoile 2, cent fois plus brillante ou éclatante qu'une étoile 1, l'étoile 1 est 5 unités de magnitude au-
dessus de l'étoile 2 (n'oublions par que l'échelle est inverse). Donc :

(48.42)

correspond à :

(48.43)

Nous pouvons alors poser les relations :

et (48.44)

Par application de la règle de trois, nous construisons :

(48.45)

En simplifiant, nous trouvons la "loi de Pogson" qui exprime la relation entre magnitudes visuelles
apparentes et éclats de deux étoiles :

(48.46)
Ainsi définie, l'échelle de magnitudes visuelles n'est que relative. La référence est photométrique est
similaire à l'éclat de Véga .

Pour se faire une idée des magnitudes visuelles voici quelques exemples : Soleil -26.5, Pleine Lune -15,
Vénus au maximum -4.8, Sirius la plus brillante des étoiles -1.5 (type spectral A1 et distante de 8.6 années
lumière), limite de la perception à l'oeil nu 6, limite de perception à travers un télescope amateur de 15 cm à
ce jour (2003) 13, limite de perception du télescope spatial Hubble 30.

Il faut préciser que la magnitude apparente visuelle ne correspond pas exactement à la magnitude apparente
réelle, car l'oeil n'a pas la même sensibilité pour toutes les longueurs d'onde. Les étoiles bleues ou rouge
nous paraissent moins lumineuses à l'oeil qu'elles ne le sont en réalité car une partie du rayonnement se
trouve dans les ultraviolets, respectivement dans l'infrarouge.

Il convient donc de préciser qu'il s'agit d'une magnitude apparente visuelle ou bolométrique. En général, les
astrophysiciens utilisent les grandeurs bolométriques dans leurs communiqués.

MAGNITUDE ABSOLUE
La magnitude absolue M (ne pas confondre avec la notation de l'émittance..) d'une étoile est une grandeur
logarithmique aussi, qui exprime cette fois la luminosité L bolométrique. C'est la grandeur présentée en
ordonnée du diagramme de Hertzsprung-Russel. L'échelle de cette grandeur est basée sur la magnitude
visuelle.

La magnitude apparente et la magnitude absolue sont liées par la distance qui nous sépare de l'étoile. A
luminosité apparente intrinsèque constante, la luminosité apparente décroît donc évidemment avec le carré
de la distance comme nous l'avons déjà vu. Afin d'établir une relation, nous avons dû choisir une distance de
référence par une nouvelle définition.

Définition: La "magnitude absolue" d'une étoile est égale à sa magnitude apparente si elle est à une distance
de 10 parsecs (32.6 années lumières).

Soit une étoile placée à une distance quelconque d. Son éclat est fonction de la distance et de son éclat
si elle était située à selon :

(48.47)

Par application de la règle de trois, nous construisons :

(48.48)

En reprenant la loi de Pogson et en assimilant à la magnitude apparente m de l'étoile à la distance


d quelconque, à la magnitude apparente de l'étoile à (par définition de sa magnitude absolue
M) ainsi que son éclat à et sont éclat à la distance quelconque, nous trouvons :

(48.49)
qui peut bien sûr aussi s'écrire :

(48.50)

En partant de cette définition, la magnitude absolue du Soleil est de 4.7. Sa magnitude apparente vue depuis
la Terre est de -26.5. Elle est de 4.7 à 10 [pc] donc faiblement visible à l'oeil nu.

Cette dernière relation de comparaison de la magnitude absolue avec la magnitude apparente (qui est la
magnitude observée effectivement sur Terre) permet une estimation de la distance d de l'objet en
astrophysique.

Remarque: Pour avoir la magnitude absolue, il faut des modèles stellaires, et connaître la température de l'étoile
comme nous allons de suite le voir. Dans la pratique, la seule quantité aisément accessible est évidemment la
magnitude observée, qui est en fait la combinaison de la magnitude apparente et de l'absorption interstellaire.

La loi de Pogson exprime de même la relation entre magnitudes absolues M et luminosité bolométrique L de
deux étoiles :

(48.51)

Ainsi, Déneb étant 300'000 fois plus lumineux que le Soleil, la magnitude absolue est de -9.

En reprenant la loi de Pogson, la magnitude absolue peut s'écrire relativement à la luminosité bolométrique
absolue du Soleil :

(48.52)

Avec et , la magnitude absolue bolométrique se calcule ainsi à partir de sa


luminosité bolométrique :

(48.53)

En reprenant l'expression de la luminosité bolométrique :

(48.54)

La magnitude (bolométrique) absolue d'une étoile étant directement fonction de sa température et de son
rayon :

(48.55)

C'est le résultat que nous voulions montrer depuis le début : la magnitude absolue est directement liée à la
luminosité bolométrique de l'étoile, raison pour laquelle c'est celle qui intéresse le plus les astrophysiciens.
Remarque: La distance d'étoiles proches a pu être déterminée grâce au satellite Hipparcos. Par mesure du parallaxe
(mesure de la position de l'étoile à six mois d'intervalles et pas application des règles trigonométriques
élémentaires). Mais, au delà de quelque dizaines de parsec, la mesure de la distance d'étoiles par parallaxe devient
très imprécise. En étudiant le spectre de l'étoile, nous pouvons déterminer sa classe spectrale, sa température de
surface et la placer dans le diagramme de Hertzsprung-Russel. Il est donc possible d'estimer sa magnitude absolue et
de calculer approximativement sa distance.

Cet artifice de mesure est fondamental pour la cosmologie. C'est ainsi que l'on détermine la distance des
galaxies proches en mesurant la période de certaines étoiles variables (nous y consacrons un petit chapitre
ci-dessous).

La distance des galaxies lointaines se calcule en mesurant la magnitude apparente de supernovae qui s'y
produisent fortuitement. En effet, la magnitude absolue des supernovae du type Ia (nous les reconnaissons
par l'absence de rayes d'hydrogène et par la décroissance de leur luminosité) sont bien calibrées car l'énergie
dégagée par ces explosions stellaires est relativement constante.

ÉTOILES VARIABLES
Les étoiles de la séquence principale du diagramme de Hertzsprung-Russel sont des objets très stables. La
force de gravitation, qui tend à contracter l'astre, est exactement compensée par les forces de pression
interne, qui tendent à le dilater. C'est au moment où l'étoile devient une géante rouge que parfois l'équilibre
est rompu. Commence alors une phase d'instabilité qui se traduit par de fortes variations de la luminosité de
l'étoile.

La rupture de l'équilibre est provoquée par un phénomène complexe qui met en jeu des variations de
transparence des couches d'hélium près de la surface de l'étoile. A partir de là, l'astre se met à connaître une
succession de dilatations et de contractions contrôlées par les forces qui assuraient auparavant l'équilibre.
Lorsque la force de pression l'emporte, le volume de l'astre augmente. Mais la gravité freine le mouvement
et finit par provoquer la contraction. Le volume de l'étoile passe alors sous sa valeur moyenne, jusqu'à ce
que la pression interne s'oppose à la contraction et réussit à provoquer une nouvelle dilatation.

Ce ne sont pas les changements de taille qui provoquent les variations de luminosité, mais ceux de la
température. Effectivement, comme nous l'avons vu précédemment, la luminosité d'une étoile varie avec la
quatrième puissance de la température, alors qu'elle ne varie qu'avec le carré du rayon. Lorsque le volume de
l'étoile est cependant plus faible qu'en moyenne, sa température est légèrement plus forte et la luminosité
maximale. Dans le cas contraire, la température est légèrement plus basse qu'en moyenne et la luminosité
minimale. L'éclat de l'étoile change donc de façon périodique, d'où le nom d'étoile variable.

Il existe dans le diagramme de Hertzsprung-Russel une bande d'instabilité qui traverse ce diagramme
presque verticalement dans laquelle se produisent justement les phénomènes thermiques en question.

Les deux principaux types de variables pulsantes sont les céphéides et les étoiles RR Lyrae. Ces astres
jouent un rôle central en astrophysique. Les céphéides sont des étoiles de quelque masses solaires. Elles sont
dans la phase de combustion de l'hélium après avoir atteint le stade de géante rouge. Les étoiles de masse
solaire arrivées à ce stade deviennent des RR-Lyrae. Leur luminosité varie avec une période comprise entre
un jour et plusieurs semaines. La propriété remarquable des céphéides est l'existence d'une relation entre leur
luminosité moyenne et la période de leurs oscillations. Par exemple, leur luminosité moyenne est de 1000
fois celle du Soleil pour une période de quelques jours et de 10000 fois cette valeur pour une période de
plusieurs semaines. C'est cette relation qui fait des céphéides l'un des outils de base de l'astrophysique.
Si nous connaissons cette relation pour une étoile variable, il est relativement aisé, par la détermination de sa
période d'en tirer la magnitude absolue M. En mesurant alors sa magnitude apparente m nous pouvons
ensuite calculer sa distance d en parsec à l'aide de la relation (démontrée précédemment):

(48.56)

La figure ci-dessous représente la courbe période-luminosité des Céphéides.

(48.57)

L'étalonnage de cette courbe ne peut se faire que par des mesures de parallaxe sur des Céphéides proches. Il
n'en existe malheureusement pas d'assez rapprochées pour qu'il soit possible d'utiliser la parallaxe annuelle.
Il faut avoir recours à la parallaxe secondaire qui est basée sur le mouvement du Soleil dans la galaxie.

Exemple:

Nous repérons une Céphéides grâce à son type de classe spectrale. Sa période est de 50 jours et sa magnitude
apparente . La figure précédente donne, pour cette étoile, une magnitude absolue .

En appliquant ensuite la formule donnée précédemment, nous trouvons :

(48.58)

Cette céphéide est donc éloignée de 630 [pc].

Grâce aux propriétés des Céphéides, nous disposons d'un instrument de mesure qui porte jusqu'à quelques
dizaines de millions d'années-lumière. Il est donc applicable au delà de notre Voie lactée jusqu'aux galaxies
proches comme les membres du groupe local. Au-delà, il devient difficile de détecter des Céphéides aux
caractéristiques connues.

Les étoiles RR Lyrae sont quant à elles des étoiles peu massives et vieilles. Leur période d'oscillation est
inférieure à un jour. Contrairement aux céphéides, elles ont toutes la même luminosité moyenne (magnitude
absolue de 0.5), environ 100 fois celle du Soleil.

Il existe encore une certaine quantité d'étoiles variables différentes (variables à éclipses, des variables
explosives, variables binaires,...) dont nous pouvons trouver une source abondante d'information sur
l'Internet.

Il existe d'autres méthodes plus connues de mesure des distantes que celle des céphéides ou de l'effet
Doppler :
PARALLAXE TRIGONOMÉTRIQUE
La méthode de parallaxe trigonométrique est très simple (mais délicate à mettre en oeuvre à la surface de
notre planète pour les étoiles très distantes). Tout astronome amateur constate la fuite de l'étoile qu'il observe
dans son oculaire. Ce mouvement se nomme "mouvement diurne". Il est dû à la rotation de la Terre sur elle
même. L'étoile est également animée d'un mouvement elliptique beaucoup mois facilement détectable : le
"mouvement parallactique".

Il est dû, comme le suggère le schéma ci-contre, à la rotation de la Terre autour du Soleil. Nous mesurons
dont l'angle :

(48.59)

si l'angle est faible (ce qui est très fréquemment le cas étant donné la distance des étoiles), nous pouvons
prendre le premier terme du développement de Taylor de la fonction tangente :

(48.60)

Ce qui nous permet d'écrire :

(48.61)

où d est la distance du Soleil à l'étoile et a celle de la Terre au Soleil comme représenté ci-dessous :

(48.62)

l'effet Doppler-Fizeau relativiste


L'effet Doppler-Fizeau est le décalage entre la fréquence de l'onde émise et de l'onde reçue lorsque
l'émetteur et le récepteur sont en mouvement l'un par rapport à l'autre. C'est une technique utilisée en
astrophysique pour calculer la distance d'un astre en supposant sa longueur d'onde d'émission connue (ou
estimée) et en mesurant sa longueur d'onde reçue.

L'effet Doppler des ondes électromagnétiques doit être discuté indépendamment de l'effet Doppler
acoustique (appelé également "effet Doppler-Fizeau galiléen"). Premièrement parce que les ondes
électromagnétiques ne consistent pas en un mouvement de matière et que par conséquent la vitesse de la
source par rapport au milieu n'entre pas dans la discussion, ensuite parce que leur vitesse de propagation est
c (la vitesse de la lumière) et reste la même pour tous les observateurs indépendamment de leurs
mouvements relatifs. L'effet Doppler pour les ondes électromagnétiques se calcule donc nécessairement au
moyen du principe de relativité.

Pour un observateur dans un repère d'inertie, une onde électromagnétique plane et harmonique peut être
décrite par une fonction de la forme :

(48.63)

multipliée par un facteur d'amplitude approprié. Pour un observateur attaché à un autre repère d'inertie, les
coordonnées x et t doivent être remplacées par x' et t', obtenues par la transformation de Lorentz (cf. chapitre
de Relativité Restreinte), et celui-ci écrira par conséquent pour sa description la fonction :

(48.64)

où k' et ne sont pas nécessairement les mêmes que pour l'autre observateur (justement c'est ce que nous
chercons à savoir). Par ailleurs, le principe de relativité demande que l'expression:

(48.65)

reste invariante quand nous passons d'un observateur d'inertie à un autre.

Nous aurons alors:

(48.66)

En utilisant les relations de transformation de Lorentz (cf. chapitre de Relativité Restreinte), nous avons:

(48.67)

Par identification il vient immédiatement:

(48.68)

si nous tenons compte que :

(48.69)

dans le cas des ondes électromagnétiques, nous pouvons écrire chacune de ces relations sous la forme:

(48.70)

Le rapport:

(48.71)
donne le "décalage spectral" noté Z pour un mouvement de l'observateur par rapport à la source suivant la
direction de propagation.

Par ailleurs la dernière relation avec les pulsations est plus souvent donnée dans la littérature sous la forme
suivante :

(48.72)

Ce qui se notre plus couramment encore :

(48.73)

Il faut bien se rappeler que le décalage de pulsation (et donc fréquence) qui a lieu ici est dû à un mouvement
relatif par rapport à la source et non autre chose. Effectivement, lors de notre étude la relativité générale (cf.
chapitre de Relativité Générale), nous verrons qu'il y a également superposition d'un décalage à cause du
champ gravitationnel environnant l'émetteur qui sera étudié comme étant causé par la courbure de l'espace-
temps.

En ce qui concerne la transformation de l'amplitude du champ électrique et du champ magnétique il faut


utiliser le tenseur de Maxwell démontré dans le chapitre de Relativité Restreinte.

Un très bon exemple de l'application de l'effet Doppler consiste à étudier les limites données par la mesure
de la vitesse apparente. Voyons de quoi il s'agit :

VITESSE APPARENTE
En mesurant la vitesse apparente de déplacement d'objets très rapides dans le ciel (jets de plasma, etc...), les
astrophysiciens ont obtenu des vitesses apparentes de déplacement supérieures à la vitesse de la lumière
dans le vide!

Au fait, il s'agit d'une illusion qui peut se produire si la vitesse de l'objet est très proche de celle de la
lumière qu'il émet, donc assez proche de c.

(48.74)

L'objet émet de la lumière à l'instant , celle-ci ne nous atteint pas instantanément mais doit parcourir une
distance d pour arriver à nous. Nous recevons après le temps :
(48.75)

L'objet lui, se déplace à la vitesse v suivant un angle noté θ avec la direction d'observation, donc à l'instant t,
l'objet s'est déplacé d'une distance . La lumière émise par l'objet à l'instant t doit parcourir la distance
(application de Pythagore) :

(48.76)

pour nous arriver (l'objet s'est avancé de dans la direction d'observation mais s'est éloigné de l'axe
d'observation de la distance ), nous recevons donc la lumière qui a été émise par l'objet à l'instant t
après un temps :

(48.77)

Entre les deux positions de l'objet, il s'est écoulé la durée t mais, vu de l'observateur, l'intervalle de temps
entre la réception des images de ces deux positions est :

(48.78)

différent de t.

Pour un intervalle de temps t petit, nous avons, en développement limité de Taylor :

(48.79)

Pendant cet intervalle de temps, toujours vu de l'observateur, l'objet semble s'être déplacé sur le plan du ciel
de .

Ainsi, la vitesse apparente de l'objet est :

(48.80)

Si nous posons l'angle comme étant égal très proche d'un angle droit, nous avons alors le deuxième terme
du dénominateur qui est très petit ce qui nous permet avec un développement de Taylor d'écrire une relation
que l'on retrouve assez souvent dans les manuels scolaires des petites classes:
(48.81)

Cherchons le maximum de cette fonction pour comprendre comme une telle observation est possible en
dérivant par rapport à et en cherchant pour quelle valeur la dérivée s'annule:

(48.82)

et cela s'annule après simplification du dénominateur pour :

(48.83)

d'où :

(48.84)

La vitesse apparente est alors est alors :

(48.85)

et elle est égale ou supérieure c si déjà :

(48.86)

donc :

(48.87)

Nous voyons ainsi qu'il est possible d'observer des mouvements apparents plus rapides que la lumière, alors
même que l'objet est très rapide, certes, mais plus lent que c. Comme il ne s'agit que d'une illusion, il n'y a
pas de contradiction avec la théorie de la relativité.

En connaissant la vitesse de déplacement d'un astre obtenue à l'aide de l'effet Doppler et la vitesse apparente
à l'aide des observations, il est alors facile pour les astrophysiciens de déterminer l'angle en faisant un peu
d'algèbre élémentaire à partir de la relation ci-dessous :

(48.88)
LIMITE DE CHANDRASEKHAR
Nous avons déjà déterminé dans le chapitre de Mécanique Classique le rayon de Schwarzschild (sous sa
forme classique) qui exprime le rayon critique d'un corps pour que la vitesse de libération à sa surface soit
égale à la vitesse de la lumière. Nous avions obtenu la relation ci-dessous qui exprimait typiquement le
rayon que devrait avoir un astre donné pour avoir une vitesse de libération égale à celle de la lumière :

(48.89)

Dans ce cas particulier l'astre est ce que nous avions appelé un "Trou Noir". Cependant, avant le trou noir,
une étoile passe comme nous en avons parlé par plusieurs étapes intermédiaires par lesquelles elle peut
d'ailleurs se stabiliser. Ainsi, vous avez du souvent lire dans la littérature que pour une naine blanche
s'effondre en étoile à neutrons, que sa masse devait être supérieur à 1.4 masses solaire. C'est ce que nous
allons démontrer maintenant.

Nous allons introduire le sujet sur l'étude de l'influence du principe d'incertitude sur la taille d'un système
atomique (il en limite la dimension minimale). Cet exemple est fort puissant car il montre que le principe
d'incertitude ne régit pas seulement le processus de la mesure mais aussi le comportement global des
systèmes quantiques.

Le premier exemple que nous pouvons donner est celui de l'atome d'hydrogène, non que nous attendions un
résultat nouveau de cette méthode d'analyse, mais plutôt parce que nous pouvons exposer l'usage du principe
d'incertitude et insister sur sa signification.

Nous admettons que le proton, dont la masse l'emporte de beaucoup sur celle de l'électron, peut être
considéré comme fixe. L'énergie de l'électron s'écrit :

(48.90)

En physique classique, un système dont l'énergie est donnée par la relation précédente ne possède pas de
minimum : si nous faisons tendre r vers zéro en conservant la forme circulaire de l'orbite, il est facile de voir
que tend vers . En revanche, en physique quantique, cette limite n'a pas de sens : le principe
d'incertitude s'y oppose.

Dans ce cas, la recherche du minimum de prend un sens, car une contrainte apparaît qui maintient ce
minimum à une valeur finie. Elle se détermine en physique quantique (voir le modèle de Bohr de l'atome
dans le chapitre de Physique Quantique Corpusculaire) et impose:

où (48.91)

Cependant, cette relation mis à part, si le rayon r de l'atome devient trop faible sous des contraintes
extérieures (attention! nous nous affranchissons des orbites quantifiées du modèle de Bohr de l'atome qui
impose une contrainte à p) la quantité de mouvement p de l'électron ne peut être inférieure à l'incertitude
qu'impose le principe d'incertitude de Heisenberg, dès lors que est de l'ordre du rayon r de l'atome.
La forme même de la relation précédente limite la portée de la méthode : nous ne pouvons espérer
déterminer mieux qu'un ordre de grandeur du minimum de .
Afin d'évaluer le minimum de l'énergie totale, que nous interprétons comme l'état fondamental de l'atome
d'hydrogène, nous calculons le minimum de en éliminant p de l'expression:

par (48.92)

Nous obtenons :

(48.93)

Le rayon de l'atome dans l'état fondamental est la valeur de r qui donne à E(r) sa valeur minimale:

(48.94)

si bien que:

(48.95)

qui est l'expression bien connue du rayon de Bohr vue en physique quantique corpusculaire lors de l'étude du
modèle de Bohr de l'atome. L'énergie de l'état fondamental est donc maintenant facilement calculable.

Le but de cet exemple est de montrer qu'avec le principe d'incertitude de Heisenberg nous pouvons par un
raisonnement très simple retrouver l'état fondamental d'un système. C'est exactement de cette façon que
nous allons procéder pour déterminer les conditions qui font qu'un astre se retrouve dans son état
fondamental.

Attaquons maintenant à l'étude d'une étoile. Schématiquement celle-ci se compose d'un mélange de deux
gaz: celui qui est formé de noyaux d'une part, le gaz électronique de l'autre.

Au cours de la vie de l'étoile, de nombreux processus de fusion ont eu lieu. Ils ont accru à chaque fois la
taille et la masse des noyaux; FE (le fer) qui est abondant à la fin de la vie d'une étoile, contient en moyenne
56 nucléons (voir la partie physique atomique du site).

Ces noyaux sont de nature chimique ou isotopique variée. Comme ils sont peu nombreux en comparaison
des électrons, leur pression est celle d'un gaz classique chargé, neutralisé par la présence des électrons: elle
peut être ignorée, et ce d'autant plus que la température est nulle.

La charge électronique seule ne permettrait pas aux électrons de résister à l'effondrement d'une étoile
puisque la matière stellaire est neutre. A très basse température, quand le carburant est épuisé, la seule
pression que le gaz électronique puisse opposer à la pression hydrostatique due à la pesanteur est d'origine
quantique.

En première approximation, les électrons exercent donc l'un sur l'autre une répulsion apparente qui n'est pas
d'origine coulombienne (principe d'exclusion de Pauli). En première approximation, ils obéissent à une
relation analogue à celle de l'électron atomique et qui s'écrit dans le cas minimal (ou maximal de pression) :
(48.96)

où est la distance moyenne qui sépare deux électrons voisins.

A température , l'équilibre est atteint quand l'énergie (la matière de l'astre) totale du système est
minimale.

Que se passe-t-il si nous essayons d'évaluer la variation du rayon de la Naine Blanche en fonction de sa
masse ?

L'énergie potentielle gravifique d'une étoile est donnée en bonne approximation par (voir chapitre de
Mécanique Classique) :

(48.97)

étant approximativement donnée par:

(48.98)

où est la masse du proton et N le nombre de nucléons que contient l'étoile: la contribution des électrons à
la masse de l'astre est négligeable et il n'y pas lieu de distinguer entre la masse du neutron et celle du proton,
presque identiques.

La seconde contribution à l'énergie est essentiellement celle du gaz électronique dégénéré (la
dégénérescence correspond à l'existence de plusieurs états ayant la même énergie), d'origine cinétique. Nous
pourrions être tentés d'écrire simplement:

(48.99)

Cette manière de faire conduit à une impasse. Si nous exigeons que la somme atteigne une valeur
minimale, nous aboutissons à une valeur du rayon de l'étoile tellement faible que, par application de la
relation la vitesse moyenne des électrons v dépasserait celle de la lumière!

Pour éviter cette contradiction, nous devons recourir à la mécanique relativiste qui nous a montré que, dans
ce cas (cf. chapitre de Relativité Restreinte), nous pouvons exprimer l'énergie totale comme:

(48.100)

si la valeur numérique de l'énergie cinétique l'emporte considérablement sur l'énergie de repos nous avons :

(48.101)

et donc:

(48.102)
La distance moyenne d entre électrons s'évalue en supposant que l'étoile est homogène, approximation
suffisante dès lors que nous cherchons l'ordre de grandeur d'une moyenne. Nous simplifions encore la
géométrie en admettant que chaque électron est entouré d'un domaine sphérique de rayon d dans lequel il n'y
a pas d'autre électron de même spin et où nous ne pouvons compter qu'un électron de spin opposé. Dès lors:

(48.103)

Il reste à évaluer le minimum de la somme:

(48.104)

compte tenu de la condition :

(48.105)

Il vient encore:

(48.106)

puis:

(48.107)

que nous écrivons finalement:

(48.108)

Face à ce résultat, nous sommes confrontés à une situation inattendue :

Si le facteur:

(48.109)

est positif, alors l'énergie totale de la naine blanche l'est aussi, ce qui signifie que le système n'est pas lié:
l'étoile est totalement instable (elle n'a pas atteint son seuil d'énergie minimal). Elle ne peut réduire son
énergie qu'en augmentant sans limite son rayon r.

Nous voyons que le facteur K est négatif si :

(48.110)

Si la Naine Blanche dépasse cette masse alors nous ne pouvons plus traiter le problème avec les équations
précédentes. Elle satisfait alors aux équations régissant un astre composé de neutrons uniquement (étoile à
neutrons) et ceci constitue alors un autre problème que nous n'aborderons pas ici pour l'instant.
La masse (approximative) de la fameuse "limite de Chandrasekhar" est donc donnée par :

(48.111)

Elle constitue la masse au-delà de laquelle une naine blanche s'effondre en étoile à neutrons.

Conventionnellement, les astrophysiciens associent cette valeur limite à un facteur multiplicateur de la


masse du Soleil . Nous avons effectivement (numériquement) .
49. RELATIVITÉ RESTREINTE

N ous avons toujours considéré jusqu'à maintenant lors de tous nos développements que les interactions
(relations de cause à effet) entre les corps se faisaient instantanément, ainsi que l'observation d'un
phénomène avait lieu instantanément après que celui-ci soit. Or, deux physiciens (Michelson et Morley) au
cours d'une expérience découvrirent quelque chose qui allait changer radicalement toute la physique
classique : la vitesse (célérité) de la lumière était invariante (constante) quelque soit le mouvement que l'on
avait par rapport à elle !

Cette observation est d'autant plus importante que nous savons que c'est la lumière qui nous permet de
percevoir et de ressentir les choses. Il convient également de prendre en considération que le champ
électrostatique et magnétique sont comme nous l'avons vu en physique quantique des champs (voir chapitre
du même nom) véhiculés par le vecteur d'interaction qu'est le photon qui se déplace à la vitesse finie de la
lumière c. Cette constatation nous permet aussi de supposer que le champ gravitationnel finalement a aussi
un vecteur d'interaction (qui serait le "graviton" dont l'existence semble prouvée indirectement) qui se
propage à la vitesse de la lumière. Il convient dès lors de prendre en compte cette non-instantanéité et les
conséquences que cela entraîne dans les phénomènes observés pour déterminer finalement ce qui est
réellement que de ce qui semble être.

Avant de nous attaquer aux calculs, il convient de définir un petit peu ce qui va être étudié dans ce chapitre.

Définition: La "relativité restreinte" est une théorie confinée aux référentiels inertiels isolés (galiléens),
c'est-à-dire à l'étude de référentiels animés d'un mouvement rectiligne uniforme (inertiels). La raison sera
donnée lors de l'énoncé du principe de relativité restreinte (voir plus bas).

Remarques:

R1. Restreindre l'étude à des référentiels inertiels n'empêche bien évidemment pas qu'à l'intérieur de ceux-ci
les corps peuvent êtres animés d'une vitesse uniforme ou non!

R2. La relativité générale a pour rôle de prendre en compte des référentiels non inertiels et dans n'importe
quel système de coordonnées en faisant usage de la puissance du calcul tensoriel pour être applicable dans
n'importe quel type d'espace (autre que plat donc !).

La relativité restreinte se base principalement sur trois concepts très importants :

1. Le postulat d'invariance (de la vitesse de la lumière).

2. Le principe cosmologique (voir plus bas)

3. Le principe de relativité restreinte (voir plus bas)

Il convient aussi de prévenir le lecteur que nous allons utiliser ici beaucoup de concepts vus dans les
chapitres d'algèbre linéaire, calcul tensoriel, trigonométrie hyperbolique, calcul différentiel et intégral,
mécanique analytique, mécanique classique, électrostatique, magnétostatique et électrodynamique. Il est
fortement conseillé d'avoir parcouru ces différents sujets au risque de décrocher dans la lecture de ce qui va
suivre.
PRINCIPES ET POSTULATS

Les lois physiques expriment des relations entre des grandeurs physiques fondamentales. Si les lois
physiques sont invariantes par changement de référentiel galiléen comme nous l'avons vu en mécanique
classique, il n'en est pas forcément de même des grandeurs physiques. Ces dernières peuvent se transformer
d'un référentiel galiléen à un autre selon une loi de transformation simple comme nous l'avons vu au chapitre
de Mécanique Classique. Il en est de même en relativité restreinte mais nous devons maintenant prendre en
compte ce que nous avions négligé lors de notre des transformations de Galilée : l'intervalle de temps entre
deux événements n'est pas le même pour deux observateurs si la vitesse de la lumière est finie ! (trivial)

POSTULAT D'INVARIANCE

Des mesures de laboratoire (expérience de Michelson-Morley comme nous en avons fait mention) ont,
depuis fort longtemps, montré que la vitesse c mesurée par un référentiel inertiel (en ligne droite et à vitesse
constante) est bien constante quelque soit sa vitesse d'entraînement. Nous devons alors postuler la propriété
suivante :

Postulat d'invariance : la vitesse de la lumière (vecteur de transport de l'information) ne peut ni s'ajouter, ni


se soustraire, à la vitesse d'entraînement du référentiel dans lequel nous la mesurons (plus clairement cela
signifie que quelque soit la vitesse à laquelle vous vous déplacerez vous mesurerez toujours la vitesse de
lumière comme valant c numériquement constant et fini!).

Corollaire : le principe de relativité Galiléen (cf. chapitre de Mécanique Classique) selon ce postulat est
complètement mis à défaut et il nous faut alors développer une nouvelle théorie qui prend en compte cette
propriété de la lumière

Remarque: Il est important de noter que nous considérons que la lumière est dans le cadre actuel de la
relativité restreinte, le messager de l'information d'un corps sur un autre !!!

PRINCIPE COSMOLOGIQUE

Nous supposons que notre position dans l'Univers est typique, non seulement dans l'espace comme l'affirme
le modèle standard de l'Univers (cf. chapitre d'Astrophysique), mais aussi dans le temps. Ainsi, un
astronome situé dans une galaxie éloignée doit observer les mêmes propriétés générales de l'Univers que
nous, qu'il ait vécu un milliard d'années plus tôt, ou qu'il l'observe dans un milliard d'années.

En fait, il est relativement naturel d'aller plus loin et d'énoncer que : l'Univers présente le même aspect en
chacun de ses points, c'est-à-dire qu'il est homogène. Cette homogénéité s'énonce donc sous la forme du
"principe cosmologique".

Ce principe ne repose pas sur les observations, si fragmentaires par rapport à la démesure du cosmos qu'elles
ne sauraient permettre d'établir sa validité. Il constitue bien un présupposé à toute étude physique de
l'Univers. Sa raison d'être tient à son caractère, indispensable à toute cosmologie scientifique, et peut-être à
une certaine réaction par rapport à l'ancienne vision géocentrique ou héliocentrique : il est supposé
désormais qu'aucun lieu n'est privilégié dans le cosmos !

PRINCIPE DE RELATIVITE RESTREINTE

Rappelons (cf. chapitre de Mécanique Classique) que les transformations galiléennes nous disent qu'aucun
référentiel ne peut être considéré comme un référentiel absolu puisque les relations entre les grandeurs
physiques sont identiques dans tous les référentiels galiléens ("principe de relativité galiléen"). Le
mouvement galiléen est donc relatif.

Au 20ème siècle les physiciens constatèrent qu'une importante catégorie de phénomènes physiques violait le
principe de relativité galiléen : les phénomènes électromagnétiques.
En appliquant les transformations galiléennes aux équations de Maxwell nous obtenons un jeu d'équations
différent selon que l'observateur se trouve dans un référentiel fixe ou un référentiel mobile.

Effectivement, nous avons montré dans le chapitre d'Électrodynamique que l'équation de propagation du
champ électrique ou magnétique s'écrivait sous la forme :

(49.1)

où représente l'un quelconque des deux champs.

Nous avions aussi vu dans le chapitre de Mécanique Classique qu'un facteur important de la validité d'une
théorie était l'invariance de l'expression de ses lois sous une transformation galiléenne (transformée de
Galilée) en posant :

(49.2)

Nous avons également montré dans le chapitre de Calcul Différentiel Et Intégral que la différentielle totale
d'une fonction s'écrivait (exemple à deux variables) :

(49.3)

Soit :

(49.4)

Ce qui nous amène simplement à écrire :

(49.5)

Après élimination de f et en utilisant le théorème de Schwarz (cf. chapitre de Calcul Différentiel et Intégral):

(49.6)

Si nous écrivons de même avec le temps :

(49.7)
Enfin de compte la transformation galiléenne de l'équation d'onde censée avoir une forme invariante devient
:

(49.8)

La forme de l'équation d'onde a donc été complètement altérée par la transformation. Au fait, nous savons
que cela est dans un sens normal. Effectivement, après tout le champ magnétique, créer par des charges en
mouvement disparaît quand nous utilisons un référentiel en mouvement avec les charges (ou inversement).
Cependant, les champs électrique et magnétique ne se transforment pas correctement sous les
transformations Galiléennes.

Pour fixer la situation, suite à ces deux exemples, nous avons trois hypothèses :

H1. Les équations de Maxwell sont fausses. Les équations correctes restent à être découvertes et devront être
invariantes sous une transformation Galiléenne.

H2. L'invariance Galiléenne est valide pour la mécanique mais pas pour l'électromagnétisme (c'est la
solution historique avant Einstein, un "éther" détermine l'existence d'une sorte de référentiel absolu où les
équations de Maxwell ne changent pas)

H3. L'invariance Galiléenne est fausse. Il y a une invariance plus générale, qu'il reste à découvrir, qui
préserve la forme des équations de Maxwell. La mécanique classique doit être reformulée telle qu'elle soit
invariante sous cette nouvelle transformation.

Remarque: Il s'avère que les deux premières hypothèses sont exclues par les faits expérimentaux.

Albert Einstein n'admettait pas la violation du principe de relativité galiléenne par l'électromagnétisme. De
son point de vue il fallait au contraire le généraliser à toutes les lois physiques.

Il postula donc que les lois physiques devaient être identiques dans tous les référentiels galiléens ce qui
implique, implicitement, que du point de vue des lois physiques, il n'est pas possible de distinguer un
référentiel galiléen d'un autre. Ce résultat est plus fréquemment formulé sous la forme qu'au référentiel n'est
privilégié. Ce principe fut baptisé "principe de relativité". En effet, cette relativité est étant restreinte aux cas
des référentiels galiléens (dit aussi "référentiels inertiels") exclusivement.

En d'autres termes, les lois physiques doivent rester inchangées après un changement de référentiel. Il nous
faut donc déterminer les nouvelles transformations adéquates qui se substitueront aux transformations
galiléennes.

Dans le cas des référentiels non galiléens les référentiels ne sont plus indiscernables. Effectivement,
imaginons une personne se trouvant dans un train se déplaçant à une certaine vitesse constante et une autre
personne sur la terre ferme chacun pourra dire c'est l'autre qui est en mouvement (relatif) et ce
indistinctement. Par contre, si le train se met à accélérer, bien que les deux individus puissent dire que c'est
l'autre qui accélère, seulement celui qui est dans le train ressentira l'effet de cette accélération.... ainsi les
référentiels ne sont plus indistinguables.

Einstein abolit ainsi aussi l'idée qu'il existe un point de référence absolu qui ne bouge pas et par rapport
auquel on peut définir un temps absolu, une longueur absolue ou une masse absolue. On peut cependant
définir un point de référence privilégié pour tout objet dans l'univers. Celui-ci est le référentiel se déplaçant à
la même vitesse et dans la même direction que l'objet en question. Le temps mesuré dans ce référentiel
privilégié est minimal et est appelé le "temps propre". Similairement, la dimension de l'objet y est maximale,
c'est sa "dimension propre", et sa masse y est minimale, c'est sa "masse au repos".
TRANSFORMATIONS DE LORENTZ

Pour que soit possible l'invariance de c (postulat d'invariance), nous devons admettre que le temps ne
s'écoule pas de la même manière pour l'observateur immobile O que pour l'observateur O' dans un référentiel
en translation uniforme en x (soit un référentiel inertiel) à vitesse relative (le terme "relative" est important!)
v (attention ! la vitesse relative entre les référentiels est souvent notée u dans la littérature).

Remarque: Ce cas particulier de dispositions des référentiels dans lesquels les axes d'espaces sont parallèles
amènent à ce que nous appelons les "transformations de Lorentz pures" ou "transformations de Lorentz
spéciales" et le déplacement relatif selon un axe particulier est souvent appelée un "boost".

Pour étudier le comportement des lois physique, nous devons alors nous munir de deux horloges qui donnent
t et t' (le référentiel qui contient son horloge/instrument de mesure est appelé "référentiel propre")

Mettons en place l'expérience imaginaire suivante :

Lorsque les observateurs O et O' sont superposés, nous posons t=0 et t'=0 et nous émettons un flash
lumineux dans la direction d'un point A repéré par r et r' :

(49.9)

Il est évident que lorsque le flash arrivera en A, l'observateur O mesurera un temps t et O' un temps t'.

L'observateur O conclut dès lors :

(49.10)

L'observateur O' lui, conclut :

(49.11)

Étant donne que le déplacement de O' ne se fait qu'en x, nous avons pour les deux observateurs :

(49.12)

De plus, si la trajectoire du rayon lumineux se confond dans Ox, nous avons :

(49.13)

Ce qui nous donne dès lors et d'où :


et (49.14)

Ce deux relations sont donc égales (nulles) en tout x, x', t, t' entre les deux observateurs. Ce sont les premiers
"invariants relativistes" (valeurs égales quelque soit le référentiel) que retrouvons sous une forme plus
généralisée lorsque qu'appliquée à tout l'espace:

(49.15)

Il convient maintenant de se rappeler, que dans le modèle classique (relativité galiléenne), nous aurions écrit
que la position du point A pour l'observateur O à partir des informations données par O' serait et
réciproquement (cf. chapitre de Mécanique Classique) tel que :

(49.16)

Dans le modèle relativiste, nous devons par contre admettre que le temps t qui est en relation avec x n'est pas
le même que t' qui est en relation avec x' parce que le principe de relativité oblige (sinon quoi il serait donc
impossible d'expliquer l'invariance de la vitesse de la lumière) !

Nous sommes alors amenés à poser la relation précédente sous la forme suivante :

(49.17)

où serait une valeur numérique à déterminer.

De plus, si , nous devons aussi pouvoir exprimer t' comme fonction de t et de x sous la même similaire
:

(49.18)

Résumons la forme du problème :

(49.19)

à déterminer . Et ensuite :

(49.20)

à déterminer : a,b.

Nous cherchons alors à déterminer la relation permettant de connaître la valeur des coefficients , a,b qui
satisfont simultanément:

et (49.21)

Donc, avec les trois dernières relations, nous obtenons :

(49.22)

Distribuons :
(49.23)

Pour satisfaire la relation:

(49.24)

Il faut que :

(1)

(2)

(3)
(49.25)

Il est facile de résoudre (2) :

(49.26)

Nous introduisons alors ce résultat dans (1) et (3) et nous arrivons à :

(1')

(2')
(49.27)

Si nous divisons (1') par (2'), nous obtenons :

(49.28)

et en introduisant ce dernier résultat dans la relation , nous obtenons le résultat remarquable


suivant:

(49.29)

que nous notons souvent :

(49.30)
et que nous appelons "facteur de Michelson-Morley" avec :

(49.31)

En introduisant également :

(49.32)

dans :

(49.33)

nous obtenons :

(49.34)

Posons maintenant (afin d'être conforme aux notations d'usage) :

(49.35)

avec donc le paramètre sans dimensions et toujours inférieur ou égal à l'unité:

(49.36)

QUADRIVECTEUR DÉPLACEMENT

Nous en tirons les relations de "transformation de Lorentz" pour passer des valeurs mesurées par O' et celles
mesurées par O et inversement :

(49.37)

qui ont par ailleurs comme propriété d'être covariantes (se traduisent comme par des relations ayant même
structure lors d'un changement de référentiel Galiléen).

Remarque: Si v est beaucoup plus petit que c nous retrouvons la transformation de Galilée.

Nous pouvons aussi écrire les dernières relations sous la forme (le lecteur remarquera que les unités de tous
les termes à gauche de l'égalité sont toutes identiques- il s'agit à chaque fois d'une distance!) :
(49.38)

Nous pouvons alors mettre les transformations de Lorentz des coordonnées et du temps sous la forme
matricielle (cf. chapitre d'Algèbre Linéaire) traditionnelle suivante qui définit la "matrice de Lorentz" ou de
"matrice de Lorentz-Poincaré":

(49.39)

et réciproquement :

(49.40)

ce qui donne :

(49.41)

sous forme indicielle cela est plus fréquemment noté :

(49.42)

ce qui sous forme tensorielle s'écrit :

ou (49.43)

Il s'agit de la forme traditionnelle chez les physiciens de l'expression de changement de référentiel


localement inertiel par une transformation de Lorentz.

Remarque: Nous retrouvons le tenseur (la matrice) de transformation de Lorentz dans certains ouvrages sous
la forme condensée voir parfois ou encore .
Le vecteur :

(49.44)

est appelé le "quadrivecteur d'espace-temps" ou encore "quadrivecteur déplacement".

Remarquons que puisque :

(49.45)

la transformation par la matrice conserve donc la norme. En termes, géométriques il s'agit donc d'une
isométrie.

INVARIANCE DE L'ÉQUATION D'ONDE

Maintenant que nous avons déterminé les transformations de Lorentz, nous pouvons contrôler si l'équation
d'onde est invariante relativement à ces dernières (rappelons que nous avons démontré plus haut qu'elle
n'était pas invariante à une transformation Galiléenne).

Partant de la transformation de Lorentz écrite en clair :

(49.46)

nous calculons les dérivées partielles par rapport à x et t (l'expression après la deuxième égalité ayant été
démontrée plus haut dans ce chapitre):

(49.47)

Ces relations peuvent aussi s'écrire :

(49.48)

Au carré :

(49.49)

Dans les équations de Maxwell, ou plutôt dans l'équation de propagation du champ électrique ou magnétique
dans le vide, nous avons montré (cf. chapitre d'Électrodynamique) que l'opérateur suivant apparaissait :
(49.50)

En substituant les expressions différentielles précédentes :

(49.51)

Nous avons donc bien :

(49.52)

qui montre qu'une transformation de Lorentz laisse invariant cet opérateur (Jackpot!). Nous avons donc
obtenu ce que nous cherchions!

INTERPRETATION HYPERGEOMETRIQUE

Revenons maintenant à nos transformations de Lorentz. Rappelons que nous nous sommes restreints au cas
particulier où les axes d'espaces étaient parallèles (ce qui nous avait amené à définir le terme
"transformations de Lorentz pures"). Cette configuration spéciale a une propriété géométrique intéressante
dont parfois dont de nombreux ouvrages font usage.

Voyons de quoi il s'agit :

Nous avons vu dans le cadre des transformations de Lorentz des longueurs que nous avions une
transformation spéciale (boost) que selon l'axe Ox, ayant pour les autres composantes . Ce qui
nous permet tout à fait de réduire la matrice de transformation que nous avions à une matrice plutôt
que comme nous l'avions obtenu plus haut :

(49.53)

Les propriétés A, B, C, D de ses composantes sont telles que :

(49.54)

La première relation peut être mise en relation avec une des relations remarquables de la trigonométrie
hyperbolique (cf. chapitre de Trigonométrie) tel que :
et (49.55)

la deuxième qu'il existe tel que :

et (49.56)

Remarque: Le choix du signe "-" pour C et B sont utiles car comme nous avons toujours (de même
pour qui est strictement positif) cela nous imposera à la fin des calculs d'avoir . Dès lors, comme
et la seule manière pour que C (ainsi que B) puisse être négatif c'est de mettre un "-".

La troisième donne alors la relation d'addition remarquable :

(49.57)

et donc que nous noterons plus simplement . Ce qui valide les relations :

(49.58)

Finalement les transformations de Lorentz spéciales de vitesse v suivant l'axe X peuvent aussi s'écrire :

(49.59)

ce qui nous amène à écrire :

et (49.60)

La quantité (sans dimensions) est appelée "rapidité" par ceux qui l'utilisent en physique des hautes
énergies. Nous nous arrêterons ici en ce qui concerne l'étude géométrique de la relativité restreinte trouvant
que cela à de moins en moins d'intérêt de procéder ainsi (bien que ce soit fort sympathique).

QUADRIVECTEUR VITESSE

Nous pouvons de même déterminer les transformations de Lorentz des vitesses. Considérons une particule
en mouvement dans le référentiel inertiel O' tel qu'au temps t', ses coordonnées sont x', y', z'.
(49.61)

Dès lors, les composantes de la vitesse v' sont :

(49.62)

Quelles sont alors les composantes dans la vitesse dans O (rappelons que O s'éloigne à vitesse v) ?

A nouveau, nous écrivons :

(49.63)

Nous pouvons différentier les équations de transformation des composantes que nous avons obtenus avant et
ainsi pouvons écrire :

(49.64)

Dès lors, nous avons :

(49.65)

et de même :

(49.66)

et :

(49.67)
Et comme la vitesse constante du référentiel O' est donné par , nous avons alors :

(49.68)

et inversement :

(49.69)

Dans la limite de la mécanique classique, où la vitesse de la lumière était supposée comme instantanée et
donc , nous avons :

(49.70)

qui sont les transformations de Galilée telles que nous les avons vues en mécanique classique.

Comme nous pouvons le voir, les transformations des vitesses ne suivent pas trop la forme de la matrice de
Lorentz que nous avions déterminé plus haut pour les coordonnées. Les physiciens, n'aimant pas ce qui est
inhomogène, ont cherché à avoir les mêmes transformations pour les deux.

Ainsi, reprenons les relations de transformation des vitesses et récrivons les tels que ci-dessous :

(49.71)

Ces relations peuvent s'écrire différemment si nous calculons :

(49.72)

Soit en simplifiant un peu :


(49.73)

Posons :

(49.74)

et :

(49.75)

et :

(49.76)

Avec cette notation, la relation :

(49.77)

s'écrit :
(49.78)

En procédant de même pour chacune des composantes, nous aurons au total :

(49.79)

et nous avons atteint ici notre objectif d'homogénéisation qui nous permet d'écrire si nous posons
:

(49.80)

ce qui sous forme tensorielle s'écrit :

ou (49.81)

Le vecteur :

(49.82)

est quant à lui appelé le "quadrivecteur vitesse".

QUADRIVECTEUR COURANT

Nous avons défini naturellement lors de notre introduction du tenseur du champ électromagnétique (cf.
chapitre d'Électrodynamique) le quadrivecteur courant :

(49.83)
que nous pouvons écrire :

(49.84)

Dès lors, en considérant comme la densité de charge dans le référentiel propre se déplaçant à la vitesse v
par rapport au référentiel O'. Du fait de la contraction des longueurs dans la direction de la vitesse, le volume
occupé par une charge donnée sera multipliée par le facteur de sorte que :

(49.85)

qui n'est d'autre que le "quadrivecteur courant" où nous retrouvons le quadrivecteur vitesse déterminé
précédemment.

QUADRIVECTEUR ACCÉLÉRATION

Ayant obtenu précédemment une quadrivecteur vitesse transformable à l'aide de la matrice de Lorentz
cherchons aussi l'équivalent pour l'accélération. Le quadrivecteur accélération s'exprime naturellement
comme la dérivée par rapport au temps propre de la quadrivitesse tel que:

(49.86)

Remarque: Attention!! Si le lecteur a compris les développements jusqu'à maintenant, l'accélération que
nous cherchons à calculer est celle d'un objet accéléré dans un des référentiels en mouvement relatif par
rapport à un autre (ce ne sont donc pas les référentiels qui sont en mouvement accéléré ici!!).

Il faudra d'abord que le lecteur admette (nous le démontrons cependant un peu plus loin) que :

(49.87)

Dès lors, nous avons :

(49.88)

Si nous introduisons l'accélération ordinaire nous voyons que :

(49.89)

alors :

(49.90)

En utilisant la relation (cf. chapitre de Calcul Vectoriel) :


(49.91)

nous trouvons que le quadrivecteur accélération peut être écrit :

(49.92)

Le vecteur :

(49.93)

est appelé "quadrivecteur accélération" et se transforme donc aussi à l'aide de la matrice de Lorentz.

Nous voyons que si et cette dernière relation se simplifie en :

(49.94)

Nous retrouvons donc l'accélération classique.

En utilisant la métrique de Minkowski (voir sa définition plus loin), notée calculons la norme du
quadrivecteur accélération :

(49.95)

Remarque: Il faut bien comprendre que quand nous écrivons il s'agit dans ce cas
implicitement de la somme du carré des composantes du calcul entre la parenthèse.

Et comme :

(49.96)

nous rassemblons cela :


(49.97)

Maintenant, nous développons la somme de la grosse parenthèse qui devient dès lors :

(49.98)

Nous simplifions :

(49.99)

d'où :

(49.100)

Or, nous avons la relation :

(49.101)

et la propriété du produit vectoriel :

(49.102)

Ce qui nous donne finalement :

(49.103)

Imaginons maintenant un objet avec un mouvement relatif uniformément accéléré (accélération


constante) dans notre propre référentiel. Si nous supposons notre référentiel fixe, nous avons .
Dès lors :
(49.104)

In extenso, si le mouvement accéléré ne se fait que le long d'une seule composante :

(49.105)

Or, nous avons aussi :

(49.106)

Donc finalement, nous pouvons écrire :

(49.107)

Ce qui après intégration donne :

(49.108)

Nous voyons que la vitesse u n'atteint jamais c alors que la force est toujours la même!

Nous avons donc :

(49.109)

ce qui nous donne :

(49.110)

Après réarrangement, nous écrivons cela :

(49.111)

Nous sommes bien loin de la relation du mouvement uniformément accéléré que nous avions en mécanique
classique. Cependant, pour t proche de zéro, nous retrouvons la relation de la mécanique classique en
prenant le développement de Taylor au deuxième ordre de la racine (cf. chapitre Suites Et Séries) :
(49.112)

Cependant, ceci ne nous donne pas les relations de transformations de composantes de l'accélération sous
une forme simple. Voyons donc comment les obtenir.

Rappelons d'abord que nous avions obtenu pour la vitesse :

(49.113)

Il vient en les différentiant :

(49.114)

et donc :

(49.115)

Rappelons maintenant que nous avions démontré que :

(49.116)

en différenciant il vient :
(49.117)

d'où finalement :

(49.118)

et pour les composantes y, z :

(49.119)

et donc :

(49.120)

Donc finalement :

(49.121)

Rappelons que ces relations s'appliquent lorsque les mouvements des référentiels sont de translation
uniforme!
ADDITION RELATIVISTE DES VITESSES

Comme la vitesse de la lumière est une vitesse supposée indépassable nous venons maintenant à nous
demander quelle sera alors finalement la vitesse d'un objet lancé à une vitesse proche de celle de la lumière
(par exemple...) à partir d'un référentiel se déplaçant lui aussi à une vitesse proche de la lumière (pourquoi
pas non plus...).

Il nous faut alors trouver une relation qui donne la vitesse réelle V à partir de la vitesse de lancement et
de la vitesse de référentiel .

Nous savons que pour l'objet lancé :

(49.122)

Comme celui qui est intéressé ne connaît pas la vitesse réelle V, il se doit d'utiliser les transformations de
Lorentz. Ainsi, nous avons vu plus haut que :

(49.123)

et nous avons également :

(49.124)

d'où :

(49.125)

Nous savons que d'où finalement la "loi de compositions des vitesses relativistes" :

(49.126)

qui est donc la vitesse d'un corps en mouvement dans la référentiel en mouvement par rapport au référentiel
au repos (ou autrement dit : vu par le référentiel en mouvement).

Et réciproquement vu de l'autre référentiel en mouvement nous avons en faisant les mêmes développements
(avec inversion des signes et des vitesses bien sûr):

(49.127)

qui est donc la vitesse d'un corps en mouvement dans la référentiel en repos par rapport au référentiel en
mouvement (ou autrement dit : vu par le référentiel en mouvement).
VARIATION RELATIVISTE DES LONGUEURS

Considérons maintenant que longueur d'un objet est donnée par la distance entre ses deux extrémités A et B.
Considérons cet objet AB immobile dans le référentiel O' et orienté selon l'axe O' x'.

(49.128)

Sa longueur est donc la distance entre ses deux extrémités :

(49.129)

Pour l'observateur O, l'objet est en mouvement. Les positions de A et B devraient donc être mesurées
simultanément :

(49.130)

Il vient donc en utilisant la relation démontrée au début de ce chapitre:

(49.131)

la différence suivante:

(49.132)

d'où le résultat remarquable :

(49.133)

Ainsi, la longueur d'une règle observée dans un référentiel mobile par rapport au référentiel propre de la
règle est inférieure à sa longueur propre. Ce phénomène porte le nom de "contraction des longueurs".

VARIATION RELATIVISTE DU TEMPS

Un événement est un phénomène qui se produit en un endroit donné et à un instant donné. L'origine du
temps étant difficile à préciser, nous préfèrerons souvent définir la notion d'intervalle de temps comme le
temps qui s'écoule entre deux événements comme il est fréquemment d'usage.
Considérons maintenant deux événements A et B consécutifs qui se produisent au même endroit x' (!) dans le
référentiel en translation uniforme:

(49.134)

Pour l'observateur O', l'intervalle de temps est simplement :

(49.135)

Pour mesurer cet intervalle, l'observateur O dans le référentiel fixe, doit aussi imposer que x' est commun
aux deuxévénements. Alors en utilisant la relation démontrée au début de ce chapitre:

(49.136)

nous obtenons:

(49.137)

d'où le résultat remarquable ci-dessous :

(49.138)

ce qui ce note sous forme condensée traditionnelle:

(49.139)

Donc l'observateur O mesure un intervalle de temps d'autant plus grand que le référentiel dans lequel se
déroule le phénomène se déplace rapidement. Le temps dans le référentiel mobile semble comme dilaté par
rapport à celui en vigueur dans le référentiel fixe.
Voyons un exemple d'application sympathique et simplifié (cependant) à l'extrême:

En 1971, une vérification expérimentale directe de la dilatation du temps fut effectuée. Deux avions à bord
desquels avaient été placées une horloge atomique au césium pendant leurs vols commerciaux réguliers (l'un
vers l'Est, l'autre vers l'Ouest) comparèrent leur horloge à une troisième horloge atomique restée au sol.
Cette expérimentation devenue célèbre par le temps est appelée "expérience de Hafele-Keating".

L'avion volant vers l'Est perdit 59 [ns] alors que l'avion volant vers l'Ouest gagna 279 [ns] (la Terre tourne
sur elle-même en un jour, d'Ouest en Est). Il fut donc mesuré une différence totale de:

(49.140)

entre les deux horloges est cette différence est nettement supérieure à celle qu'implique la relativité générale.

Analysons l'expérience en considérant que tous les référentiels sont inertiels (ce qui élimine donc la
relativité générale).

Remarque: En toute rigueur l'effet de la relativité générale (ralentissement des horloges en fonction de
l'altitude conformément à l'effet Einstein vu dans le chapitre de Relativité Générale) n'est absolument pas
négligeable puisqu'il est d'une amplitude équivalente à celle de la relativité restreinte.

Considérons pour l'étude trois repères inertiels, un situé au pôle Nord, un sur Terre (ailleurs qu'au pôle nord
dans l'idée!) et un dans un avion. Les intervalles de temps et respectivement (que nous
noterons de manière abrégée pour la suite), sont reliés entre eux par la relation démontrée
précédemment:

(49.141)

où nous avons donc:

(49.142)
Les repères sur Terre et dans l'avion ont donc des vitesses relatives et par rapport au pôle nord. Le
temps en avion et sur Terre sont donc reliées par:

(49.143)

Nous allons récrire cette relation:

(49.144)

Nous allons accepter l'approximation suivante:

(49.145)

où nous avons supposé au dénominateur que:

(49.146)

Pour les racines dont la valeur est de toute façon proche de 1 (puisque c est beaucoup plus grand que les
vitesses relatives considérées), nous pouvons faire un développement de Taylor au deuxième ordre lorsque x
tend vers zéro:

(49.147)

Nous pouvons alors écrire:

(49.148)

Grâce à ces approximations successives nous pouvons facilement écrire la différence entre les deux horloges
qui est alors de:

(49.149)

Selon les hypothèses initiales, la vitesse de croisière des deux avions par rapport au sol est constante et sera
notée v. La vitesse de chaque avion (non relativiste selon les approximations précédentes!) est alors:

(49.150)
suivant que l'avion va vers l'Est et:

(49.151)

suivant que l'avion va respectivement vers l'Ouest. Alors:

(49.152)

Nous allons considérer que (c'est assez grossier...):

(49.153)

Donc il reste:

(49.154)

Nous voyons bien évidemment avec qu'avec les approximations effectuées, nous perdons l'asymétrie de la
dilatation du temps entre l'Est et l'Ouest. Celui que cela dérange peut appliquer alors directement les valeurs
numériques à la relation antéprécédente.

Le résultat précédent des approximations successives permet déjà de voir de manière formelle et rapide que
le signe sera en accord avec le résultat expérimental.

Pour une application pratique, nous prendrons la vitesse constante des avions commerciaux de l'époque qui
valait:

(49.155)

et le voyage total des avions dura 41 heures selon mesure au sol soit:

(49.156)

et la vitesse d'une point de la surface Terrestre va à la vitesse:


(49.157)

où le rayon de la Terre étant de 6'371 kilomètres (cela suppose que les avions sont sur le rayon de
l'équateur!). Nous avons donc en application numérique:

(49.158)

ce qui mène à un résultat très proche de la mesure qui fut effectuée.

Et en utilisant directement la version non approximée:

(49.159)

où nous avons pris cette fois-ci la vitesse de rotation de la terre à la latitude conforme à l'expérience faite en
1971:

(49.160)

Donc nous voyons que le résultat n'est dès lors plus très conforme à l'expérience! Effectivement, il faut
maintenant prendre en compte dans ce cas non approximé l'accélération du temps du à la gravité. Nous
allons devoir utiliser la relation de l'effet Einstein démontrée dans le chapitre de Relativité Générale:

(49.161)

qui exprime donc que le temps au sol s'écoule moins rapidement que le temps à l'altitude h.

D'après le compte rendu de l'expérience, les avions ont volé à 10'000 [m] d'altitude. Ce qui donne
(l'accélération g n'est pas la même au sol qu'à l'altitude pour rappel!) une accélération du temps:

(49.162)

Or, nous voyons que les deux avions étant tout deux à la même hauteur nous avons toujours:

(49.163)

Donc soit il y a d'autres effets, de l'ordre de la Relativité Générale, qui devraient être pris en compte pour
expliquer les 66 [ns] de différence par rapport à l'expérience, soit il s'agit d'un problème de précision des
appareils de l'époque.
Au fait, nous verrons une étude détaillée de cette expérience dans le chapitre de Relativité Générale et nous
verrons que les valeurs théoriques sont en très très bon accord avec les résultats expérimentaux.

VARIATION RELATIVISTE DE LA MASSE

Bon d'abord attention le titre est abusif par tradition! Nous verrons plus loin pourquoi.

En attendant, imaginons une collision frontale entre deux objets identiques (1), (2) ayant dans le référentiel
des vitesses égales mais opposées. Nous supposerons que cette collision est élastique, c'est-à-dire que
l'énergie cinétique et la quantité de mouvement sont conservées. Avant le choc, les composantes des vitesses
des objets (1) et (2) sont :

(49.164)

comme indiqué ci-dessous :

(49.165)

Après le choc nous avons :

(49.166)

Maintenant, plaçons nous dans un référentiel R qui se déplace par rapport à avec la vitesse suivant Ox,
les composantes des vitesses sont avant choc :

(49.167)

et après le choc :
(49.168)

Nous avons donc trivialement :

(49.169)

mais en appliquant la loi de composition des vitesses démontrée plus haut :

(49.170)

pour les composantes de l'axe horizontal nous avons :

(49.171)

et pour le mouvement vertical, nous avons vu plus haut que :

(49.172)

Ainsi il vient :

(49.173)

En passant de à R, la composant suivant y de la quantité de mouvement total doit rester nulle (comme
c'était le cas dans R initialement). Or :

(49.174)
Pour sortir de cette impasse, il faut admettre que les masses respectivement des objets (1) et (2) ne
peuvent être identiques dans R. Alors cela nous amène à imposer :

(49.175)

entraîne :

(49.176)

Dans R, les normes des vitesses des deux objets sont :

(49.177)

La dernière relation peut s'écrire :

(49.178)

de sorte que :

(49.179)

où nous avons posé :

(49.180)

Nous trouvons ainsi :

(49.181)
Nous poserons maintenant :

(49.182)

où est évidemment la masse au repos de l'un ou l'autre des objets identiques (1) et (2).

Le raisonnement que nous venons de faire sur un exemple simple, montre que l'inertie (et non la masse!)
d'un objet semble dépendre de sa vitesse v dans un référentiel donné. Au fait, pour être plus exact, c'est le
facteur de Michelson-Morley qui varie et non pas la masse en elle même car celle-ci est un invariant
relativiste!

D'une façon générale, étant la "masse au repos" :

(49.183)

Ainsi, le facteur de Michelson-Morley tend vers l'infini lorsque la vitesse tend vers la vitesse c de la lumière
dans le vide. C'est une raison supplémentaire pour affirmer que c est la limite supérieur assignée à la vitesse
de tout objet matériel, ce qui est conforme à la fois à l'expérience et aux conséquences déjà formulées de la
transformation de Lorentz.

ÉQUIVALENCE MASSE-ENERGIE

Sous l'action d'une force F, la vitesse d'une masse m augmente ou diminue sur chaque portion de la
trajectoire. Le travail de la composante peut s'interpréter alors en énergie cinétique ..

Dans la théorie relativiste, la masse varie avec la vitesse, donc:

(49.184)

L'intégration par partie (cf. chapitre de Calcul Différentiel Et Intégral) :

(49.185)

nous donne :

(49.186)
Le gain d'énergie cinétique d'une particule peut donc être considéré comme gain de sa masse. Puisque
est la masse au repos, la quantité est appelée "énergie au repos" de la particule.

Nous avons donc :

(49.187)

où représente l'énergie de mouvement.

La somme :

(49.188)

représente donc l'énergie totale E de la particule en absence de champ de potentiel. Ce qui nous amène à
écrire :

(49.189)

LAGRANGIEN RELATIVISTE

Les développements suivants vont nous permettre dans l'étude de l'électrodynamique (si ce chapitre n'a pas
encore été lu), de déterminer l'expression du tenseur du champ électromagnétique ainsi qu'en physique
quantique relativiste de déterminer l'équation de Klein-Gordon avec champ magnétique. Il faut donc bien
lire ce qui va suivre.

En relativité, nous voulons donc que les équations du mouvement aient la même forme dans tous les
référentiels inertiels. Pour cela, il faut que l'action S (cf. chapitre de Mécanique Analytique) soit donc
invariante par rapport aux transformations de Lorentz. Guidés par ce principe, essayons d'obtenir l'action
d'une particule libre. Supposons que l'action soit dans le référentiel :

(49.190)

Remarques:

R1. Le choix du signe moins deviendra évident lors de notre étude de l'électrodynamique.

R2. La notation au lieu de L pour le lagrangien permet simplement de mettre en évidence qu'il s'agit d'un
cas d'étude ou le système est libre. Cette distinction de notation sera utile lors de notre étude de la relativité
générale et de la détermination du tenseur du champ électromagnétique.

R3. Nous somme pas censés savoir à quel type de masse nous avons affaire (masse au repos ou inertielle)
d'où le fait que dans l'ignorance nous travaillerons avec la masse inertielle m quitte à corriger cette
hypothèse plus loin.

Et rappelons que :

(49.191)
Dans le référentiel O, nous avons alors "l'action invariant de Lorentz":

(49.192)

Donc selon notre hypothèse initiale, nous avons pour le lagrangien relativiste (en l'absence de champ de
potentiel donc... puisque le système est "libre") :

(49.193)

Dans l'approximation non-relativiste , nous avons selon le développement de MacLaurin :

(49.194)

Nous retrouvons donc le lagrangien habituel d'un système libre en mouvement mais plus une constante
qui n'affecte cependant pas les équations du mouvement que nous obtenons en mécanique classique
mais qui nous sera absolument nécessaire en électrodynamique.

Rappelons maintenant que le moment généralisé (cf. chapitre de Mécanique Analytique) est défini par :

(49.195)

Nous allons voir maintenant que cette définition n'est pas fortuite. Effectivement :

(49.196)

L'hamiltonien (cf. chapitre de Mécanique Analytique) vaut :

(49.197)

ce qui donne :

(49.198)

L'hamiltonien est dans ce cas égal à l'énergie totale de la particule. Son expression nous amène à finalement
à changer un peu notre hypothèse initiale et finalement à écrire au lieu de m dans l'expression de l'action
S.

Ainsi nous avons finalement :

(49.199)
et :

(49.200)

Dans l'approximation non relativiste , devient avec un développement de MacLaurin (cf. chapitre
sur les Suites Et Séries):

(49.201)

Nous reconnaissons l'énergie cinétique usuelle, plus une constante : l'énergie au repos. Ce qui correspond
bien aux calculs que nous avions fait avant où nous avons obtenu :

(49.202)

QUANTITE DE MOUVEMENT RELATIVISTE

L'énergie totale E et la quantité de mouvement d'une particule peuvent donc prendre n'importe
quelle valeur positive (si la vitesse tend vers la valeur limite c, la masse s'adapte pour que le produit
ne soit pas borné).

Dans l'expression de E , nous pouvons remplacer la vitesse par une fonction de :

(49.203)

introduit dans :

(49.204)

nous avons :

(49.205)

d'où (nous reviendrons sur cette relation de la plus haute importance lors de notre démonstration de la
relation d'Einstein) :

(49.206)

Nous n'avons pas gardé la partie négative de l'égalité précédente car elle n'a aucun sens en physique
classique. Cependant, lorsque nous étudierons la physique quantique relativiste, il s'avérera indispensable de
la préserver sinon quoi nous arriverons à des absurdités.

Cependant, nous pouvons bien évidemment écrire cette dernière relation aussi sous la forme :
(49.207)

ou encore (beurk!) :

(49.208)

En d'autres termes, l'énergie totale d'une particule en mouvement est égale à son énergie de masse
additionnée par son énergie cinétique (rien de fondamentalement nouveau).

Cette relation présente deux cas limite où nous pouvons réduire la formule :

C1. Pour une particule au repos (p=0), nous pouvons réduire l'expression à (en omettant l'énergie
négative...pour l'instant).

C2. Nous pouvons appliquer l'équation à une particule sans masse de manière à éliminer le premier terme ce
qui nous donne alors .Un photon, par exemple, à une masse nulle au repos mais il n'est jamais au
repos... Par définition, c'est un quantum d'énergie, son énergie cinétique n'est donc jamais nulle et il a donc
un masse correspondant à son énergie cinétique. Ainsi, une particule de masse nulle au repos se déplace à la
vitesse de la lumière, quel que soit le référentiel choisi! A l'inverse, une particule ayant une masse au repos
non-nulle ne pourra jamais atteindre la vitesse de la lumière dans aucun référentiel.

Remarques:

R1. Comme nous le démontrerons plus loin (voir la "relation d'Einstein"), à partir de la définition de la loi de
Planck, nous pourrons écrire

R2. La masse du photon peut difficilement être non nulle! Effectivement, la théorie quantique serait alors
dans le cas contraire fausse. Or, elle n'a jamais été mise à défaut à ce jour (cf. chapitre de Physique
Quantique Ondulatoire). On aurait également un léger changement sur la loi des forces électrostatiques et
gravitationnel selon le potentiel de Yukawa (cf. chapitre de Physique Quantique Des Champs) et cela se
remarquerait.

Cherchons maintenant les relations entre p et p' ainsi qu'entre E et E', pour qu'il soit possible à O' d'écrire :

(49.209)

Nous commençons alors à nous débarrasser de la racine carrée:

(49.210)

Si O écrit :

(49.211)

O' doit pouvoir écrire :

(49.212)
Nous avons donc :

(49.213)

Si nous comparons :

, , et (49.214)

nous obtenons des expressions exactement semblables à celles utilisées pour les transformations de Lorentz
des composantes spatiales et temporelles. Nous pouvons alors écrire, par similitude, que les transformations
pour la quantité de mouvement et l'énergie sont dès lors données par :

(49.215)

À nouveau, si nous prenons :

(49.216)

toujours avec .

Nous avons dès lors en exprimant toutes les relations précédentes de transformation dans les mêmes unités
en se souvent que :

(49.217)

Nous pouvons alors définir un matrice telle que:

(49.218)

où nous retrouvons la "matrice de Lorentz" ou "tenseur symétrique de Lorentz" .


Le vecteur :

(49.219)

est quant à lui, appelé le "quadrivecteur d'énergie-impulsion". Son utilité est que sa valeur est conservée, lors
d'une réaction nucléaire. Si nous additionnons ces vecteurs sur toutes les particules (sans oublier les
photons) avant et après la réaction, nous trouve les mêmes sommes pour les 4 composantes.

Remarques:

R1. La transformation inverse étant effectuée bien évidemment avec la matrice inverse que nous avons déjà
exposée plus haut.

R2. Nous utilisons en optique relativises le quadrivecteur , où est la pulsation de l'onde et le


vecteur d'onde (cf. chapitre de Mécanique Ondulatoire ou Optique Ondulatoire). Ce quadrivecteur est
l'équivalent pour une onde électromagnétique du quadrivecteur pour une particule, multiplié par la
constant de Planck . En effet, la dualité onde-corpusccule (cf. chapitre de Physique Quantique
Ondulatoire) attribue à une onde une énergie :

(49.220)

et une quantité de mouvement dont la norme est :

(49.221)

RELATION D'EINSTEIN

Suivant le principe de relativité, nous souhaitons que la relation entre la quantité de mouvement et l'énergie
d'une onde électromagnétique s'écrive de la même manière pour deux observateurs d'inertie en translation
l'un par rapport à l'autre:

Si O écrit :

(49.222)

alors O' doit pouvoir écrire :

(49.223)

Reprenons la première relation ci-dessus et mettons-la au carré sans oublier que le photon à une masse nulle
. Alors :

(49.224)

et comme :
(49.225)

Étant donnée connue la relation de Planck (définie en thermodynamique) :

nous sommes amenés à écrire la fameuse "relation d'Einstein" que nous retrouverons très souvent en
physique quantique ainsi qu'en thermodynamique :

(49.226)

FORCE RELATIVISTE

Suivant le principe de la relativité, nous voulons que la relation entre la force et la quantité de mouvement
s'écrive de la même manière par deux observateurs d'inertie en translation l'un par rapport à l'autre:

Ainsi, si O écrit :

(49.227)

O' doit pouvoir écrire :

(49.228)

La relation entre est assez compliquée dans le cas général. Nous nous limiterons ici au cas
particulier où un corps est momentanément immobile dans O' et où donc l'observateur O' ne tiendra compte
que de la force qu'il applique. Il l'appellera par ailleurs "force propre", car il n'a pas à se préoccuper
d'autres forces (comme une force centrifuge, par exemple).

Il faut substituer p' et t' par p et t dans :

(49.229)

Puisque :

(49.230)

nous aurons :

(49.231)

Nous avons par ailleurs vu que :


(49.232)

Il reste donc :

(49.233)

La composante de la force est donc invariable dans la direction du déplacement.

Pour les directions y, z perpendiculaires au déplacement:

et (49.234)

En résumé:

(49.235)

Cependant, pour passer d'un référentiel à un autre, il vaut mieux utiliser le "quadrivecteur force" défini
comme la dérivée du quadrivecteur impulsion par rapport au temps propre :

(49.236)

Effectivement, rappelons que :

(49.237)

ELECTRODYNAMIQUE RELATIVISTE

Avec un spectromètre de masse, nous établissons que le rapport m/q de la masse m d'une particule par sa
charge électrique q varie de la même manière que la masse m lorsque la vitesse v de la particule varie :

(49.238)

Ainsi, il vient que :

(49.239)

La charge d'une particule est donc indépendante de sa vitesse comme nous l'avons démontré dans la section
d'électromagnétisme (cf. chapitre d'Électrodynamique) lors de la détermination de l'équation de conservation
de la charge.
Considérons maintenant deux charges q et Q immobiles dans le référentiel O' en translation à vitesse v par
rapport à O :

(49.240)

Nous allons nous restreindre au cas où la vitesse est parallèle à l'axe X :

(49.241)

La charge Q est placée en O' et elle est donc immobile pour O' . L'observateur O' conclut qu'une force
électrostatique :

(49.242)

agit donc sur la charge témoin q placée en .

(49.243)

L'observateur O voit également un champ électrostatique en , mais il voit aussi que Q est en
mouvement selon l'axe X. Il en déduit donc l'existence d'un champ magnétique en orienté dans le plan
YZ :

(49.244)

Il mesure donc la force (cf. chapitre de Magnétostatique) de Lorentz (supposée connue) :

(49.245)

Mais :

(49.246)

Donc :

(49.247)
Nous avons vu maintenant:

(49.248)

La comparaison des expressions ci-dessus donne les transformations relativistes du champ électrique :

(49.249)

Comme pour la transformation de Lorentz des composantes spatiales et temporelles, nous avons obtenu les
transformations inverses en échangeant les champs et en considérant que O' voit O reculer (nous remplaçons
donc v par -v).

Pour obtenir les transformations du champ magnétique nous procédons comme ci-dessous:

(49.250)

Après quelques petites manipulations d'algèbre très élémentaire, nous obtenons :

(49.251)

Nous faisons identiquement:

(49.252)

Après encore une fois quelques petites manipulations d'algèbre très élémentaire, nous obtenons :

(49.253)

et ainsi de suite. Nous obtenons finalement :

(49.254)
Etudions maintenant le comportant du champ électromagnétique d'une charge en mouvement :

Soient deux référentiels parallèles O et O', en translation à vitesse constante v selon l'axe XX' :

(49.255)

où une charge immobile Q est placée en O'.

Il est clair alors que l'observateur O mesure partout et qu'au point P du plan X 'Y ', en
il mesure le champ électrostatique :

(49.256)

Si l'observateur O est informé des valeurs de et de , il peut les introduire dans les transformées
relativistes donnant le champ électrique qu'il observe:

(49.257)

Pour écrire une expression du champ au point P, l'observateur O doit déterminer, à un instant t de son
temps local, les composantes du vecteur qui sépare le point P de la charge Q (en sommant les
vecteurs positions de ces deux derniers points matériels).

Les coordonnées du point P et de la charge Q qu'il voit dans le plan XYZ sont données par les
transformations de Lorentz habituelles :
et (49.258)

Il en déduit donc facilement, par sommation les distances x,y.

Une autre méthode, plus simple, est que étant donné que la composante x est une longueur, elle subit donc
les transformations de Lorentz et :

(49.259)

Car rappelons-le:

et (49.260)

La transformée relativiste du champ électrique donne alors:

(49.261)

et :

(49.262)

Écrit sous forme vectorielle :

(49.263)

Il nous faut encore déterminer exprimer r' en fonction de r :

(49.264)

car (théorème de Pythagore) :

(49.265)

L'écriture se simplifie si nous utilisons l'angle formé par le vecteur champ électrique et l'axe X. Nous notons
alors dans O' et dans O les angles données par :

et (49.266)

avec à cause de la dilatation des longueurs selon l'axe X.

Nous élimine y avec :


(49.267)

Ainsi, le champ électrique que voit O est donné par :

(49.268)

Le facteur contenant montre que le champ électrique d'une charge en mouvement n'a plus la
symétrie sphérique. Il dépend de la direction du vecteur .

A distance égales, le champ électrique est plus intense dans la direction verticale à celle du déplacement
( ) que dans la direction du déplacement de la charge ( ).

Si v=0, nous retrouvons par ailleurs l'expression classique et connue:

(49.269)

Remarque: Rappelons que nous avons effectué (et continuons dans ce sens) ici une étude d'une charge en
mouvement rectiligne uniforme, c'est-à-dire à vitesse constante.

Pour trouver maintenant l'expression du champ magnétique , nous introduisons :

et

et
(49.270)

dans:

(49.271)

Nous obtenons dès lors:

(49.272)

qui sont les composantes de :

(49.273)

Pour connaître en fonction de , nous substituons l'expression obtenue pour


(49.274)

Dans le cas où la vitesse est faible, le terme relativiste tend vers 1 et le champ d'une charge Q se déplaçant
à la vitesse v devient:

(49.275)

car comme nous l'avons dans le chapitre d'Électrodynamique :

Remarques:

R1. En chaque endroit, les lignes du champ sont contenues dans un plan perpendiculaire à la direction de
déplacement de la charge Q (produit vectoriel oblige)

R2. Si la charge en mouvement est vue comme un dQ attaché au point O', nous pouvons interpréter son
déplacement à vitesse v comme un courant I en un point du référentiel O où se trouve O'. Ainsi :

(49.276)

Cette dernière relation est connue sous le nom de la "loi de Biot et Savart" et nous la retrouverons au début
de la section traitant de l'électromagnétisme. Cet état de fait, valide encore le modèle relativiste.

Il est intéressant de se rappeler qu'une particule chargée en mouvement sera vue dans le référentiel de la
particule comme n'émettant aucun champ électromagnétique (il y aura juste un champ électrostatique). Ce
qui n'est pas le cas pour un référentiel au repos. Il y a donc ici une sorte de contradiction contre intuitive
flagrante.

Mais cela pose alors un autre problème, dans un référentiel en mouvement accéléré, une particule chargée
émet normalement un rayonnement d'accélération, ce rayonnement en mécanique quantique doit
s'accompagner forcément de l'émission d'un quanta, qui lui existe ou n'existe pas (un moyen terme n'existe
pas). L'existence même des photons seraient donc purement relative. Et pourtant c'est le cas! Certaines
particules n'ont qu'une existence relative. La réponse compliquée, c'est donc de savoir ce que sont devenus
les photons.

Mais là, nous touchons à la limite de ce que nous maîtrisons parfaitement dans la physique de la fin du
20ème siècle car nous parlons de référentiels accélérés (ce qui implique d'être en relativité générale et non
restreinte) et de théorie quantique des champs. Le cadre rigoureux pour traiter ça (qui engloberait une
gravitation quantique) n'existe pas encore. Mais un premier pas a été franchis avec le développement de la
théorie quantique des champs en espace courbe.

TRANSFORMATION DU TENSEUR DE CHAMP

Nous avons vu et démontré dans le chapitre d'Électrodynamique que l'ensemble du champ


électromagnétique se résumait au tenseur du même nom. Il serait alors bon de regarder comment se
transforme ce tenseur et s'il le fait correctement relativement aux résultats obtenus plus hauts.

Considérons la transformation (où le tenseur du champ électromagnétique est en unités naturelles!!!) :


(49.277)

Avec :

(49.278)

Prenons, par exemple, la vitesse parallèle à l'axe x, alors nous avons démontré plus haut que :

(49.279)

Soit, donc :

(49.280)

Nous calculons les transformées (ce rappeler que le tenseur du champ électromagnétique est
antisymétrique!) :

(49.281)

Nous en déduisons donc, pour le champ électrique (ce qui correspond parfait à ce que nous avions obtenu
plus haut) :

(49.282)

Nous faisons un second calcul pour la composante perpendiculaire :

(49.283)

d'où :

(49.284)

ce qui correspond à nouveau parfaitement à ce que nous avions obtenu plus haut (en unités naturelles, ne pas
oublier que nous avons alors )!

La vérification se fait de même pour le champ magnétique :

(49.285)
et :

(49.286)

ce qui donne :

(49.287)

etc.

ESPACE-TEMPS DE MINKOWSKI

Nous avons démontré plus haut que:

(49.288)

Écrivons cela sous la forme :

(49.289)

Multiplions les deux membres par :

(49.290)

ce qui nous donne :

(49.291)

Si , l'équation s'annule :

(49.292)

Ce résultat traduit, que les dimensions d'espace et de temps sont comme arrêtées dans le référentiel
relativiste, car la vitesse relative de l'objet est égale à celle de la lumière!

Imaginons maintenant qu'un faisceau lumineux soit émis à l'instant et se propage depuis l'origine du
référentiel. Nous savons que dans l'espace-temps (application du théorème de Pythagore dans l'espace
euclidien à trois dimensions) la distance parcoure par le photon lumineux est :

(49.293)

En changeant t de membre et en portant le tout au carré pour supprimer la racine, nous obtenons :
(49.294)

Remarque: Nous pouvons assimiler cette équation à la représentation d'un front d'onde sphérique d'une onde
lumineuse se propageant à la vitesse de la lumière (voir l'équation d'une sphère centrée à l'origine dans le
chapitre de Géométrie Analytique).

Considérons maintenant deux événements de coordonnées et et pour éviter la


confusion changeons de lettre . Nous pouvons dès lors écrire l'intervalle spatio-temporel tel quel :

(49.295)

En passant à la limite, nous obtenons la forme quadratique :

(49.296)

qui à la même forme et même valeur quelque soit le référentiel considéré. L'intervalle infinitésimal d'espace-
temps entre deux événements infiniment voisions est donc un invariant relativiste que nous appelons
souvent "abscisse curviligne d'espace-temps", c'est l'intervalle d'espace-temps où, comme le dit simplement
Einstein, le "carré de la distance".... Le fait que cette grandeur puisse être positive, négative (!) ou nulle est
liée au caractère absolu de la vitesse de la lumière (nous y reviendrons juste après).

Nous pouvons aussi maintenant nous intéresser au caractère relativiste de cette métrique. Si elle est
invariante, c'est qu'elle doit aussi l'être par les transformations de Lorentz. Nous disons alors que "la
métrique est invariante par transformation de Lorentz". Une telle transformation peut être trouvée en
s'inspirant de celle utilisée pour le tenseur du champ électromagnétique (voir plus haut). Le lecteur vérifiera
sans peine en s'inspirant de l'exemple détaillé du champ électromagnétique que pour le tenseur métrique,
nous avons la relation :

(49.297)

L'abscisse curviligne peut s'exprimer aussi par la norme du quadrivecteur déplacement que nous avions
défini plus comme étant . Effectivement, la norme (cf. chapitre de Calcul Tensoriel) s'écrit en
descendant les indices à l'aide de la "métrique de Minkowski" ou "métrique pseudo-riemannienne" :

(49.298)

avec par définition (nous reviendrons là-dessus dans les détails au début de notre étude de la relativité
générale) la "matrice de Minkowski":

(49.299)

Si nous mettons les deux relations suivantes en correspondance :


et (49.300)

nous avons alors lorsque que les deux événements sont reliés à la vitesse de la lumière.

De plus, si nous posons nous pouvons alors écrire :

(49.301)

Ceci n'est rien d'autre que l'équation d'un cône (cf. chapitre de Géométrique Analytique) d'axe d'ordonnée
... le fameux "cône d'Univers" (sur lequel nous consacrons une étude plus loin). Tout événement est
donc par extension dans ce cône et l'évolution de tout système peut donc y être décrit (par sa position
spatiale et temporelle), par ce que nous appelons sa "ligne d'Univers". La ligne d'Univers d'une particule est
donc la séquence d'événements qu'elle occupe durant sa vie.

QUADRIVECTEURS

Nous venons de définir ce qu'était la métrique de Minkowski, nous pouvons maintenant définir correctement
le concept de quadrivecteur que nous avons déjà abordé sans toutefois toujours savoir ce que l'on faisait.

Définition: Dans un espace à quatre dimensions de type Minkowski, quatre grandeurs (peu
importe l'ordre des termes pour cette définition ou que les indices soient des chiffres ou des lettres
correspondant aux quatre composantes spatio-temporelles) forment un quadrivecteur covariant si elles se
transforment suivant la transformation de Lorentz :

(49.302)

La pseudo-norme d'un quadrivecteur dans un espace de Minkowski à métrique est alors :

(49.303)

où nous voyons que le quadrivecteur multiplié contravariant multiplié par la métrique redonne le
quadrivecteur covariant.

La quantité suivante étant invariante par changement de référentiel Galiléen comme nous l'avons vu presque
tout au début de ce chapitre :

(49.304)

Cette propriété d'invariance par changement de référentiel Galiléen des quadrivecteurs est leur propriété
principale. Ainsi deux observateurs en mouvement relatif uniforme l'un par rapport à l'autre doivent pour
comparer les résultats d'une même mesure utiliser la norme des quadrivecteurs. De même, les lois qu'ils
cherchent à déterminer pour être les plus générales possibles doivent utiliser ces quantités invariantes!
Nous pouvons par ailleurs aussi écrire la norme sous la forme :

(49.305)

et les quadrivecteurs sous la forme :

(49.306)

CONE D'UNIVERS

La topologie du cône de lumière trouve son origine dans les relations d'antériorité et postériorité des
événements relativistes, ce qui permet de faire la distinction entre un événement dans le passé d'un autre ou
dans le futur de celui-ci.

Les cônes de lumière ont pour objectif principal dans les ouvrages de vulgarisation de la physique théorique
de schématiser l'histoire d'impulsions lumineuses émises en un point de l'espace où peuvent régner certaines
conditions. Les points sont représentés dans l'espace par une série d'instantanés à divers instants ,etc.
(voir figure ci-dessous), le front d'onde sphérique de la lumière grossissant dans l'espace. Dans l'espace-
temps, le même événement (en bas sur la figure) est représenté par un "cône de lumière", dont le sommet est
le point d'émission.

Sur une feuille de papier, nous devons supprimer l'une des dimensions spatiales. Les axes spatiaux sont
dessinés dans le plan horizontal et l'axe temporel dirigé vers le haut. Les sections du cône aux instants
correspondant aux instantanés de la représentation spatiale : les fronts d'ondes à deux dimensions
sont des cercles dont le rayon est celui du front d'onde sphérique à l'instant considéré. Le cône de lumière
montre un seul diagramme de l'histoire continue du front d'onde d'un signal lumineux.
(49.307)

Plus rigoureusement, les "instantanés" dont il a été fait mention plus haut sont appelés des "événements
ponctuels" et ceux-ci apparaissent instantanés (approximation reposée sur l'optique géométrique) à tout
observateur capable de les voir. Une collision entre deux particules ponctuelles fournit un exemple
d'événement ponctuel. Il est tout à fait possible qu'un événement instantané non ponctuel apparaisse
instantané à un certain observateur mais, à cause de la vitesse de propagation finie de la lumière, non
instantané à un autre observateur.

Définitions:

D1. Nous disons par définition que deux événements ponctuels occupent le même point d'espace-temps s'ils
apparaissent simultanés à tout observateur capable des les voir.

D2. L'ensemble M de tous les points de l'espace-temps est appelé "l'espace-temps".

D3. La frontière définie par le cône d'Univers est appelée "horizon cosmologique"

Rappelons que si aucune force n'agit sur une particule ponctuelle, nous la qualifions "d'inertielle" ou de
"libre". Nous disons également qu'elle est en "mouvement inertiel".

Étant donné le point p, N(p) est une structure géométrique absolue, indépendante de l'observateur. Sa
composante future sera notée ; sa composante passée et elle sera représentée par le cône
suivant :
(49.308)

Effectivement, rappelons que l'équation de Minkowski est invariante puisque :

(49.309)

Rapporté à trois paramètres (nous enlevons une dimension spatiale) nous avons, si les événements ponctuels
sont reliés à la vitesse de la lumière (voir plus haut) :

(49.310)

Ce que nous pouvons aussi écrire sous la forme :

(49.311)

à comparer avec l'équation d'un cône (cf. chapitre de Géométrie Analytique) :

(49.312)

lorsque nous posons c=1 (ce qui est fréquent en physique théorique comme nous en avons déjà fait mention
de nombreuses fois).

Donc l'équation de Minkowski peut donc bien être représentée par un cône.

Remarque: Si nous gardons les trois paramètres spatiaux et l'intervalle de temps constant, le lecteur
remarquera certainement que nous tomberions non plus sur l'équation d'un cône mais sur celle d'une sphère.
Il s'agit de la "sphère céleste" où à un instant donné, à sa surface, se créent de multiples cônes de lumière.

La ligne d'univers de tout observateur qui occupe instantanément p et dont la ligne d'univers passe donc par
p lui-même, est contenue à l'intérieur de N(p) définit par un point unique sur sa sphère céleste (celle qui est
donc décrite par le vecteur d'information - qu'est le photon - dans toutes les directions de l'espace). Cela veut
dire qu'il peut y avoir, in extenso, autant de rayons nuls (foyers des cônes) passant par p que de points sur
une sphère.

L'exemple suivant paraîtra plus évident :


(49.313)

Comme illustré sur la figure ci-dessus, un événement lumineux au point O de l'espace-temps produit un
faisceau de photons, tous dans le cône nul du futur O, (ces photons ont été émis par des atomes dans
des états de mouvement variés, dont les lignes d'univers l et l' passent par O, mais sont entièrement
contenues à l'intérieur de ). La ligne d'univers n peut seulement être décrite par une particule se
mouvant à la vitesse de la lumière car elle définit la frontière du cône (nous disons alors que la ligne
d'Univers est "du genre lumière").

Remarque: La représentation des lignes d'Univers dans la partie inférieur (cône renversé) vient du fait qu'un
événement peut également avoir un passé... donc le schéma généralise l'exemple particulier.

Soit la ligne d'univers d'un personnage P immobile (d'où la verticalité de sa ligne d'Univers sur la figure
ci-dessus) et n celle d'un rayon lumineux ayant pour origine O. Tous deux résident dans l'espace à quatre
dimensions et ils se coupent selon un point unique P. Les points O et P se situent sur un rayon nul (d'un
future cône), n, de . En P, le personnage P voit un flash soudain dans la direction définie par n, pour
lui la direction de l'événement lumineux (décrite uniquement par sa vitesse donc, ainsi une ligne d'univers
d'une particule inertielle peut être décrite uniquement par le temps et sa vitesse).

Un atome dont la ligne d'Univers coupe n au point Q, absorbe un photon de l'événement lumineux O et
réémet peu de temps après un faisceau de photons. Ceux-ci forment alors à leur tour des rayons nuls dans
, mais seuls ceux de direction n atteindront le personnage P et seront vus par lui au point P.

Si P se trouve à l'intérieur de N(O), le cône nul de O, nous dirons que sa ligne d'Univers est de "genre
temps". Dans ce cas, O et P sont situés sur la ligne d'Univers d'un observateur ou d'une particule massive. Il
existe bien évidemment deux types de déplacements de genre temps :

1. Si P est dans le futur de O (selon un observateur dont la ligne d'univers passe par O et P), nous dirons que
P "pointe vers le futur"

2. Dans le cas contraire, nous dirons bien entendu qu'il "pointe vers le passé".

Si P se situe sur N(O), nous dirons alors qu'il est "nul" et P n'est ni nul ni de genre temps, alors P se situe à
l'extérieur de N(O). Nous disons alors que qu'il est de "genre espace" :
(49.314)

Cela se traduit mathématiquement par en se rappelant (voir plus haute) que:

(49.315)

D1. : la ligne d'univers est donc de "type lumière" et c'est elle qui décrit la surface du cône par
définition (selon ce que nous avons démontré précédemment et quelque soit le choix de la métrique) soit
que:

(49.316)

ce qui est le cas d'un photo de lumière (d'où le nom...).

D2. : nous disons alors que la ligne d'univers est de "type espace" soit que:

(49.317)

Deux événements qui ont lieu simultanément mais à des lieux différents sont donc de type espace.

D3. : nous disons alors que l'intervalle ou la ligne d'univers sont de "type temps" soit que:

(49.318)
(49.319)

D4. Une "ligne causale" est une ligne de genre lumière ou temps qui est toujours orientée vers le futur.

Revenons à nos équations après ce petit interlude... les équations conduisent donc à faire plusieurs
observations. Ainsi, dans l'Univers euclidien à quatre dimensions de Minkowski, les trajectoires des objets
dans l'espace-temps sont toujours des droites. Effectivement, l'exemple trivial consiste à considérer que
l'objet reste au repos, seul le temps continue alors à s'écouler. Nous avons dès lors:

(49.320)

en posant , cela nous nous donne :

(49.321)

donc :

(49.322)

et aussi :

(49.323)

La primitive étant (constante d'intégration nulle):

(49.324)

qui est bien une droite et représente donc la ligne d'Univers de l'objet considéré dans le cône d'Univers.
Nous pouvons aussi observer aussi que dans ce cas, l'évolution du phénomène est purement temporelle
quand l'intervalle est positif (ce qui appuie ce que nous avions dit tout à l'heure).

Remarques:
R1. Si la vitesse de la lumière est infinie nous retrouvons le cas particulier de l'univers newtonien, où un
phénomène peut instantanément se produire en dehors de tout lien de causalité (nous disons alors que l'effet
à lieu avant la cause). Le temps y est absolu et il n'existe pas d'horizon cosmologique car le cône à une
ouverture maximale (angle droit).

R2. Si nous posons que la vitesse de lumière est égale à l'unité, comme nous l'avons fait, l'axe des ordonnées
du cône est dit "axe purement temporel".

R3. Il faut comprendre par soi-même que l'Univers a son propre cône d'Univers (cône... si l'espace est de
type Minkowskien bien sûr...).

Enfin, indiquons que la théorie de la relativité restreinte, au même titre que celle de la relativité générale,
n'impose pas un nombre de dimensions spatiles données pour rester consistante: ce qui est dommage pour
les physiciens théoriciens qui souhaiteraient une théorie qui s'impose à elle-même une nombre fini de
dimensions pour rester consistante (ce que par contre la théorie des cordes fait avec 25 dimensions... et celle
des supercordes avec 11).
50. RELATIVITÉ GÉNÉRALE

C omme nous l'avons vu, la relativité restreinte est une réussite remarquable sur le point de vue théorique
aussi bien que sur le point de vue pratique en formant un continuum d'espace-temps où les grandeurs
d'espace et de temps se voient donner la même dimension physique (celle d'une distance métrique pour
rappel!). Cependant, celle-ci s'applique aux repères euclidiens seulement et aux référentiels
inertiels/galiléens (à vitesse constante pour rappel... ). Il convient donc de généraliser l'ensemble de la
mécanique d'abord en exprimant ses principes et ses résultats fondamentaux sous une forme généralisée
indépendante du type de systèmes de coordonnées choisi (in extenso : du type d'espace) en faisant usage du
calcul tensoriel et de prendre en compte les systèmes non inertiels.

Il convient de prendre en compte aussi que le fait que la relativité restreinte ne s'applique qu'aux référentiels
galiléens est restrictif car toute masse crée un champ gravitationnel dont la portée est infinie. Pour pouvoir
trouver un vrai référentiel galiléen il est donc nécessaire de se situer infiniment loin de toute masse. La
mécanique relativiste bâtie à partir de la relativité restreinte ne constitue donc qu'une approximation des lois
de la nature, dans le cas où les champs gravitationnels ou les accélérations sont suffisamment faibles. Cette
limitation d'application n'est plus adaptée à l'astrophysique relativiste donc l'activité s'est intensifiée à la fin
du 20ème siècle.

C'est ici qu'encore une fois qu'intervient Albert Einstein et nombreux de ses confrères à travers le temps!

POSTULATS ET PRINCIPES

Effectivement, Einstein croyait à une physique ne devant privilégier aucun référentiel puisque telle était à
ses yeux la réalité de l'Univers (nous en avons déjà fait mention). Mais comment se soustraire alors au
phénomène d'accélération. L'idée géniale fut d'énoncer le "postulat d'équivalence" suivant (qui encore
aujourd'hui au début du 21ème siècle n'est toujours pas mis en défaut par les expériences récentes) en plus
du postulat d'invariance et du principe cosmologique que nous avons énoncé dans le chapitre de Relativité
Restreinte :

POSTULAT D'EQUIVALENCE

Dans un premier temps, Albert Einstein va améliore le postulat d'équivalence dont les versions les plus
anciennes sont due à Galilée et Newton :

Postulat : L'accélération (uniforme!) d'une masse (hors champ gravitationnel) due à l'application d'une force
mécanique et l'accélération de cette même masse soumis à un champ gravitationnel (uniforme!) sont
supposées parfaitement équivalentes. Ainsi, les résultats des analyses mathématiques dans un cas, peut
s'appliquer dans l'autre (déjà là c'est fort mais cohérent... l'idée est très très bonne encore fallait-il l'avoir...!)

Autrement dit, le champ de gravité possède une propriété fondamentale qui le distingue de tous les autres
champs connus dans la nature : le mouvement de chute libre des corps est universel, indépendant de la
masse et de la composition des corps.

Corollaire : La masse au repos d'un corps doit alors être la même lorsqu'elle est mesurée dans le référentiel
dans un champ gravitationnel ou hors champ gravitationnel (nous parlons alors de masse inertielle et de
masse pesante comme nous l'avons vu au tout début de notre étude de la mécanique classique).
Remarque: Il faut bien prendre garde et vérifier que le corollaire du postulat d'équivalence soit vrai sinon
toute la relativité générale s'écroulerait (en ce début de 21ème siècle des expériences sont toujours en cours
pour essayer de mettre à défaut cette équivalence)!

In extenso, tout champ de gravitation statique et uniforme est équivalent à un référentiel accéléré dans le
vide. Nous pouvons physiquement considérer que tout champ de gravitation comme statique et uniforme
dans une région assez petite de l'espace et pendant un lapse de temps assez court pour éviter les effets de
marée. Nous sommes donc amenés à poser le "principe d'équivalence faible" (PEF) : En tout événement de
l'espace-temps dans un champ de gravitation arbitraire, nous pouvons choisir un référentiel dit "localement
inertiel" tel que dans un voisinage de l'événement en question le mouvement libre de tous les corps (qui sont
donc aussi dans le champ de gravité) soit rectiligne et uniforme.

Si nous mettons expérimentalement en défaut PEF, alors nous mettons en défaut le principe d'équivalence
lui-même... ce qui n'a jamais pu être fait en laboratoire à ce jour!

Remarque: Le concept de localité est très important car il n'existe pas naturellement de champ de gravité
uniforme. Par exemple, sur Terre, deux corps ponctuels distants d'une certaine longueur lâchés d'une
certaine hauteur tomberont au sol avec une distance plus courte que la distance qui les séparaient au moment
où ils ont été lâchés. C'est ce que nous appelons en physique les "effets de marée" : le champ gravitationnel
n'est jamais uniforme (dans la nature en tout cas...).

Donc le principe d'équivalence (qui inclut le principe d'équivalence faible) affirme finalement que la force
de Newton :

(50.1)

et celle de la gravitation selon la forme de la loi de Newton-Poisson (cf. chapitre d'Astronomie) :

(50.2)

sont équivalentes telles que la masse inerte égale la masse pesante et l'accélération égale la pesanteur et qu'il
n'est pas possible de distinguer les deux :

(50.3)

(50.4)

En quoi ce postulat permet-t-il de résoudre toutes les difficultés alors ? C'est simple ! L'idée est la suivante :

Lorsque nous allons considérer un corps en accélération, nous allons d'abord toujours assimiler celle-ci à
l'accélération due à la chute dans un champ gravitationnel (de par l'application du principe d'équivalence).
Ensuite, nous allons supposer, et devrons le vérifier (démonstration plus bas) en retrouvant la loi de Newton,
que l'accélération due à ce champ gravitationnel n'est pas due au champ lui même mais à la géométrie de
l'espace déformée par la présence de la masse (in extenso l'énergie) qui crée le champ gravitationnel. Ainsi,
l'objet n'est plus en "chute libre" mais sera vu comme glissant sur la trame spatiale déformée pour acquérir
ainsi son accélération.

Au fait, l'enjeu est double :

1. Si le calcul tensoriel permet d'exprimer les lois de la mécanique classique et relativiste restreinte dans
n'importe quel système de coordonnées, il est alors possible de voir comment le système de coordonnées (la
métrique) agit sur l'expression des lois de l'Univers (Albert Einstein ne le savait pas tant qu'il n'avait pas
terminé ces calculs mais le pressentait) !
2. Si l'expression tensorielle naturelle des lois de la mécanique fait apparaître le glissement (in extenso
l'accélération) sur la trame spatiale suivant la métrique (locale) considérée, alors le pari est gagné et alors
l'accélération peut être vue comme un effet dont la cause est purement géométrique.

Ainsi, l'extension de la relativité restreinte ne se fait plus en prenant en compte les systèmes non inertiels
mais la géométrie du système!! Nous pouvons (et arrivons!) ainsi à contourner le problème initial et le pire...
c'est que cela marche!!!!

Exemple:

Supposons que deux fusées, que nous nommerons A et B, se trouvent dans une région de l'espace éloignée
de toute masse. Leurs moteurs sont arrêtés ce qui se traduit physiquement par un mouvement rectiligne
uniforme. Dans chaque fusée, des physiciens réalisent des expériences de mécanique avec des objets dont ils
connaissent la masse inerte. Soudain, le moteur de la fusée A démarre et lui communique une accélération
dont l'effet ressenti à l'intérieur du vaisseau spatial est une force d'inertie qui plaque les objets vers le
plancher. Pour les physiciens de la fusée A les lois de la mécanique sont alors les mêmes que celles que l'on
observe dans un champ gravitationnel. Ils sont donc logiquement amenés à interpréter la force d'inertie
comme la manifestation d'un champ gravitationnel. A l'aide d'une balance, ils peuvent alors peser leurs
objets et leur attribuer une masse gravitationnelle.

Supposons que les physiciens de la fusée B puissent observer ce qui se passe dans la fusée A. Ils savent que
ce que leurs collègues interprètent comme le poids des objets n'est en fait qu'une force d'inertie. La force
d'inertie étant proportionnelle à l'accélération et à la masse inerte. Si la masse gravitationnelle était différente
de la masse inerte les physiciens de la fusée A pourraient distinguer les effets des forces d'inertie de ceux
d'un champ de gravitation car les masses mesurées seraient distinctes. Or, nous savons que la masse inerte et
la masse gravitationnelle sont équivalentes (principe d'équivalence galiléen). Il s'ensuit que les physiciens de
la fusée A n'ont aucun moyen de faire la différence entre des forces d'inertie résultant d'un mouvement
accéléré de leur vaisseau spatial et les forces d'attraction gravitationnelles.

Il faut toutefois tempérer les conclusions de cette expérience : les vrais champs de gravitation se distinguent
d'un référentiel accéléré dans la mesure où l'accélération gravitationnelle varie avec la distance qui sépare les
corps alors que dans un référentiel accéléré, l'accélération est identique en tout point de l'espace. Cependant,
localement, un champ gravitationnel et un référentiel accéléré ne peuvent être différenciés.

Nous sommes donc amenés à énoncer le "principe d'équivalence d'Einstein" (PEE) tel que l'a fait Einstein :
localement, toutes les lois de la physique sont les mêmes dans un champ gravitationnel et dans un référentiel
uniformément accéléré.

Ceci à une conséquence : Si la masse (qui est équivalent à de l'énergie comme nous l'avons vu en relativité
restreinte) d'un objet n'est pas différenciable que nous soyons dans un champ gravitationnel ou dans un
référentiel uniformément accéléré c'est que tous les types d'énergie (énergie de cohésion nucléaire, énergie
électrostatique, énergie gravifique propre de l'objet, etc.) de cet objet ne sont pas différenciables. Donc les
lois de la relativité restreinte sont valables quelque soit le référentiel considéré!

Si les lois ne sont pas les mêmes, alors PEE est mis à défaut, donc in extenso PEF aussi et plus généralement
le principe d'équivalence dans sa généralité mais ceci n'est encore jamais arrivé expérimentalement.
Remarque: De par le PEF il est intéressant de constater que le champ gravitationnel agit aussi sur l'énergie
potentielle gravitationnelle des autres corps. Nous disons alors que le champ gravitationnel est un "champ
couplé".

Etant donné qu'en relativité générale, le champ gravitationnel est censé être décrit par la métrique , nous
pouvons voir un référentiel localement inertiel comme un système de coordonnées de l'espace-temps dans
lequel la métrique devient plate (pseudo-riemannienne) :

(50.5)

Un tel système de coordonnées existe toujours, ce qui traduit l'existence, pour tout champ gravitationnel, de
référentiels localement inertiels!

Lorsque la métrique n'est cependant pas plate, les coordonnées sont appelées "coordonnées normales de
Riemann" et la métrique décrit alors un espace riemmanien (espace courbe) et dépend elle-même de manière
non triviale des coordonnées du système.

PRINCIPE DE MACH

Si le principe d'équivalence met en évidence l'égalité des masses inerte et gravitationnelle, il ne nous éclaire
pas sur la nature de ces deux masses. Finalement, que sont les masses inerte et gravitationnelle ?

La nature profonde de la masse inerte devrait nous renseigner sur celle de l'inertie elle-même. L'inertie se
manifeste sous une forme passive - le principe d'inertie - et une forme active - la seconde loi de Newton.
D'une manière générale, elle exprime un comportement universel des corps à résister au changement du
mouvement. Or nous savons que le mouvement inertiel est relatif c'est-à-dire qu'il n'existe aucun référentiel
absolu. En est-il de même du mouvement accéléré ? Considérons, pour illustrer cette interrogation, une fusée
dans laquelle se trouve un physicien et réalisons deux expériences :

- Première expérience. La fusée accélère : le physicien est soumis à une force d'inertie orientée dans la
direction opposée à celle de l'accélération.

- Deuxième expérience. Maintenant supposons que l'on imprime à l'ensemble de l'Univers - à l'exception de
la fusée qui se déplace selon un mouvement inertiel - une accélération exactement opposée à celle de la
fusée lors de l'expérience précédente.

Si le mouvement accéléré est relatif alors, pour un observateur, il n'est pas possible de distinguer les deux
expériences. Notamment, le physicien situé à l'intérieur de la fusée doit observer l'apparition d'une force
d'inertie absolument identique à celle qu'il a notée lors de la première expérience. La masse inerte trouverait
alors son origine dans les interactions de la masse gravitationnelle des corps avec l'ensemble des masses
gravitationnelles de l'Univers! Selon Ernst Mach, un physicien et philosophe du 19ème siècle, le mouvement
quel qu'il soit, inertiel ou accéléré, serait relatif.
Cette théorie fut baptisée par Einstein "principe de Mach". Jusqu'à ce jour, le principe de Mach n'a pas été
confirmé, mais pas davantage infirmé. Il est vrai que sa vérification expérimentale dépasse de beaucoup les
capacités humaines !

Tout se passe comme si en déplaçant toutes les masses de l'Univers, celles-ci entraînaient avec elles les
objets se trouvant dans la fusée, dont le physicien qui ressent alors une force qui le tire dans le même sens
que l'accélération appliquée aux étoiles.

MÉTRIQUES

Einstein supposa donc que la gravitation n'était que la manifestation de déformations de l'espace-temps. Pour
tenter d'illustrer de façon simpliste mais très imagée l'idée d'Einstein, considérons une roue dentée roulant à
vitesse constante (disons une dent à la seconde) sur une crémaillère. Imaginons que nous ayons le pouvoir de
modifier simultanément le pas de la crémaillère et celui de la roue quand et où nous le désirons. Faisons
alors en sorte que le pas de la crémaillère augmente légèrement d'une dent à l'autre. Pour des observateurs
fixes la roue est alors animée d'un mouvement uniformément accéléré car, en effet, à chaque tour celle-ci
parcourt une distance toujours plus grande. En revanche, si l'on choisit la crémaillère comme référentiel et le
pas de celle-ci comme étalon de mesure, le mouvement de la roue est alors uniforme (une dent par seconde).
L'accélération de la roue est la conséquence de l'augmentation du pas de la crémaillère.

Poursuivons l'analogie : le pas de la crémaillère joue le rôle d'étalon de mesure local dans notre espace à une
dimension que constitue la crémaillère. En géométrie, il porte le nom de "métrique". La métrique est ce qui
permet de déterminer la distance entre deux points, elle représente en quelque sorte l'étalon infinitésimal
d'un espace. En géométrie euclidienne la métrique est une constante ce qui nous permet de créer des étalons
de mesure universels. Bernhard Riemann, inventa une géométrie où la métrique peut varier d'un point à un
autre de l'espace, ce qui lui permit de décrire des espaces courbes comme la surface d'une sphère par
exemple (cf. chapitre de Géométries Non-Euclidiennes).

Lors de notre étude du calcul tensoriel, des géométries non-euclidiennes et de la géométrie différentielle,
nous avons vu que la mesure de la distance ds entre deux points positionnés dans un espace à deux ou trois
dimensions peut s'effectuer au moyen d'un grand nombre de système de coordonnées par "l'équation
métrique" (cf. chapitre de Calcul Tensoriel) :

(50.6)

Exemples:

E1. Les coordonnées rectangulaires (dans ):

(50.7)

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat (cf. chapitre de
Géométries Non-Euclidiennes).

E2. Les coordonnées polaires (dans ):

(50.8)

d'où:
(50.9)

d'où:

(50.10)

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat (cf. chapitre de
Géométries Non-Euclidiennes).

E3. Les coordonnées cylindriques pour lesquelles nous avons :

(50.11)

à remplacer dans nous obtenons de façon quasiment identique à précédemment:

(50.12)

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace plat (cf. chapitre de
Géométries Non-Euclidiennes).

E4. Les coordonnées sphériques (dans ) pour lesquelles nous avons :

(50.13)

à remplacer dans nous obtenons :

(50.14)

Petit rappel préalable:

(50.15)

Donc:
(50.16)

Après une première série de mise en commun et de simplifications élémentaires des termes identiques, nous
obtenons:

(50.17)

Si la distance au carré satisfait à cette relation alors nous sommes dans un espace courbe (de type sphérique)
mais qui localement peut être plat (cf. chapitre de Géométries Non-Euclidiennes).

Jusque là, vous vous demandez peut-être où nous voulons en venir. Au fait, nous cherchons à définir à partir
des ces relations, un être mathématique qui en concordance avec l'hypothèse d'Einstein, exprime les
propriétés géométriques d'espaces donnés.

Comment allons-nous faire? : Nous allons d'abord changer d'écriture tout simplement. Au lieu d'utiliser les
symboles nous allons écrire . Attention! Les chiffres en suffixes ne sont pas des
puissances. Ce sont des valeurs muettes qui sont là uniquement pour symboliser la x-ème coordonnée d'un
repère donné.

Ecrivons maintenant à nouveau nos équations métriques avec cette nouvelle notation :

- Coordonnées rectangulaires:

(50.18)

- Coordonnées polaires:

(50.19)

- Coordonnées cylindriques:

(50.20)

- Coordonnées sphériques:

(50.21)

Maintenant rappelons encore une fois que le "tenseur métrique" (nommé ainsi car il étalonne l'espace-temps)
noté :
(50.22)

intervient dans l'équation métrique de la manière suivante :

(50.23)

et remarquez que les composantes de la matrice sont sans dimensions aussi.

Cet être mathématique qui est un tenseur contient donc les paramètres de la courbure (nous disons parfois
aussi de la "contrainte" ou de la "tension") dans lequel un espace se trouve. Mais alors que contient le
tenseur métrique d'espace-temps pour un espace euclidien plat?:

Selon la convention d'écriture de sommation d'Einstein (cf. chapitre de Calcul Tensoriel) par exemple, pour
nous avons:

(50.24)

Donc si nous revenons à notre tenseur pour l'espace euclidien plat nous savons déjà (cf. chapitre de Calcul
Tensoriel) que m et n vont de 1 à 3 et que nous avons dans notre tenseur pour et
pour (tenseur symétrique). Donc:

(50.25)

Ainsi :

(50.26)

Ce résultat est remarquable car le tenseur métrique va nous permettre donc de définir les propriétés d'un
espace à partir d'un simple être mathématique facilement manipulable formellement.

En coordonnées polaires le tenseur s'écrit:

(50.27)

Vérification:

(50.28)
En coordonnées cylindriques le tenseur s'écrit:

(50.29)

La vérification ne se fait même plus tellement le résultant est évident.

En coordonnées sphériques le tenseur est un peu plus complexe et s'écrit:

(50.30)

La vérification ne se fait même plus tellement le résultant est évident.

En relativité restreinte, nous avons vu que les notions d'espace et de temps étaient implicitement liées. Ainsi,
pour étudier la physique (cela intéresse peu le mathématicien), nous avons besoin d'ajouter à notre tenseur
métrique la composante du temps pour obtenir ce que nous appelons le "tenseur métrique d'espace-temps".

Pour déterminer l'écriture de ce tenseur, nous allons nous placer dans un premier temps dans un espace de
Minkowski où nous avions rappelons-le (cf. chapitre de Relativité Restreinte) :

(50.31)

qui est donc l'intervalle infinitésimal d'espace-temps entre deux événements infiniments voisins (ou
considérés comme tel à une certaine échelle...).

Ainsi, en posant:

(50.32)

Nous avons:

(50.33)

avec la "signature" :

(50.34)

Remarque: Pour tous les tenseurs métriques que nous avons déterminés avant, si nous les exprimons dans
l'espace-temps (donc en rajoutant le temps), les composantes spatiales ont toutes un signe négatif!
Nous verrons par la suite d'autres métriques beaucoup moins intuitives une fois que nous aurons démontré
bien plus loin l'équation d'Einstein des champs.

CRITÈRE DE SCHILD

Nous allons maintenant voir que pour étudier la gravitation, la géométrie courbe est nécessaire après quoi (il
nous faudra démontrer l'équation des géodésiques avant!) nous montrerons qu'elle est également suffisante.
Nous verrons que la gravitation telle qu'elle est formulée en mécanique newtonienne est entièrement
descriptible à partir d'une formulation de courbure de l'espace-temps.

Imaginons d'abord une tour d'une très grande hauteur h construite à la surface de la Terre. Un homme A se
trouve au pied de la tour, et envoie un signal de pulsation à son collègue B situé en haut de la tour. Il se
trouve, et nous allons de suite le démontrer, que la pulsation de l'onde reçue par B diffère de selon:

(50.35)

où:

(50.36)

Ce décalage des pulsations (respectivement fréquences) dans un champ gravitationnel est ce que nous
appelons "l'effet Einstein", ou encore "redshift gravitationnel".

Nous allons démontrer cette relation à l'aide d'arguments classiques et connus maintenant.

Un corps matériel envoyé du sol vers le ciel doit lutter contre la force de gravitation qui l'attire vers le bas. Il
perdra donc une certaine quantité d'énergie, équivalent à l'énergie potentielle gravitationnelle gagnée durant
le trajet. L'énergie du corps au niveau du sol est donc son énergie de masse à laquelle s'ajoute l'énergie
potentielle à la hauteur de la tour :

(50.37)

L'énergie de ce corps une fois arrivé en haut de la tour est simplement son énergie de masse :

(50.38)

car il a dû dépenser la quantité d'énergie mgh durant le trajet. Le rapport des énergies est alors :

(50.39)

Ce rapport étant indépendant de la masse, on peut prendre la limite afin d'avoir la relation pour le
photon. Nous obtenons alors :

(50.40)

ce qui implique:
(50.41)

Nous allons maintenant étudier ce phénomène dans le cadre de l'espace-temps de Minkowski. Nous verrons
apparaître une contradiction, ce qui motivera le passage vers un espace-temps de courbe : c'est l'argument en
faveur d'une géométrie courbe qui a été utilisé par Schild.

Considérons à nouveau le schéma d'expérience de l'homme A qui envoie une onde vers son ami B. Soit
le temps mis par A pour émettre exactement 1 cycle de l'onde (cf. chapitre de Mécanique Ondulatoire) :

(50.42)

et le temps mis par B pour recevoir ce cycle :

(50.43)

A cause de l'effet Einstein, nous savons que et donc en temps propre ! Soit en le temps
passe plus lentement pour quelqu'un au sol (A) qu'une autre personne en haute d'une montagne (B)!

Mais comme nous sommes en géométrie plate et que le champ gravitationnel est supposé statique, nous en
déduisons que les trajectoires d'espace-temps décrites par les signaux doivent être parallèles. Ceci mène à la
conclusion que l'intervalle de temps propre serait (selon la relativité restreinte).

Si nous optons pour un espace courbe, nous pouvons préserver la relation , c'est-à-dire le fait que
le temps avance plus lentement pour A que pour B. Ceci se traduit simplement par le fait qu'en géométrie
courbe, le temps propre (!) d'un observateur dépend de la métrique.

Les mêmes développements peuvent être faits en assimilant l'expérience précédente à un train qui se déplace
avec une accélération constante g. L'observateur A se trouve dans le compartiment arrière (équivalent au sol
de la Terre dans l'expérience précédente) et envoie une onde à son collègue B situé à l'avant du train (à une
distance h).

L'observateur B reçoit l'onde après un temps . Durant ce laps de temps, le train a accéléré, et sa
vitesse a augmenté d'une valeur . Par conséquent, l'onde perçue par B sera altérée par
l'effet Doppler conventionnel (cf. chapitre de Mécanique Ondulatoire) :

(50.44)

Nous retrouvons le résultat initial de l'effet Einstein en écrivant simplement :

(50.45)

ce qui donne glorieusement :


(50.46)

Nous retrouvons plus souvent cette relation sous la forme ci-dessous dans la littérature en utilisant les
relations entre pulsation et fréquence et la force de gravitation de Newton pour expliciter g et en posant h
comme valant 1:

(50.47)

Nous retrouvons également cette dernière relations sous la forme condensée suivante:

(50.48)

Le même résultat peut être obtenu en utilisant la métrique de Schwarzschild (voir plus loin) d'où le nom de
cet effet qui peut aussi être obtenu à partir des outils de la relativité générale d'Einstein. Nous démontrerons
simplement plus tard à l'aide de cette métrique que le temps s'écoule effectivement moins vite dans un
champ gravitationnel (hypothèse que nous avons faite quelques paragraphes plus haut).

Nous voyons dans tous les cas que puisque le terme de droite est positif et non nul. Cela signifie
simplement que l'onde électromagnétique en analogie au spectre des couleurs se décale vers le rouge. Ainsi,
l'effet Einstein est bien un redshift gravitationnel.

La différence de fréquence est très faible et par conséquent difficilement mesurable même avec les meilleurs
spectroscopes. La moindre perturbation peut totalement masquer l'effet Einstein. Il faudra véritablement
attendre 1960 pour que l'expérience de Pound et Rebka permette de mesurer un décalage de fréquences avec
une précision de 1% ne laissant dès lors plus aucun doute quant à la réalité du phénomène.

ÉQUATIONS DU MOUVEMENT

Nous allons démontrer ici que l'équation du mouvement d'une particule libre est constant le long de sa ligne
d'Univers en nous limitant d'abord dans un espace plat (de type Minkowski). Après quoi, nous
généraliserons ce résultat à tout type d'espace en utilisant un développement simple, pour montrer de
manière évidente que l'équation de mouvement est indépendante de la masse et suit la courbure de
l'espace!!! Enfin, nous présenterons une deuxième démonstration dans tout type d'espace en utilisant le
principe variationnel.

Commençons donc par démontrer l'équation du mouvement d'une particule libre dans un espace plat.

Lors de notre étude de la relativité restreinte, nous avons démontré le lagrangien relativiste d'une particule
libre donné par (attention! la notation m est celle de la masse au repos de la particule conformément à ce
que nous avons montré dans le chapitre de Relativité Restreinte!!!) :

(50.49)

et pour cela nous étions partis de l'action (hypothétique) :


(50.50)

et nous étions arrivés à écrire :

(50.51)

Maintenant, montrons quelque chose d'intéressant. Rappelons que pour l'espace-temps de Minkowski nous
avons obtenu :

(50.52)

en nous restreignant à une seule dimension spatiale, nous obtenons comme relation :

(50.53)

et alors... eh bien voilà au fait, si nous posons :

(50.54)

nous avons finalement :

(50.55)

nous retrouvons donc la même action à partir d'une forme plus générale (pure) de l'action qui est:

(50.56)

résultat que nous avions aussi démontré dans le chapitre d'Électrodynamique!! Nous pouvons même faire
mieux en termes d'élégance...! Si nous observons bien les développements des lignes précédentes, nous
observons qu'au fait la relation:

(50.57)

est le cas particulier à une dimension de la relation:

(50.58)

avec comme défini plus haut:


(50.59)

et donc:

(50.60)

Effectivement, si nous prenons le cas à une dimension dans un espace plat de Minkowski:

(50.61)

Ainsi, nous avons le facteur de Fitzgerald-Lorentz qui est donné en toute généralité par:

(50.62)

comme généralisation de la Relativité Restreinte!

Ceci étant fait, revenons à nos moutons... Dans un espace sans champ de potentiel, nous avons démontré
dans le chapitre de Mécanique Analytique que le lagrangien se réduit à la simple expression de l'énergie
cinétique tel que:

(50.63)

si nous souhaitons généraliser cette relation pour qu'elle soit valable dans n'import que type d'espace (courbe
ou plat), il nous faut introduire les coordonnées curvilignes telles que nous les avons étudiées en calcul
tensoriel (cf. chapitre de Calcul Tensoriel).

Dans un premier temps, cela donne:

(50.64)

où rappelons-le ds est l'abscisse curviligne de la trajectoire.

Et nous avons démontré en calcul tensoriel que:

(50.65)

Cette dernière relation s'écrit dans le contexte de la mécanique relativiste sous manière plus standard :

(50.66)

t est un paramètre qui correspond en mécanique au temps propre de la particule et qui dans la littérature
spécialisée est souvent notée .
Avant de nous intéresser aux espaces courbes décrits par la métrique (ce que nous ferons lors de notre
démonstration du lagrangien libre généralisé), restreignons nous à l'espace euclidien avec la métrique (ce
sera un bon exercice pour bien comprendre) donnée par la matrice de Minkowski (cf. chapitre de Relativité
Restreinte):

(50.67)

que nous noterons pour la différencier des autres (car plus souvent utilisée). Nous avons finalement dans
l'espace l'euclidien :

(50.68)

maintenant, appliquons le principe variationnel :

(50.69)

La variation de ds peut être trouvée plus simplement par la variation de :

(50.70)

nous trouvons :

(50.71)

Le facteur "2" provient du fait que par symétrie de l'espace euclidien, les variations de et sont
égales.

Remarque: Comme nous le verrons après, cette relation de ne sera plus identique lorsque nous
traiterons des espaces courbes.

En simplifiant un peu, nous obtenons :

(50.72)

Ce qui est équivalent à écrire :

(50.73)

Nous pouvons maintenant revenir à l'action :


(50.74)

Nous récrivons l'intégrale précédente (ce sera plus simple à traiter) :

(50.75)

Effectivement, vérifions que cette forme est bien équivalente :

(50.76)

Donc revenons à notre intégrale :

(50.77)

Nous avons donc deux intégrales qu'il va être un peu plus simple à analyser. La première intégrale :

(50.78)

donne simplement une expression évaluée aux extrémités temporelles . Dès lors, comme la valeur de
est parfaitement connues aux extrémités temporelles, le variationnel est nulle aux deux bornes et
cette intégrale est nulle.

Il nous reste alors plus que l'intégrale :

(50.79)

Donc pour que le principe variationnel soit respecté, il faut que nous ayons :

(50.80)

Or, nous pouvons récrire une partie de cette expression. Effectivement, nous avons :
(50.81)

Rappelons par ailleurs que nous avons démontré plus haut que :

(50.82)

et que nous avons :

(50.83)

Donc :

(50.84)

Maintenant, rappelons que lors de notre étude de la relativité restreinte nous avons démontré le cheminement
qui nous amenait à définir le quadrivecteur d'énergie impulsion :

(50.85)

Donc finalement, ce qui annule le variationnel de l'intégrale d'action peut s'écrire :

(50.86)

Nous retrouvons donc l'équation de conservation de la quantité de mouvement (conservation de l'impulsion)


que nous appelons dans le cadre de la relativité générale "équation du mouvement". Cette forme de
l'équation de mouvement semble dépendante de la masse mais en fouillant un peu, nous verrons qu'il n'en est
rien.

En multipliant cette relation par nous pouvons aussi écrire :

(50.87)

et de même pour un autre observateur :

(50.88)

En d'autres termes, l'impulsion de la particule reste constante sur toute sa ligne d'Univers.

Mais nous pouvons aussi écrire :


(50.89)

donc :

(50.90)

Une forme plus importante encore de l'équation de mouvement peut-être obtenue. Effectivement :

(50.91)

alors :

(50.92)

cette relation est donc la forme "sans masse" de l'équation de mouvement dans un espace euclidien ou
autrement dit, dans un espace-temps de type Minkowski. Autrement dit, il existe donc un système de
coordonnées en chute libre dans lequel le mouvement de la particule est celle d'un déplacement uniforme
dans l'espace-temps.

Il sera très intéressant de la comparer avec l'équation de mouvement dans un espace courbe que nous verrons
plus loin (appelée "équation des géodésiques").

Remarque: Il est équivalent d'écrire les relations des équations de mouvement par rapport à l'abscisse
curviligne propre ds ou au temps propre dt.

Nous pouvons maintenant montrer que l'équation du mouvement, au même titre que l'équation des
géodésiques que nous verrons de suite après, est invariante par transformation de Lorentz :

(50.93)

Maintenant, voyons une forme plus générale de l'équation du mouvement pour tout type d'espace. L'objectif
ici, est de mettre en évidence, et ce en quelques lignes de calculs, que le mouvement suivie par une particule
libre est indépendant de sa masse (vous pouvez déjà anticiper sur l'interprétation de la trajectoire d'un photon
dans un espace courbe...!).

Nous avons démontré en calcul tensoriel (et précédemment) que:

(50.94)

ce qui donne pour le lagrangien généralisé d'une particule libre avec (nous
retrouvons bien l'expression générale de l'énergie cinétique) :
(50.95)

où t est le temps propre de la particule, c'est un invariant !

Remarque: Cette relation est appelée "lagrangien géodésique" par certains auteurs.

Rappel : Le temps propre est une sorte d'horloge imaginaire qui voyage sur la particule et quelque soient les
observateurs qui regardent l'horloge, ils seront mathématiquement d'accord sur la valeur de l'intervalle de
temps entre deux "TIC" de l'horloge.

Ce qui nous permet d'écrire (attention il faut bien se rappeler des différentes relations que nous avions
déterminées lors de notre étude du formalisme lagrangien dans le chapitre traitant des la Mécanique
Analytique):

(50.96)

Remarque: L'élimination du facteur 1/2 du Lagrangien provient de la symétrie du tenseur métrique. Si ce


dernier n'est pas symétrique, nous pouvons toujours le caractériser par un tenseur qu'il l'est.

Effectivement, soit un vecteur de coordonnées et soit :

(50.97)

Les ne sont pas symétriques a priori, mais nous pouvons écrire :

(50.98)

Nous posons ensuite :

(50.99)

Donc :

(50.100)

et les sont symétriques.

La forme quadratique q peut donc toujours s'écrire avec une matrice symétrique, il y a même bijection. La
conclusion étant qu'un tenseur métrique doit être symétrique si l'on veut le caractériser par la forme
quadratique qu'il définit.

L'interlude mathématique étant terminé, continuons notre développement physique. Par conséquence de la
dernière relation l'expression de l'Hamiltonien devient bien évidemment:

(50.101)
puisque nous considérons être dans un espace sans champ de potentiel. Le carré de la vitesse étant dès lors
constant sur toute la trajectoire, nous avons:

(50.102)

Etablissons maintenant les équations du mouvement de tout corps. Nous avons :

et (50.103)

et comme :

(50.104)

alors :

(50.105)

d'où :

(50.106)

en mettant en commun :

(50.107)

que nous pouvons écrire identiquement pour les en procédant de façon identique à ci-dessus.

La relation précédente donne donc la trajectoire d'un corps en mouvement, dans un espace sans champ de
potentiel, en fonction de ses coordonnées curvilignes et de la métrique de l'espace considéré.

Ce qui est particulièrement intéressant dans ce résultat, c'est que la masse m (à nouveau) s'élimine
identiquement dans cette équation du mouvement :

(50.108)

Remarquez, que nous aurions pu utiliser aussi un autre paramètre invariant que le temps propre tel que
l'abscisse curviligne ds. Dès lors l'équation précédente s'écrirait :

(50.109)
Nous pouvons encore simplifier cette relation mais nous garderons cette simplification pour la deuxième
démonstration de l'équation du mouvement dans un espace quelconque (en faisant usage du principe
variationnel cette fois) juste après.

Il est très (très) intéressant d'observer que si nous restreignons la métrique à un espace euclidien :

(50.110)

avec :

(50.111)

Nous obtenons alors la simplification :

(50.112)

Nous retrouvons donc la première équation du mouvement obtenue pour un espace plat! Le résultat est
remarquable !

Conclusion : Aux mêmes conditions initiales de position et de vitesse curvilignes dans un espace (plat ou
courbe) sans champ de potentiel (c'est ce que nous pourrions penser du moins selon nos hypothèse
initiales...), correspond la même trajectoire quelle que soit la masse m de la particule (même pour les
photons - la lumière - dont la masse est nulle!!).

Nous pouvons maintenant étudier le principe de moindre action dans le but de rechercher le plus court
chemin (aussi bien au niveau spatial que temporel) entre deux points dans un espace de géométrie donnée
avant de s'attaquer au cas beaucoup plus complexe du lagrangien qui prend en compte le tenseur des
champs...

ÉQUATION DES GÉODÉSIQUES

Intéressons-nous maintenant à obtenir le même résultat mais en faisant usage cette fois-ci du principe
variationnel. Nous retomberons sur la même équation que précédemment pour tout type d'espace à la
différence que cette fois-ci, nous prendrons la peine de la simplifier pour arriver à "l'équation des
géodésiques".

En partant de (voir développements précédents) :

(50.113)

avec une paramétrisation telle que et sont fonction d'un paramètre temporel ou spatial.

Pour une surface donnée sous forme paramétrique, nous cherchons donc à minimiser la longueur d'un arc
ds en appliquant donc le principe variationnel (non dépendant du temps car les photons ne peuvent avoir un
chemin plus rapide au sens temporel du terme entre deux points mais uniquement un chemin plus court - au
sens métrique du terme):
(50.114)

en unités naturelles.

Or:

(50.115)

En développant, et comme les indices ont le même domaine de variation:

(50.116)

d'où:

(50.117)

En travaillant sur la seconde intégrale, nous posons:

et (50.118)

Donc par l'intégration par partie (cf. chapitre de Calcul Différentiel et Intégral):

(50.119)

il vient:

(50.120)

Soit finalement:

(50.121)
Le terme non intégré ci-dessous est négligeable à cause de la présence du facteur :

(50.122)

Donc nous avons:

(50.123)

Nous effectuons un changement d'indice:

(50.124)

ce qui nous permet de factoriser :

(50.125)

Comme et sont différents de zéro, c'est l'intégrant qui doit être nul:

(50.126)

En développant le second terme:

(50.127)

Qui s'écrit encore:

(50.128)

et qui se simplifie en:

(50.129)

Nous obtenons (à nouveau!!!) le système d'équations qui définissent les "géodésiques", c'est-à-dire les
droites de . Ces dernières constituent donc les extrémales de l'intégrale qui mesure la longueur d'un arc de
courbe joignant deux points donnés dans .
Cette dernière équation, est celle qui nous intéresse dans le cas du lagrangien libre. Effectivement, si nous
prenons le cas extrême de la lumière (ou des photons si vous préférez), cette dernière ne va pas chercher le
chemin le plus rapide (le plus vite) au niveau temporel. Ce serait totalement en contradiction avec le postulat
d'invariance de voir la lumière accélérer en fonction du chemin!!! Dans ce contexte, cela signifie que sur la
trame spatio-temporelle, la seule chose qui à un sens est le plus court chemin spatial et non le plus court
chemin temporel! C'est la raison pour laquelle cette dernière équation est appelée "équation des
géodésiques" ou encore "équation d'Euler-Lagrange généralisée".

Cependant, nous pouvons écrire cette dernière équation de façon plus condensée en introduisant les
symboles de Christoffel si la métrique est un tenseur symétrique tel que . Effectivement:

(50.130)

et comme le symbole de Christoffel de première espèce est (cf. chapitre de Calcul Tensoriel) est défini par :

(50.131)

Remarque: Il est important de se rappeler que ce symbole contient toute l'information sur la métrique de
l'espace-temps. Nous verrons un exemple plus bas comme quoi dans un référentiel localement inertiel ce
symbole de Christoffel est nul.

Alors l'équation d'Euler-Lagrange s'écrit:

(50.132)

La multiplication contractée (cf. chapitre de Calcul Tensoriel) de la relation précédente dans la base
canonique par nous donne :

(50.133)

dans la littérature un changement d'indice est souvent effectué afin d'avoir au final (c'est toujours la même
expression étant donné que les indices ont le même domaine de variation!) :

(50.134)

avec étant donc le symbole de Christoffel de deuxième espèce (cf. chapitre de Calcul Tensoriel) donné
par :

(50.135)

et est appelé dans le cadre de la relativité générale la "connexion affine" ou encore "coefficients de
connexion" et qui permet de trouver le système de coordonnées (via la résolution d'un système d'équation
différentielles) en chute libre dans lequel l'équation de la particule est celle d'un déplacement uniforme dans
l'espace temps en fonction d'un système de référence (les deux systèmes étant donc reliés par la connexion
affine!).

Cette relation, de la plus haute importance, nous permet de déterminer comment un corps en mouvement va
naturellement se déplacer dans un espace courbe et peut-être... ce indépendamment de sa masse !!! Elle nous
donne donc la métrique dans laquelle nous devons poser un référentiel pour qu'il soit inertiel par rapport au
corps considéré.

L'équation des géodésiques antéprécédente est aussi l'équation différentielle du second ordre que doit donc
satisfaire la représentation paramétrique d'une ligne sur une surface où s est la longueur le long de la ligne
afin que sa longueur totale soit extrêmale.

Selon le principe d'équivalence, nous somme donc en droit d'interpréter cette relation comme l'équation du
mouvement dans un champ de gravitation quelconque, et donc d'interpréter le deuxième terme
supplémentaire de l'équation comme l'opposé d'un terme de force gravitationnelle par unité de masse, c'est-
à-dire comme l'opposé d'un champ gravitationnel.

Remarque: Nous pouvons également écrire l'équation des géodésiques et utilisant le temps propre :

(50.136)

ou encore en utilisant la quadrivitesse :

(50.137)

Encore une fois, si nous nous restreignons à un espace-temps plat, nous voyons trivialement que nous
retombons sur la première équation du mouvement que nous avions obtenu :

(50.138)

car les composantes de la métrique de Minkowski étant constantes les coefficients de Christoffel sont tous
nuls.

Les solutions de cette dernière équation sont des lignes droites ordinaires données par:

(50.139)

Bien évidemment, dans un espace-temps courbe général, les géodésiques ne pourront pas être globalement
représentées par des lignes droites. Cependant avec une approximation au deuxième ordre en développement
de Taylor nous arrivons à nous ramener à des droites (ce qui revient à ramaner l'espace courbe à un espace
plat).

L'important dans tout cela, c'est que l'équation des géodésiques permet de constater que la courbure de
l'espace détermine les trajectoires des corps qui s'y meuvent quelque soit leur masse, qu'ils soient en
mouvement uniforme ou non (observez la dérivée seconde dans l'équation des géodésiques!). Il ne nous
reste plus alors qu'à effectuer la fin du travail et de mettre en relation la courbure de l'espace-temps avec
l'énergie qui s'y trouve !

LIMITE NEWTONIENNE

Nous avons montré plus haut (argument de Shild) que pour étudier la gravitation (en particulier l'effet
Einstein), la géométrie courbe est nécessaire. Nous avions promis de montrer aussi qu'elle était suffisante. Il
est temps maintenant de la faire !

Définition: La "limite newtonienne" est une situation physique où les trois conditions ci-dessous sont
satisfaites :

C1. Les particules se déplacent lentement par rapport à la vitesse de la lumière. Ce qui s'exprime comme le
fait que les composantes spatiales de leur quadrivecteur est très inférieure à la composante temporelle (t
étant le temps propre) :

(50.140)

C2. Le champ de gravitation est statique. En d'autres termes, toute dérivée temporelle de la métrique est
nulle.

C3. Le champ gravitationnel est faible, c'est-à-dire qu'il peut être vu comme une faible perturbation d'un
espace plat :

avec (50.141)

et où est constant (seul dépend des coordonnées).

Considérons l'équation des géodésiques obtenue précédemment :

(50.142)

La première condition nous amène à la simplifier sous la forme :

(50.143)

Les deux autres conditions nous offrent plusieurs simplifications dans l'expression du symbole de Christoffel
de deuxième espèce :

(50.144)

L'équation des géodésiques devient alors :


(50.145)

la composante temporelle ( ) vaut alors :

(50.146)

car (rappel de la métrique de Minkowski) pour et pour nous avons (métrique statique)
.

En d'autres termes, est constant. Quant aux composantes spatiales, nous avons que est la matrice
identité 3x3 (la partie spatiale!), ce qui donne :

(50.147)

Notons maintenant le temps propre comme il est de tradition de le faire :

(50.148)

En divisant par et en rétablissant , nous obtenons :

(50.149)

A partir d'ici nous posons (car nos illustres prédécesseurs ont tâtonné avant nous):

(50.150)

tel que (relation qui nous sera très utile lors de l'étude de la métrique de Schwarzschild plus loin) :

(50.151)
où est le potentiel gravitationnel, nous retrouvons l'expression de l'accélération gravitationnelle (équation
de Newton-Poisson) de la mécanique newtonienne (cf. chapitre de Mécanique Classique) :

(50.152)

avec .

Ce développement, simple mais néanmoins remarquable par son interprétation, prouve que la géométrie
courbe est suffisante pour décrire la gravitation !!

TENSEUR D'ÉNERGIE-IMPULSION

Le tenseur énergie-impulsion (T.E.I.) est un outil mathématique utilisé (notamment) en relativité générale
afin de représenter la répartition de masse et d'énergie dans l'espace-temps.

Prenons pour exemple le T.E.I. qui considère en relativité générale la matière comme pouvant être
approximée par un fluide parfait. Dans le chapitre de Mécanique Des Milieux Continus nous avons
démontré :

(50.153)

où a les unités d'une force et ceux d'une surface. Ainsi :

(50.154)

sous forme variationnelle cela donne :

(50.155)

Calculons maintenant :

(50.156)

Remarque: Nous ne travaillons exprès pas avec des éléments différentiels afin de ne pas être coincé plus
tard. C'est un peu du bricolage à la physicienne mais bon cela marche (confirmé par l'expérience).

En supposant que seuls le volume et le temps font que la force varie (ce qui suppose une densité constant
quand même et que le système est inertiel) nous avons alors :

(50.157)

Ce qui donne simplement (ch. chapitre de Calcul Tensoriel) le produit tensoriel des vitesses :
(50.158)

Si nous généralisons cette relation aux quadrivecteurs-vitesse de la relativité restreinte, nous avons alors par
définition le "tenseur d'énergie-impulsion" :

(50.159)

ou sous forme indicielle :

(50.160)

soit sous forme contravariante :

(50.161)

Cette relation est la justification pour laquelle la relativité générale est aussi indiquée comme étant une
théorie des milieux continus par certains spécialistes.

Maintenant démontrons que la dérivée :

(50.162)

Remarque: Ce qui comme nous l'avons déjà signalé dans le chapitre de Calcul Tensoriel s'écrit
dans les vieux livres.

D'abord, rappelons que (cf. chapitre de Relativité Restreinte) :

(50.163)

et admettons que nous sommes dans les faibles vitesses telles que . Dès lors dans une métrique de
Minkowski :

(50.164)

Or, nous reconnaissons dans les parenthèses l'équation de continuité (conservation de la masse) que nous
avons démontré en thermodynamique et qui nous le savons est nulle! Ainsi :
(50.165)

Regardons par ailleurs ce que contient la composante du T.E.I. :

(50.166)

En termes d'unités, il s'agit d'une densité d'énergie (nous voyons directement que cette grandeur ne peut être
que positive).

Regardons maintenant les composantes de la diagonale :

(50.167)

où a les unités d'une densité de quantité de mouvement.

Regardons maintenant les composantes de la diagonale du tenseur lorsque et pour (nous


omettons donc la première ligne et la première colonne) :

(50.168)

Nous retrouvons donc les composantes du tenseur des contraintes d'un fluide parfait.

Donc finalement, le T.E.I. peut s'écrire sous la forme d'une matrice 4x4 réelle symétrique :

(50.169)

Dans le cas où les vitesses sont faibles :

(50.170)
Nous retrouvons donc dans ce tenseur les interprétations suivantes des grandeurs physiques (bien que
rigoureusement toutes les composantes aient des unités qui peuvent être vues comme densité d'énergie soit
comme une pression).

- est la densité volumique d'énergie (elle est positive)

- sont les densités de moments

- sont les flux d'énergie

Remarque: La sous-matrice des composantes spatiales :

(50.171)

est la matrice dite des "matrice des flux de moments" (appellation tout à fait discutable...). En mécanique des
milieux continus (cf. chapitre de Mécanique Des Milieux Continus), nous avons démontré que sa diagonale
correspond à la pression, et les autres composantes aux efforts tangentiels dus à la viscosité dynamique.

Montrons que la dérivée covariante du tenseur d'énergie-impulsion est nulle tel que :

(50.172)

Donc :

(50.173)

Commençons par développer le premier terme :

(50.174)

Or, nous avons :

(50.175)

d'où :

(50.176)

Nous retrouvons entre les crochets l'équation de continuité qui est nulle. Par contre le premier terme entre
parenthèses non nul comme nous l'avons vu lors de notre étude du quadrivecteur accélération dans le
chapitre de Relativité Restreinte :
(50.177)

Mais selon le principe d'équivalence faible (PEF), nous pouvons toujours nous placer dans un référentiel tel
que localement l'accélération soit nulle tel que :

(50.178)

et il vient alors :

(50.179)

Donc nous avons maintenant :

(50.180)

Regardons ce que donne ce dernier terme mais en rappelant d'abord que dans le chapitre de Relativité
Restreinte nous avions démontré que la quadriaccélération s'exprimait selon :

(50.181)

Soit (nous ne prenons que les deux premières composantes comme exemples) :

(50.182)

Nous allons maintenant au fait montrer que :

(50.183)

Commençons par montrer que :

(50.184)

Or :

et (50.185)

d'où :
(50.186)

Maintenant montrons que (les autres composantes se vérifiant alors automatiquement) :

(50.187)

et donc nous avons bien :

(50.188)

mais selon le PEF alors :

(50.189)

et nous avons donc bien finalement :

(50.190)

Qui est l'expression de la conservation de l'énergie en relativité générale!

En abaissant les indices il vient :

(50.191)

ÉQUATION D'EINSTEIN DES CHAMPS

Il est temps maintenant de nous attaquer au plus beau, à l'une des équations les plus fameuses de notre
époque et qui fait briller les yeux de beaucoup de jeunes étudiants : l'équation d'Einstein des champs. Celle
qui explique pourquoi la matière (l'énergie) courbe l'espace.

Rappelons quelques résultats que nous avons obtenus jusqu'ici. Premièrement, nous avons réussi à
démontrer avec brio que toute particule (supposée libre mais cela est laissé à l'interprétation... dans un
espace courbe...) suit l'équation du mouvement des géodésiques :

(50.192)
Dans le chapitre de Calcul Tensoriel, nous avons démontré (non sans peine) que ce que nous appelons le
"tenseur d'Einstein" (qui est une constante dans un espace Riemannien donné) est donné par :

(50.193)

Puisque la dérivée covariante du tenseur d'Einstein est nulle et que nous avons démontré que la dérivée
covariante de T.E.I. l'est aussi, il est tentant de poser :

(50.194)

où est un constant de normalisation et devant satisfaire la relation pour qu'elle soit homogène au niveau
des unités. Ainsi, il vient :

(50.195)

Pour trouver l'expression de la constante, nous allons nous placer en limite newtonienne et exiger que la
relation précédente reproduise l'équation de Poisson pour le potentiel gravitationnel (cf. chapitre de
Mécanique Classique) :

(50.196)

Remarque: Cette relation montre que le potentiel de gravitation est relié à la matière de façon linéaire par
l'intermédiaire de ses dérivées secondes. Einstein pensa donc que le premier membre des équations du
champ en relativité générale, membre supposé décrire la géométrie de l'espace-temps, devait donc inclure
d'une manière ou d'une autre les dérivées secondes, non pas du potentiel de gravitation, mais des potentiels
de la métrique. En fait, Einstein essaya de généraliser le membre de droite de l'équation de Poisson : la
grandeur recherchée devait inclure non seulement la densité de matière mais aussi l'impulsion (dès que le
corps est en mouvement, son énergie augmente et donc sa masse. Pour évaluer l'effet gravitationnel d'un
corps il fallait donc combiner sa masse au repos avec son impulsion. Il s'agissait finalement du T.E.I. de
rang 2 qui est la généralisation du quadrivecteur impulsion de la relativité restreinte.

Nous avons montré plus haut que dans la limite newtonienne (approximation du champ faible) :

(50.197)

et dans notre définition du T.E.I., pour une distribution de matière au repos seule la composante suivante est
non nulle :

(50.198)

Il vient dès que l'équation de Poisson peut s'écrire :

(50.199)

Maintenant revenons sur la relation :

(50.200)

En contractant les deux membres de la relation précédente, il vient :


(50.201)

Or, le scalaire de Ricci (cf. chapitre de Calcul Tensoriel) est donné par . Il vient donc :

(50.202)

Or dans la métrique lorentzienne (-,+,+,+) il est immédiat que:

(50.203)

Donc :

(50.204)

En utilisant cette dernière relation, l'équation :

(50.205)

qui peut s'écrire aussi :

(50.206)

peut finalement s'écrire :

(50.207)

Intéressons-nous à la composante telle que la relation précédente s'écrive :

(50.208)

Explicitons selon le tenseur de Ricci (cf. chapitre de Calcul Tensoriel) selon sa définition :

(50.209)

Il vient alors :

(50.210)
Or, le tenseur de Riemann-Christoffel sous forme développée dans ce cas particulier est donnée par (cf.
chapitre de Calcul Tensoriel) :

(50.211)

Remarque: En absence de champ gravitationnel et en coordonnées cartésiennes, il est logique que tous les
symboles de Christoffel soient nuls. En effet, les Christoffel traduisent rien de plus que les forces d'inertie.
Mais quand nous avons un champ de gravitation, les trajectoires suivies ne sont plus des droites, même dans
le cas newtonien alors les Christoffel sont non nuls...

A l'approximation du champ faible lentement variable dans le temps, les symboles de Christoffel sont
d'ordre O et leurs produits sont d'ordre et les dérivées temporelles sont négligeables devant les dérivées
spatiales. Il reste donc seulement les termes d'ordre O tel que :

(50.212)

Or, nous avons vu dans le chapitre de Calcul Tensoriel que :

(50.213)

Dès lors :

(50.214)

Or dans l'approximation du champ faible la variation de la métrique par rapport au temps étant négligeable
par rapport à la variation spatiale (l'approximation est un peu tirée par les cheveux il faut dire...) :

(50.215)

Par conséquent, la relation :

(50.216)

devient :

(50.217)

et nous constatons immédiatement qu'il s'agit de l'équation de Poisson si et seulement si :

(50.218)
constante qui est parfois appelée "constante d'Einstein".

L'équation d'Einstein des champs est donc sous forme définitive :

(50.219)

ou de manière plus conventionnelle :

(50.220)

La partie de gauche représente la courbure de l'espace-temps telle qu'elle est déterminée par la métrique et
l'expression de droite représente une modélisation du contenu masse/énergie de l'espace-temps. Cette
équation peut alors être interprétée comme un ensemble d'équations décrivant comment la courbure de
l'espace-temps est reliée au contenu masse/énergie de l'univers. Ces équations, ainsi que l'équation de la
géodésique, forment le coeur de la formulation mathématique de la relativité générale.

L'équation d'Einstein est donc une équation dynamique qui décrit comment la matière et l'énergie modifie la
géométrie de l'espace-temps. Cette courbure de la géométrie autour d'une source de matière est alors
interprétée comme le champ gravitationnel de cette source. Le mouvement des objets dans ce champ étant
décrit très précisément par l'équation de sa géodésique.

Par ailleurs, nous venons aussi de voir que l'équation d'Einstein se réduit aux lois de la gravité de Newton en
utilisant l'approximation des champs faible et des mouvements lents.

Puisque le tenseur d'énergie-impulsion comporte 16 composantes dont au fait 10 sont réellement uniques
(indépendantes) puisque le tenseur est symétrique, nous pouvons voir l'équation d'Einstein des champs
comme dix équations différentielles du second ordre sur tenseur de champ métrique .

Ces équations différentielles sont en général cauchemardesques à résoudre, les scalaires et tenseurs de Ricci
sont des contractions du tenseur de Riemann, qui incluent les dérivées et les produits des symboles de
Christoffel, qui eux mêmes sont construits sur le tenseur métrique inverse et sur les dérivées de celui-ci.
Pour corser le tout, il est possible de construire des tenseurs d'énergie-impulsion qui peuvent invoquer la
métrique aussi. Il est donc très difficile de résoudre les équations d'Einstein des champs dans le cas général
et nous devons donc souvent nous appuyer sur des hypothèses simplificatrices.

SOLUTION DE SCHWARZSCHILD

La "métrique de Schwarzschild" (1916) est une solution de l'équation d'Einstein dans le cas d'un champ
gravitationnel isotrope. Elle fournit les trois preuves principales de la Relativité Générale: le décalage des
horloges, la déviation de la lumière par le Soleil et l'avance du périhélie de Mercure. Ces trois preuves sont
très importantes car l'équation d'Einstein n'était pas démontrée expérimentalement à l'époque.

Pour introduire cette métrique imaginons une source (par exemple le Soleil) qui produit un champ de
gravitation à l'aide de sa masse M. Nous cherchons, pour comparer par rapport à l'expérience, les solutions
de l'équation d'Einstein (en d'autres termes : la métrique) en dehors de la source (du Soleil donc...) de masse
M.

En d'autres termes, cela revient à avoir dans la région de l'espace qui nous intéresse (en considérant qu'il n'y
que l'astre en question et rien d'autre autour n'y même l'énergie/masse propre au champ gravitationnel) la
propriété suivante :

(50.221)
Donc l'équation d'Einstein des champs :

(50.222)

devient alors :

(50.223)

Mais nous avions montré plus haut que cette dernière relation peut aussi s'écrire l'aide de la définition du
scalaire de :

(50.224)

et comme il est peu vraisemblable que la parenthèse soit nulle il reste :

(50.225)

Nous devons donc trouver la métrique qui satisfait cette relation. Comme il y en à plusieurs intéressons-nous
à un cas particulièrement élégant avec comme l'aime les physiciens... plein de symétries.

L'idée est donc de trouver une métrique si possible indépendante du temps (donc le champ gravitationnel
aussi) et... à symétrie sphérique (l'astre étant lui-même de cette forme), prenant en compte la masse de l'astre
central (c'est l'objectif majeur!) et telle qu'assez loin de la source (...) ou lorsque la masse est nulle nous
retrouvions la métrique classique connue vue plus haut :

(50.226)

Mais ceci n'est pas totalement exact.

Effectivement, nous travaillons dans l'espace-temps. Or, nous avons vu que l'équation de la métrique
curviligne est dans un espace temps plat par :

(50.227)

en passant en coordonnées sphériques nous avons alors :

(50.228)

Et c'est sur cette équation de la métrique que nous devons retomber lorsque nous sommes éloignés de la
source ou que la masse de celle-ci est extrêmement faible (la métrique de Schwarzschild doit donc être
asymptotiquement plate).

Donc mettons nous à la tâche. D'abord nous partons de ce que nous savons (vaut mieux!). C'est-à-dire que :

(50.229)
et en coordonnées sphérique avec le temps nous avons pour composantes . En tout rigueur, nous
notons:

(50.230)

les "coordonnées de Schwarzschild".

Donc il vient un total de 16 termes dont outre les diagonales au nombre (4 termes) les autres s'additionnent
(6 termes) soit finalement 10 termes qui sont les suivantes:

(50.231)

où A, B, C, ...sont des coefficients à déterminer.

Avant de s'attaquer à ce travail, nous savons que selon une de nos contraintes de départ, lorsque la masse est
faible ou que nous sommes éloignés de la source, nous devons retomber sur :

(50.232)

dès lors intuitivement nous pouvons déjà écrire :

(50.233)

ce qui admettons-le... est un net progrès...!

Si comme nous nous le sommes imposés au début l'équation de la métrique est indépendante du temps. Nous
pouvons par symétrie du temps (hypothèse...) faire le changement de variable suivante sans que
cela change quoi que ce soit dans notre . Or, nous nous rendons tout de suit compte que cela ne sera pas
le cas. Immédiatement, pour que cela soit satisfait il faut :

(50.234)

ce qui nous amène (c'est déjà mieux!) à :

(50.235)

Maintenant si le système est bien sphérique. L'équation de la métrique doit être invariante par la
transformation (le contraire se saurait depuis longtemps si ce n'était pas le cas
expérimentalement) et/ou également par la transformation .

Donc pour que cela soit juste, nous voyons immédiatement que dans la relation précédente, nous devons
imposer :

(50.236)

Donc finalement nous n'avons plus que :


(50.237)

où A, B, C, D seront bien évidemment indépendant du temps (le contraire contredirait notre contrainte
initiale) mais peuvent par symétrie de la sphère être dépendant de r tel que :

(50.238)

Maintenant, imaginons-nous sur la sphère (rigoureusement c'est une hyper-sphère mais cela aide quand
même...) à une distance r fixe du centre de la source du champ à un instant donné t fixé. Nous n'avons alors
plus que :

(50.239)

puisque dt est nul (temps fixé) et dr aussi (distance r fixée).

Nous avons par ailleurs enlevé le signe - car nous avons anticipé le fait qu'il va s'éliminer à la troisième
égalité qui va suivre et nous le remettrons ensuite.

Maintenant, imaginons-nous proche du pôle nord de la sphère nous n'avons alors plus qu'en
première approximation:

(50.240)

et à l'équateur :

(50.241)

Par symétrie du champ, un déplacement angulaire infinitésimal en chacun des ces deux zones particulières
doit pourtant être égal. Dès lors, nous ne pouvons que poser :

(50.242)

Dès lors, l'équation de la métrique se réduit à :

(50.243)

Montrons maintenant que nous pouvons choisir un système de coordonnées pour lequel .

Introduisons pour cela une distance définie par :

(50.244)

d'où :

(50.245)

Il vient dès lors :


(50.246)

d'où :

(50.247)

Ce qui se simplifie encore en :

(50.248)

Mettons le tout au carré et divisons à gauche et à droite par :

(50.249)

d'où :

(50.250)

Dès lors, l'équation de la métrique s'écrit :

(50.251)

C'est donc comme si :

(50.252)

Donc :

(50.253)

Soit :

(50.254)
et le tenseur métrique contravariant correspondant (dont nous allons avoir besoin plus loin):

(50.255)

tel que (cf. chapitre de Calcul Tensoriel) :

(50.256)

Maintenant, pour déterminer les coefficients restants (soit A et B) nous allons nous aider de la relation que
doit satisfaire la métrique :

(50.257)

Soit sous forme développée (cf. chapitre de Calcul Tensoriel):

(50.258)

avec bien évidemment (cf. chapitre de Calcul Tensoriel):

(50.259)

C'est dire que l'on a du travail sur la planche... Bon d'abord puisque la métrique est simple les seules
dérivées non nulles sont :

(50.260)

Nous en déduisons simplement les 9 éléments de la connexion (nous pouvons détailler sur demande...) non
nuls :

(50.261)

Maintenant que nous avons ces termes de la connexion il nous faut calculer leur dérivée conformément aux
deux premiers termes de :

(50.262)

il y a alors 10 termes non nuls qui sont :


(50.263)

Nous avons finalement pour chaque composante du tenseur de Ricci :

(50.264)

Soit les seuls éléments non nuls sont :

(50.265)

Soit sous forme plus conventionnelle (conforme à la littérature) nous pouvons simplifier un peu et par
ailleurs garder que les trois premières équations :
(50.266)

Si nous additionnons les deux premières équations il nous reste :

(50.267)

ce qui équivaut à :

(50.268)

Nous avons donc :

(50.269)

qui devient :

(50.270)

Le lecteur pour vérifier qu'une solution de l'équation différentielle est :

(50.271)

où S est une constant réelle non nulle. En conséquence, la métrique pour une solution statique,
symétriquement sphérique et dans le vide (...), s'écrit :

(50.272)

Il nous reste à déterminer un coefficient. Mais comme :

(50.273)

il vient :

(50.274)

Donc :
(50.275)

Donc finalement :

(50.276)

Notons que l'espace-temps représenté par cette métrique est asymptotiquement plat, ou, en d'autres termes
lorsque , la métrique s'approche de celle de Minkowski, et la variété de l'espace-temps ressemble à
celle de l'espace de Minkowski.

Pour calculer les constantes K et S, nous utilisons l'approximation du champ faible. En d'autres termes, nous
nous plaçons loin du centre, là où le champ de gravitation est faible. Dans ce cas, la composante de la
métrique peut être calculée.

Effectivement, nous avions étudié plus haut la limite newtonienne et avions obtenu la relation suivante :

(50.277)

avec (cf. chapitre d'Astronomie) . Donc in extenso nous pouvons poser sans trop de craintes :

(50.278)

soit :

et (50.279)

Finalement nous avons pour la "métrique de Schwarzschild" :

(50.280)

soit en unités naturelles :

(50.281)

Une singularité toute (physiquement) apparente apparaît lorsque :

(50.282)
ou en d'autres termes, lorsque la coordonnée du rayon r vaut :

(50.283)

Ce rayon, que nous avions déjà déterminé lors de notre étude la mécanique classique, est appelé "rayon de
Schwarzschild".

Le rayon de Schwarzschild est défini comme le rayon critique prévu par la géométrie de Schwarzschild, en
deçà duquel rien ne peut s'échapper : si une étoile ou tout autre objet atteint un rayon égal ou inférieur à son
rayon de Schwarzschild (qui dépend de sa masse, cf. ci-dessous), alors elle devient un Trou Noir, et tout
objet s'approchant à une distance de celui-ci inférieure au rayon de Schwarzschild ne pourra s'en échapper.
Le terme est utilisé en physique et en astronomie pour donner un ordre de grandeur de la taille
caractéristique à laquelle des effets de relativité générale deviennent nécessaires pour la description d'objets
d'une masse donnée. Les seuls objets qui ne sont pas des trous noirs et dont la taille est du même ordre que
leur rayon de Schwarzschild sont les étoiles à neutrons (ou pulsars), ainsi, curieusement, que l'univers
observable en son entier.

Remarques:

R1. La singularité dans la métrique lorsqu'on atteint le rayon de Schwarzschild est apparente car il ne s'agit
que d'un effet du système de coordonnées utilisées.

R2. Un théorème remarquable affirme que la métrique de Schwarzschild est l'unique solution aux équations
d'Einstein dans le vide possédant la symétrie sphérique. Comme la métrique de Schwarzschild est également
statique, ceci montre qu'en fait dans le vide toute solution sphérique est automatiquement statique. Une des
conséquences intéressantes de ce théorème est que n'importe quelle étoile pulsante qui reste à symétrie
sphérique ne peut pas générer d'ondes gravitationnelles (puisque la région de l'espace-temps extérieure à
l'étoile doit rester statique).

Maintenant que nous avons la métrique de Schwarzschild revenons sur le critère de Schild que nous avions
vu lors de notre étude classique de l'effet Einstein.

Si nous récrivons la métrique de Schwarzschild pour un corps immobile nous avons la métrique qui se
simplifie en :

(50.284)

En faisant intervenir le potentiel gravitationnel (cf. chapitre d'Astronomie) :

(50.285)

la métrique s'écrit :

(50.286)

d'où en introduisant le temps propre :


(50.287)

d'où :

(50.288)

soit :

(50.289)

Le développement au deuxième ordre en série de MacLaurin (cf. chapitre de Suite Et Séries) de la racine
négative donne :

(50.290)

Ainsi, nous avons :

(50.291)

Donc cela démontre que la courbure (la gravitation) engendre une dilatation du temps d'autant plus
importante (dans le sens qu'elle s'écoule plus vite) que le champ de gravité est intense (la masse M est
grande) ou que nous sommes près du corps sous du champ (rayon r petit).

Or, pour la Terre, le terme:

est relativement faible. Mais pour un Trou Noir ou une étoile à Neutrons, ce n'est plus vraiment le cas et la
dilatation devient importante et les effets accessibles à la mesure.

VERIFICATIONS EXPERIMENTALES

Nous allons maintenant passer en revue les quatre vérifications expérimentales classiques du 20ème siècle
de la théorie de la relativité générale qui sont :

1. La précession du périhélie qui au niveau des résultats numériques nous posait problème avec les outils de
la mécanique classique (cf. chapitre d'Astronomie).

2. La déflexion des ondes électromagnétiques (lumière) passant proche d'un corps stellaire massif qui au
niveau des résultats numériques nous posait aussi problème avec les outils de la mécanique classique (cf.
chapitre d'Astronomie).

3. La démonstration du critère de Schild (déjà fait dans les paragraphes précédents) comme seul moyen
d'expliquer rigoureusement le redshift gravitationnel et l'hypothèse de ralentissement du temps dans un
champ gravitationnel.
4. Le retard des signaux électromagnétiques se propageant près de corps massif. Retard désigné sous le nom
"d'effet Shapiro" dont les applications numériques sont utilisées pour le fonctionnement du G.P.S et que
nous verrons plus loin.

PRECESSION DU PÉRIHÉLIE DE MERCURE

Traitons donc maintenant un des plus fameux exemples de la relativité générale : la précession du périhélie
de Mercure. Nous avions déjà traité dans le chapitre d'Astronomie ce cas mais nous avions mentionné que le
résultat théorique numérique ne correspondait pas à l'expérience. Nous allons voir en l'équivalent d'une
dizaine de pages A4 de développements détaillés comment la relativité générale permet de réconcilier
théorie et expérience.

Pour étudier cas, nous allons utiliser le formalisme lagrangien vu dans le chapitre de Mécanique Analytique.

D'abord, rappelons que nous avons obtenu pour la métrique de Schwarzschild :

(50.292)

D'où en divisant par :

(50.293)

et pour abréger les notations, nous poser tel que :

(50.294)

Maintenant rappelons que (cf. chapitre de Mécanique Analytique) en unités naturelles :

(50.295)

Donc (c'est très grossier mais cela fonctionne... c'est aussi ça parfois la physique...) :

(50.296)

Enfin cela signifie que le lagrangien est :

(50.297)
Les équations de Lagrange nous donnent pour la :

(50.298)

avec donc :

(50.299)

d'où :

(50.300)

et :

(50.301)

d'où finalement pour la coordonnée :

(50.302)

Faisons de même pour :

(50.303)

et il vient immédiatement :

(50.304)

Faisons de même pour t :

(50.305)

et il vient ici aussi immédiatement :

(50.306)

Dès lors :

(50.307)
Maintenant nous allons supposer que le mouvement de Mercure est dans le plan équatorial tel que .
Dès lors, la relation :

(50.308)

se simplifie en :

(50.309)

d'où :

(50.310)

Nous avons aussi dès lors l'expression de la ligne d'univers qui se simplifie en :

(50.311)

Remplaçons alors dans l'élément de ligne d'Univers :

(50.312)

Considérons aussi r comme fonction alors :

(50.313)

d'où :

(50.314)

Ainsi, nous pouvons récrire la ligne d'univers sous la forme :

(50.315)

Faisons un changement de variable en posant :

(50.316)
d'où :

(50.317)

Ce qui donne pour notre ligne d'univers :

(50.318)

ou :

(50.319)

en différenciant :

(50.320)

ou écrit autrement :

(50.321)

ce qui se simplifie et factorise en :

(50.322)

La première solution possible est bien évidemment :

(50.323)

d'où comme r=1/u :

(50.324)

Le mouvement circulaire est donc aussi une solution du problème de Kepler en relativité générale dans un
champ de Schwarzschild.

L'autre solution sera :

(50.325)
Soit écrit autrement :

(50.326)

elle correspond à l'orbite du problème de Kepler.

Faisons la comparaison en considérant en mécanique de Newton le mouvement d'une particule de masse m


dans un potentiel U. Le lagrangien (cf. chapitre de Mécanique Analytique) est alors :

(50.327)

En coordonnées polaires nous avons déjà vu dans différents chapitre (de Calcul Vectoriel et d'Astronomie)
que la vitesse s'écrit alors :

(50.328)

En utilisant l'équation d'Euler-Lagrange nous avons l'équation du mouvement :

(50.329)

ce qui donne :

et (50.330)

d'où :

(50.331)

et comme nous l'avons vu dans le chapitre d'Astronomie :

(50.332)

est la constante des aires. Introduisons :

(50.333)

d'où :

(50.334)
et donc :

(50.335)

Ainsi :

(50.336)

L'équation :

(50.337)

devient alors :

(50.338)

Or :

(50.339)

d'où :

(50.340)

soit :

(50.341)

ou :

(50.342)

Il s'agit simplement de la "formule de Binet non relativiste" qui donne donc la relation entre u=1/r et pour
une force centrale. Dans le cas d'un potentiel newtonien :

(50.343)

d'où :
(50.344)

avec pour rappel :

(50.345)

Or, rappelons la forme de celle que nous avions obtenue avec la relativité générale :

(50.346)

Ainsi, nous voyons que le terme analogue en relativité est :

(50.347)

et que la relativité générale ajouter le terme . Or, comme en relativité générale :

(50.348)

Alors :

(50.349)

Or, dans le cas de l'approximation des champs faibles :

(50.350)

d'où :

(50.351)

donc finalement :

(50.352)

Ceci dit, il est vraiment intéressant de remarquer que l'équation pour la relativité générale :
(50.353)

peut être interprétée comme l'équation de Binet pour la mécanique classique :

(50.354)

avec le potentiel :

(50.355)

avec .

Revenons maintenant à notre équation :

(50.356)

Nous aimerions savoir si le deuxième terme à gauche de l'égalité est négligeable ou non par rapport au
premier terme de gauche de l'égalité et ce afin de pouvoir appliquer la théorie des perturbations.

Nous allons d'abord poser à l'aide de l'approximation des champs faibles faite plus haut :

(50.357)

Maintenant calculons le rapport :

(50.358)

Rappelons qu'en coordonnées polaires :

(50.359)

en approximation nous pouvons grossièrement poser que :

(50.360)

Dès lors pour Mercure... :


(50.361)

Ainsi nous voyons de suite que nous pourrons appliquer les théories variationnelles sur le terme . Ainsi,
posons :

(50.362)

L'équation :

(50.363)

prend alors la forme :

(50.364)

Pour résoudre cette équation différentielle, nous allons utiliser l'approche de la théorie des perturbations (cf.
chapitre de Calcul Différentiel Et Intégral). Nous allons donc nous intéresser à une solution de la forme de
Taylor en deuxième ordre seulement en :

(50.365)

où sont bien évidemment dépendants de et devront être déterminés! Pour cela, nous savons qu'il
faut remplacer l'expression précédente dans l'équation différentielle telle que :

(50.366)

Ce qui donne :

(50.367)

et se simplifie en :

(50.368)

où rappelons que :

(50.369)

est l'équation classique obtenue plus haut :


(50.370)

considérons la solution du type :

(50.371)

où D est une constante arbitraire. Or, comme nous l'avons vu dans le chapitre d'Astronomie dans le cas de la
précession du périhélie :

(50.372)

est au fait une ellipse. Ce qui signifie que toute solution de la forme :

(50.373)

est aussi une ellipse!

Pour l'équation en :

(50.374)

qui se simplifie en :

(50.375)

Puisque (cf. chapitre de Trigonométrie) :

(50.376)

Il vient :

(50.377)

Pour déterminer , décomposons la relation précédente en trois termes :

(50.378)

Ce qui nous donne immédiatement :


(50.379)

Finalement :

(50.380)

La solution cherchée est finalement :

(50.381)

C'est donc avec :

(50.382)

qu'il faut calculer le déplacement du périhélie (on y arrive...).

Nous voyons relativement vite en observant la relation précédente que le seul terme dont l'amplitude n'est
pas constante est .

Rappelons alors que (cf. chapitre de Trigonométrie) :

(50.383)

Ce qui peut grossièrement s'écrire aussi en première approximation :

(50.384)

d'où :

(50.385)
Nous savons que l'orbite d'ordre zéro est :

(50.386)

L'effet du dernier terme :

(50.387)

est donc d'introduire une petite variation périodique dans la distance radiale. Ce terme n'affecte pas le
déplacement du périhélie. C'est le terme dans :

(50.388)

qui introduit une non-périodicité qui peut être non négligeable dans le cas où est grand.

Le périhélie (point le plus proche du Soleil) se présente donc quand r est minimum soit maximum.
Or, u est maximum quand le terme qui nous intéresse est maximum, c'est-à-dire :

(50.389)

Nous avons approximativement :

(50.390)

Pour deux périhélies successifs, nous avons un intervalle :

(50.391)

au lieu de . Ainsi, le déplacement pour une révolution est :

(50.392)

où K est donc la constante des aires et M la masse de l'astre central et puisque :

(50.393)

Bref, nous avons au final:

(50.394)
Relation à comparer avec celle que nous avons obtenue dans le chapitre d'Astronomie avec un traitement
newtonien classique:

(50.395)

Nous retrouvons donc à la perfection le facteur 6 qui manquait dans les traitement classique!

Pour Mercure une application numérique donne :

(50.396)

et l'expérience donne .

Pour terminer sur ce sujet, signalons une deuxième écriture fréquente dans la littérature concernant le
résultat obtenu. Effectivement, nous avons démontré dans le chapitre d'Astronomie que le paramètre focal
était donné par:

(50.397)

Il reste donc:

(50.398)

et nous avons démontré aussi dans le chapitre de Géométrique Analytique que:

(50.399)

Il vient donc au final la forme la plus classique:

(50.400)

DÉFLÉXION DE LA LUMIERE

Nous avons donc montré que :

(50.401)

en remplaçant les facteurs par leurs valeurs respectives nous avons :

(50.402)
Mais nous avons vu plus haut que :

(50.403)

et comme K est la constante des aires donnée par la conservation du moment cinétique lui-même constant
(cf. chapitre de Mécanique Classique) :

(50.404)

Nous avons alors pour un photon .

Finalement l'équation du mouvement d'un photon se résume à :

(50.405)

Posons maintenant pour simplifier les notations :

(50.406)

alors :

(50.407)

Le terme à droite de l'égalité est petit (vu les constantes qui y interviennent...) si bien qu'une forme
approchée de l'équation différentielle est :

(50.408)

Dont une solution particulière est qui ne le savons d'avance est intéressante :

(50.409)

Nous portons cette solution approximée dans l'équation différentielle initiale et nous obtenons :

(50.410)

Soit :

(50.411)

Soit :
(50.412)

La suite va être très subtile (comment deviner quelque chose comme cela...?). D'abord nous allons créer une
nouvelle équation différentielle:

(50.413)

L'astuce consiste à multiplier cette équation par i et la sommer à l'équation différentielle d'origine :

(50.414)

Ce que nous noterons :

(50.415)

L'astuce est de chercher une solution particulière de la relation précédente sous la forme :

(50.416)

Nous avons alors :

(50.417)

Ceci injecté dans notre nouvelle équation différentielle donne :

(50.418)

Nous en déduisons immédiatement :

(50.419)

Une solution particulière de l'équation différentielle d'origine est donc :

(50.420)
Soit en utilisant les relations trigonométriques remarquables :

(50.421)

Il vient :

(50.422)

La solution générale est finalement :

(50.423)

Si nous admettons que la lumière est très faiblement déviée par le Soleil, le rayon de courbure (1/r) de sa
trajectoire sera très faible.

Ainsi :

(50.424)

tel que :

(50.425)

Le premier terme est prédominant par rapport au deuxième à cause du facteur qui est très petit sur le
deuxième. Pour la suite, nous procédons comme dans le chapitre d'Astronomie (juste les notations changent)
pour lors de l'étude de l'angle de déflexion (si vous n'y revenez pas vous ne pourrez comprendre la
justification de ce qui va être fait!). Nous posons sans perdre en généralité que :

(50.426)

Soit :

(50.427)

et comme :

(50.428)

il vient :
(50.429)

En utilisant les relations trigonométriques à nouveau :

(50.430)

Il vient :

(50.431)

étant supposé très petit nous faisons un développement de MacLaurin (cf. chapitre de Suites Et Séries)
au premier ordre des fonctions trigonométriques :

(50.432)

Ce qui donne :

(50.433)

Donc après une série d'approximations... et d'hypothèses limites acceptables nous arrivons à :

(50.434)

au lieu du résultat que nous avions obtenu selon l'approche newtonienne dans le chapitre d'Astronomie:

(50.435)

Nous trouvons donc le facteur 2 qui faisait défaut au traitement classique du problème, relativement aux
mesures expérimentales, que nous avons vu dans le chapitre d'Astronomie.

(50.436)
Cette déviation a pu être mise en évidence en mesurant la position des étoiles au voisinage du disque solaire
lors de l'éclipse de 1919 par Arthur Eddington et son équipe. Après l'avance du périhélie de Mercure, il
s'agissait du second test passé avec succès par la Relativité Générale. C'est cet événement qui a rendu Albert
Einstein célèbre auprès du grand public. Aujourd'hui, la déviation des rayons lumineux a pu être mesurée
avec beaucoup plus de précision en considérant les signaux radio émis par des sources extragalactiques
(quasars, AGN, etc...) : la prédiction de la Relativité Générale a été confirmée au millième près.

La déviation des rayon lumineux est aujourd'hui très importante en cosmologie observationnelle,
puisqu'elle est a l'origine du phénomène de mirage gravitationnel, encore appelée "lentille gravitationnelle".

Il est intéressant de remarquer que toute la théorie des mirages gravitationnels est basée
sur la relation:

(50.437)

du moins pour un détecteur ponctuel. C'est le seul ingrédient de Relativité Générale utilisé dans le calcul des
images.

EFFET SHAPIRO

En 1964, Shapiro démontra qu'un rayon lumineux n'était pas seulement dévié en passant près d'une masse,
mais également que la durée de son trajet était allongée par rapport à une géométrie euclidienne. Il calcula
que le retard devait atteindre environ 200 microsecondes, donc parfaitement mesurable, pour une ligne de
visée rasant le Soleil. Il suggéra alors de mesurer systématiquement la durée mise par un signal radar pour
effectuer le trajet aller-retour entre la Terre et une planète passant derrière le Soleil (pour que l'effet soit
maximal). Cela fut d'abord accompli avec des échos radar sur Mars, Vénus ou Mercure, avec une précision
de l'ordre de 20%. Le résultat est très net : la durée nécessaire à un signal radar pour faire l'aller-retour
Terre-Planète augmente brutalement juste avant que la planète passe derrière le Soleil et diminue tout aussi
brutalement quand celle-ci réapparaît.

Remarque: Nous parlons parfois de ralentissement de la lumière près du Soleil pour décrire l'effet Shapiro
mais c'est une expression maladroite et erronée. Comme cela a déjà été mentionné, la vitesse de la lumière
est constante en relativité générale aussi bien qu'en relativité restreinte. Dans le cas de l'effet Shapiro (et
dans d'autres cas similaires), ce qui change c'est l'écoulement du temps là où passe la lumière, par rapport à
ce qu'il est là où se situe l'observateur.

Bien qu'il s'agisse d'un effet faible, on a pu le vérifier très précisément depuis l'arrivée des sondes Viking sur
Mars en 1976, à l'aide de signaux envoyés depuis la Terre vers Mars et réfléchis sur cette dernière par les
sondes (voir le principe de l'expérience sur la figure suivante). En outre, il existe même désormais un objet
de plus en plus courant pour le fonctionnement duquel l'effet Shapiro doit être pris en compte : le "G.P.S."
(Global Positioning System). En effet, malgré la faiblesse du champ de gravitation terrestre, une précision
géographique de quelques mètres nécessite de tels détails dans les calculs. Toutefois, un satellite a été lancé
récemment dont le but est de vérifier, dans le champ de gravitation terrestre, un effet encore plus faible
prédit par la relativité générale et qui n'intervient même pas dans le GPS : l'entraînement de l'espace-temps,
aussi nommé "effet Lense-Thirring".

Signalons pour le GPS que deux phénomènes d'erreur sont connus dans le cadre de la relativité:

1. Les satellites tournent autour de la Terre à une vitesse approximative de 20'000 kilomètres par heure
retardent alors de 7 millionièmes de seconde par jour (relativité restreinte).

2. A l'altitude de 20'200 kilomètres, celle de l'orbite des satellites, le champ gravitationnel plus faible fait
avancer les horloges satellitaires de 45 millionièmes de seconde par jour.

La somme des deux corrections donne une dérive de 38 millionièmes de seconde par jour, un chiffre
ahurissant pour un système GPS dont la précision se doit d'être de 50 milliardièmes de seconde par jour.

Faisons le calcul pour un rayon frôlant la surface du Soleil. Pour cela, nous reprenons notre métrique de
Schwarzschild :

(50.438)

avec :

(50.439)

Pour un photon, nous savons que et donc l'équation de la métrique de Schwarzschild s'écrit alors :

(50.440)

La trajectoire du photon ayant lieu dans le plan équatorial du Soleil, nous posons :

(50.441)

ce qui simplifie encore l'équation de la métrique en :

(50.442)

Pour simplifier encore plus nous faisons l'hypothèse (surprenante!) que la trajectoire (en coordonnées
polaires) du photon rasant le Soleil est rectiligne telle que (pour une des composantes polaires du plan):

(50.443)
où est le rayon du Soleil. Nous allons utiliser cette hypothèse pour simplifier l'équation de la métrique.
Pour cela nous réarrangeons :

(50.444)

Nous dérivons (cf. chapitre de Calcul Différentiel Et Intégral) :

(50.445)

Si nous mettons le tout au carré :

(50.446)

d'où :

(50.447)

Nous pouvons maintenant récrire l'équation de la métrique :

(50.448)

En prenant la racine :

(50.449)

Etant donné que et que alors :


(50.450)

Dès lors nous avons en utilisant les développements de MacLaurin (cf. chapitre de Suites Et Séries) au
premier ordre :

(50.451)

Nous avons alors :

(50.452)

Nous avons finalement une fois condensé :

(50.453)

Ce qu'il est de tradition de noter (nous sortons le 1/c des différents termes) :

(50.454)

S'il n'y pas de masse alors l'espace-temps est plat et . Dès lors :

(50.455)

Nous pouvons ainsi distinguer le temps classique du temps supplémentaire engendré par l'espace courbe. Le
"retard" sera donc donné par :

(50.456)

Ensuite, pour intégrer les quatre fonctions de r il faut se placer dans un référentiel placé si possible au centre
de l'astre principal (le Soleil typiquement) puisque la métrique de Schwarzschild est basée sur cette
hypothèse pour rappel... Ainsi, pour connaître le retard d'un rayon lumineux partant du Soleil jusqu'à la
Terre, nous choisirons logiquement comme rayon de départ celui du Soleil lui-même ( ) et comme
rayon d'arrivée, la distance Soleil-Terre ( ).

(50.457)

Bon ceci dit c'est bien joli de connaître les notations d'usage mais c'est encore mieux de faire une application
numérique! Nous allons donc déterminer la primitive de chacun des termes ci-dessous:

(50.458)

Les deux premières primitives sont simples car il s'agit de primitives usuelles démontrées dans le chapitre de
Calcul Différentiel et Intégral:

(50.459)

où pour la dernière primitive nous avons préservé la constante d'intégration (contrairement à ce qui a été fait
dans le chapitre de Calcul Différentiel et Intégral car ).

Maintenant il nous reste les deux dernières intégrales. Commençons dans l'ordre par:

(50.460)

En posant:
(50.461)

et en utilisant les résultats démontrés dans le chapitre de Calcul Différentiel et Intégral nous avons alors:

(50.462)

Puisque nous avons (cf. chapitre de Trigonométrie):

(50.463)

Alors:

(50.464)

Enfin, il reste la dernière primitive:

(50.465)

Nous posons pour la suite:

(50.466)

Il vient alors:
(50.467)

Dans le chapitre de Calcul Différentiel et Intégral nous avons démontré que:

(50.468)

et que :

(50.469)

Donc:

(50.470)

Pour revenir à l’intégrale du début on se rappelle que . Donc:

(50.471)

Nous avons donc au final:

(50.472)

Nous voyons dans le cas limite Newtonien où , nous avons:

(50.473)

Donc pour un aller-retour (entre planète et satellite par exemple), il vient alors dans ce cas simplifié:
(50.474)

TROUS NOIRS

En restant toujours à notre métrique de Schwarzschild....Une trajectoire radiale de type lumière implique:

(50.475)

donc:

(50.476)

et dans un trajectoire radiale directe (par définition) nous avons aussi:

et (50.477)

donc:

(50.478)

Dès lors:

(50.479)

Il vient alors:

(50.480)

D'où:

(50.481)

Posons en unités naturelles . Il vient alors:

(50.482)
Lorsque le membre de droite de l'égalité tend vers , donc l'évolution du temps t (observateur
extérieur) en fonction de r tend vers l'infini par rapport au temps propre de la lumière.

La sphère donnée par le rayon:

(50.483)

définit "l'horizon du Trou Noir de Schwarzschild".

Vers cette frontière limite, la lumière semble mettre un temps infini par rapport à un observateur extérieur à
se déplacer lorsqu'elle approche un Trou Noir. Elle ne parvient donc jamais vraiment à l'atteindre par rapport
à l'observateur, d'où le fait que les Trous Noirs peuvent être entourés en fonction de leur environnement d'un
halo lumineux aux abords du rayon de Schwarzschild. De plus, puisque le temps semble arrêté, la fréquence
de la lumière environnant le Trou Noir a une fréquence qui tend vers zéro et tend vers l'infra-rouge.

Signalons encore un point très important. Avant Einstein, la géométrie était considérée comme partie
intégrante des lois. Einstein a montré que la géométrie de l'espace évolue dans le temps selon d'autres lois,
encore plus profondes. Il est important de bien comprendre ce point. La géométrie de l'espace ne fait pas
partie des lois de la nature. Par conséquent, rien que nous puissions trouver dans ces lois ne dit ce qu'est la
géométrie de l'espace. Ainsi, avant de commencer à résoudre les équations de la théorie générale de la
relativité d'Einstein, nous n'avons strictement aucune idée de ce qu'est la géométrie. Nous la découvrons
seulement une fois les équations résolues.

Cela signifie que les lois de la nature doivent s'exprimer sous une forme qui ne présuppose pas que l'espace
ait une géométrie fixe. C'est le coeur de la leçon einsteinienne. Cette forme se traduit en un principe appelée
"indépendance par rapport au fond". Ce principe énonce dont que les lois de la nature peuvent être décrites
dans leur totalité sans présupposer la géométrie de l'espace.

In extenso, le choix des quatre dimensions fait partie du fond. Serait-il possible qu'une autre théorie plus
profonde ne nécessite pas présupposer le nombre de dimensions?

En résumé, l'idée de l'indépendance par rapport au fond, dans sa formulation la plus générale est une façon
sage de faire de la physique: faite de meilleures théories, dans lesquelles les choses qui, avant, étaient
postulées, seront expliquées en permettant à de telles choses d'évoluer dans le temps en fonction de lois
nouvelles.

C'est là aussi une difficulté de la théorique quantique. Elle est dépendante de fond contrairement à la
relativité générale.
51. COSMOLOGIE

L a cosmologie s'occupe donc de comprendre la naissance et l'évolution de l'Univers par la méthode


scientifique. C'est uniquement par ce jeu entre théorie physique, modélisation et observation que nous
aborderons cette question ici. Nous éviterons soigneusement toute digression métaphysique. Les problèmes
spécifiques de la cosmologie tiennent dans sa définition même: la statistique qui est une des grandes
méthodes scientifiques est apparemment pauvre: nous n'avons qu'un univers à notre disposition. En outre,
nous n'observons que le passé de l'Univers. Peut-on parler de prédictions dans ces conditions? Les théories
sont cependant falsifiables dans la mesure où elles prédisent des comportements que des observations
peuvent tester.

La cosmologie utilise principalement l'arsenal des mathématiques, de la physique théorique, de la physique


des particules, de la physique nucléaire, de la physique des détecteurs, et de l'astrophysique. Elle est donc
interdisciplinaire. La cosmologie traite des échelles supérieures à la taille d'une galaxie jusqu'aux échelles
définies par elle-même comme les horizons. Encore que la limite soit volontairement floue, la cosmologie ne
traite pas des détails internes de la naissance et de l'évolution d'objets astrophysiques (tels que les galaxies,
les amas globulaires, ou des amas de galaxies) qui relèvent plus de la "cosmogonie".

MODÈLE COSMOLOGIQUE NEWTONIEN

Un modèle cosmologique est une représentation mathématique de l'Univers qui cherche à expliquer les
raisons de son aspect actuel, et à décrire son évolution au cours du temps (appelé "temps cosmologique")
mais pas de sa création!

Le modèle Newtonien s'applique dans le cadre des hypothèses de la mécanique de Newton (action
instantanée). Les résultats que nous allons étudier ici ont été découverts avant le développement de la
Relativité Générale mais publié après! Mais ce modèle présente l'avantage de la simplicité tout en étant
capable de mettre en évidence et de discuter de la dynamique de l'Univers et de se préparer à l'étude des
modèles d'Univers faisant usage des résultats de la Relativité Générale. Ses inconvénients, outre le fait qu'il
ne correspond pas tout à fait avec les résultats expérimentaux, est de n'être plus valable dans des conditions
extrêmes donc de ne pas être extrapolable à l'instant du Big Bang.

Avant de commencer, nous devons définir le "principe cosmologique" formé des deux assertions suivantes
(en gros, il assure que nous ne sommes pas des observateurs privilégiés, et que ce que nous observons est
bien représentatif de l'ensemble de l'Univers) :

- L'espace (Univers) est homogène, c'est à dire qu'il présente les mêmes propriétés dans toutes ses régions.
Ceci doit s'entendre à très grande échelle, au-delà du millier de Mpc (Mégaparsecs). Il est clair qu'à petite
échelle existent des inhomogénéités, nous par exemple.

- L'espace (Univers) est isotrope, c'est à dire qu'il n'existe pas de direction particulière de l'espace, comme
une direction d'aplatissement, ou un mouvement d'ensemble à l'échelle Universelle par exemple.

Remarque: Cette hypothèse de l'isotropie de l'Univers et qui marche relativement bien dans les modèles
théoriques (voir ci après) impose une constatation intéressante si nous admettons un commencement à
l'Univers. Cette constatation implique que l'Univers à eu une phase dans son histoire où il n'a pas laissé à la
matière le temps s'agglutiner pour former à ses débuts de groupes de matières inhomogènes et anisotropes
qui seraient visibles aujourd'hui à nos télescopes. De ceci, il découle qu'à un moment de son histoire,
l'Univers a eu un taux d'expansion supérieur à celui que l'on pourrait faire correspondre à la vitesse de la
lumière (c'est mal dit mais j'espère que c'est quand même acceptable).

Nous allons poser quelques autres hypothèses de travail :


H1. L'Univers est un fluide gazeux non visqueux dont les particules sont les galaxies. Sous l'hypothèse du
principe cosmologique, le mouvement des galaxies, constituants de ce "fluide" est par construction,
statistiquement au repos.

H2. L'Univers est thermodynamiquement un système fermé, sans travail et adiabatique (pas d'échange de
chaleur avec l'extérieur).

H3. L'Univers en expansion et homothétique (en expansion proportionnelle dans toutes ses dimensions) pris
comme ayant une géométrique sphérique avec un centre (eh oui c'est le modèle newtonien...).

H4. Sa masse volumique est uniquement fonction du temps et il y a conservation de la masse (et donc de
l'énergie). Donc la quantité de matière y est constante!

H5. Nous acceptons la dynamique (approximation) newtonienne pour construire les modèles à suivre dans
ce chapitre.

H6. L'origine du temps est assimilée à l'origine de création de l'Univers et le référentiel d'étude est comobile
aux particules (et se déplace donc avec les galaxies posées sur la trame de l'espace-temps) et appelée
"référentiel matériel" (les galaxies sont donc immobiles dans ce référentiel!).

LOI DE HUBBLE

Sous l'hypothèse du principe cosmologique et des hypothèses précédentes, la distance d'un point origine O à
un point M quelconque de l'Univers peut varier en fonction du temps (de manière indétectable à l'échelle
humaine) sous la forme :

(51.1)

où F(t) est le "facteur d'échelle" (souvent noté R(t) dans la littérature aussi...).

En écrivant cette relation, nous considérons que les points O et M sont sur un plan à courbure nulle.
Effectivement, si nous imaginons deux points sur une surface courbe cercle (par exemple la surface d'une
sphère) voyons ce qui ce passe:

(51.2)

La distance entre deux points du cercle (in extenso de l'espace sphérique) est donné par:
(51.3)

Nous voyons très bien dans cette relation que si le rayon (de l'Univers sphérique) change d'un facteur F,
alors la variation de distance entre les deux points n'est pas proportionnelle à ce facteur !! Ce qui n'est pas le
cas dans un plan à courbure nulle.

Conséquence: Notre modèle Newtonien n'est valable que dans un Univers plat alors que la relativité
générale peut prendre en compte différents types de courbure !

Nous voyons tout de suite que la relation:

(51.4)

est indépendante de l'origine choisie, en effet, si nous l'appliquons à deux points A, B quelconques, nous
avons :

(51.5)

Soit par différence:

(51.6)

Remarques:

R1. Au temps il est évident que la relation précédente s'écrit :

(51.7)

et nous impose . Cette remarque est importante et nous y reviendrons plusieurs fois pendant
les développements qui vont suivre.

R2. La loi s'applique donc à un segment quelconque dans l'Univers c'est pourquoi l'Univers ne
comporte pas de centre géométrique et que nous pouvons nous donner une image suggestive pour se donner
une idée de l'expansion de la trame de l'Univers : soit un ballon mi-gonflé sur la surface de laquelle nous
traçons deux repères (par exemple : deux croix tracées à l'encre). En le gonflant davantage, nous
constaterons que ces deux croix s'écartent l'une de l'autre et donc la distance qui les séparent s'accroître.
C'est ce que nous constatons avec les galaxies.

Dérivons par rapport au temps la relation:

(51.8)

Le premier membre donne alors la vitesse des particules (ou de tout autre objet) au point :

(51.9)

Soit en éliminant :
(51.10)

Nous posons pour simplifier l'écriture :

(51.11)

Nous avons donc :

(51.12)

Cette relation est connue sous le nom de "loi de Hubble".

Avant d'aller plus loin, il convient de s'arrêter sur cette équation pour l'instant présent :

(51.13)

Cette équation dit que les objets de l'Univers s'éloignent avec une vitesse proportionnelle à leur éloignement
dans tous les points de l'Univers sans référentiel privilégié (aucune galaxie ne semble être fixe alors qu'elles
le sont dans le référentiel matériel!).

Remarque: Cette relation permet d'avoir des vitesses supérieures à celles de la lumière. Mais cela n'est pas
une violation de la relativité relativement à la constance de la vitesse de la lumière! Effectivement, il ne faut
pas oublier que la loi de Hubble prend en compte l'expansion de la "trame" de l'espace-temps sur laquelle se
meut la lumière. Dès lors si la trame s'étend selon un facteur d'expansion F supérieur à l'unité, cela donne
l'impression que la lumière va plus vite que c et c'est ce qui donne des RedShift parfois de 4 ou 5!

La constante étant bien sûr identifiable à la "constante de Hubble" telle qu'elle est mesurée
actuellement et valant (très approximativement) environ : .

En unités S.I., puisque un mégaparsec vaut alors nous avons :

(51.14)

Ainsi, une estimation actuelle de l'âge de l'Univers pourrait être interprétée comme l'inverse de la constante
de Hubble qui donne le "temps de Hubble" :

(51.15)

soit environ 13 milliards d'années.

Inversement, nous pouvons nous amuser à calculer la distance à partir de laquelle nous pouvons atteindre la
vitesse de la lumière avec la relation :

(51.16)
et une application numérique donne grosso modo 13 milliards d'années-lumière. Telle est la distance de
"l'horizon cosmologique".

ÉQUATIONS DE FRIEDMANN

Considérons maintenant un anneau sphérique de matière de rayon r et de masse constante m en expansion à


la vitesse v , et contenant une boule de matière de masse M (elle aussi en expansion à la vitesse v).

Rappelons que selon le principe cosmologique, M et m n'ont pas la même densité à cause de la masse
constante de l'Univers.

Nous pouvons appliquer à ce système la conservation de l'énergie mécanique car il est isolé (c'est d'ailleurs
le seul vrai système isolé...). Nous obtenons alors l'équation :

(51.17)

où est une constante. En divisant par m chaque membre et en remplaçant M par son expression en
fonction de la densité, nous obtenons :

(51.18)

Remarque: Si cela peut aider le lecteur pour comrpn

Remarque: Si cela peut aider le lecteur à comprendre ce que nous avait fait avec le terme de l'énergie
potentielle, il peut se référer au chapitre de Mécanique Classique lorsque nous avons développé les calculs
de l'énergie potentielle d'une sphère de matière.

Or la loi de Hubble nous donne selon ce que nous avons vu plus haut:

(51.19)

et :

(51.20)

Nous obtenons:

(51.21)

que nous simplifions en:

(51.22)

Or, sont des constantes. Nous introduisons une nouvelle constante k définie par (afin de simplifier
les écritures) :
(51.23)

Nous obtenons donc l'équation :

(51.24)

qui est n'est d'autre que la "première équation de Friedmann".

Que nous retrouvons dans la littérature souvent sous la forme suivante (parmi tant d'autres...):

(51.25)

Remarque: Einstein rajouta à cette équation pour des raisons de convictions personnelles et quasi religieuses
une fameuse constante cosmologique qui lui permettait de rendre statique le facteur d'échelle de l'Univers.
Nous (les auteurs du site) rejetons cette constante arbitraire, même si dans la physique contemporaine elle
est revenue à la mode (sa valeur a été cependant définie mathématiquement plutôt que religieusement) car
elle permettrait d'expliquer la provenance de la matière sombre, les lois actuelle de notre Univers, la période
inflationniste de notre Univers ainsi que sa géométrie. Ainsi, l'équation de Friedmann avec cette constante,
qui est un total artifice de travail, moderne s'écrit :

(51.26)

avec :

(51.27)

C'est Andreï Sakharov qui a défini la valeur de cette constante cosmologique qui s'apparenterait soit disant à
l'énergie quantique du vide (fonction des champs de Higgs).

Deux idées guident les chercheurs de ce début de 21ème siècle : en physique quantique les équations du
champ associées aux particules élémentaires servent à définir la théorie du Big Bang. La célèbre équation
d'équivalence d'Einstein nous dit que l'énergie crée un champ gravitationnel comme l'électron en
mouvement provoque un champ électromagnétique. Il découle de ces deux observations qu'en mesurant le
champ gravitationnel nous avons un moyen de déterminer l'énergie du vide. Le champ gravitationnel ne
concerne plus la matière mais bien la densité d'énergie du vide. Or la constante cosmologique est
directement proportionnelle à la constante de la gravitation, G. Sa mesure est un jeu très dangereux car de sa
valeur dépend plusieurs lois fondamentales de physique et des propriétés non négligeables quant à la
dynamique de notre Univers. Le débat reste donc complètement ouvert et si nous (les auteurs du site)
trouvons une démonstration valable et rigoureuse de cette constante, nous mettrons à disposition du lecteur
les conséquences de cette constante sur les modèles que nous allons voir ci-après.

Utilisons maintenant le premier principe de la thermodynamique (cf. chapitre de Thermodynamique) pour


un système par définition fermé dont la somme de l'énergie cinétique et potentielle est constante (et donc la
somme des variations est nulle pour ces deux énergies). Nous avons alors la variation d'énergie totale qui
n'est donnée que par la variation d'énergie interne (cas le plus courant en thermodynamique pour les objets
macroscopiques):
(51.28)

et nous avons également vu dans le chapitre de Thermodynamique l'équation caractéristique du fluide à


l'équilibre:

(51.29)

Si le système est adiabate (aucun transfert chaleur entre le système et l'extérieur), alors nous avons selon ce
qui a été vue dans le chapitre de Thermodynamique:

(51.30)

Donc:

(51.31)

Puisque l'Univers est supposée sphérique dans notre modèle, nous avons:

(51.32)

et dans la référentiel matériel où les galaxies (particules du fluide cosmique) sont immobiles:

(51.33)

Soit:

(51.34)

ce qui se simplifie en:

(51.35)

en prenant la dérivée par rapport au temps cosmique t:

(51.36)

d'où:

(51.37)

Reprenons maintenant la première équation de Friedmann, obtenue plus haut, sous la forme:
(51.38)

et mettons la sous la forme suivante:

(51.39)

Si nous différencions:

(51.40)

Nous obtenons alors:

(51.41)

Injectons:

(51.42)

dans la relation:

(51.43)

Nous obtenons alors:

(51.44)

Soit:

(51.45)

La relation suivante:

(51.46)

est la "deuxième équation de Friedmann" appelée également "équation de Raychaudhuri".

DENSITÉ CRITIQUE
Revenons à notre première équation de Friedmann sans constante. En sachant que :

(51.47)

Nous obtenons :

(51.48)

qui se réarrange avec :

(51.49)

en :

(51.50)

L'exposant du terme de gauche impose que le terme de droite soit positif ou nul tel que :

(51.51)

Rappelons que les conditions initiales nous imposent qu'au temps nous ayons :

et (51.52)

Effectivement :

(51.53)

Il vient alors :

(51.54)

Ce terme devrait être accessible à l'observation, hélas est très mal connu et encore plus. Autrement
dit, compte tenu du signe "-" dans l'expression de k, nous ne connaissons aujourd'hui même pas le signe de
cette constante.

Cependant, il peut-être important de noter qu'il existe une valeur appelée "densité critique" qui annule k
et donc aussi (voir plus haut):

(51.55)
soit, l'énergie totale de l'Univers serait nulle (selon des considérations de la cosmologie quantique). Cette
valeur de est donc trivialement:

(51.56)

Pour (valeur actuelle) nous trouvons . A titre de


comparaison, un atome d'hydrogène pèse , la densité critique correspondrait donc à 3 atomes
d'hydrogène par mètre cube.

Les physiciens ont défini une constante (variant dans temps) notée par la lettre grecque et appelée
"paramètre de densité cosmologique" et donnée par :

(51.57)

Il est intéressant de travailler avec cette constante car dans le cas où :

- :

Nous avons :

(51.58)

ce qui en remplaçant dans l'équation de Friedmann donne : (un Univers plat comme nous le verrons
dans notre étude du modèle relativiste).

- :

En effectuant le même raisonnement, et toujours en inégalités, nous avons alors: (un Univers à
courbure positive (fermé) comme nous le verrons dans notre étude du modèle relativiste).

- :

En effectuant le même raisonnement, mais en inégalités, nous avons alors: (un Univers à courbure
négative (fermé) comme nous le verrons dans notre étude du modèle relativiste).
(51.59)

Remarques:

R1. Toutes les mesures qui ont pu être faites jusqu'à présent n'ont pas permis de mettre en évidence une
courbure de l'univers. Les mesures du rayonnement fossile par le ballon BOOMERANG et le satellite
COBE tendent cependant à accréditer l'hypothèse d'un univers plat relativement aux simulations numériques
:

(51.60)

R2. La notion de topologie de l'Univers et son ouverture sont en fait deux notions distinctes normalement.
Quand nous parlons d'Univers fermé ou ouvert nous ne parlons normalement pas de sa topologie mais de
son destin. Ainsi, un Univers ouvert s'expant indéfiniment et un Univers fermé se recontracte sur lui-même
au bout d'un certain temps. Cela dit, dans les modèles que nous étudions dans ce chapitre (à constante
cosmologique nulle), la courbure est directement liée à la densité, et donc à son ouverture.

Revenons à l'équation :

(51.61)
Nous pouvons écrire :

(51.62)

En adoptant la notation :

(51.63)

Remarque: Les mesures actuelles donnent :

(51.64)

D'où :

(51.65)

Il convient maintenant pour nous de considérer trois situations:

(51.66)

Remarque: Nous ne pouvons poser car dans nos hypothèses initiales se trouvait le principe de
conservation de l'énergie.

UNIVERS DE FRIEDMANN-LEMAITRE

Le modèle euclidien Friedmann-Lemaître consiste dans la limite newtonienne à étudier "l'équation


fondamentale des modèles de Friedmann":

(51.67)

en considérant les trois situations:

(51.68)

Remarque: Il est possible dans le cadre de la relativité générale de trouver rigoureusement une solution aux
équations d'Einstein des champs appelée "métrique de Robertson-Walker" qui dans le cas d'une
approximation newtonienne nous redonne les équations de Friedmann obtenues dans le présent texte
(souvent ce sont ces approximation qui sont utilisées dans la littérature car la solution exacte est hors de
portée du cadre des cours universitaires).

ESPACE EUCLIDIEN (K=0)

Le modèle d'espace euclidien consiste à supposer que . Autrement dit, nous sommes dans un Univers
dont la densité est dite "densité critique" ou également simplement "plat" (comme nous le verrons avec le
modèle relativiste).

Nous avons alors l'équation :


(51.69)

En disposant les termes de manière adéquate :

(51.70)

et en intégrant, il vient :

(51.71)

Qui se simplifie en (nous élevons au carré d'où la suppression du double signe ±):

(51.72)

Nous avons donc dans ce modèle la relation :

(51.73)

à laquelle il nous faut rajouter une constante pour avoir la condition qui reste satisfaite :

(51.74)

Ce qui nous donne sur un tracé (nous avons représenté une échelle arbitraire du temps sur l'axe vertical) une
fonction à l'allure suivante (ne pas se fier aux valeurs indiquées elles sont arbitraires) :

(51.75)

Nous avons mise la zone où en évidence pour bien rappeler que cette partie de la solution est à
rejeter.

Nous avons donc un modèle d'Univers dont le facteur d'échelle croit de façon exponentielle et et ce
indéfiniment.
Remarque: Plus est grand, plus la croissance du facteur d'échelle est grand (sous-entendu que la pente est
bien évidemment plus grande).

MODÈLE SPHÉRIQUE (K>0)

Dans ce modèle (appelé aussi parfois "modèle elliptique"), nous considérons . Donc l'équation à traiter
reste :

(51.76)

Ce qui s'écrit aussi :

(51.77)

Rappelons que nous avions supposé pour que si nous effectuons le changement de variable
, nous obtenons l'intégrale suivante :

(51.78)

Nous recherchons donc une primitive de :

(51.79)

et nous discuterons du signe ± après avoir trouvé la primitive.

Nous effectuons encore un changement de variable en posant donc ce qui nous


donne la primitive suivante à calculer :

(51.80)

en refaisant un changement de variable :

(51.81)

d'où à une constante multiplicative près :

(51.82)
nous avons :

(51.83)

Dans le chapitre de Calcul Différentiel Et Intégral nous avons vu que cette forme de primitive se résout par
la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de la physique et il faut
satisfaire des conditions initiales auxquelles nous ne nous intéressions pas nécessairement en mathématique)
:

(51.84)

avec :

(51.85)

d'où :

(51.86)

Il nous faut encore calculer :

(51.87)

Enfin :

(51.88)

en remettant en place tous les changements de variables et en introduisant à nouveau la constante


multiplicative, nous avons dans le cas où :

(51.89)

Entre les deux bornes d'intégration nous avons donc (la constante d'intégration s'annule et nous
reprenons le ± qui se trouvait initialement dans l'intégrale) :

(51.90)

Rappel : La théorie nous impose


Si nous traçons cette fonction pour une valeur fixe. Nous avons le tracé suivant dans Maple (nous ne
considérerons que le cas avec le signe "-" ci-dessous pour l'instant car le signe "+" nous donnerait un tracé
dans les différentiels de temps négatifs : ):

(51.91)

Remarque: Le temps est toujours représenté sur l'axe vertical ainsi que pour tous les diagrammes suivants (il
vous faut tourner un peu la tête si habituellement vous mettez le temps sur l'axe des abscisses...).

Nous voyons que plus la constante A est petite, plus l'Univers arrive rapidement à une valeur finale. De plus
pour une valeur de k fixée, certaines valeurs de A sont interdites (c'est à cause de la condition d'intégration).

En fixant une valeur de A, nous obtenons la représentation bidimensionnelle suivante :

(51.92)

Si nous effectuons un zoom au niveau , nous avons :


(51.93)

Nous voyons que le critère est parfaitement et naturellement respecté sans introduction
d'une quelconque constante. Il suffit par ailleurs de remplacer F par 1 dans l'équation que nous avons
obtenue pour voir que nous trouvons .

Remarque: Comme nous l'avons déjà précisé, toutes les valeurs de inférieures à 1 sont à rejeter!

Analysons l'avant-dernier tracé en rappelant que :

(51.94)

Une condition limite (condition d'intégration) pour que le terme de droite de l'égalité soit positif est que :

ou (51.95)

Donc, si est plus petit que , nous ne somme plus dans un domaine valable (réel) du modèle.

Il faut donc que :

ou (51.96)

Cette limite a été présentée par une ligne verticale bleue sur l'avant-dernier diagramme. Nous y avons
également représenté par une ligne horizontale verte la limite temporelle temps correspondante .

Au fait, au-delà de cette limite temporelle, ce que ne sait pas l'ordinateur qui a tracé notre fonction, c'est qu'il
devrait basculer sur la fonction d'échelle avec le signe "+". Ainsi, lorsque nous exécutons le tracé des deux
fonctions avec les bornes adéquates :

(51.97)

nous obtenons alors (le temps est représenté sur l'axe vertical!) :
(51.98)

Nous voyons que alors que pour l'Univers entre dans une phase de contraction que nous appelons
communément "Big Crunch". Après cette phase de rétraction, il est possible soit que l'Univers disparaisse
totalement, soit qu'il entre à nouveau dans un phase dynamique cyclique (mathématiquement les deux issues
sont possibles).

MODÈLE HYPERBOLIQUE (K<0)

Dans ce modèle, nous considérons . Donc l'équation à traiter peut s'écrire :

(51.99)

Ce qui s'écrit aussi :

(51.100)

Rappelons que nous avions supposé pour que si nous effectuons le changement de variable
, nous obtenons l'intégrale suivante :

(51.101)

Nous recherchons donc une primitive de :

(51.102)

et nous discuterons du signe ± après avoir trouvé la primitive.


Nous effectuons encore un changement de variable en posant donc ce qui nous
donne la primitive suivante à calculer:

(51.103)

en refaisant un changement de variable :

(51.104)

d'où à une constante multiplicative près :

(51.105)

nous avons :

(51.106)

Dans le chapitre de Calcul Différentiel Et Intégral nous avons vu que cette forme de primitive se résout par
la relation (nous rajoutons la constante d'intégration à la fin car nous faisons de la physique et il faut
satisfaire des conditions initiales auxquelles nous ne nous intéressions pas nécessairement en mathématique)
:

(51.107)

avec :

(51.108)

d'où :

(51.109)

Il nous faut encore calculer :

(51.110)

Enfin :
(51.111)

en remettant en place tous les changements de variables et en introduisant à nouveau la constante


multiplicative, nous avons dans le cas où :

(51.112)

Entre les deux bornes d'intégration nous avons donc (la constante d'intégration s'annule) :

(51.113)

Nous devons évidemment avoir (nous reprenons le ± qui se trouvait initialement dans l'intégrale) :

(51.114)

Si nous traçons cette fonction pour une valeur fixe. Nous avons le tracé suivant dans Maple (nous ne
considérerons que le cas avec le signe "-" car celui avec le signe "+" n'a pas de sens physique même
translaté) :

(51.115)
Nous voyons que plus la constante A est petite, plus l'Univers croit indéfiniment rapidement. De plus pour
une valeur de k fixée, certaines valeurs de A sont interdites (il s'agit au toujours fait de la condition
d'intégration).

Nous voyons à nouveau que le critère est naturellement parfaitement respecté. Toutes les
valeurs de F(t) inférieures à 1 sont à rejeter !

Nous avons donc dans ce modèle hyperbolique un Univers qui croit indéfiniment de façon exponentielle
(comme le modèle plat de Friedmann-Lemaître) car étant donné que , il n'y a plus de condition limite
d'intégration (contrairement au modèle elliptique précédent).

UNIVERS OBSERVABLE

Nous avons déterminé plus haute une estimation actuelle de l'âge de l'Univers comme pouvant être
interprétée comme l'inverse de la constante de Hubble ce qui nous a donné :

(51.116)

soit environ 13 milliards d'années.

Remarques:

R1. Nous noterons que les articles populaires et professionnels de recherche en cosmologie emploient
souvent le terme "Univers" dans le sens de "Univers observable".

R2. Il faudrait au fait être plus rigoureux lorsque nous parlons d'âge de l'Univers. Au fait, nous devrions
plutôt dire que l'âge de l'Univers, pour un observateur comobile depuis les époques les plus reculées, est de
13 milliards d'années. En clair, c'est l'âge que mesurerait quelqu'un qui serait resté observateur inertiel (en
chute libre : ne subissant aucune autre force que la gravitation) tout au long de l'évolution de l'Univers et
dans un référentiel tel qu'il aurait toujours perçu cet Univers comme homogène et isotrope.

A ce jour, nous ne savons pas si l'Univers est fini ou infini, bien que la majorité des théoriciens favorisent
actuellement un Univers infini.

L'Univers observable se compose ainsi de tous les endroits qui pourraient nous avoir affectés depuis le Big
Bang (attention! malgré son nom, cette théorie du Big Bang n'a rien à dire sur le début! Elle se contente de
décrire l'évolution et l'expansion de l'Univers), en tenant compte que la vitesse de la lumière est certainement
finie. L'horizon cosmique se trouve quant à lui à une distance de 14 à 15 milliards d'années lumière selon les
observations expérimentales de la fin du 20ème siècle.

La taille actuelle (la "distance comobile") de l'Univers observable est plus grande, puisque l'Univers a
continué de s'étendre pendant le temps que la lumière met à nous parvenir, nous estimons qu'elle est
d'environ ~40 milliards d'années lumière.

Ce chiffre peut être obtenu en prenant un objet visible qui est à 13 milliards d'années de notre Terre. Celui-ci
aura donc mis 13 milliards d'années pour s'éloigner de nous, sa lumière aura mis 13 milliards d'années pour
arriver jusqu'à nous et pendant ce temps de parcours de la lumière, il ce sera éloigné de 13 milliards d'années
(puisque les objets à l'horizon cosmologique vont à la vitesse de la lumière). Soit un total de ~39 milliard
d'années.

Celui-ci contiendrait d'après des estimations toutes heuristiques environ étoiles, répandues dans
environ galaxies, elles-mêmes organisées en amas et super-amas de galaxies (le nombre de galaxies
pourrait être encore plus grand, selon le "champ profond de Hubble" observé avec le télescope spatial
Hubble.)

Cependant il est difficile de s'imaginer ce que cela représente. A ce titre, nous avons trouvé sur Internet une
magnifique série d'illustrations (http://atunivers.free.fr) que nous vous proposons :

1. L'univers jusqu'à 13 milliards d'années lumière (l'Univers visible) :

(51.117)

Cette carte essaie de montrer l'ensemble de l'Univers visible. Les galaxies dans l'Univers ont tendance à se
rassembler en vastes feuilles et "superamas" de galaxies, entourant de grands vides, ce qui confère à
l'univers une apparence cellulaire. Parce que la lumière dans l'univers ne voyage qu'à une vitesse finie, nous
voyons les objets sur le bord de l'univers quand celui-ci était très jeune, il y a 13 milliards d'années.

Quelques chiffres (estimations) :

- Nombre de superamas de l'univers visible = 270'000


- Nombre de groupes de galaxies de l'univers visible = 500 millions
- Nombre de grandes galaxies de l'univers visible = 10 milliards
- Nombre de galaxies naines de l'univers visible = 100 milliards
- Nombre d'étoiles de l'univers visible = 2'000 milliards de milliards

2. L'Univers jusqu'à 1 milliard d'années lumière (les superamas voisins) :


(51.118)

Quelques chiffres (estimations) :

Les Galaxies et les amas de galaxies ne sont pas distribués régulièrement dans l'Univers. Au lieu de cela, ils
sont rassemblés en de larges amas, feuillets et murs de galaxies séparés par de larges vides dans lesquels peu
de galaxies semblent se trouver. La carte ci-dessus montre un certain nombre de ces superamas, y compris
celui de la Vierge - un superamas plutôt petit dont notre galaxie fait partie. La carte entière représente à peu
près 7% du diamètre de l'Univers visible. Les galaxies sont trop petites pour apparaitre individuellement sur
cette carte, chaque point y représente un groupe de galaxies.

Quelques chiffres (estimations) :

- Nombre de superamas jusqu'à 1 milliard d'années lumière = 80


- Nombre de groupes galactiques jusqu'à 1 milliard d'années lumière = 160'000
- Nombre de grande galaxies jusqu'à 1 milliard d'années lumière = 3 millions
- Nombre de galaxies naines jusqu'à 1 milliard d'années lumière = 30 millions
- Nombre d'étoiles jusqu'à 1 milliard d'années lumière = 500 millions de milliards

3. L'univers jusqu'à 100 millions d'années lumière (le superamas de la Vierge) :


(51.119)

Notre galaxie n'est qu'une parmi des milliers d'autres qui se trouvent à moins de 100 millions d'années
lumière. La carte ci-dessus montre comment les galaxies tendent à s'amasser par groupes, le plus important
des amas proches étant l'amas de la Vierge (Virgo), une concentration de plusieurs centaines de galaxies qui
domine les groupes de galaxies environnants. Collectivement, l'ensemble de ces groupes est connu sous le
nom de Superamas de la Vierge. Le second amas le plus riche de ce volume est l'amas du Fourneau
(Fornax), mais il est bien moins riche que celui de la Vierge. Seules les galaxies brillantes sont dessinées ici,
notre galaxie est le point tout au centre.

Quelques chiffres (estimations) :

- Nombre de groupes de galaxies jusqu'à 100 millions d'années lumière = 160


- Nombre de grandes galaxies jusqu'à 100 millions d'années lumière = 2'500
- Nombre de galaxies naines jusqu'à 100 millions d'années lumière = 25'000
- Nombre d'étoiles jusqu'à 100 millions d'années lumière = 500'000 milliards

4. L'univers à moins de 5 millions d'années lumière (le groupe local de galaxies) :


(51.120)

La Voie Lactée est une des trois grandes galaxies du groupe appelé "Groupe Local" qui contient aussi
plusieurs dizaines de galaxies naines. La plupart de ces galaxies sont portées sur cette carte, mais il faut
noter que beaucoup de ces galaxies naines sont très peu brillantes, et qu'il y en a donc certainement d'autres
à découvrir.

Quelques chiffres (estimations) :

- Nombre de grandes galaxies à moins de 5 millions d'années lumière = 3


- Nombre de galaxies naines à moins de 5 millions d'années lumière = 36
- Nombre d'étoiles à moins de 5 millions d'années lumière = 700 milliards

5. L'univers jusqu'à 500'000 Années Lumière (les galaxies satellites) :

(51.121)
La Voie Lactée est entourée par plusieurs galaxies naines, qui contiennent chacune quelques dizaines de
millions d'étoiles, ce qui est insignifiant comparé à la population de la Voie Lactée elle-même. La carte ci-
dessus montre l'ensemble des galaxies naines les plus proches, elles sont liées gravitationnellement à la Voie
Lactée, et gravitent autour d'elle en quelques milliards d'années.

Quelques chiffres (estimations) :

- Nombre de grandes galaxies jusqu'à 500'000 années lumière = 1


- Nombre de galaxies naines jusqu'à 500'000 années lumière = 9
- Nombre d'étoiles jusqu'à 500'000 années lumière = 200 milliards

6. L'Univers jusqu'à 50'000 Années lumière (la Voie Lactée) :

(51.122)

Cette carte montre la Voie Lactée dans son ensemble - une galaxie spirale d'au moins deux cent milliards
d'étoiles. Notre Soleil est profondément enfoui dans le Bras d'Orion à environ 26'000 années lumière du
centre. Vers le centre de la Galaxie, les étoiles sont beaucoup plus proches les unes des autres qu'à la
périphérie où nous vivons. Notez également la présence de petits amas globulaires bien en dehors du plan
galactique, et la présence d'une galaxie naine voisine - dite du Sagittaire - qui est en train d'être lentement
avalée par notre propre Galaxie.

Quelques chiffres (estimations) :

- Nombre d'étoiles jusqu'à 50'000 années lumière = 200 milliards

7. L'Univers jusqu'à 5'000 Années lumière (le Bras d'Orion) :


(51.123)

Ceci est une carte de notre coin de la Voie Lactée. Le Soleil est situé dans le Bras d'Orion - un bras assez
petit comparé au Bras du Sagittaire, qui se situe plus près du centre galactique. La carte montre plusieurs
étoiles visibles à l'oeil nu, situées loin dans le bras d'Orion. Le groupe d'étoiles le plus marquant est composé
des étoiles principales de la constellation d'Orion - de laquelle le bras spiral tire son nom. Toutes ces étoiles
sont des géantes et supergéantes lumineuses, des milliers de fois plus lumineuses que le Soleil. L'étoile la
plus brillante de la carte est Rho Cassiopeia - à 4'000 années lumière de nous, c'est juste une étoile à peine
visible à l'oeil nu, mais en réalité c'est une supergéante 100'000 fois plus lumineuse que le Soleil.

Quelques chiffres (estimations) :

- Nombre d'étoiles jusqu'à 5'000 années lumière = 300 millions

8. L'univers jusqu'à 250 Années lumière (le voisinage du Soleil) :


(51.124)

Cette carte indique les 1'500 étoiles les plus lumineuses situées à moins de 250 années lumière. Toutes ces
étoiles sont bien plus lumineuses que le Soleil, et la plupart sont visibles à l'oeil nu. Environ un tiers des
étoiles visibles à l'oeil nu sont situées à moins de 250 années lumière, même si cette zone ne représente
qu'une toute petite partie de notre galaxie.

Quelques chiffres (estimations) :

- Nombre d'étoiles jusqu'à 250 années lumière = 250'000

9. L'univers jusqu'à 12.5 Années Lumière (les étoiles les plus proches) :
(51.125)

Cette carte montre toutes les étoiles jusqu'à une distance de 12.5 années lumière de notre Soleil. La plupart
de ces étoiles sont des naines rouges - des étoiles avec une masse du dixième de celle du Soleil et une
luminosité cent fois moins grande. Environ quatre vingt pour cent des étoiles de l'univers sont des naines
rouges, et l'étoile la plus proche - Proxima du Centaure- en est un exemple typique.

Cette carte montre toutes les étoiles connues situées à moins de 20 années lumière. On y trouve un total de
77 systèmes contenant 110 étoiles.
(51.126)

Les distances entre les étoiles sont énormes. La distance du Soleil à Proxima Centauri est de 4.22 années
lumière, soit quarante trillions de kilomètres. Marcher sur cette distance prendrait un milliard d'années.
Même les sondes spatiales les plus rapides mettraient soixante mille ans pour faire le voyage. Il y a
actuellement quatre sondes qui quittent le système solaire - Pioneer 10 et 11, et Voyager 1 et 2 mais nous
perdrons vraisemblablement le contact avec elles d'ici une vingtaine d'années. Le schéma ci-dessous essaye
de montrer ces distances en élargissant le champ depuis le système solaire intérieur jusqu'à Alpha du
Centaure.
(51.127)

RAYONNEMENT FOSSILE

L'existence et les propriétés du rayonnement cosmique découvert par Penzias et Wilson s'expliquent
essentiellement par les deux phénomènes physiques que nous allons maintenant décrire dans leurs grandes
lignes.

L'expansion de l'Univers a pour conséquence son refroidissement graduel. A partir des valeurs
fantastiquement élevées qui ont dû régner aussitôt après le Big Bang qui a engendré l'Univers, sa
température a progressivement décru. Lorsqu'elle atteint environ 3'000 [°K] se produit le premier des deux
phénomènes cruciaux qui nous intéressent ici : la rayonnement, qui jusque-là était en équilibre thermique
avec les particules matérielles, cesse pratiquement d'interagir avec elles et en devient indépendant. Dans le
"modèle standard" d'évolution de l'Univers, nous calculons que ce moment crucial se situe ans
après le Big Bang.

Nous pouvons comprendre qualitativement les raisons physiques de ce phénomène. Un peu avant, lorsque
par exemple la température était de 100'000 [°K], l'Univers contenait essentiellement des photons, des
électrons et des noyaux atomiques nus (principalement des protons, et, dans une moindre proportion, des
particules , noyaux d'hélium 4). La température était trop élevée pour que les électrons et les noyaux
puissent former des atomes, autrement que de manière transitoire et labile. L'interaction entre les photons et
les particules chargées (surtout les électrons, les plus légères d'entre elles) est suffisamment intense, et la
densité de ces dernières était alors suffisamment forte, pour que les photons soient sans arrêt diffusés, émis
et absorbés. Malgré son expansion, l'Univers était alors à chaque instant en équilibre; sa température T était
constamment bien définie, bien que décroissant au cours du temps, l'énergie des photons, c'est-à-dire la
pulsation du rayonnement, était donc distribuée suivant la loi de Planck correspondant à cette température T.

La diminution de la température a ensuite permis la formation d'atomes à partir des électrons et des noyaux.
Ce processus a entraîné une chute rapide de la section efficace moyenne d'interaction entre les photons et les
particules matérielles (principalement à cause de la disparition des électrons libres), de sorte que l'Univers
est devenu transparent aux photons. Une évaluation quantitative des caractéristiques du phénomène situe ce
découplage au moment où la température est descendue à 3'000 [°K].

Au moment du découplage, la densité volumique d'énergie du rayonnement est distribuée dans le spectre des
pulsations selon la loi de Planck (cf. chapitre de Thermodynamique) :

(51.128)

où nous admettrons que T est la température (3'000 [°K] environ - température d'ionisation des atomes les
plus simples) à ce moment-là. Cette distribution va ensuite évoluer sous l'influence de l'expansion de
l'Univers.

Considérons les photons situées, à cet instant t dans le volume , et dont la pulsation est à près. Leur
nombre est donc égal à :

(51.129)

Comme il n'y a plus d'absorption ni d'émission de photons à cette température (c'est une hypothèse mais
comme les mesures expérimentales semblent confirmer ce modèle à défaut de mieux...), ce nombre va rester
constant. Mais à cause de l'expansion de l'Univers, ces photons en nombre constant vont occuper un volume
plus grand, et acquérir une longueur d'onde plus grande (selon l'expansion de la structure même de l'espace
du à la valeur positive de la constante de Hubble) c'est-à-dire une pulsation plut petite (l'équivalent de l'effet
Doppler). Pour préciser, examinons la situation à un instant t' ultérieur. Toutes les longueurs de l'Univers ont
été multipliées entre, entre t et t', par le même facteur d'échelle F selon la loi de Hubble : l'arête r du volume
cubique choisi est ainsi devenue :

(51.130)

et la longueur d'onde des photons considérés :

(51.131)

de sorte que leur pulsation vaut à l'instant t' :

(51.132)
Donc, l'énergie contenue à cet instant dans le volume et dans la bande de pulsations ,
que nous écrirons est donne par :

(51.133)

La densité volumique d'énergie à l'instant t', pour la bande de pulsation , s'écrit


donc :

(51.134)

Il s'ensuite que la distribution spectrale de l'énergie est encore à l'instant t' celle du corps noir :

(51.135)

où la température correspondante T ' est telle que :

(51.136)

Ainsi, après son découplage d'avec la matière, le rayonnement cosmique évolue en conservant la distribution
d'un corps noir dont la température décroît régulièrement, dans la même proportion que s'accroissent les
distances au cours de l'expansion de l'Univers (depuis le moment du découplage, le facteur F d'échelle est
très voisin de 1'000 puisque pour passer de 3'000 [°K] aux 2.7 [°K] actuels il y a un facteur 1000...). Cette
valeur de 1000 nous permet à partir du modèle de Friedmann-Lemaître que nous avons démontré en partie
ci-dessus de facilement calculer à quel moment de l'âge de l'Univers ce découplage a eu lieu. C'est ainsi que
nous trouvons une valeur d'à peu près années.

C'est en se fondant sur ce raisonnement que divers auteurs furent amenés à prédire l'existence dans l'Univers
actuel, d'un rayonnement fossile de quelques kelvins. La découverte de Penzias et Wilson, qui confirme
parfaitement le plus solide en faveur du modèle (cosmologique) standard, qui reconstitue l'histoire de
l'Univers à partir de la "grande explosion" initiale.

L'UNIVERS TROU NOIR

Une hypothèse assez récente dans l'histoire de la cosmologie (quelques décennies) et qui est au coeur de
nombreuses recherches théoriques (Hawking, Penrose et autres) est la possibilité d'assimiler notre Univers à
un Trou Noir (cf. chapitre de Relativité Générale).

L'origine de l'idée peut se faire à partir d'un calcul très simple :

Nous savons que le rayon de l'Univers (actuel) est donné par selon nos calculs précédents par :
(51.137)

Or, nous avons démontré dans le chapitre de Relativité Générale (et de Mécanique Classique) que le rayon
de Schwarzschild est donné par :

(51.138)

Ce que nous pouvons écrire pour l'Univers sous la forme suivante :

(51.139)

ce qui avec les valeurs de la densité critique et du rayon de l'horizon cosmologique calculé plus haut donne :

(51.140)

Donc grosso-modo, connaissant toutes les incertitudes que nous avons accumulées en particulier celle sur la
constante de Hubble nous voyons que le rayon de Schwarzschild n'est pas très loin du rayon de l'Univers
actuel.

Aussi curieux que cela puisse sembler, cette question n'est pas si farfelue et est très sérieusement étudiée. Il
est donc théoriquement possible que tout notre univers soit encapsulé dans un gigantesque Trou Noir (donc
de très grande masse et très faible densité comme nous le voyons avec nos valeurs numériques) d'un autre
univers inaccessible...

Ce qui est sûr est que si tel était le cas, l'expansion de l'Univers (observée actuellement), ne pourrait pas se
poursuivre au-delà de l'horizon de ce super trou noir, car rien venant de l'intérieur ne peut franchir cet
horizon. Or, des observations récentes semblent montrer que l'expansion de l'univers est loin de ralentir et
tend plutôt à s'accélérer avec le temps, ce qui est en contradiction avec un tel Trou Noir Univers...
52. THÉORIE DES CORDES

I l faut bien considérer dans le présent chapitre que la théorie des cordes (et in extenso des supercordes) est
actuellement spéculative et n'a pas pu être vérifiée (confirmée) ni falsifiée par l'expérience comme le veut la
démarche scientifique. Il convient donc de prendre avec prudence les développements qui vont suivre et
d'être le plus critique possible !

Il s'agit par ailleurs d'une théorie (nous ne pouvons pas parler de modèle actuellement) d'unification des
forces qui n'est pas nouvelle puisqu'elle a bientôt plus de trente ans et qui tente de combler les défauts du
modèle standard des particules et aussi de réunir la relativité générale et physique quantique (ce qui n'est pas
sans mal puisque cette dernière est dépendante du fond contrairement à la relativité générale). Elle est une
des nombreuses théories qui existe en physique moderne et qui tente cette unification (il en existe une
dizaine d'autres plus ou moins connues).

Remarque: Si ce sujet est traité dans la section de cosmologie et non d'atomistique c'est uniquement pour
une raison pédagogique. Effectivement, le formalisme de base de la théorie des cordes est beaucoup plus
proche de la mécanique relativiste (relativité restreinte et générale) que de celle de la physique quantique
ondulatoire ou de la physique quantique des champs. Il nous a semblé donc plus adapté, à ce jour (!), de
proposer une continuité dans le formalisme mathématique et son interprétation plutôt qu'une continuité
thématique avec une approche relativement différente au formalisme habituel de la physique quantique.

L'avantage indéniable de la théorie des cordes, outre le fait que mathématiquement elle soit assez indigeste
mais n'est pas vraiment pire que la relativité générale, est qu'elle permet d'éviter dans un certain ordre... de
nombreuses singularités dans les calculs des autres théories modernes qui considèrent les objets comme des
points (donc de volume et longueur nuls...).

Cette théorie tout en étant esthétique et remarquable dans le sens qu'elle utilise pour ses fondements des
bases de calculs qui ont plus de 200 ans mais a pour défaut selon nous de s'imposer par analogies
successives, comme nous le verrons, avec les théories relativistes et quantiques actuelles. Même si cela n'est
par dramatique en soit, la théorie peut sembler perdre un peu son autonomie propre même si au fait il n'en
est rien. Il ne faut alors donc pas être surpris en mal lors du parcours des développements qui vont suivre...

La principale particularité de la théorie des cordes est que son ambition ne s'arrête pas à cette réconciliation,
mais qu'elle prétend réussir à unifier les quatre interactions élémentaires connues, on parle de théorie du
tout, tout en reposant sur deux hypothèses :

H1. Les briques fondamentales de l'Univers ne seraient pas des particules ponctuelles mais des sortes de
cordelettes vibrantes possédant une tension à la manière d'un élastique. Ce que nous percevons comme des
particules de caractéristiques (masse, etc.) distinctes ne seraient que des cordes vibrant différemment. Avec
cette hypothèse, les théories des cordes admettent une échelle minimale et permettent d'éviter facilement
l'apparition de certaines quantités infinies qui sont inévitables dans les théories quantiques de champs
habituelles.

H2. L'Univers contiendrait plus de trois dimensions spatiales. Certaines d'entre elles, repliées sur elles-
mêmes, passant inaperçues à nos échelles (par une procédure appelée "réduction dimensionnelle").

Malgré de premiers résultats partiels très prometteurs ainsi qu'une richesse mathématique remarquable la
théorie des cordes reste toutefois incomplète. D'une part, une multitude de solutions aux équations de la
théorie des cordes existe, ce qui pose un problème de sélection de notre Univers et, d'autre part, même si
beaucoup de modèles voisins ont pu être obtenus, aucun d'entre eux ne permet de rendre compte précisément
du modèle standard de la physique des particules...
Ceci ayant été dit... commençons notre initiation :

ÉQUATION D'ONDE NON RELATIVISTE D'UNE CORDE TRANSVERALE

L'objectif ici va être dans un premier temps de déterminer l'équation d'onde non relativiste d'une corde
excitée transversalement à l'aide des calculs que nous avions effectué en mécanique ondulatoire. Une fois ce
travail effectué, nous passerons à l'étude des cordes relativistes et nous verrons que leur équation d'onde, au
même titre que la version non relativiste, peuvent s'assimiler à l'équation de conservation du courant que
nous avions démontré en électrodynamique.

Nous commençons en rappelant la forme de l'action que nous avions obtenue dans le chapitre de Mécanique
Ondulatoire pour une corde non-relativiste :

(52.1)

avec donc :

(52.2)

Maintenant, de manière identique à ce que nous avons fait dans le chapitre de Mécanique Analytique (ainsi
que dans celui de Physique Quantique Des Champs), nous allons définir une notation par une analogie aux
moments canoniques de la corde :

(52.3)

avec . Il s'agit simplement des dérivées de la densité lagrangienne en fonction respectivement du


premier et second argument. De manière plus explicite, nous avons alors directement en faisant le calcul (cf.
chapitre de Mécanique Ondulatoire):

(52.4)

Ainsi, si nous récrivons le variationnel d'action obtenu dans le chapitre de Mécanique Ondulatoire avec cette
notation canonique, nous obtenons :

(52.5)

Faisant usage des mêmes méthodes que dans le chapitre de Mécanique Ondulatoire, notre variationnel
s'exprime après simplification à nouveau sous la forme de trois termes :

(52.6)
Les conditions pour trouver l'extremum (selon le principe de moindre action) restent les mêmes que celles
vues dans le chapitre de Mécanique Ondulatoire. Ainsi, pour le troisième terme, nous avons bien l'équation
d'onde d'une corde excitée de manière transversale donnée avec la forme canonique par :

(52.7)

Remarque: Il convient bien évidemment de remarquer que cette forme d'écriture va considérablement nous
faciliter la tâche (et faire des économies de craies...).

Il faut bien observer (car c'est remarquable!) aussi que comme dans le chapitre Mécanique Analytique, le
moment canonique tel que défini plus haut, coïncide parfaitement (le hasard fait bien les choses...) avec
la densité de quantité de moment que nous avions obtenue dans le chapitre de Mécanique Ondulatoire.
Effectivement:

(52.8)

Ainsi, par analogie avec la mécanique analytique (où rappelons-le, la dérivée du lagrangien par rapport à la
vitesse donne la quantité de mouvement), joue bien le rôle de la vitesse et ainsi la dérivée de la densité
lagrangienne par celui-ci donne la densité de quantité de mouvement !!!

Rappelons aussi un autre point qui a été vu dans le chapitre de Mécanique Ondulatoire, l'extremum de
l'action ( ) nous impose les conditions de Neumann, ce qui nous amène à écrire .

De plus, il convient aussi de rappeler pour ce qui va suivre, que pour les conditions de Dirichlet nous avions
aussi .

Remarque: Dans le cadre de la théorie des cordes relativistes à plus de 3 dimensions, il est possible de
généraliser le concept de conditions aux limites en considérant les contraintes dans l'espace comme des
hypersurfaces nommée Dp-branes à p dimensions. Les conditions aux limites de Dirichlet usuelles
correspondent alors à la situation où les bouts d'une corde sont contraintes par une 0-brane. La condition de
Neumann pour une corde libre dans p dimensions correspond à une corde contrainte sur une Dp-brane.

(52.9)

ÉQUATION D'ONDE RELATIVISTE D'UNE CORDE TRANSVERSALE


Nous allons maintenant déterminer l'action d'une corde relativiste. Nous pouvons, pour poser les bases de
notre étude, nous rappeler qu'une particule ponctuelle trace une ligne dans l'espace-temps (chaque point de
la ligne étant repéré par une coordonnée temporelle et trois spatiales). Dès lors, par extension, une corde qui
est un élément bidimensionnel (si nous la considérons sans épaisseur) trace une surface dans l'espace-temps.

Ainsi, au même titre que la ligne que trace une particule dans l'espace-temps est appelée une "ligne
d'Univers" (cf. chapitre de Relativité Restreinte), la surface tracée par une corde sera appelée par analogie
une "surface d'Univers".

Une corde fermée dans l'espace-temps de Minkowski trace, par exemple, un tube, alors qu'une corde ouverte
tracera une bande :

(52.10)

Sur la figure ci-dessus, à deux dimensions spatiales et une temporelle, la corde est immobile dans notre
espace courant. Elle se meut que dans l'espace-temps (car le temps s'écoule sur l'axe vertical) mais pas dans
l'espace dans l'exemple-ci-dessus (il faudrait une composante spatiale supplémentaire pour voir un tel
mouvement).

Remarques:

R1. Attention! rappellez-vous bien que le schéma ci-dessous est dans trois dimensions alors que l'espace-
temps a lui quatre dimensions.

R2. Rappelez-vous également que le vecteur temps de la base orthogonale est toujours perpendiculaire à
toutes les autres composantes spatiales (cette remarque sera utile lors de notre démonstration de l'action de
Nambu-Goto).

Lors de notre démonstration de l'équation du mouvement dans le chapitre de Relativité Générale, nous avons
reparamétré la ligne d'Univers de la particule à l'aide d'un paramètre qui était le temps propre de la particule
t. Effectivement il suffit de se rappeler des équations paramétriques qui représentent des courbes. Par
exemple avec Maple:

> with(plots):
> spacecurve([cos(t),sin(t),t],t=0..4*Pi,axes=boxed);
(52.11)

et la même procédure est valable pour une ligne en quatre dimensions (espace+temps).

Nous étions ainsi arrivés à construire l'expression de l'action S de celle-ci avant d'y appliquer le principe
variationnel.

Nous allons faire de même pour une corde relativiste à la différence que nous allons reparamétrer les
surfaces engendrées par les cordes cette fois-ci. Les contraintes que nous nous imposerons sont que les
paramètres choisis devront aussi (en faisant référence au cas de la particule) être des invariants relativistes.

Comme nous l'avons donc vu en relativité générale, une ligne d'Univers peut être reparamétrée
naturellement en utilisant seulement un paramètre (abscisse curviligne). Une surface dans l'espace est
cependant un objet bidimensionnel, ainsi nous supposerons qu'il requiert par extension deux paramètres
(un de plus) pour être décrit complètement.

Effectivement, nous devinons, qu'un des deux paramètres sera le temps propre (pour faire évoluer la surface
dans le temps), le second paramètre permettra de donner une "épaisseur" à ce qui ne serait qu'une ligne
d'Univers s'il n'existait pas. Il suffirait dans un espace à trois dimensions que ce deuxième paramètre ait les
dimensions d'une longueur pour générer une surface mais dans l'espace-temps à quatre dimensions il faut
que second paramètre ait les unités d'une surface.

Etant donné une surface paramétrée, nous pouvons dessiner sur celle-ci les isolignes des paramètres
(les lignes ou les deux paramètres sont constants sur toute la surface). Ces isolignes couvrent la
surface comme une grille (voir figure un peu plus bas).

L'équation paramétrique d'un volume requiert dans l'espace trois paramètres comme nous l'avons vu dans le
chapitre de Géométrie Analytique. Ainsi, si une surface paramétrée peut dans l'espace euclidien être
représentée par un vecteur du type :
(52.12)

lors d'une reparamétrisation et en faisant usage de la notation tensorielle de l'espace-temps de Minkowski tel
que vu dans le chapitre de Relativité Générale, nous aurons (en nous restreignent pour l'instant aux cas
particulier de deux dimensions spatiales et une temporelle) :

(52.13)

Ainsi, la surface est l'image des paramètres . Alternativement, nous pouvons voir les composantes
comme les coordonnées de temps et d'espace de la surface, au moins localement!

Nous voulons maintenant calculer la surface d'un élément de n'importe quel-type d'espace au même type que
nous l'avions fait pour l'abscisse curviligne de n'importe quelle ligne d'Univers dans le chapitre de Relativité
Générale. Se pose alors la question de la forme de l'élément différentiel de surface ??? Faut-il prendre la
multiplication du différentiel des deux paramètres choisis précédemment pour un carré, un rectangle, un
cercle ou autre ?

Au fait, nous allons reporter notre choix sur un parallélogramme ! Ce choix peut sembler complètement
arbitraire pour l'instant mais comme nous allons le voir quelques lignes plus loin, ce choix coïncide pour des
raisons mathématiques à ce que nous appelons la "métrique induite" de la surface elle-même (résultat assez
remarquable!).

Ainsi, notons et les côtés du parallélogramme. Ils sont l'image par des couples et

respectivement :

(52.14)

Ainsi, nous pouvons écrire :

(52.15)
et donc :

(52.16)

Maintenant calculons la surface dA (nous ne prendrons pas la lettre S pour éviter la confusion avec l'action
dans ce chapitre) du parallélogramme (cf. chapitre de Calcul Vectoriel) :

(52.17)

en utilisant le produit scalaire, cela peut se récrire :

(52.18)

en utilisant, les relations établies précédemment cela peut s'écrire :

(52.19)

cette dernière relation est forme générale d'un élément de surface d'une nappe paramétrée. La surface totale
étant évidemment donnée par :

(52.20)

Au même titre que dans le cadre du principe de moindre action nous avons cherché l'optimum du chemin
optimum pour une particule parcourant une ligne d'Univers, pour une corde, nous aurons à optimiser la

surface A en minimisant la fonction .

Cette dernière forme est cependant un peu lourde et ne faire ressortir de particulier ou de choses similaires à
quelque forme déjà connue dans un autre domaine de la physique. Nous allons voir qu'en creusant un peu il
est possible d'obtenir quelque chose de pas mal du tout.

Considérons maintenant un vecteur et sa longueur (norme) au carré donnée par son produit scalaire :

(52.21)

Attention à l'avenir de ne pas "voir" le s comme étant au carré dans le ds (comme c'est le cas en relativité
restreinte et générale) mais rappelez-vous bien qu'il s'agit du ds en entier qui est mis au carré (la notation
peut amener à confusion...).

Le vecteur peut être exprimé sous forme de termes de dérivées partielles de , tel que nous
obtenions sa différentielle totale exacte (cf. chapitre de Calcul Différentiel Et Intégral) :

(52.22)
Ainsi, la longueur au carré de peut s'exprimer sous la forme tensorielle :

(52.23)

ce que nous noterons par convention à l'avenir :

(52.24)

La quantité est appelée la "métrique induite de la surface paramétrée" (car contient un produit scalaire
ce qui en toute généralité fait appel à une métrique... d'où le terme "induite") et il s'agit donc d'une matrice
de dimensions . Il est évident que le choix de cette dénomination provient de la ressemblance avec la
métrique habituelle telle que nous l'avons définie lors de notre étude du calcul tensoriel et de son utilisation
en relativité restreinte et générale.

La matrice à donc par construction et définition la forme :

(52.25)

Revenons maintenant à notre expression de la surface engendrée par la corde :

(52.26)

et calculons rapidement le déterminant (cf. chapitre d'Algèbre Linéaire) de la matrice :

(52.27)

et donc quoi ? Eh ben voilà :

(52.28)

Ainsi, le choix du parallélogramme comme surface élémentaire s'explique mieux ici!

Maintenant, nous allons adopter les écritures traditionnelles de la théorie des cordes relativement à
l'expression de la surface. Ainsi, au même titre que les coordonnées d'espace-temps sont décrites en
relativité restreinte par le quadrivecteur temps-espace:

(52.29)

nous décrirons les surfaces d'Univers par (nous passons maintenant à l'écriture faisant usage des 4
dimensions de l'espace-temps):
(52.30)

Cette notation nous évitera à l'avenir d'avoir à confondre, si la théorie nous y amène, les coordonnes
d'espace-temps traditionnelles avec la fonction image de la surface d'Univers et ce d'autant plus
que les physiciens étant un peu flemmard abrègent parfois cette dernière ... d'où le choix de la majuscule.

Il est donc beaucoup plus convenable et sage de changer de notation...

A partir de maintenant, nous appellerons "coordonnées de corde" la surface d'Univers décrite par .

Ce petit changement de notation ne change évidemment pas l'interprétation de la fonction image. Etant
donnée un couple associant élément de temps propre dans l'ensemble et élément de surface des pré-
images, ce point est projeté sur un élément de surface de l'espace-temps de la corde de coordonnées:

(52.31)

ACTION DE NAMBU-GOTO

Dans le cas d'une surface d'univers les paramètres sont donc par convention et , où comme en relativité
restreinte et général le temps propre peut être compris dans l'intervalle:

(52.32)

et le deuxième paramètre par contre ne peut être que positif puisqu'il s'agit d'une surface:

(52.33)

et les coordonnées de cette surface qui correspondent à l'espace des paramètres sont donc:

(52.34)

Où encore une fois pour rappel, le paramètre est considéré comme la variable décrivant l'écoulement du
temps (il en faut bien une!), et la variable décrivant l'extension dans l'espace d'une corde (i.e. la condition
correspond à la longueur finie de cette corde).

Les paramètres décrivent ainsi une surface de l'espace des pré-images :

(52.35)
Les extrémités de la corde ont une valeur constante. Cependant, comme le temps s'écoule et que les
extrémités de la corde sur la surface d'Univers se meuvent il faut noter une condition essentielle de la surface
d'Univers concernant les deux bouts d'une corde ouverte :

(52.36)

Remarque: Cette condition se fait sur la composante car elle correspond à la composante du
quadrivecteur d'espace-temps qui n'est d'autre, en unités naturelles, que t (le temps propre). Dès lors, le
temps s'écoule et n'est jamais constant d'où le fait d'imposer cette dérivée comme différente de zéro.

Et en utilisant les conventions habituelles en physique pour la notation des dérivées par rapport au temps ou
composante spatiale, nous convenons d'adopter aussi maintenant les écritures suivantes :

(52.37)

où puisque:

(52.38)

alors:

(52.39)

La surface s'écrit donc:

(52.40)

Cependant, il y a un problème ici ! Effectivement, regardons si le radicante (terme sous la racine) a une
réalité physique tangible...

Pour cela, il faut d'abord considérer la partie gauche de la figure ci-dessous qui représente la surface (nappe)
décrite par une corde ouverte :
(52.41)

En chaque point P de cette nappe (supposée dérivable en tout point) il existe une infinité de tangentes, toutes
dans le même plan, que nous noterons pour l'exemple et qui forment donc une surface tangente au point P.

Maintenant, comme l'espace dans lequel la nappe de la corde est plongée dans une base orthonormale
spatiale et temporelle, les vecteurs tangents peuvent alors aussi à leur tour être décomposés dans une base
orthogonale spatiale et temporelle locale bidimensionnelle au point P tel que les vecteurs de cette base soient
deux vecteurs:

(52.42)

tous les autres vecteurs tangents s'exprimant comme combinaison linéaire de ceux-ci.

Cependant un problème subsiste dans notre décomposition (...) : les unités des vecteurs de la base
orthogonale locale au point P ont des unités qui diffèrent. Pour cela, rajoutons un facteur de
dimensionnement à la composante spatiale (cela est arbitraire car la conclusion sera identique quelque soit la
composante sur laquelle vous mettez le facteur de dimensionnement) :

(52.43)

ce facteur de dimensionnement peut aussi être utilisé pour obtenir tous les vecteurs tangents tel que :

(52.44)

Effectivement, si , alors pour nous obtenons le vecteur et pour le


vecteur . Et pour toutes les valeurs intermédiaires, nous obtenons tous les vecteurs tangents comme
indiqué sur la partie gauche de la figure précédente.

Maintenons, rappelons que nous avons vu dans le chapitre de Relativité Restreinte qu'il existait selon
l'abscisse curviligne:

(52.45)

des lignes d'Univers de type lumière ( ), espace ( ) ou temps ( ) si nous considérions


les quadrivecteurs .
Il doit en être de même par analogie pour les vecteurs tangents à la surface et donc données par:

(52.46)

Ainsi :

(52.47)

ce qui correspond à une équation du deuxième degré en , doit pour avoir des valeurs négatives (surface
d'Univers de type temps) ou positives (surface d'Univers de type espace) avoir au moins deux racines (voir
partie droite de la figure précédente). Cela nous ramène à la condition que le discriminant soit strictement
positif (cf. chapitre de Calcul Algèbrique) :

(52.48)

Soit :

(52.49)

sous forme condensée cela nous ramène à écrire :

(52.50)

La surface doit donc alors s'écrire en fin de compte :

(52.51)

si nous voulons que le radicante ait un sens physique.

Rappelons maintenant que l'action S d'une particule ponctuelle est proportionnelle à sa ligne d'Univers.
Ainsi par analogie, l'action S d'une corde sera proportionnelle à la surface d'Univers :

(52.52)

ce qui donne :

(52.53)

Ce qui nous amène très fréquemment dans la littérature à trouver l'action d'une corde sous la forme suivante
:
(52.54)

Relation à comparer avec le lagrangien d'une particule libre (cf. chapitre de Mécanique Analytique) et la
densité lagrangienne d'un champ (cf. chapitre de Physique Quantique Des Champs) :

et (52.55)

La fonctionnelle S a pour unités celles d'une surface. Cela parce que les ont une unité de longueur et
dans la racine chacun est à la puissance quatrième et que les unités s'annulent entre l'intérieure de la
racine et les différentielles en dehors.

Maintenant, par définition même de l'action, les unités que nous devons obtenir doivent correspondre à celle
d'une énergie multiplié par le temps, des joules J ou en utilisant le système international, des .
Pour l'instant, nous avons :

(52.56)

Pour obtenir pour l'action les unités que nous voulons, il nous faut alors multiplier l'expression de la surface
A par une quantité ayant pour unités des . Pour choisir ces quantités, nous allons nous inspirer de
notre étude la mécanique ondulatoire. Quand nous avions travaillé avec des cordes (non relativistes) nous
avions vu que les propriétés à prendre en comptent étaient la tension et la vitesse de l'onde de propagation de
la corde. Nous allons donc faire l'essai de prendre le rapport tension/vitesse suivant :

(52.57)

où apparaît donc la "tension de la corde au repos" et la vitesse de la lumière.

Remarque: Cela est similaire à la physique du point où dans l'action nous retrouvons la masse au repos
(équivalent de la tension au repos de la corde) et la vitesse de la lumière (cf. chapitre de Relativité
Restreinte).

Ainsi, "l'action de Nambu-Goto" s'écrit maintenant :

(52.58)

Remarque: Nous démontrerons pourquoi nous avons posé un facteur "-" plus loin. Cependant, une petite
analogie avec l'action d'une particule ponctuelle, pour lequel nous avons aussi un signe "-" (cf. chapitre de
Relativité Restreinte), peut facilement déjà se faire.

Maintenant, au même titre que nous avions défini plus haut la métrique induite d'une surface purement
spatiale,

Dès lors :

(52.59)
ce que nous pouvons aussi écrire sous forme matricielle :

(52.60)

en utilisant le déterminant de cette matrice :

(52.61)

nous pouvons alors récrire l'action d'une corde relativiste sous la forme finale condensée suivante :

(52.62)

qui n'est d'autre que "l'action de Nambu-Goto condensée" d'une corde relativiste.

Nous allons maintenant obtenir l'équation du mouvement en faisant varier l'action. Nous allons pour cela
nous inspirer exactement des méthodes vues lors de la détermination au début de chapitre de l'équation
d'onde non-relativiste d'une corde.

Ainsi, nous récrivons l'action de Nambu-Goto en définissant une densité lagrangienne tel que :

(52.63)

où est donc définie par :

(52.64)

Nous allons maintenant appliquer le principe variationnel sur l'action afin d'en tirer l'équation de mouvement
d'une corde. Le développement et l'approximation sont parfaitement similaires à celles vue en mécanique
ondulatoire pour la corde non relativiste. Rappelons que nous avions obtenu comme densité lagrangienne et
comme expression de l'action :

et (52.65)

et que l'application du principe variationnel nous avait donné :

(52.66)

Or, ce que nous n'avions pas vu en mécanique ondulatoire, c'est que cette dernière relation pouvait
facilement s'écrire aussi à partir de la densité lagrangienne :
(52.67)

Dès lors, pour la corde relativiste, nous avons une forme identique en appliquant des développements en tout
points similaires (et ce même si la densité lagrangienne à une forme différente) :

(52.68)

et comme nous l'avons faite au début de ce chapitre pour les cordes non relativistes, nous allons introduire
les moments canoniques (densités d'impulsion/quantité de mouvement si vous préférez) de la corde en
optant pour la notation :

(52.69)

où dans les détails, nous obtenons très facilement (c'est une simple dérivée mais si vous le souhaitez en nous
contactant, nous pouvons vous le détailler) les moments longitudinaux et transverses :

(52.70)

en faisant usage de cette notation, nous pouvons alors écrire :


(52.71)

Faisant usage des mêmes méthodes que celles vue dans le chapitre de Mécanique Ondulatoire, notre
variationnel s'exprime après simplification à nouveau sous la forme de trois termes :

(52.72)

Les conditions pour trouver l'extremum (selon le principe de moindre action) restent les mêmes qu'en
mécanique ondulatoire. Ainsi, pour le troisième terme, nous avons bien l'équation d'onde d'une corde excitée
de manière transversale donnée avec la forme canonique donnée par :

(52.73)

Il s'agit de l'équation du mouvement (ou onde) d'une corde ouverte ou même fermé (car finalement dans les
développements précédents à aucun moments nous n'avions contraints les termes à êtres ouverts ou fermés).

Cette équation est horriblement difficile à résoudre mais le choix d'une paramétrisation adéquate peut
néanmoins simplifier la tâche

LAGRANGIEN D'UNE CORDE

Rappelons que nous avons:

(52.74)

et qu'avec ce choix, nous avons donc:


(52.75)

Maintenant, utilisons ce que nous avons vu dans le chapitre de Géométrie Différentielle avec le trièdre de
Frenet:

(52.76)

où est donc la tangente à la surface d'Univers à un instant t au voisinage d'un point donné. Nous avions
par ailleurs montré dans ce même chapitre que par définition:

(52.77)

Or, nous pouvons écrire:

(52.78)

où il ne faut pas oublier que est prix à un temps t fixé. Comme les lignes de la surface d'Univers de
constante t décrivent la corde, alors est tangent à la corde.

Et comme:
(52.79)

Alors est colinéaire à et donc aussi tangent à la corde (information que nous n'avions pas
quelques lignes plus haut!). Ces petites constations étant faites, revenons à:

(52.80)

cela devient déjà un peu plus intéressant!

Considérons maintenant le schéma suivant:

(52.81)

où est un vecteur quelconque et un vecteur unitaire (sans dimensions) et , la projection orthogonale


de sur . Nous avons alors (cf. chapitre de Calcul Vectoriel):

(52.82)

Or, si nous recherchons le vecteur il faudra multiplier le tout par :

(52.83)

enfin, si nous recherchons l'expression du vecteur il vient immédiatement:

(52.84)

Dès lors, par analogie, nous pouvons écrire:


(52.85)

où est donc perpendiculaire à et a comme unités celle d'une vitesse. Par construction, est donc
la vitesse transversale à la corde à un instant t donné puisque est tangent à celle-ci. Nous noterons
alors:

(52.86)

Mettons maintenant, pour des besoins ultérieurs, la norme au carré de cette dernière relation (attention on
fait le traitement des composantes des vecteurs directement en généralisant à la notation vectorielle!):

(52.87)

et si nous revenons maintenant à:

(52.88)

La lagrangien associé est alors directement (ne pas confondre avec la densité lagrangienne!):

(52.89)

puisque:

(52.90)

Le lagrangien de la relation antéprécédente est considéré par les spécialistes de la théorie de cordes comme
la généralisation naturelle du lagrangien de la particule libre obtenu dans le chapitre de Relativité Restreinte:

(52.91)

Anda mungkin juga menyukai