1. INTRODUCTION
Le terme "Mathématiques expérimentales" est pris ici dans un sens beaucoup plus
restreint, certainement proche de l'idée que pouvait s'en faire C.F.Gauss à son époque :
approcher la vérité mathématique par l'expérimentation systématique. Observer, en déduire
des conjectures qui seront prouvées plus tard.
Pourtant, que fait l'étudiant confronté à un problème mathématique ? Dans une phase
préliminaire, il va explorer différentes pistes, tenter plusieurs approches qu'il subodore être de
bonnes orientations pour arriver à la solution, grâce à ses connaissances et son intuition. N'est-
ce pas déjà, en partie, une façon expérimentale d'aborder un problème ? Certes, ce n'est pas
encore la démonstration en bonne et due forme, qui se concrétisera ensuite dans une phase
théoriquement structurée, la seule qui sera portée sur sa copie et évaluée par l'examinateur.
L'exemple précédent se situait dans un cadre scolaire où l'on sait, a priori, que le
problème posé a très probablement une solution accessible au niveau de connaissances de
celui à qui il s'adresse. Il est plus intéressant de réfléchir à la démarche du chercheur
Un exemple historique bien connu est celui de la série suivante (valeur particulière de
la fonction zêta, selon l'écriture actuelle) :
1 1 1 1
ζ (2) = 1 + + + + ... + + ...
22 32 42 n2
2
Par un calcul approximatif, Euler remarqua une bonne proximité avec π / 6 , ce qui le
conforta dans la recherche et finalement la découverte de la démonstration de l'égalité
ζ (2) = π 2 / 6
Dans le même ordre d'idées, évoquons C.F.Gauss qui observa que le nombre de
nombres premiers inférieurs à n est approximativement n/ln(n), ce qui ne sera confirmé que
beaucoup plus tard.
Une autre conjecture, fortement étayée par calcul numérique, mais non prouvée de nos
jours, est celle des zéros non triviaux de la fonction zêta de Riemann, dont la partie réelle
serait égale à ½.
Nous verrons également que les techniques empiriques dans la recherche évoluent "de
l'artisanal à l'industriel", métaphore pourtant peu appropriée aux mathématiques ! En effet,
l'accroissement spectaculaire des performances des calculateurs électroniques permet de
balayer d'une façon systématique un domaine de plus en plus étendu. Certes, ces procédés
apparaissent d'une piètre intelligence comparées aux méthodes des mathématiciens dont les
connaissances et l'intuition sont les atouts maîtres pour circonscrire les recherches.
On se souvient de l'image du singe tapant sur un clavier et qui, par hasard, écrit une
phrase intelligible et même célèbre. On sait que la probabilité pour que cela se produise est
absolument infime. Si l'on transpose cette image au domaine des mathématiques, quelle
probabilité y aurait-il de dactylographier une formule exacte ? Et au lieu du singe, s'il
s'agissait d'un ordinateur doté d'une grande puissance de calcul, d'une vitesse vertigineuse ? Je
ne crois pas que l'on puisse répondre à cette question dans l'état des connaissances actuelles.
Bien entendu, on peut faire des études statistiques sur les milliards de nombres qui sont traités
Expérimental n'implique pas rébarbatif ! Plus agréablement que par un discours ex-
cathedra et exhaustif, une petite anecdote permet de mieux appréhender certaines possibilités
offertes par les mathématiques expérimentales et surtout leurs aléas. Au départ, il s'agissait
d'un problème posé parmi d'autres sur un site de mathématiques [1] dans une catégorie
intitulée "Défis", autrement dit des questions sortant un peu de la routine. En encadré 1, voici
l'essentiel de l'énoncé (modifié et adapté aux besoins du présent papier, c.f. la note en fin
d'Annexe 1 ) :
Pour la petite histoire, la question d'abord restée sans réponse a été reposée, dans un
contexte différent, sur un autre site [2] où le pot aux roses n'a pas été long à être découvert.
Devant des formules aussi bizarres (outre l'impression de se trouver devant un piège…), la
première idée est de calculer les valeurs de ces constantes N1 à N3 . Pour vous éviter de sortir
la calculette et d'effectuer des opérations fastidieuses, voici ce que vous trouveriez
successivement :
N1 = 1,618 033 988… ; N2 = 1,618 033 988… ; N3 = 1,618 033 988… ;
Ceci est-il propre à vous mettre sur la voie ? Pour ménager le suspense (qui pourtant n'est pas
grand), la réponse est donnée à la fin de ce papier (Annexe 1). Toutefois, pour celui qui
voudrait trouver par lui-même, qu'il attende un peu avant de lire le paragraphe suivant : La
clef deviendrait par trop évidente, avant même d'en arriver à la conclusion.
Définition : " Rapport de deux dimensions qui sont entre elles dans la même proportion que la
plus grande avec leur somme ". Cela vous rappelle-t-il quelque chose ? Oui, c'est le fameux
nombre d'or, nom donné par les artistes de la Renaissance à cette constante bien connue des
architectes. Vous le calculerez aisément à partir de la définition précédente :
1
Le Nombre d'Or : N 0 =
2
(
1 + 5 = 1,618033988... )
Bien évidemment, les constructeurs de la pyramide de Chéops, ceux du Parthénon, les
sculpteurs et les peintres n'utilisent pas toutes les décimales ! Pour le Mathématicien, c'est tout
le contraire. Il lui faudrait l'infinité des décimales pour atteindre à l'exactitude. C'est pourquoi
il préfère les formules littérales, comme par exemple, pour ces autres constantes :
∞
(−1) j
π =4 ∑j =0
(2 j + 1)
= 3,141592653589793...
∞
e = ∑j =0
1
j!
= 2,718281828459045…
∞
(−1) j
Constante de Catalan : G =
∑
j =0
(2 j + 1) 2
= 0,915965594177219…
n
Constante d'Euler-Mascheroni : γ =
∑ 1
j
− ln(n)
= 0,5772156649015328...
j =1 n →∞
N1 = cos ( )
2 e−2 − cos ( 3
2 eπ )
γ3
N 2 = ch(γ ) + cos(γ ) −
sin(5)
3π
2
(
N3 = ch G sh(1) + cos )
cos(3)
QUESTIONS :
1- Y a-t-il une relation entre le nombre d'or (N0) et ces expressions N1 à N3 ? Et
lorsque vous vous exclamerez "eurêka!, c'était plus facile à trouver qu'il n'y paraissait !", alors
c'est là que vous êtes attendu : ce que vous avez trouvé, il vous faudra le prouver…
2- Par quelle(s) méthode(s) simple(s) peut-on trouver des expressions telles que N1 à
N3 et d'autres encore?
Par exemple, vous êtes confronté à une intégrale définie récalcitrante. Le calcul formel
n'en vient pas à bout. Pourtant, ne serait-elle pas égale à une constante rare mais connue, ou
bien à une combinaison de constantes répertoriées ? S'il en était ainsi, ce serait une précieuse
indication pouvant orienter la recherche d'une méthode de résolution : il est plus facile de
trouver lorsqu'on sait à l'avance ce que l'on doit trouver.
Bien entendu, au lieu d'une intégrale, on aurait pu prendre l'exemple d'une série, ou
d'une fraction continue, ou plus généralement d'une formule que l'on ne parvient pas à
simplifier.
Le très intéressant article [4] de Jean-Paul Delahaye offre une revue de méthodes
d'identification mises en œuvre et insiste particulièrement sur ce fameux "inverseur". Citation
extraite de [4] :
L'inverseur …« est à la fois un immense dictionnaire de constantes mathématiques et une
machine à rechercher des expressions simples pour les constantes numériques qu'on lui
soumet. Alors que d'habitude on donne une expression à une machine pour qu'elle la calcule,
l'inverseur, lui, retrouve l'expression à partir du résultat, d'où son nom ».
Néanmoins, il y a un revers à la médaille. La valeur numérique NO que nous
spécifions n'est pas une valeur exacte : Elle est écrite avec un nombre limité de digits. Si on la
compare à une quantité immense de nombres (constantes remarquables et beaucoup de leurs
combinaisons) on rencontrera deux difficultés pour interpréter les résultats. D'une part, il y
aura d'autant plus de coïncidences, donc de réponses proposées, que les digits connus de NO
sont peu nombreux, et on aura l'embarras du choix entre des conjectures que l'on pourrait
croire bien étayées numériquement, qu'il faudrait ensuite confirmer par du calcul formel.
D'autre part, il y aura d'autant plus de risque que les réponses proposées soient sans intérêt,
c'est-à-dire qu'un calcul un peu plus précis montre que les supposées relations sont fausses.
Ce qui vient d'être souligné n'est pas propre à l'inverseur : Tous les procédés similaires
en sont plus ou moins affectés. C'est justement le défaut, inhérent aux algorithmes de ce
genre, dont il a été tiré parti pour que le "défi" proposé au paragraphe 2 soit un piège grossier.
Dans ce "défi", les formules sélectionnées ont été obtenues avec un algorithme home made.
Son principe est sommairement exposé en Annexe 1. Le cœur en est une formule générique,
c'est-à-dire dont les paramètres, les fonctions, les opérateurs sont interchangeables. Un
algorithme, de principe simple, permet de puiser systématiquement dans des tables
préalablement établies, respectivement les constantes, les fonctions, les opérateurs et de
balayer les combinaisons possibles.
Avantageusement, l'algorithme comporte des procédures pour éliminer les
redondances, autant que faire se peut. Deux termes écrits différemment peuvent être égaux,
par exemple, d'une part exp(1) et d'autre part la constante e. Les conserver tous deux serait
multiplier le nombre de combinaisons à évaluer ultérieurement et finalement aboutir à une
pléthore de formules équivalentes ne différant que par la typographie. En soit, ce n'est pas
rédhibitoire : L'objectif est bien atteint, sauf que l'on préfèrerait n'avoir qu'une seule formule
représentative d'un ensemble des formules équivalentes. En contrepartie, l'adjonction de
routines pour éliminer certaines redondances occasionne des opérations annexes qui pèsent
sur le temps de calcul. Il ne faut pas que le remède soit pire que la mal : vouloir éliminer
toutes les redondances deviendrait pénalisant, surtout lorsqu'on est limité par les modestes
performances d'un ordinateur individuel. Dans l'exemple décrit en Annexe 1, on s'est contenté
d'une option intermédiaire, choisie empiriquement : Seules les redondances les plus simples à
identifier sont systématiquement éliminées. Il en reste donc, qui apparaissent dans l'édition
des résultats finaux. Toutefois, puisqu'on ne sélectionne qu'un nombre nécessairement limité
de formules, celles donnant les résultats les plus satisfaisants par rapport à l'objectif,
l'élimination des redondances résiduelles est moins pénalisante à ce niveau qu'elle le serait
tout au long des calculs.
On conçoit aisément qu'un logiciel du même genre, mais beaucoup plus élaboré et plus
puissant, comporte une table de constantes considérablement étendue, un registre beaucoup
plus large de fonctions usuelles et spéciales, etc. Une telle structure permet de sélectionner
des formules candidates à satisfaire un objectif : que ce soit l'égalité espérée avec un nombre
donné, comme dans l'exemple que nous avons vu, ou l'égalité espérée entre deux formules
génériques (ou, ce qui revient au même, l'égalité espérée à zéro d'une seule formule générique
plus étendue). En ce sens, la structure possèderait la potentialité de générer systématiquement
des formules nouvelles, ayant la nature de conjectures déjà sérieusement étayées par
vérification numérique.
Le gigantisme du nombre de combinaisons qu'il est possible de traiter va de pair avec
l'accroissement de vitesse et de capacité des calculateurs électroniques. Un ordinateur
personnel ne permet de traiter en un temps raisonnable que de petites formules, ne comportant
qu'un faible nombre de fonctions et de paramètres. Il permet, tout au plus, de retrouver des
relations simples et sans intérêt de nouveauté. L'essor de l'informatique est fulgurant :
accroissement spectaculaire de la vitesse opératoire, des volumes de stockage de données, de
la disponibilité de machines professionnelles de grande puissance. De ce fait, les perspectives
sont en train de changer pour les mathématiques expérimentales. A ce point, nous dépassons
la réalité actuelle pour passer à la prospective.
Le progrès des méthodes et des logiciels, dont les mathématiques expérimentales ont
besoin, ont été évoqués. Ils n'en sont encore qu'à leurs balbutiements, ainsi qu'on peut le
ressentir à la lecture des pages précédentes.
De plus et bien que ce ne soit pas l'objet de cet article, il convient de signaler que des
logiciels de calcul formel remarquables existent déjà et deviennent de jour en jour encore plus
performants. Les ingrédients d'une mutation se préparent : les mathématiques expérimentales,
pour ce qui relève de la phase de recherche exploratoire, les mathématiques formelles pour la
phase de démonstration. Certes, il faut imaginer une importante évolution avant que la
convergence soit réalisée entre les procédés de calculs tant expérimentaux que formels, que
leur complémentarité se concrétise et que des formules automatiquement générées et
sélectionnées soient formellement prouvées in fine, le tout dans un processus systématique.
Nous n'en sommes pas là. Les mathématiques expérimentales ont à leur actif des
succès récents. Mais elles ne sont actuellement rien de plus que des outils au service de
chercheurs. Par exemple, avec ces moyens, une nouvelle formule pour π a été trouvée il y a
une dizaine d'années, ce qui a permis d'importants progrès dans le calcul des digits lointains
de π indépendamment les uns des autres. Le mérite en revient à Simon Plouffe et à d'autres
chercheurs dont les contributions ne doivent pas être oubliées. Lui-même en cite plusieurs [5].
Voir également les réf. dans [4].
Quoi qu'il en soit, les perspectives sont propices pour les mathématiques
expérimentales. Et ce n'est pas dans la littérature que l'on en apprendra le plus au sujet du
fonctionnement interne des logiciels existant dans ce domaine (au sens restreint considéré ici)
: C'est par l'expérience personnelle, c'est-à-dire en construisant soi-même un logiciel, même
rudimentaire. En découvrant des problèmes qu'il serait long et difficile de décrire, mais qui
sautent aux yeux en pratique. Et en les surmontant. Cette constatation a considérablement
influencé la façon dont le sujet est présenté ici sous forme d'incitation : "Comprendre les
mathématiques expérimentales en les expérimentant". Une injonction valable pour les
mathématiques expérimentales au sens large et encore plus dans le contexte du présent travail.
Exercice n° 2 : Conjecturer une formule très simple pour cette fraction continue :
a1
J = e −1 + = 0,570 650 096 977...
−1 a2
e +
a3
e −1 +
e −1 + ...
1 1 1 1
a1 = ; a2 = ; a3 = ... ak =
12 60 140 4 4k 2 −1 ( )
Exercice n° 3 : Conjecturer une relation algébrique entre les séries K et H :
∞ 2
j ( (2 j )!)
K= π
j =0
∑
(−1)
( j !) 4 4j
2
= 1, 479 337 559 594...
∞ 2
( (2 j )!)
H =− π
j =0
(∑j !) 4 5j
2 (2 j − 1)
= 1,524 038 417 539...
En fait, il existe bien une relation exacte et démontrée analytiquement. Ici, le but est
seulement de retrouver aisément cette relation, tout en la vérifiant approximativement par
calcul numérique, avec une précision aussi bonne que possible. La preuve formelle, qui
requiert la connaissance des propriétés de certaines fonctions spéciales, sortirait largement
du présent contexte.
Il ne faudrait pas en conclure hâtivement que ces cinq nombres sont égaux. Pour
prouver qu'ils sont tous différents, il suffit de pousser un peu plus loin le calcul numérique de
façon à obtenir plus de décimales significatives:
N0 = 1,618 033 988 749…
N1 = 1,618 033 988 659…
N2 = 1,618 033 988 417…
N3 = 1,618 033 988 148…
Ainsi, malgré ce que pourrait faire croire un calcul numérique insuffisamment précis,
la conclusion est : il n'y a pas de relation d'égalité entre eux.
Ck = ± F6 ( [ ± F5 ( ± c 4)] o3 [ ± F4 (± c3 )] ) o2 ± F3 ( [ ± F2 ( ± c2 )] o1 [ ± F1(±c1)] )
c1, à c4 sont des constantes qui ont été prises dans une liste de neuf : 0, 1, 2, 3, 5, π, G, e, γ
F1 à F6 sont des fonctions qui ont été prises dans une liste de douze : identité, inverse, carré,
cube, racine carrée, cubique, exp, ln, sin, cos, sh, ch.
o1, o2 et o3 sont des opérateurs qui ont été pris dans une liste de trois : multiplication, division,
addition ou soustraction (*).
(*) Les constantes initiales, intermédiaires et finales sont affectées successivement des signes
plus et moins, ceci intervenant en dix places dans la formule. En conséquence, (addition ou
soustraction) ne constitue qu'un même opérateur : En effet, (addition et soustraction) ferait
double emploi avec l'affectation de signe ±.
Six formules ont été obtenues approchant l'objectif avec au moins 9 chiffres corrects
après la virgule. Parmi elles, trois "belles" formules ont été sélectionnées pour figurer dans
l'énoncé du problème, encore que la "beauté" d'une formule soit une appréciation très
subjective. Bien sûr, parmi les six se trouvait la formule exacte (1+√5)/2 . Le contraire eut
été inquiétant ! Un tel travail à l'ordinateur est loin de la beauté des mathématiques
pures, me direz-vous. Certes ! Néanmoins, il est intéressant de savoir que de telles fausses
coïncidences existent et sont très nombreuses.
Note: Les résultats antérieurement rapportés dans [2] prenaient en compte des fonctions réciproques (arcsin,
argsh et plusieurs autres) . Elles n'ont pas été conservées afin de réduire le nombre des combinaisons à balaye
et aussi de simplifier la tâche pour celui qui voudrait réaliser un tel programme sur son ordinateur personnel et
reproduire les résultats donnés ici. Dans cet esprit, il était souhaitable que les temps de calcul restent
raisonnables.
A partir des 9 constantes initiales et après calcul des ±F1(±c1), la table des constantes
positives comporte 91 éléments distincts. A la suite du calcul des [±F2(±c2)] o1 [ ±F1(±c1)] ,
elle passe à 17616 constantes, puis à 205361 après calcul des ±F3( [±F2(±c2)] o1 [ ±F1(±c1)] ).
Ce faible nombre, comparé au nombre théorique de combinaisons, est la conséquence de
l'élimination des redondances les plus facilement identifiables ainsi que, bien évidemment,
des cas de calcul impossible. Finalement, pour la formule générique complète :
Ck = ± F6 ( [ ± F5 ( ± c 4)] o3 [ ± F4 (± c3 )] ) o2 ± F3 ( [ ± F2 ( ± c2 )] o1 [ ± F1(±c1)] )
la population C1 , C2 , C3 , … , Ck , … , CM de constantes positives qui ont été prises en
compte pour les statistiques suivantes, s'élève à un peu plus de 105 milliards.
+
La distribution sur ℜ de ces constantes s'étend théoriquement de 0 à +∞. Mais, du
fait des limitations matérielles, les plus grandes valeurs entrent dans la catégorie des cas de
calcul impossible dont il a déjà été fait allusion.
La représentation graphique en échelle linéaire est irréalisable sur une plage aussi
étendue. C'est donc en échelle logarithmique, ce qui est assez inhabituel, qu'elle est tracée sur
la figure 1. Les valeurs xk = log(Ck) sont portées sur l'axe des abscisses. Les Ck étant supposés
classés par ordre croissant (*), il y a yk=k/M éléments dont la valeur est inférieure ou égale à
Ck . Sur l'axe des ordonnées, on porte yk en fonction de xk , représentant ainsi la fonction de
répartition.
(*) Remarque pratique : le classement et la mise en mémoire d'un aussi grand nombre de
constantes ( M ≈ 105*109 ) serait gravement pénalisant en volume et temps de calcul. En fait,
les valeurs proprement dites Ck ne sont ni classées ni mémorisées individuellement. C'est le
montant de leur population par tranche de valeurs qui est mémorisé : En l'occurrence, les xk
négatifs (0<Ck<1) ont été décomptés pour chacune de 10000 tranches et autant de tranches
pour les xk positifs ( Ck ≥1 ). Le nombre par tranche peut atteindre plusieurs dizaines de
millions : c'est cet unique nombre qui est mémorisé pour chacune. La fonction de répartition
est tracée à partir des 20000 totaux partiels.
La fonction de répartition (figure 1) ne semble pas être d'un genre répertorié : Les
fonctions les plus connues ne s'ajustent pas correctement, même avec de larges tolérances, sur
toute l'étendue de la fonction de répartition obtenue expérimentalement. Toutefois, dans le
domaine le plus usuel (0,5<C<5) la courbe peut être assimilée à sa tangente, dont l'équation
est indiquée sur la figure. Dans cette région, la densité est approximativement, avec
x = log(C) = ln(C)/ln(10) :
d ln(C ) 0, 20 M 0, 20*105*109 9,13 9
P (C ) ≈ M 0,39 + 0, 20 = ≈ ≈ 10
dC ln(10) ln(10) C 0, 23 C C
Il s'agirait donc, localement, d'une distribution du genre de Pareto, avec un exposant négatif.
Il est patent que l'on est très loin d'être capable de prévoir, d'une façon théorique, la
fonction de répartition qui résulterait d'une fonction générique donnée et associée à des
constantes, fonctions et opérateurs définis a priori : Du fait des redondances dans les
formules, la réduction considérable de la population est quasiment imprévisible. C'est un
obstacle aux calculs théoriques de probabilités et ce n'est pas le seul. On voit bien que la
démarche reste essentiellement expérimentale.
REFERENCES :
[1] : Site "EPS" (en 2001) de A.Laroche, depuis lors devenu "Forum Espace Math" :
http://www.espacemath.com/forum/index.php
Le document cité reste accessible à l'adresse suivante :
http://www.espacemath.com/def2.htm
[4] : Jean-Paul Delahaye "Certitudes sans démonstration?" Pour La Science, N° 249, juillet
1998, pp.100-105.
[5] : http://pi.lacim.uqam.ca/fra/server_fr.html