Anda di halaman 1dari 4

PHILOSOPHIE DE LA DONNE

Selon les tudes de Bruno TEBOUL1, la numrisation du monde a pour consquence de


placer les donnes numriques au centre des changes conomiques et sociaux. Nous
produisons une quantit croissante de donnes, que des technologies de plus en plus
sophistiques permettent de faire circuler, de scuriser, danalyser. Une conomie de la
donne tente de rendre compte de la valeur de ces oprations. Des politiques de la donne sont
mises en uvre par les tats et les grandes corporations. Un business se dveloppe,
notamment autour du Big Data. Mais la nature prcise de la donne reste floue. Une approche
philosophique, comme celle mene par Luciano FLORIDI, peut en affiner la dfinition.
Quest-ce quune donne ? Lavnement du numrique a amen reprendre et prciser cette
question longtemps nglige, qui merge la fin du XIXe sicle, quand la philosophie se
partage entre la prise en compte des donnes immdiates de la conscience (Bergson) et
une mthode exprimentale privilgiant la mesure indirecte de donnes objectives .

Le connu et linconnu
La philosophie des sciences, avec QUINE, mettra vite en doute cette prtention lobjectivit.
Mais toute pense pratique soucieuse de prcision et de ralisme, dun ct, toute approche
scientifique, de lautre, ne sen appuient pas moins, jusqu aujourdhui, sur des donnes.
Le terme mme de donne suggre un don qui est en ralit une contrainte : la donne
simpose. Cest prcisment ce qui lui permet de servir de socle une rflexion partage, de
permettre le dveloppement technique, de fonder des politiques publiques ou daccrotre les
connaissances scientifiques. Lingnieur, lconomiste, le physicien, le botaniste, lagronome,
le chimiste raisonnent donnes en main.
La donne, dans ce contexte, cest du connu, sur lequel on peut sappuyer pour aller vers
linconnu.
Le connu suppose un accord, une reconnaissance, bref un rgime dvidence ou de convention
qui fait que lensemble des participants une rflexion sentendent sur ce qui est donn .
On parle ainsi de donnes scientifiques, techniques, ou sociologiques : donnes intelligibles et
valides, qui sont publiques ou tout le moins partageables au sein dune communaut
dutilisateurs qui reconnaissent leur valeur.
Dans cette perspective les donnes quantitatives ont un avantage indniable sur les donnes
qualitatives. Il est plus facile de sentendre sur les nombres que sur les qualits. Aussi une
bonne partie de la science et de lingnierie modernes cherchent-elles quantifier le qualitatif,
le dcomposer en chiffres. Entre le noir et le blanc, il ny a pas le gris, mais du noir 25%,
70%, etc. Une image se dcompose en pixels, et chaque pixel peut se voir indexer sur laxe
qui va des infra-rouges aux ultra-violets.
La numrisation du monde, ainsi, ne commence pas au numrique , la traduction de
signaux en sries de 0 et de 1. Elle caractrise la vaste traduction du monde sensible et en
son sein de lhumanit en sries de donnes, traduction entame au dbut de lre moderne
et qui connat aujourdhui une acclration vertigineuse.
Mais cette acclration porte en elle une seconde volution, celle qui passe de lanalyse la
stochastique, de la rduction prcise et rigoureuse des mcanismes la rvlation ex post, au
moyen du datamining, de lois statistiques. Cette rvolution, qui vient de commencer, pourrait
se caractriser comme le triomphe de la pense inductive sur la pense dductive. Dans des

1
Senior VP, Science & Innovation, Groupe Keyrus / avril 2017
Auteur de La donne n'est pas donne - Stratgie & Big Data , de juin 2016,
domaines de plus en plus nombreux, la connaissance est produite partir des corrlations
extraites de grandes masses de donnes. Il sagit moins de prouver que de voir apparatre des
lois.
La statistique et lalgorithmique saffirment ainsi dsormais comme les outils
fondamentaux de la connaissance, mais aussi de la dcision.
Cette rvolution, dans laquelle nous sommes plongs, oblige interroger le statut de ce qui la
nourrit, de ces data innombrables, stockes dans de gigantesques centres de stockage. En
commenant par des questions aussi simples que radicales, comme celle-ci : les donnes sont-
elles de linformation ?

Atomes dinformation
La distinction importe, et elle sinscrit dans une chane allant des faits au savoir.
Sven Ove HANSSON, professeur de philosophie lInstitut royal de technologie de
Stockholm, rsume dans un article de 2002 le jeu des diffrences entre donnes, information
et savoir : Les donnes diffrent de linformation en ce quelles nont pas se prsenter sous
une forme qui se prte lassimilation. Si au lieu de louvrage [de sociologie que je suis en
train de lire], javais sur mon bureau les dix mille questionnaires sur lesquels il repose,
jaurais des donnes au lieu dinformation. En rsum, il faut que des donnes soient
assimilables pour pouvoir constituer de linformation et quelles soient assimiles pour
pouvoir constituer du savoir.
HANSSON reprend une distinction dj faite par Roger BOHN dans un article de la Sloan
Review of Management (1994) entre donne, information et connaissance.
Les donnes sont des lments provenant des capteurs, elles sont relatives au niveau
mesur dune variable quelconque.
Linformation consiste en des donnes organises dans une structure donne et qui,
place dans un contexte, est dote de sens.
La connaissance va plus loin : elle permet de faire des prdictions, dtablir des liens
de causalit ou de prendre des dcisions. Ce qui a de la valeur, cest la connaisssance.
Mais comme le note BOHN linformation est plus facile stocker, dcrire et
manipuler. La mme chose est-elle vraie des donnes ? En termes numriques, oui :
une donnes serait en quelque sorte un atome dinformation, une mesure minimale,
un instant et en un point de lespace. Bref, quelque chose qui peut se rduire un 0 ou
un 1.
En termes philosophiques, la donne est galement plus facile caractriser que
linformation. Cest un concept plus simple, moins glissant. La donne serait la traduction la
plus immdiate, la plus brute, dun fait. Elle nest pas le fait, mais lunit minimale
dobservation qui permet de le caractriser.
Il serait illusoire de prtendre son objectivit, et de soutenir quil ny a pas dintention ni de
projet dans la donne. La mesure, en elle-mme, procde dune discrimination entre toutes les
donnes mesurables dun phnomne : vous choisissez de mesurer telle variable plutt que
telle autre, et par ce filtre vous dfinissez ainsi une ralit, celle, en quelque sorte, que vous
avez besoin de connatre.
Mais dans le cas de la donne, typiquement produite par un capteur, une apparence
dobjectivit est retrouve, par deux voies : la trs faible quantit dinformation contenue dans
la donne, et la prsence dautres capteurs (qui permettent de construire une reprsentation
plus riche du phnomne observ, comme par exemple ltat du pneumatique avant droit de
votre voiture : la chaleur, les vibrations, la pression de lair, lge du pneumatique, la dure
dutilisation aujourdhui, permettent votre ordinateur de bord de construire une information
extrmement fiable).
Une dfinition smantique de la donne
Les considrations qui prcdent peuvent tre renverses. Dun ct, elles aboutissent
assumer la ncessit doprer des choix, de filtrer les donnes et ainsi de reconstruire une
reprsentation trs rductrice de la ralit.
Dun autre ct, la recherche dobjectivit, la multiplication des captures de donnes et la
croissance exponentielle de la masse de donnes recueillies ouvrent vers ce fantasme
scientifique dune reprsentation complte des phnomnes, dune numrisation absolue du
monde. Version scientifique : quand on tudie telle pathologie osseuse, on mobilise 100 000
ensembles de donnes trs compltes provenant de 100 000 patients diffrents, et on se donne
ainsi une chance indite de comprendre un phnomne, ou tout au moins de tout enregistrer,
de ne rien laisser de ct. Version quotidienne, cest lhomme connect : votre pression
sanguine est analyse chaque seconde par des capteurs, votre position dans lespace est capte
en permanence, etc. Vous vous transformez en un producteur de masses de donnes toujours
plus abondantes. Avec la cl une interrogation sur ce que peuvent valoir ces donnes. En
dautres termes, quest-ce qui peut leur permettre dentrer dans la chane qui va des faits au
savoir, en passant par linformation ?
Une approche de la donne comme atome dinformation trouve ici ses limites, car elle ne dit
rien de ce passage. Luciano FLORIDI, professeur de philosophie et directeur de recherche
lOxford Internet Institute, propose une rflexion qui permet de dpasser cette limite.
Il sinterroge sur la possibilit de fonder une thorie de linformation sur la donne ( a data-
based definition of information ). En dautres termes, de dfinir smantiquement la donne,
en se demandant ce qui lui permet de produire de linformation.
Il retient dabord une dfinition rigoureuse de la donne : une donne est un fait suppos qui
procde dune diffrence ou dun manque duniformit dans un contexte (a datum is a
putative fact regarding some difference or lack of uniformity within some context).
Cette diaphore, cette diffrence dans le tissu du rel, ouvre sur la possibilit dune
information, mais certaines conditions. FLORIDI identifie trois rquisits. Il faudrait
a) une ou plusieurs donnes ;
b) que ces donnes soient bien formes ( well-formed ), cest--dire assembles
selon certaines rgles ;
c) et quelles soient porteuses de sens ( meaningful ), cest--dire mme dtre
interprtes ou, si lon prfre, aptes tre traduites, ou exprimes autrement.
Il sensuit, et cest l le point essentiel, que la donne peut se dfinir comme une entit
relationnelle (relational entity).
Lclairage thorique de FLORIDI permet de comprendre ce point, en faisant surgir toute la
porte des notions de diffrence et de manque duniformit . Ces deux notions
renvoient, dit-il, ce que les Grecs nommaient diaphora , un cart. FLORIDI poursuit en
proposant une dfinition diaphorique de la donne qui peut tre applique suivant trois
niveaux.
Il distingue dabord la donne comme diaphora de re , cest--dire comme manque
duniformit dans le monde rel. Il nexiste pas de nom spcifique pour de telles
donnes dans la nature . Une suggestion possible est de se rfrer aux donnes
comme des ddomen (traduction en grec ancien de donnes ). On peut noter
dailleurs dun point tymologique, que le mot datum est apparu en latin partir de
la traduction dune uvre dEuclide, Dedomena. On ne peut connatre directement la
donne, mais simplement linfrer partir de lexprience. FLORIDI explique que les
Dedomena sont des donnes pures ou des donnes proto-pistmiques, cest--dire
des donnes avant quelles ne soient pistmiquement interprtes. En tant que
Fractures dans la fabrique de ltre , elles ne sont jamais accessibles ni labors
indpendamment dun certain niveau dabstraction. Elles ne sont pas pistmiquement
exprimentes, mais leur prsence est empiriquement dduite de (et requise par)
lexprience.
ces donnes proto-pistmiques sajoute la donne comme diaphora de signo ,
cest--dire le manque duniformit (ou la perception dun manque duniformit)
entre deux tats physiques, comme le niveau plus ou moins lev dune batterie, un
signal lectrique dans une conversation tlphonique, ou un point dans lalphabet
morse.
Vient enfin la diaphora de dicto , cest--dire le manque duniformit entre deux
symboles, par exemple les lettres A et B dans lalphabet latin. La notion centrale de
diaphora, qui runit ces trois versions de la donne, renvoie une divergence, un
moment o quelque chose se met diffrer, une diffrence qui appelle un sens. La
donne est lentit symbolique qui code cette diffrence. Elle est le lien entre cet
cart, quon serait tent de dire insignifiant, et le sens. Le point de passage de
linsignifiant au signifiant.

Anda mungkin juga menyukai