Introduction :
La réduction des données a pour objet le calcul de paramètres qui permettent de caractériser de
façon simple les séries statistiques et les distributions observées.
Les paramètres les plus utilisés sont :
✓ Les paramètres de tendance centrale ou de position :
Ces paramètres servent à caractériser l’ordre des grandeurs des observations
✓ Les paramètres de dispersion :
Ces paramètres permettent de chiffrer la variabilité des valeurs observées autour d’un
paramètre de position
✓ Les paramètres de forme :
Ces paramètres permettent de caractériser la forme d’une distribution.
I. La moyenne arithmétique :
La moyenne arithmétique simple, qu’on appelle tout simplement moyenne, est égale à la
somme des valeurs observées divisée par le nombre d’observations.
▪ Cas d’une série de données brutes sous forme (𝒙i) :
𝑛
∑ 𝑥
𝑋̅ = 𝑖=1 𝑖 avec ∑𝑛𝑖=1 𝑥𝑖 = 𝑥 1 + 𝑥 2 + 𝑥 3 + ……. + 𝑥 i + ……… + 𝑥 n
𝑛
𝑘 𝑘 𝑘 𝑘
∑ ∑𝑖=1 𝑛𝑖 ×𝑥𝑖
𝑋̅ = 𝑖=1𝑘
𝑛𝑖 ×𝑥𝑖
= (VQD) ou ̅ = ∑𝑖=1𝑘 𝑛𝑖×𝑐𝑖 = ∑𝑖=1 𝑛𝑖 ×𝑐𝑖 (VQC)
𝑋
∑ 𝑖=1 𝑛𝑖 𝑛 ∑ 𝑖=1 𝑛𝑖 𝑛
𝑋̅ = ∑𝑘𝑖=1 𝑓𝑖 × 𝑥𝑖 ou 𝑋̅ = ∑𝑘𝑖=1 𝑓𝑖 × 𝑐𝑖
𝑛𝑖
avec 𝑓𝑖 = et ∑𝑘𝑖=1 𝑓𝑖 = 1
𝑛
7 14 20 15 11
Statistique descriptive 17
M. BOUMESKA Mustapha FSJES D’AGADIR
𝑘
∑ 𝑥 4+7+9+10+11+12+14+15+18+20 120
𝑋̅ = 𝑖=1 𝑖 = = = 12
𝑛 10 10
Interprétation :
En moyenne, chaque PME, de la région Souss-Massa, emploie 12 salariés.
Ou : le nombre moyen des salariés dans les PME de la région Souss-Massa est : 12.
𝑘
∑ 𝑛𝑖𝑥 875
𝑋̅ = 𝑖=1 𝑖 = = 8,75 DH
𝑛 100
ou
𝑋̅ = ∑𝑘𝑖=1 𝑓𝑖𝑥𝑖 = 8,75
Interprétation :
▪ En moyenne, le produit A coûte 8,75 DH ;
▪ Ou : le prix moyen du produit A est 8,75 DH.
𝑛
∑ 𝛼𝑖𝑥𝑖 4∗12+6∗10+ 6∗13+2∗11 208
𝑋̅ = ∑𝑖=1
𝑛 = = = 11,55
𝑖=1 𝛼𝑖 4+6+6+2 18
Interprétation :
▪ La note moyenne de cet étudiant est 11,55.
Statistique descriptive 18
M. BOUMESKA Mustapha FSJES D’AGADIR
▪ Application 1 :
On observe dans un complexe résidentiel, le nombre de pièce de 400 appartements. Les
résultats sont classés dans le tableau suivant :
1. Préciser :
✓ la population étudiée,
✓ sa taille,
✓ l’unité statistique,
✓ le caractère étudié et sa nature, et
✓ nombre de modalités.
2. Calculer et interpréter la moyenne arithmétique.
Application 2 :
o Le salaire mensuel d’un ensemble d’employés d’une entreprise industrielle se présente
ainsi :
[0 – 2000[ 5
[2000 – 4000[ 20
[4000 – 6000[ 38
[6000 – 8000[ 25
8000 et plus 12
1. Préciser :
✓ la population étudiée,
✓ sa taille,
✓ l’unité statistique,
✓ le caractère étudié et sa nature, et
✓ nombre de modalités.
2. Calculer et interpréter la moyenne arithmétique.
Statistique descriptive 19
M. BOUMESKA Mustapha FSJES D’AGADIR
II. Le mode :
Le mode est l’observation la plus fréquente dans une série statistique, c’est-à-dire la modalité
qui a la plus grande fréquence.
3 cas de figures sont possibles : Un seul mode, plusieurs modes ou aucun mode.
▪ Cas d’un caractère quantitatif discret sous forme (𝒙i) :
Nombre d’enfants par famille :
Cas 1 : 0 1 2 1 2 3 ▪ Un seul mode : Mo = 2.
Cas 2 : 1 2 2 1 0 3 ▪ Plusieurs modes : Mo = 1 et 2.
Cas 3 : 5 2 0 3 1 4 ▪ Aucun mode.
▪ Interprétation du Mode :
Si on prend le Cas 1 : On dit que la plupart des familles ont 2 enfants ;
Pour le Cas 2 : On dit que la plupart des familles ont 1 ou 2 enfants.
150
Mo = 3
Effectif
100
50
0
1 2 3 4 5
Nombre de pièces
Statistique descriptive 20
M. BOUMESKA Mustapha FSJES D’AGADIR
600
400
200
0
0 100 100 200200 300300 400 400 500500500 et600
plus
Chiffre d'affaires
Statistique descriptive 21
M. BOUMESKA Mustapha FSJES D’AGADIR
2. La méthode graphique :
500
400
300
200
100
0
Mo 300 400 400 500 500500 et plus
0 100 100 200 200 300 600
Chiffre d'affaires
Statistique descriptive 22
M. BOUMESKA Mustapha FSJES D’AGADIR
III. La médiane :
La médiane d’une distribution statistique, noté Me, est la valeur de la variable étudiée qui
partage en deux parties égales la population étudiée.
▪ La première partie regroupe tous les individus ayant une modalité inférieure ou égale à
la médiane Me.
▪ La deuxième partie regroupe tous les individus ayant une modalité supérieure ou égale à
la médiane Me.
Cas n°2 : Si le nombre d’observations est pair, la médiane est comprise entre l’observation de
rang (n/2) et l’observation de rang (n/2)+1.
X n/2 ≤ Me ≤ X (n/2) +1
Exemple : la note des étudiants d’une classe
𝟕 𝟗 𝟏𝟏 𝟏𝟐 14 𝟏𝟔
n = 6, il est pair ;
X n/2 ≤ Me ≤ X (n/2)+1
Donc X 6/2 ≤ Me ≤ X (6/2)+1
c-à-d : X3 ≤ Me ≤ X4
Ainsi : 11 ≤ Me ≤ 12,
On prend comme médiane, la moyenne arithmétique de ces deux valeurs :
𝟏𝟏+𝟏𝟐
𝐌𝐞 = = 11,5.
𝟐
Interprétation : La moitié des étudiants ont une note inférieure ou égale à 11,5, et l’autre
moitié ont une note supérieure ou égale à 11,5.
Statistique descriptive 23
M. BOUMESKA Mustapha FSJES D’AGADIR
Nombre
Nombre de pièces (xi) fi Ni ↑ Fi ↑
d’appartements (ni)
1 92 23,00% 92 23,00%
2 108 27,00% 200 50,00%
3 110 27,50% 310 77,50%
4 54 13,50% 364 91,00%
5 36 9,00% 400 100,00%
TOTAL 400 100,00%
On parle dans ce cas de la classe médiane. C’est la classe qui contient la médiane ;
On détermine la médiane par interpolation linéaire.
Chiffre d’affaires en
ni fi N↑ F↑
1000 DH
[0 – 100[ 385 17,50% 385 17,50%
[100 – 200[ 315 14,32% 700 31,82%
[200 – 300[ 763 34,68% 1463 66,50%
[300 – 400[ 250 11,36% 1713 77,86%
[400 – 500[ 357 16,23% 2070 94,09%
500 et plus 130 5,91% 2200 100,00%
Total 2200 100%
Statistique descriptive 24
M. BOUMESKA Mustapha FSJES D’AGADIR
200 Me 300
Me – 200 300 – 200
=
1100 1463 1100 – 700 1463 – 700
700
300 – 200
Me = 200 + x (1100 – 700)
1463 – 700
Me = 252,42 DH
La médiane = 252 420 DH (le chiffre d’affaires est en 1000 DH) ;
Interprétation :
La moitié des entreprises marocaines ont un chiffre d’affaires inférieure ou égale à 252 420
DH, et l’autres moitié ont un CA supérieure ou égale à 252 420 DH.
Statistique descriptive 25
M. BOUMESKA Mustapha FSJES D’AGADIR
1. Les quartiles :
Q1 : est la valeur de la variable telle que 25% (1/4) des observations lui sont inférieures ou
égales et 75% (3/4) des observations lui sont supérieures ou égales ;
Q2 : est la valeur de la variable telle que 50% (2/4) des observations lui sont inférieures ou
égales et 50% (2/4) des observations lui sont supérieures ou égales. Le deuxième quartile est
égale aussi à la médiane (Q2 = Me);
Q3 : est la valeur de la variable telle que 75% (3/4) des observations lui sont inférieures ou
égales et 25% (1/4) des observations lui sont supérieures ou égales.
Intervalle interquartile
Pour calculer la valeur exacte de chaque quartile, on va procéder de la même façon que pour la
médiane, c’est-à-dire par interpolation linéaire.
Chiffre d’affaires en
ni fi N↑ F↑
1000 DH
[0 – 100[ 385 17,50% 385 17,50%
[100 – 200[ 315 14,32% 700 31,82%
[200 – 300[ 763 34,68% 1463 66,50%
[300 – 400[ 250 11,36% 1713 77,86%
[400 – 500[ 357 16,23% 2070 94,09%
500 et plus 130 5,91% 2200 100,00%
Total 2200 100%
Statistique descriptive 26
M. BOUMESKA Mustapha FSJES D’AGADIR
100 Q1 200
Q1 – 100 200 – 100
=
550 700 550 – 385 700 – 385
385
200 – 100
Q1 = 100 + x (550 – 385)
700 – 385
Q1 = 152,38
Interprétation :
Le chiffre d’affaires étant en millier de DH, on dit que : 25% des entreprises marocaines réalisent
un chiffre d’affaires inférieure ou égale à 152 380 DH, et 75% de ces entreprises réalisent un chiffre
d’affaires supérieure ou égale à 152 380 DH.
200 Q2 300
Q2 – 200 300 – 200
=
1100 1463 1100 – 700 1463 – 700
700
300 – 200
Q2 = 200 + x (1100 – 700)
1463 – 700
Q2 = Me = 252,42
Interprétation :
Le chiffre d’affaires étant en millier de DH, on dit que : La moitié des entreprises marocaines ont
un chiffre d’affaires inférieure ou égale à 252 420 DH, et l’autres moitié ont un CA supérieure ou égale
à 252 420 DH.
Statistique descriptive 27
M. BOUMESKA Mustapha FSJES D’AGADIR
300 Q3 400
Q3 – 300 400 – 300
=
1650 1713 1650 – 1463 1713 – 1463
1463
400 – 300
Q3 = 300 + x (1650 – 1463)
1713 – 1463
Q3 = 374,80
Interprétation :
Le chiffre d’affaires étant en millier de DH, on dit que : 75% des entreprises marocaines réalisent
un chiffre d’affaires inférieure ou égale à 374 800 DH, et 25% de ces entreprises réalisent un chiffre
d’affaires supérieure ou égale à 374 800 DH.
2. Les déciles :
d1 : est la valeur de la variable telle que 10% (1/10) des observations lui sont inférieures ou
égales et 90% (9/10) des observations lui sont supérieures ou égales ;
d2 : est la valeur de la variable telle que 20% (2/10) des observations lui sont inférieures ou
égales et 80% (8/10) des observations lui sont supérieures ou égales ;
…
d9 : est la valeur de la variable telle que 90% (9/10) des observations lui sont inférieures ou
égales et 10% (1/10) des observations lui sont supérieures ou égales.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
n
x
d1 d2 d3 d4 d5 d6 d7 d8 d9
Pour calculer la valeur des différents déciles, on procède de la même façon que la médiane et
les quartiles (interpolation linéaire) ;
Statistique descriptive 28
M. BOUMESKA Mustapha FSJES D’AGADIR
3. Les centiles :
C1 : est la valeur de la variable telle que 1% (1/100) des observations lui sont inférieures ou
égales et 99% (99/100) des observations lui sont supérieures ou égales ;
C2 : est la valeur de la variable telle que 2% (2/100) des observations lui sont inférieures ou
égales et 98% (98/100) des observations lui sont supérieures ou égales ;
…
C78 : est la valeur de la variable telle que 78% (78/100) des observations lui sont inférieures ou
égales et 22% (22/100) des observations lui sont supérieures ou égales ;
1% 1% 1% 1% 1% 1% 1% 1% 1% 1%
n
x
c1 c2 c3 c4 c5 c77 c78 c79 c80 c98 c99
V. La médiale :
La médiale d’une distribution statistique, notée Ml, est la valeur de la variable étudiée qui
partage en deux parties égales la somme des observations (∑nixi).
50% 50%
∑nixi
x
Ml
Application : Le chiffre d’affaires 2200 entreprises marocaines
Chiffre d’affaires en
ci ni ni * ci ni * ci ↑
1000 DH
[0 – 100[ 50 385 19 250,00 19 250,00
[100 – 200[ 150 315 47 250,00 66 500,00
[200 – 300[ 250 763 190 750,00 257 250,00
[300 – 400[ 350 250 87 500,00 344 750,00
[400 – 500[ 450 357 160 650,00 505 400,00
500 et plus 550 130 71 500,00 576 900,00
Total 2200 576 900,00
Statistique descriptive 29
M. BOUMESKA Mustapha FSJES D’AGADIR
300 Ml 400
Ml – 300 400 – 300
=
257.250 288.450 288.450– 257.250 344.750– 257.250
344.750
400 – 300
Ml = 300 + x (288.450– 257.250)
344.750 – 257.250
Ml = 335,66
Interprétation :
Le chiffre d’affaires étant en millier de DH.
On dit que : Le chiffre d’affaires total réalisé par les entreprises marocaines est répartit en deux
parties égales. La première est inférieure ou égale à 335 660,00 DH et la deuxième est supérieure ou
égale à 335 660,00 DH.
Statistique descriptive 30