Anda di halaman 1dari 11

Chapitre1 : Distribution Statistique une dimension I.H.E.

T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
3
CHAPITRE 1 : Distribution statistique une dimension
Section 1 : Vocabulaire lmentaire de la statistique descriptive
1. Population et individu
Dfinition
On appelle population statistique, tout ensemble d'units statistiques constituant les units
observes.
On appelle individu (ou unit statistique), tout lment de la population tudie.
Remarque
La dtermination avec prcision de la population et des individus qui la composent
conditionne l'homognit des units observe et la fiabilit des rsultats.
2. Variable statistique
2.1. Dfinition
On appelle variable statistique (ou caractre), une application (relation) qui associe chaque
individu de la population, une observation particulire.
2.2. Type d'une variable statistique
a) Variable qualitative
Une variable est qualitative si elle est lie un ensemble d'observations non mesurables.
Exemple : La population active tunisienne peut tre caractrise par :
- Le sexe (masculin ou fminin)
- La catgorie professionnelle (cadres, employs, ouvriers, etc...)
La nature qualitative d'une variable s'exprime donc par l'appartenance une catgorie ou
rubrique d'un ensemble fini.
b) Variable quantitative
Une variable est quantitative si l'ensemble des observations est un ensemble de nombres. Ces
observations expriment donc des valeurs numriques (quantitatif = mesurable).
Exemple : La Catgorie Htelire, La Capacit en lits,
Les variables quantitatives peuvent tre discrtes ou continues :
Une variable quantitative est dite discrte lorsqu'elle prend un nombre fini ou dnombrable
de valeurs (La Catgorie Htelire).
La variable nombre d'enfants par mnage est une variable quantitative discrte.
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
4
Une variable quantitative est dite continue, lorsqu'elle prend toutes les valeurs d'un
intervalle rel.
La variable La Capacit en lits peut tre envisage comme une variable quantitative
continue. Ses valeurs sont le plus souvent regroupes par intervalle.
3. Effectifs
Dfinition
On appelle effectif d'une valeur (ou rubrique) donne x
i
le nombre de fois ou cette valeur (ou
rubrique), apparait dans la population statistique tudie. Ce nombre est note n
i
. L'effectif est
parfois appel frquence absolue.
On appelle effectif total de la population tudie, not n, la somme des p effectifs particuliers
n
i
correspondant chacune des valeurs (ou rubriques), soit :
n = n
1
+n
2
+.+n
p
=

p
i
i
n
1
Le symbole (lu somme) permet une criture synthtique de la somme des p effectifs
n
1
, n
2
.... n
p
. On lit alors n = somme des n
i
(pour i variant de 1 p) .
4. Frquences
On appelle frquence de la valeur (ou modalit) x
i
, note f
i
, le rapport de l'effectif n
i
correspondant a
la valeur x
i
et de l'effectif n de la population observe.
n
n
f
i
i

Ce rapport est gal au pourcentage d'individus prsentant la valeur (ou modalit) x
i
par rapport
l'ensemble de la population observe. f
i
est toujours comprise entre 0 et 1.
Pour une srie statistique prsentant p valeurs (ou modalits), on a :
1 . ..........
2 1
1

p
p
i
i
f f f f
Remarque :
Parfois on peut rencontrer le terme de frquence relative pour les frquences.
Lemploi des frquences ou frquences relatives savre utile pour comparer deux
distributions de frquences tablies partir dchantillons de taille diffrente.
On appelle frquences cumules ou frquences relatives cumules en x
i
, le nombre f
i
cum tel
que


i
p
p i j
f cum f F
1
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
5
Section 2 : Reprsentation des donnes
Il existe plusieurs niveaux de description statistique : la prsentation brute des donnes, des
prsentations par tableaux numriques, des reprsentations graphiques et des rsums
numriques fournis par un petit nombre de paramtres caractristiques.
1. Sries statistiques
Une srie statistique correspond aux diffrentes modalits dun caractre sur un chantillon
dindividus appartenant une population donne.
Le nombre dindividus qui constituent lchantillon tudi sappelle la taille de lchantillon.
2. Tableaux statistiques
Le tableau de distribution de frquences est un mode synthtique de prsentation des donnes.
Sa constitution est immdiate dans le cas dun caractre discret mais ncessite en revanche
une transformation des donnes dans le cas dun caractre continu.
2.1 Caractre qualitatif
Modalit
Numro i
Effectif
n
i
Frquence
f
i
1
2
..
p
n
1
n
2
.
n
p
f
1
f
2

f
p
On a les relations suivantes:

p
i
i
n n
1
n
n
f
i
i
1
1

p
i
i
f
Remarque : les frquences peuvent tre exprimes dans le tableau en pourcentage, dans ce
cas : 100
1

p
i
i
f
2.2 Caractre quantitatif
a) Caractre quantitatif discret
Valeurs observes
x
i
Effectifs
n
i
Frquences
f
i
Frquences cumules
croissantes F
i
x
1
x
2
.
x
P
n
1
n
2
..
n
P
f
1
f
2
.
f
P
F
1
F
2

F
P
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
6
b) Caractre quantitatif continu
Classes
numro i
[b
i
; b
i+1
[
Centres
c
i
Effectifs
n
i
Frquences
f
i
Frquences
cumules
croissantes F
i
[b
1
; b
2
[
[b
2
; b
3
[
..
[b
P
; b
P+1
[
c
1
c
2

c
P
n
1
n
2
.
n
P
f
1
f
2

f
P
F
1
F
2

F
P
Remarque :
- Une classe est un intervalle ferm gauche et ouvert droite, du type [b
i
; b
i+1
[.
- Le centre d'une classe est
2
1

i i
i
b b
c
- L'amplitude d'une classe est
i i i
b b a
1
3. Reprsentations graphiques
3.1 Caractres qualitatifs
a) Diagrammes bandes
On appelle diagramme bandes un graphique qui, chaque modalit de la variable qualitative
associe un rectangle de base constante dont la hauteur est proportionnelle l'effectif.
Figure 1-1 : Diagramme bandes (verticales) :
nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005
0
5 000
10 000
15 000
20 000
25 000
30 000
35 000
40 000
Sudois Danois Norvgiens Finlandais
Nationalits
b) Diagrammes secteurs
On appelle diagramme secteurs un graphique qui divise un disque en secteurs angulaires
dont les angles au centre sont proportionnels aux effectifs de chaque modalit.
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
7
Pour une modalit donne M
i
, d'effectif n
i
, l'angle au centre
i
, correspondant est donn (en
degr) par : 360 360
i
i
i
f
n
n

Figure 1-2 : Diagramme secteurs :


nombre darrive aux frontires des scandinaves par nationalit pour l'anne 2005
Sudois
Danois
Norvgiens
Finlandais
3.2 Caractres quantitatifs
3.2.1 Caractre quantitatif Discret
a) Diagramme en btons
On appelle diagramme en btons un graphique qui associe chaque valeur de la variable un
segment (bton) dont la hauteur est proportionnelle l'effectif.
Remarque
On suppose les valeurs observes de la variable quantitative discrte, ordonnes par ordre
croissant.
Figure 1-3 : Diagramme en btons :
Nombre de nuites des non rsidants par nombre dtoile en 2005
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
8
b) Diagrammes cumulatifs
On appelle diagramme cumulatif, la courbe reprsentative de la fonction de rpartition.
On appelle fonction de rpartition d'un caractre X, l'application note F, dont l'ensemble de
dpart est R et l'ensemble d'arrive, l'intervalle [0,1].
F : R [0,1]
X F(x) = P(X<x)
F(x) = proportion des individus dont la valeur du caractre est strictement inferieure x.
1 2
( ) de ( ) ...
p
F x frquence X x f f f
Remarque
Le plus souvent, le diagramme cumulatif est obtenu partir des frquences cumules
croissantes. Dans le cas d'une variable discrte, la courbe cumulative se prsente comme une
courbe en escalier (La fonction F est dans le cas discret, une fonction constante par intervalle)
Chaque segment de cette courbe en escalier est ouvert gauche et ferme droite (sauf le
dernier).
Si on dfinit la fonction de rpartition par F(x) = P(X x), alors les segments deviennent
ferms gauche et ouverts droit (sauf le premier).
Figure 1-4 : Courbe en escalier du
Nombre de nuites des non rsidants par nombre dtoile en 2005
3.2.2 Caractres quantitatifs continus
a) Histogrammes
On appelle histogramme un diagramme compar d'un ensemble de rectangles contigus
(adjacents), chaque rectangle, associ chaque classe, ayant une surface proportionnelle
l'effectif (ou la frquence) de cette classe. Deux cas peuvent se prsenter :
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
9
Classes d'amplitudes gales :
Lorsque les classes sont d'amplitudes gales (a
i
= a)
Figure 1-5 : Histogramme (amplitude gales) :
Capacit Htelire en lits pour la rgion de Nabeul-Hammamet
0,00
0,05
0,10
0,15
0,20
0,25
0,30
101 201 301 401 501
capacit hteli re en lits
F
r

q
u
e
n
c
e
s
Classes d'amplitudes ingales :
Lorsqu'au moins deux classes ont des amplitudes diffrentes, la hauteur proportionnelle
l'effectif ne permet plus de construire un histogramme. En effet, la surface de chaque
rectangle n'est plus proportionnelle l'effectif (conformment la dfinition).
Do la ncessit de corrig les frquences (ou les effectifs).
i
i c
i
a
f
f ou
i
i c
i
a
n
n
Avec:
c
i
f : frquence corrig ;
c
i
n : effectif corrig
Figure 1-6: Histogramme (amplitude ingales) : Chmeurs par groupe d'ges
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
10
b) Polygone des frquences
On obtient un polygone de frquences en joignant les milieux des segments suprieurs de
chaque rectangle de lhistogramme (laire du polygone des frquences est laire de la surface
par la ligne polygonale et laxe des abscisses).
Figure 1-7 : Polygone des frquences (amplitude gales) :
Capacit Htelire en lits pour la rgion de Nabeul-Hammamet
c) Courbe des frquences cumules croissantes
Dfinition
On appelle courbe des frquences cumules croissantes la reprsentation graphique de la
fonction de rpartition de la variable x.
Les donnes tant groupes en classes, la frquence cumule croissante F
i
associe la classe
n : i reprsente la proportion d'individus de la population pour lequel la variable prend une
valeur inferieure (strictement) la limite suprieure b
i
de la classe n : i.
En pratique, la courbe des frquences cumules croissantes est obtenue en joignant, dans un
systme d'axes orthogonaux, les points d'abscisse b
i
(extrmit de la classe n : i) et
d'ordonne F
i
(frquence cumule croissante correspondante) [Remarque : Joindre les points
de coordonnes (b
i
, F
i
) par des segments revient faire lhypothse dune rpartition
uniforme des individus lintrieur des classes].
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
11
Figure 1-8 : Courbe des frquences cumules croissantes : Capacit Htelire en lits pour la
rgion de Sousse-Kairouan
Courbe des frquences cumules
croissantes
0,00
20,00
40,00
60,00
80,00
100,00
101 201 301 401 501 601
Capacit Htelire en lits
f
r

q
u
e
n
c
e
s
c
u
m
u
l

e
s
c
r
o
i
s
s
a
n
t
e
s
e
n
%
3.3 Graphiques spcialises
a) Pyramide des ges
Exemple : Pyramide des ges en Tunisie en 1994 :
La pyramide est une version particulire de l'histogramme, uti lis e pour repart ir une
popul ati on en foncti on de l ge (va ri abl e quant ita tive continue) et du sexe des
indivi dus (variable quali tat ive secondaire).
Le graphi que se prsente comme un histogramme double, les valeur s de la va ri ab le
pr in ci pa le ( l g e) t an t po rt e s sur l' ax e ve rt ic al .
Fi gu re 1-9 : Py ra mi de de s g es (e n%) 19 94
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
12
b) Diagramme cartographique (ou cartogramme)
Lors qu'une tude stat ist ique concerne des donnes gographiques, les indivi dus ou les
modalit s de la variabl e tudie sont des units spatial es (des rgions par exemple).
On petit alors utili ser une carte pour visualiser les valeurs associes a un caractre et a
une unit spatiale.
La population tudie est l'ensemble des gouver norats de la Tunisi e . La var iable
tudie est l'car t global en taux (L'car t global en taux, reprsent e ici le
dif fr ent iel de croiss ance de l'empl oi un gouver nor at donn et la nat ion tout e ent ir e
sur la pr iode 1984-1989. Un cart global pos iti f (ngat if) , signif ie que le taux de
croiss ance de l emploi du gouver nor at considr est supri eur (infer ieur), au taux do
croiss ance moyen au niveau nat iona l). Ell e est quanti tat ive continue. Une
dcomposi tion des val eur s de la var iable en 5 classes di ngale amplit ude condui t
la figure sui vante :
Figure 1-10 : Diagramme Car tographique
Ecart global en taux (Tr ) par gouver nor at (1984-1989)
Chapitre1 : Distribution Statistique une dimension I.H.E.T de Sidi Dhrif
Cours Statistique descriptive Mahmoud BABAY
13
c) Diagramme polaire
Ce diagramme (figure 1-10) est utilise lorsqu'on cherche comparer, pour une variable
donne, des observations relatives plusieurs sous populations (d'une mme population).
On suppose que la variable (qualitative ou quantitative) tudie prsente p modalits. Le plan
est divis en p secteurs dlimits par des axes associes aux diffrentes modalits de la
variable. On reporte sur chaque axe la valeur correspondant la modalit concerne ; la
distance du point l'origine est proportionnelle la valeur correspondante. Les points
correspondants une mme sous population peuvent tre joints (figure 1-10).
Les donnes du tableau prcisent le nombre de chmeurs selon la dure du chmage (en mois)
et le niveau d'instruction enregistres en 1997(Source : enqute national sur l'emploi, 1999).
Tableau: Nombre de chmeurs en Tunisie, enregistrs en 1997
Dure de
chmage
(en mois)
nant primaire secondaire suprieur total
[0,1[ 1880 5089 2453 138 9560
[1,3[ 12616 39895 16193 731 69435
[3,6[ 12108 43318 16346 1072 72844
[6,9[ 4002 19797 13263 1657 38719
[9,12[ 2112 8419 8582 1816 20929
[12,24[ 16224 93402 83346 11708 204680
Figure 1-10 : Diagramme Polaire

Anda mungkin juga menyukai