Professeurs :
Denis Dupré et Youssef Khoali
Conception : Denis Dupré, Sonia Jimenez et Mohamed Zouaoui – Abdoul Cissé (2009)
Statistiques élémentaires
Analyse bivariée
Éléments de probabilité
Estimation, intervalles de confiance
Sondages
Tests statistiques
La régression linéaire
2
Statistiques élémentaires
3
Statistiques descriptives
Utilisation:
Comptabilité, finance
Séries chronologiques sur des bilans ou comptes de résultats, gestion du capital,
trésorerie, opérations avec les banques
Production
Gestion des stocks, du matériel, contrôle de la qualité
Achats, ventes
Statistiques des ventes, études de marché.
4
Statistiques descriptives : Vocabulaire
Population
Ex: l’ensemble des entreprises aux EU
Échantillon
Ex: les entreprises recensées dans une base de données
Caractères
Qualitatifs
5
Statistiques élémentaires
Caractéristiques de dispersion
6
Statistiques à 1 caractère qualitatif
Les valeurs du caractère étudié (modalités) sont
qualitatives. On ne peut pas les mesurer ou les
ordonner.
Ex: caractère étudié : destination des voyages
Présentation des données: tableau par catégorie avec effectifs
7
Statistiques à 1 caractère quantitatif
Les valeurs du caractère étudié sont quantitatives. On peut les
ordonner, cumuler les fréquences, calculer des moyennes, etc.
Exemples:
Discret: Nombre de jours d’absence dans le service « Achats »
Continu: Les salaires des employés dans une entreprise
%
Classes Effectifs %
Nombre de Nombre cumulés
jours d’employés Fréquence: fi
Moins de 5000 30 30 30
d’absence concernés
5000 - 6000 32 16 46
0 5 19
6000 – 8000 22 22 68
1 8 30
2 6 22 8000 - 10000 11 11 79
3 3 11
4 2 7 10000 - 16000 5 15 94
5 1 4
Plus de 16000 3 6 100
6 2 7
8
Analyse des statistiques à un caractère:
Caractéristiques de tendance centrale
Le mode
Le mode d’une série statistique (Mo) est défini comme la
modalité de la variable correspondant à l’effectif le plus élevé.
La médiane
La médiane (Me) d’une série est une valeur de la variable telle
que 50% des individus présentent une modalité inférieure et
50% une modalité supérieure à Me.
La moyenne arithmétique
La moyenne arithmétique (X ) d’une série quantitative est
9
Caractéristiques de tendance centrale :
un exemple
Ex: Absentéisme dans Jours Nb.
Fréquences
Fréquences
absentéisme employés cumulées
le service Achats
Le mode
0 5 19 19
Le mode = 1
1 8 30 49
La médiane
Médiane= 2 2 6 22 71
La moyenne 3 3 11 82
arithmétique 4 2 7 89
Moyenne = 2
5 1 4 93
n n
X ni X i / ni
i 1 i 1 6 2 7 100
10
Quelle mesure de tendance retenir ?
Tout dépend de ce
qu’on veut étudier.
Nb. employés / jours d'absentéisme
Le mode: peu utilisé 9
Médiane: stable 8
7
Moyenne: informative 6
5
mais instable 4
3
2
1
0
0 1 2 3 4 5 6
11
Analyse des statistiques à un caractère:
Caractéristiques de dispersion
L’étendue: W = Xmax-Xmin
L’étendue, ou intervalle de variation d’une série statistique se définit,
uniquement pour des variables quantitatives, comme la différence entre
la plus grande et la plus petite des valeurs de la série.
12
Caractéristiques de dispersion (suite)
La variance
La variance notée V(X) est la moyenne
arithmétique des carrés des écarts à la moyenne.
n 2
n
n
V ( X ) ni X i X / ni f i ( X i X ) 2
i 1 i 1 i 1
n
V ( X ) fi X i 2 X 2
i 1
V (X )
13
Exercices d’application
14
Analyse bivariée
15
Statistiques relatives à deux caractères
quantitatifs
Exemple 1: couples de variables quantitatives
Entreprises A B C D E F
Résultat
120 180 280 400 600 800
d’expl.
Nb.
25 38 65 85 102 150
employés
16
Tendance centrale et dispersion de la série
Res. d'expl.
Tendance centrale:Pour chaque série
on peut calculer comme paramètre de 900
800
tendance centrale, les moyennes X 700
et Y . 600
500
400
300
200
100
Dispersion: pour chaque série, on peut 0
aussi mesurer la dispersion des 0 50 100 150 200
17
Ajustement linéaire
Il s’agit de trouver la droite (Y=aX+b) qui
s’ajuste au mieux au nuage de points Res. d'expl.
900
y = 5,6608x - 42,044
800
Solutions: R2 = 0,9756
700
a = Cov(X,Y)/Var(X) 600
b Y aX 500
400
300
200
18
Exemple 2: variables quantitatives regroupées en classes Mesure
du poids Y et de la taille X pour 100 individus
Y/X 145 155 165 175 185 195 T
À chaque individu est toujours associé un couple,
mais plusieurs individus peuvent être associés
au même couple de modalités 50 4 3 2 0 0 0 9
20
Éléments de probabilité
21
Événements: définition
22
Probabilités: définitions
Soit un univers et P() l’ensemble des parties de , c’est-à-dire
l’ensemble des événements que l’on peut définir à partir de . On
appelle probabilité sur , une application p de P() dans [0,1] qui
vérifie:
P()=1 (l’événement certain a une probabilité de 1)
Si A et B sont deux événements incompatibles alors
p(A U B)=p(A)+p(B)
Propriétés
Pour tout événement A, p(A) appartient à [0,1]
Événement impossible: p ( ) O
Événement contraire: p( A) 1 p( A)
Union d’événements quelconques: p( A B) p( A) p( B) p( A B)
23
Probabilités: propriétés (suite)
Intersection d’événements :
Événements indépendants: p( A B) p( A) p( B)
Si la réalisation de B dépend de celle de A (événements non
indépendants):
p( A B) p( A) p( B A)
Théorème de bayes
24
Exercice d’application
25
Variables aléatoires (v.a.)
Variable aléatoire
Définition: règle permettant d’associer à tout élément de , un
nombre réel. C’est une application de dans R, notée X.
Ex: on jette 2 dés et on appelle X la variable aléatoire égale à la somme
des points lus. X()={2,3,4,…12} avec ={(1,1),(1,2),…(2,1),…(6,6)}
Probabilité associée
P(X=2)=1/36 car c’est la probabilité de l’événement (1,1);
p(X=3)=p{(1,2),(2,1)} =2/36
Distribution de probabilité d’une v.a.
C’est l ’ensemble des probabilités associées aux différentes valeurs
possibles de X.
Fonction de répartition
C’est la fonction F(X)=p(X<x)
26
Espérance mathématique et variance
n
Espérance de X: E(X) = x p
i 1
i i
n
Variance de X: Var(X) = p X
i 1
i i E ( X ) ²
Var(X) = E(X2)-E(X)2
27
Exercice d’application
28
Lois discrètes
Les réalisations de la variable aléatoire (X) sont discrètes.
Loi de probabilité: f(xi) = pi = probabilité de réalisation de xi
Fonction de répartition: F(xi) = P(Xxi)
Exemple de loi discrète: nombre de points lus sur deux dés
après un jet
Loi de probabilité
Fonction de répartition F(x)
0,18
1,20
0,16
0,14 1,00
0,12 0,80
0,10
0,60
0,08
0,06 0,40
0,04 0,20
0,02
0,00
0,00 2 3 4 5 6 7 8 9 10 11 12
2 3 4 5 6 7 8 9 10 11 12
29
Exemple
Loi de probabilité Fonction de répartition F(x)
0,18 1,20
0,16
1,00
0,14
0,12 0,80
0,10
0,60
0,08
0,06 0,40
0,04
0,20
0,02
0,00 0,00
2 3 4 5 6 7 8 9 10 11 12 2 3 4 5 6 7 8 9 10 11 12
30
Exemple de loi discrète: Loi binomiale
Définition
Si X suit une loi B(n, p), alors:
X ={1, …, n};
P(X=k) = Cnkpk(1-p)n-k
Propriétés: E(X) = n*p; Var(X) = n*p*q
Utilisation: Evénements indépendants, qui se répètent et
qui ont deux issues possibles (succès et échec).
Exemple
Une entreprise finance 12 forages. Probabilité de trouver du
pétrole après un forage = 20%. Pour éviter la banqueroute, il faut
qu’au moins trois puits donnent du pétrole. Quelle est la
probabilité de faillite?
Réponse: C100.200.812 + C1210.210.811 + C1220.220.810
31
Exercice d’application
32
Lois continues
Les réalisations de la variable aléatoire (X) sont
continues
L’événement X = X0 n’a pas de sens
En revanche, l’événement « X appartient à l’intervalle [X0-;
X0+] » a un sens
X est caractérisée par :
La loi de probabilité f(x) : associe à chaque réalisation xi une
valeur f(xi) appelée densité de probabilité
La fonction de répartition F(x) : représente une fonction F(x)
telle que Proba (xi < X < xk) = F(xj) – F(xk). On a : F’(x) = f(x)
33
Fonction de densité et de répartition d’une
loi continue
34
Principales lois continues
Loi Normale
Loi de Student
Loi de Fisher
35
La loi normale générale
1 2
X prend toute valeur réelle et la densité est f(X) = e
2
Utilisation
Modélisation de la plupart des phénomènes qui résultent
d’un grand nombre (>30) de ressources de variations
indépendantes
Estimations et tests pour des échantillons dont la
population est grande
Propriétés
E(X) = m, Var(X) = 2, Ecart-type =
36
Propriétés
37
Masses de probabilités de la loi normale
générale
38
Loi normale centrée réduite: illustration
39
40
La loi normale : Exemple
41
Exercices d’application
42
Loi du Khi deux
Définition
La loi du Khi deux à n degrés de liberté est la loi suivie par la somme
des carrés de n variables aléatoires normales centrées réduites,
indépendantes.
n
Y X Y i
2
2
n
i 1
Utilisation
Analyse de la qualité (contexte industriel)
Tests (moyennes, variances)
Propriétés
Espérance: E(Y) = n
Variance: Var(Y) = 2n
43
Loi de Student
Définition
La loi de Student à n degrés de
liberté est la loi suivie par le rapport
entre une variable normale et la
racine d’une loi de Khi deux à n
degrés de liberté divisée par n.
Utilisation Si X N (0,1) et Y 2 n alors
Pour des faibles échantillons ou X
quand la variance de la population T= tn
n’est pas connue Y
Estimation et tests de moyennes
(comparaison, conformité) n
Estimation et tests de coefficients de
régression
Propriétés
Espérance: E(T) = 0
Variance: Var(T) = n/n-2 pour n>2
44
Loi de Student
45
Loi de Student: Exemple
46
Loi de Fisher
Définition
La loi de Fisher à n et n’ degrés
de liberté est la loi suivie par le
rapport entre deux variables
suivant des lois du Khi deux à n
et resp. n’ degrés de liberté,
Si Z 2 n et Z' 2 n ' alors
chacune étant divisée par le Z /n
nombre de degrés de liberté. F= Fn ,n '
Utilisation Z '/ n '
Estimation et tests de variance
(comparaison, conformité)
Estimation de la significativité
d’un modèle
Analyse de la variance
47
Fonction densité de la loi de Fisher pour
différents degrés de liberté
48
Loi de Fisher: Exemple
49
Théorèmes de convergence
50