Anda di halaman 1dari 13

51-601-96 Statistique Automne 1999

EXAMEN FINAL

Professeurs : François Bellavance et Jean-Claude Lebrun

Problème 1. (12 points)

Un sondage « SOM La Presse » a été réalisé auprès de 505 Montréalais du 18 au 25 octobre 1999 pour
connaître le niveau de satisfaction des citoyens sur l’administration du maire Pierre Bourque ainsi que
leur opinion sur le projet « une île, une ville ». À la question, « Le maire Bourque exerce présentement
son deuxième mandat. Diriez-vous que vous lui faites plus, autant ou moins confiance actuellement
qu’au cours de son premier mandat ? », les résultats suivants ont été obtenus :

Langue maternelle Réponse à la question


Plus confiance Autant confiance Moins confiance
Français 32 156 118
Anglais (ou autre) 40 50 59

Note : 50 personnes (18 francophones et 32 anglophones ou autre) ne savaient pas ou n’ont pas
répondu à la question et n’ont donc pas été comptabilisées dans ce tableau.

Questions :

a. Est-ce qu’il y a une différence significative entre le niveau de confiance accordé au maire par les
citoyens Montréalais francophones comparativement aux anglophones (ou autres)? Utilisez le
niveau =5% et vérifiez au moins 3 FOIS qu’il n’y a pas d’erreur dans la transcription des données
dans EXCEL ou MINITAB!!!! (2 points)

b. Si vous avez observé un lien significatif, décrivez brièvement ce lien. Si vous n’avez pas observé
de lien significatif, décrivez brièvement pourquoi. (4 points)

51-601-96 Examen final – janvier 2000 1


Lors du même sondage, à la question, « Si un référendum se tenait sur l’île de Montréal, voteriez-vous
oui on non à la question suivante : voulez-vous que les 29 municipalités de l’île de Montréal soient
remplacées par une seule ville, c’est-à-dire une île, une ville? », les résultats suivants ont été obtenus :

Langue maternelle Réponse à la question


Oui Non
Français 161 145
Anglais (ou autre) 64 102

Note : 33 personnes (18 francophones et 15 anglophones ou autres) ne savaient pas ou n’ont pas
répondu à la question et n’ont donc pas été comptabilisées dans ce tableau.

Nous voulons vérifier l’hypothèse que la proportion de Montréalais francophones en faveur du projet
« une île, une ville » est différente de la proportion de Montréalais anglophones (ou autres) .

Questions :

c. Formulez les hypothèses pour ce problème.(1 point)

d. Quelles sont les proportions de Montréalais francophones en faveur du projet « une île, une ville »
et de Montréalais anglophones (ou autres) en faveur dans l’échantillon? (1 point)

e. Obtenez le « p-value » pour le test des hypothèses formulées en c) et donnez votre conclusion au
niveau  =5 %? (4 points)

51-601-96 Examen final – janvier 2000 2


Les problèmes 2 à 5 portent sur le fichier de données EXCEL « jan2000.xls ».
Avant d’utiliser ce fichier pour répondre aux questions, assurez-vous d’avoir au
moins une copie de ce fichier sous un autre nom ou dans un autre répertoire sur
votre disque dur.

Description du contexte et du fichier de données :

Une entreprise de « chasseur de têtes » offre ses services pour recruter à l’interne ou à l’externe les
meilleurs gestionnaires. Plusieurs prétendent dans le milieu des affaires que les gestionnaires engagés à
l’externe obtiennent de meilleures performances que les gestionnaires recrutés à l’interne.

Une équipe de chercheurs a demandé à 150 gestionnaires choisis aléatoirement aux Etats-Unis de
participer à une petite étude afin de vérifier cette prétention du milieu des affaires. L’échantillon a été
obtenu à l’aide d’un tirage aléatoire simple avec un taux de participation de 91%. Une comparaison de
quelques caractéristiques démographiques entre les participants et les non participants n’a pas révélé de
différence importante entre ces deux groupes. C’est donc dire que l’échantillon obtenu n’est fort
probablement pas biaisé.

Le fichier « jan2000.xls » contient les données recueillies pour chacun des 150 gestionnaires
participant (source : Foster D.P. et al. Business Analysis Using Regression. A Casebook . Springer-
Verlag, New York, 1998). Voici le contenu détaillé du fichier et la description des variables mesurées:

Colonne Nom de la variable Description


A Id Numéro anonyme d’identification des participants (1 à 150)
B Performance Score de performance évalué par l’équipe de chercheurs
Salaire annuel du gestionnaire en milliers de dollars U.S.
C Salaire (Notez qu’un salaire plus élevé est un indicateur d’un poste de
gestionnaire de niveau plus élevé dans l’entreprise, c’est-à-dire plus
près de la haute direction.)
D Années Années d’expérience du gestionnaire
E Ext-Int Variable indiquant l’origine du gestionnaire: 1=Externe et 0=Interne
F Origine Même variable que colonne F, mais non codée numériquement
G Perf-Ext Score de performance des gestionnaires recrutés à l’externe
H Perf-Int Score de performance des gestionnaires recrutés à l’interne
I Salaire-Ext Salaire annuel des gestionnaires recrutés à l’externe
J Salaire-Int Salaire annuel des gestionnaires recrutés à l’interne

Notez que les données dans les colonnes G et H sont les mêmes que dans la colonne B, mais
regroupées par l’origine du gestionnaire. De même, les données dans les colonnes I et J sont les
mêmes que dans la colonne C, mais regroupées par l’origine du gestionnaire.

51-601-96 Examen final – janvier 2000 3


Problème 2. (10 points)

Questions :

a. À l’aide de EXCEL (ou MINITAB) obtenez le minimum, le maximum, la moyenne et l’écart-type


des salaires des 150 gestionnaires de l’échantillon? (4 points)

Minimum :

Maximum :

Moyenne :

Écart-type :

b. À l’aide de EXCEL (ou MINITAB), obtenez l’intervalle de confiance au niveau 95% pour la
moyenne des salaires des gestionnaires aux Etats-Unis et donnez brièvement l’interprétation de cet
intervalle. (4 points)

c. À partir de l’intervalle de confiance pour la moyenne des salaires trouvé en b), dites si le « p-
value » pour confronter les hypothèses H0 :  = 70 vs H1 :   70 , où  représente la vraie
moyenne des salaires en milliers de dollars U.S. des gestionnaires aux Etats-Unis, serait supérieure,
inférieure ou égale à 5%. Justifiez brièvement votre réponse. (2 points)

51-601-96 Examen final – janvier 2000 4


Problème 3. (15 points)

Questions :

Malgré que plusieurs prétendent dans le milieu des affaires que les gestionnaires engagés de l’externe
obtiennent de meilleures performances, nous croyons que la proportion de ces gestionnaires recrutés à
l’externe aux Etats-Unis est inférieure à 50%. Nous voulons donc vérifier, à partir de notre échantillon,
cette dernière affirmation: la proportion de gestionnaires recrutés à l’externe aux Etats-Unis est
inférieure à 50%.

a. Formulez précisément les hypothèses H0 et H1 que l’on veut confronter dans ce problème. (1 point)

b. Quelle est la proportion de gestionnaires recrutés à l’externe dans l’échantillon ? (2 points)

c. À l’aide de EXCEL (ou MINITAB), obtenez le p-value correspondant à vos hypothèses formulées
en a) et donnez votre conclusion au niveau =5% ? (3 points)

d. À l’aide de EXCEL (ou MINITAB), obtenez l’intervalle de confiance au niveau 95% pour la
proportion de gestionnaires recrutés à l’externe aux Etats-Unis et donnez brièvement
l’interprétation de cet intervalle. (4 points)

51-601-96 Examen final – janvier 2000 5


e. Est-ce que vous auriez pu vérifier les hypothèses formulées en a) si, au lieu d’avoir pris un
échantillon aléatoire simple, l’équipe de chercheurs avaient utilisé un plan d’échantillonnage
stratifié avec comme première strate les gestionnaires recrutés à l’externe et comme deuxième
strate les gestionnaires recrutés à l’interne? Justifiez brièvement votre réponse. (5 points)

Problème 4. (8 points)

Questions :

a. Quelles sont les moyennes et les écarts-types du score de performance pour les groupes de
gestionnaires recrutés à l’externe et à l’interne respectivement ? (4 points)

Externe  moyenne de performance: écart-type :

Interne  moyenne de performance: écart-type :

b. Nous sommes maintenant intéressés à vérifier l’hypothèse qu’en moyenne les gestionnaires
engagés à l’externe obtiennent des scores de performance plus élevés que les gestionnaires recrutés
à l’interne. Préalablement, nous avons effectué un test sur les variances afin de prendre le bon test
statistique pour comparer les moyennes. Nous avons obtenu les résultats suivants pour le test sur
les variances:

H0 : variances égales H1 : variances inégales p-value = 0,309.

En utilisant EXCEL (ou MINITAB), trouver le seuil expérimental (p-value) correspondant à


l’hypothèse sur les moyennes que nous voulons vérifier ici et commentez brièvement les résultats
en considérant un niveau =5% . (4 points)

51-601-96 Examen final – janvier 2000 6


51-601-96 Examen final – janvier 2000 7
Problème 5. (15 points)

Avant d’entreprendre une analyse de régression linéaire multiple, il est important d’examiner les
diagrammes de dispersion entre toutes les variables ainsi que les coefficients de corrélation.

9,5 9,5

8,5 8,5

7,5 7,5
Performance

Performance
6,5 6,5

5,5 5,5

4,5 4,5

3,5 3,5

2,5 2,5

1,5 1,5
45 55 65 75 85 95 105 0 10 20

Salaire Années

9,5 105

8,5
95
7,5
85
Performance

6,5
Salaire

5,5 75

4,5
65
3,5
55
2,5

1,5 45
Externe Interne 0 10 20

Origine Années

105
20
95

85
Années
Salaire

75 10

65

55

0
45
Externe Interne Externe Interne

Origine Origine

Correlations (Pearson)
P-Value

Performance Salaire
Salaire 0,684
0,000

Années 0,068 -0,323


0,410 0,000

51-601-96 Examen final – janvier 2000 8


Afin de mieux analyser et comprendre cet ensemble de données et les relations entre les variables, il
est également intéressant d’examiner les diagrammes de dispersion entre la performance, le salaire et
les années d’expérience en identifiant sur les diagrammes de dispersion les deux groupes de
gestionnaires. Les coefficients de corrélation de Pearson entre ces variables ont également été calculés
séparément pour chacun des deux groupes.

9,5 9,5
Externe Externe
8,5 Interne 8,5 Interne

7,5 7,5
Performance

Performance
6,5 6,5

5,5 5,5

4,5 4,5

3,5 3,5

2,5 2,5

1,5 1,5
45 55 65 75 85 95 105 0 10 20

Salaire Années

105
Externe
Interne
95

85
Salaire

75

65

55

45
0 10 20

Années

Gestionnaires recrutés à l’externe Gestionnaires recrutés à l’interne

Correlations (Pearson) Correlations (Pearson)


P-Value P-Value
Performance Salaire Performance Salaire
Salaire 0,736 Salaire 0,642
0,000 0,000

Années 0,150 -0,174 Années 0,276 -0,014


0,245 0,175 0,009 0,899

51-601-96 Examen final – janvier 2000 9


Questions :

a. Selon les graphiques et les coefficients de corrélation de Pearson, on constate que pour l’ensemble
des gestionnaires il y a une relation linéaire négative qui est significative entre le salaire et le
nombre d’années d’expérience (r = -0,323). Comment pouvez-vous expliquer cette relation
quelque peu inattendue à première vue? (5 points)

À l’aide du logiciel SAS nous avons obtenu un résumé des caractéristiques de tous les modèles de
régression linéaire multiple. Les résultats sont les suivants :

N = 150 Regression Models for Dependent Variable: Performance

Number in R-square Adjusted C(p) Variables in Model


Model R-square

1 0.46737553 0.46377672 30.84091 SALAIRE


1 0.05674645 0.05037311 167.17715 EXT-INT
1 0.00458214 -.00214366 184.49664 ANNÉES
----------------------------------------------------
2 0.56021507 0.55423160 2.01651 SALAIRE ANNÉES
2 0.48849467 0.48153541 25.82897 SALAIRE EXT-INT
2 0.11058043 0.09847948 151.30330 ANNÉES EXT-INT
------------------------------------------------------------
3 0.56026479 0.55122914 4.00000 SALAIRE ANNÉES EXT-INT
--------------------------------------------------------------------

Questions :

b. Parmi les différents modèles de régression linéaire simple et multiple, quel est celui qui vous
semble le meilleur et pourquoi ? (4 points)

51-601-96 Examen final – janvier 2000 10


c. Obtenez à l’aide de EXCEL (ou MINITAB) la droite de régression linéaire du meilleur modèle
trouvé en b) et interprétez brièvement les coefficients de ce modèle ainsi que le coefficient de
détermination au carré. (6 points)

51-601-96 Examen final – janvier 2000 11


Solutions :

Problème 1.

a) Tableau croisé 2x3. Oui il y a une différence significative puisque le p-value = 0,000007 < 0,05.
Donc, on rejette l’hypothèse H0 : il n’y a pas de lien entre le niveau de confiance accordé au maire
par les citoyens Montréalais francophones comparativement aux anglophones (ou autres). (Le
coefficient de Cramer = 0,2288)

b) La proportion des Montréalais qui font moins confiance au maire est similaire pour les
francophones et les anglophones (38,56% et 39,60% respectivement). Cependant, les Montréalais
francophones font plus confiance au maire dans une proportion de seulement 10,46%
comparativement à 26,85% pour les Montréalais anglophones. D’un autre côté la proportion des
Montréalais qui font autant confiance au maire est de 50,98% pour les francophones et de 33,56%
pour les anglophones.

c) H0 : pfrancophones = panglophones vs H1 : pfrancophones  panglophones .

161 64
d) p francophones   52,61% p anglophones   38,55%
306 166

e) p-value = 0,0035 <  = 0,05. Par conséquent, on rejette l’hypothèse H0 . Donc, la proportion de
Montréalais francophones en faveur du projet « une île, une ville » est significativement différente
de la proportion de Montréalais anglophones (ou autres) en faveur du projet.

Problème 2.

a) Minimum = 48, Maximum = 103, Moyenne = 71,63 et Écart type = 10,704

b) IC 95% (69,906 ; 73,360). En affirmant que la vraie moyenne des salaires des gestionnaires aux
Etats-Unis est entre 69 906$ et 73 360$, il n’y a que 5% de chances de se tromper.

c) Le p-value pour confronter ces hypothèses serait > 0,05 car 70 est inclus dans l’intervalle de
confiance au niveau 95%.

Problème 3.

a) H0 : pexterne  50% vs H1 : pexterne < 50%.

62
b) p externe   41,3%
150

c) p-value = 0,0169 <  = 0,05. Par conséquent, on rejette l’hypothèse H 0 . Donc, la proportion de
gestionnaires recrutés à l’externe est significativement inférieure à 50%.

d) IC 95% (33,45% ; 49,21%). En affirmant que la vraie proportion de gestionnaires recrutés à


l’externe est entre 33,45% et 49,21% , il n’y a que 5% de chances de se tromper.

51-601-96 Examen final – janvier 2000 12


e) Non. Dans le cas d’un échantillonnage stratifié où les deux strates sont les gestionnaires recrutés à
l’externe et à l’interne respectivement, les chercheurs déterminent à l’avance le nombre de
gestionnaires à échantillonner à l’externe et à l’interne et donc déterminent automatiquement le
pourcentage de gestionnaires recrutés à l’externe (et à l’interne) qu’il y aura dans l’échantillon au
total.

Problème 4.

a) Externe  moyenne de performance: 6,32 écart-type : 1,342


Interne  moyenne de performance: 5,60 écart-type : 1,518

b) H0 : externe  interne vs H1 : externe > interne . Test pour comparer deux moyennes avec variances
égales (car on ne rejette pas l’égalité des variances, p-value = 0,309 > 0,05): p-value = 0,001665 <
 = 0,05. Par conséquent, on rejette l’hypothèse H 0 . Donc, la moyenne des scores de performance
des gestionnaires engagés à l’externe est significativement plus élevée que la moyenne des scores
de performance des gestionnaires recrutés à l’interne.

Problème 5.

a) En analysant les diagrammes de dispersion, on observe que les « externes » ont en moyenne un
salaire plus élevé que les « internes » tout en ayant, en moyenne, moins d’années d’expérience.
D’ailleurs, lorsqu’on regarde la relation entre le salaire et les années d’expériences séparément
pour les « externes » et les « internes », le lien n’est plus significatif (externes : r = -0,174 p-value=
0,175 ; internes : r = -0,014 p-value = 0,899).

b) Le modèle avec salaire et années d’expérience. Comparativement aux autres modèles, ce modèle a
la plus grande valeur de R2 ajusté (55,4%) et la plus petite valeur de Cp (2,01).

c) Performance = -2,9206 + 0,1093 x salaire + 0,1215 x années d’expérience. R 2 = 56,02%, donc


56,02% de la variabilité observée dans les scores de performance des gestionnaires est expliquée
par les salaires et les années d’expérience. Selon le modèle, lorsque le salaire est plus élevé, le
score de performance est plus élevé. De même, lorsque le nombre d’années d’expérience est plus
élevé, le score de performance est plus élevé.

51-601-96 Examen final – janvier 2000 13