Anda di halaman 1dari 23

M. NEVEU Techniques d'enqute et Mthode de Sondage.

2005

Technique dEnqute et
Mthode de Sondage
Matthieu NEVEU
Licence dconomtrie
Anne 2004-2005

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Rfrences

Ouvrages gnraux

Echantillonnage

Beaud J. P. (1997). Lchantillonnage, in : Gauthier, op.cit.


Satin A., Shastry W (1983). Lchantillonnage : un guide non mathmatique. Statistique
Canada, Ottawa. 69 p.

Questionnaires

Brossier G et Dussaix AM (1999). Enqutes et Sondages. Dunod


Ardilly Pascal (1994). Les techniques de sondage.
Arkin Herbert (1963). Handbook of sampling for auditing and accounting.
Gouriroux C. (1981). La thorie des sondages, Economica.
Rea Louis (1992). Designing and conducting survey research : a comprehensive guide.
Till Y (2001). Thorie des sondages. Dunod

De Singly (2001). Lenqute et ses mthodes : le questionnaire. Nathan Universit. 127 p.


Gauthier (1997). Recherche sociale : de la problmatique la collecte des donnes. Presses de
lUniversit du Qubec. 529 p.
Sudman, Seymour, Bradburn, Norman (1987). Asking questions : a practical guide for
questionnaire design. Jossey -Bass, San Francisco. 397 p.

Manuels de statistiques

Bouget D., Vinot A. (1995). Traitement de linformation : statistiques et probabilits.


Melton J.S., Arnold C.J. Introduction to probability and statistics, Mc Graw-Hill, International
Edition.
Wonnacott R. et Wonnacott T. (1999). Statistiques. Economica.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Introduction

Champ dexercice des sondages :

Enqutes sur les intentions de vote, baromtres et ctes de popularit, mesures


daudience
Information conomique et sociale (dmographie, conditions de vie, emploi,
consommation, sant, ducation, transports, loisirs, logement, prix).
Contrle des comptes : Conseil Suprieur de lordre des experts comptables et
comptables agrs.
Contrle de qualit : fabrication et rception de produits industriels.

Acteurs

CNIS (Conseil National de lInformation Statistique)


INSEE (secrtariat du CNIS)
Organismes publics et para-publics mnent un grand nombre dtudes et de
recherches.
Entreprises prives : tudes de march, analyses de clientle, activits de conseil,
sondages politiques et tudes dopinion : Nielsen, SECODIP (panels), BVA, IFOP,
IPSOS, ISL, SOFRES, Mdiamtrie (audience des mdias), CESP (tude des supports
publicitaires)

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Introduction

LEnqute

Est une recherche dinformation.

Le Recensement

Est une collecte dinformation sur la totalit des personnes


concernes par lenqute.

Lchantillonnage

Est une opration consistant slectionner une fraction dune


population plus vaste.

- Dfinition -

Sondages ou Tests

Reprsentativit de lchantillon

Lanalyse Statistique et lanalyse conomtrique

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Introduction

- Dfinition -

Avant tout travail, pensez dfinir :

Le champs de lenqute

Les units dobservations (ou individus)

Lunit dchantillonnage

La base dchantillonnage ou la base de sondage

Lchantillonnage

Variables dintrts

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Introduction

- Etapes de lEnqute par sondage -

Pertinence : sassurer que les informations recherches nexistent pas dj.

Rflexion gnrale et thorique sur le sujet : laboration


dhypothses qui seront confirmes ou infirmes par les observations
denqute.

Faisabilit : matriellement ralisable un cot raisonnable. Sassurer que


lenqute produira des informations statistiques de bonne qualit.

Conception gnrale de lenqute :

Dfinition des objectifs de lenqute


Dtermination de la taille de lchantillon selon budget et prcision
souhaite.
Dfinition dune technique de recueil de linformation
Dfinition simultane de la mthode dchantillonnage.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Introduction

Rdaction du questionnaire :

Premire rdaction en utilisant, si possible, les rsultats dtudes


exploratoires ou qualitatives pralables.
Pr-test du questionnaire
Rdaction dfinitive incluant le pr-codage

Administration du questionnaire :

- Etapes de lEnqute par sondage -

Runion dinformation des enquteurs


Administration des questionnaires sur le terrain.
Contrle de la qualit du travail des enquteurs.

Traitement et analyse des donnes :

Vrification de lexhaustivit et de la vraisemblance des informations.


Reprage de valeurs aberrantes (apurement).
Codage de certaines variables (age, profession, ducation).
Saisie informatique des questionnaires.
Traitement par logiciels spcialiss de traitement de donnes.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Introduction

Lchantillonnage : une succession dtapes

Dfinition de lunit et du cadre dchantillonnage


Dtermination de la base dchantillonnage
Mthodes dchantillonnage
Mthode Probabiliste

SAS, Sondage stratifi, sondage


en grappe, sondage complexe

Calcul de la
taille de
lchantillon

Mthode non-Probabiliste

Echantillon de convenance, boule de


neige squentielle, mthode des quotas

Mthode de recueil
Rdaction du questionnaire
Administration du questionnaire
Traitement et analyse des donnes

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

Introduction - Mthode dEchantillonnage Mthode alatoire ou probabiliste

Le
La
Le
Le

sondage alatoire simple


stratification
sondage par grappes
sondage plusieurs degrs

Mthodes empiriques ou choix raisonn

Absence de base de sondage.


Mthode des units types
Mthode des quotas

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

Partie de la thorie des sondages qui sappuie sur la thorie des probabilits

quiprobabilit des alternatives

Le problme du tirage au hasard

Logique daffinit : risque que les units dchantillonnage suivent une logique
daffinit.
Biais de slection : ce biais est li la population de rfrence.

Lorsque les conditions sont runies, il est possible dengager un processus


dchantillonnage probabiliste, dont lavantage essentiel est de pouvoir tre
valu rigoureusement.

Le modle fondamental le plus simple est celui du sondage alatoire simple

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS)

Modle de rfrence, modle le plus simple

Procdure de tirage alatoire dune fraction de la population. Tous les


chantillons sont possibles avec la mme probabilit.

Echantillon avec remise (peu rpandu en pratique).


Echantillon sans remise.

Tirages avec remise : Risque dinterroger plusieurs fois la mme personne au lieu
dunits diffrentes.

Equiprobabilit : tous les individus ont la mme probabilit (1/N) dtre choisis chaque tirage.
Probabilit que lindividu ne soit pas choisi au cours dun tirage est 1 - 1/N.
Probabilit
quil
ne
figure
pas
dans
lchantillon
est
:
er
me
ime
Pr ({ non choisi au 1 tirage} { non choisi au 2
tirage} { non choisi au n
tirage}).
Tout individu a la mme probabilit de figurer dans lchantillon. Lorsque N est grand, cette
probabilit est peu diffrente du taux de sondage n/N.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS)

Tirages sans remise : variables alatoires non indpendantes.

Probabilit que lindividu ( = 1 N) appartienne lchantillon avant le ime tirage (i = 1


n) :

Probabilit que lindividu soit choisi au ime tirage est gale au produit de la probabilit quil
ne lait pas t avant par la probabilit quil le soit ce ime tirage : 1/N
A chaque tirage, un individu a donc la mme probabilit 1/N dtre choisi. La probabilit quil
figure dans lchantillon est :

i - 1 individus ont t tirs


N (i-1) individus peuvent encore tre tirs au cours du ime choix.
Probabilit que lindividu nait pas t dsign au cours des i-1 premiers tirages, donc quil figure parmi les
N-1 restants : (N-i+1)/N
Probabilit que lindividu soit tir au ime choix, sachant quil ne la pas t avant : 1/(N-i+1)

Pr ({ choisi au 1er tirage} U { choisi au 2me tirage} U { choisi au nime tirage})

Les vnements { choisi au ime tirage} tant incompatibles, cette probabilit est gale la
somme des probabilits { choisi au ime tirage}, soit n/N.

Le sondage sans remise est donc reprsentatif puisque chaque individu de la


population peut figurer dans lchantillon avec la mme probabilit connue n/N.

Si le taux de sondage f=n/N est infrieur 0.05 (0.10 selon la prcision souhaite),
lchantillon sans remise peut tre assimil un chantillon avec remise.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS)

Le sondage, cest lobservation de lun de ces chantillons.

Cette situation ne reflte que rarement la ralit. Dans la pratique, on essaie de


restreindre le nombre de combinaisons en vitant celles qui seraient a priori non
souhaitables.

Le SAS fournit un cadre de rfrence indispensable pour deux raisons :

Jugement des autres modles dchantillonnage par rapport ses proprits. Il sert, en
quelque sorte, dtalon.
Il constitue la brique lmentaire. Ex. : les sondages stratifis et les sondages deux
degrs sont des assemblages de sondages simples

Il est donc important den connatre parfaitement toutes les proprits.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS)

Exercices : Estimation dune moyenne


Clients dune socit bancaire.
Lancement dun nouveau produit financier.
Variables dintrt : caractristiques de la clientle, ses motivations et ses ractions ventuelles.
Fichier de N titulaires de comptes.
Sondage sur un chantillon de n comptes parmi les N.

Hypothses :

N = 5 titulaires de comptes.

Echantillon de n = 2.

Dpts sur ces comptes sont : 13, 15, 17, 25 et 30 milliers deuros. La somme vaut 100 000 .

Lorganisme charg de lenqute ignore ces montants et se fixe pour objectif dvaluer leur moyenne partir
des deux valeurs quil constatera sur lchantillon.

Soient :
y1 et y2 les valeurs observes et

y1 y2
2

leur moyenne empirique qui est une variable alatoire qui dpend de lchantillonnage

Questions :

Recenser les situations possibles dans le cas o lchantillon est constitu dunits distinctes ( sans remise ).

Calculer la moyenne y des 10 valeurs possibles (chantillons) et la moyenne Ydes 5 valeurs des comptes (base de
sondage).

Evaluer la dispersion des individus au sein de la population.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS) La prcision dpend de 3 lments :

la taille n de lchantillon : plus lchantillon est grand, plus lestimation est


prcise.

La variance de la variable dintrt : plus une population est homogne


(variance faible), plus le sondage est efficace.
Si tous les individus sont caractriss par des valeurs Yi identiques, un seul
suffit les reprsenter. A linverse, sonder dans une population trs htrogne
ncessite des chantillons de taille importante, ou un dcoupage pralable en
sous populations homognes (principe de stratification).

Le taux de sondage f (=n/N) : si le taux de sondage est gal 1, lchantillon


est la population entire et il ny a plus derreur. Mais, dans la trs grande
majorit des sondages, les taux de sondage sont trs faibles.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS) Moyenne, variance, erreur type :


n

ni yi
n
i 1

La moyenne : y 1

La variance : 1 ni(yi y)
n i 1

La variance corrige :

S n
n1
N

Lerreur type :

v(y) 1 Ni( Yi Y )
N i 1

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS) Intervalle de confiance :

Pour estimer Y , on procde comme suit :

Daprs la table de Gauss, 95% des valeurs possibles pour y se situent une
distance infrieure 1,96. V(y) , soit environ moins de 2 erreurs-type deY
Ayant obtenu la valeur de y par lchantillon, on en dduit un intervalle
contenant le paramtre Y , avec une probabilit de 95% :

Y y1,96 V(y), y1,96 V(y)

Lintervalle de confiance 90% sobtient en remplaant 1.96 par 1.65, et dans


lintervalle de confiance 99% par 2.58 (coefficients dtermins par la loi de
Gauss).
Lintervalle de confiance vritable fait intervenir la quantit V(y) qui dpend de
et nest donc pas calculable. Dans la pratique, il doit tre valu partir de
lchantillon observ. La variance peut tre estime par la variance corrige
n
des donnes recueillies :
1
s
(yi y)
n 1
i 1
s

Do, une estimation de V(y) par V(y) n

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS)

Estimation dune proportion

Une proportion est un cas particulier de moyenne.


Construisons la variable qui, lindividu i, fait correspondre la valeur Yi suivante :

La proportion P recherche nest autre que la moyenne des Yi . On peut donc


mettre en uvre les techniques exposes prcdemment.
Les calculs prennent une forme particulirement simple:

Yi = si le client i a lintention de souscrire au produit.


Yi = 0 sinon.

si on note Q=1-P, alors la variance des Yi est gale : =P-P= (1-P)P=QP.

Les oprations destimation de P sont les suivantes :

lestimateur ponctuel de P est la proportion p observe sur lchantillon.


lintervalle de confiance 95% scrit :
P p1.96 (1 f) s , p 1.96 (1 f) s
n
n

Ou de faon approche : P p2 qp , p 2 qp
n
n

Avec q = 1-p

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS) Estimation dune proportion

La prcision absolue (PA) : 2qp. Daprs lchantillon, lestimation de P se fait plus ou


moins 2qp points.

La prcision relative (PR) vaut PA/p. Cela signifie que la marge dincertitude est de lordre
de PR de la quantit value.

Dans notre exemple,

La fourchette des rsultats possibles pour P reprsente par cet intervalle de confiance est
plus ou moins large et correspond une estimation peu prcise.

Cest la taille de lchantillon qui est en cause : lintervalle de confiance est construit daprs
lcart-type, elle-mme fonction de n comme on la vu.

En consquence, pour diviser par deux la largeur de lintervalle de confiance, il aurait fallu un
chantillon de n = 800 clients au lieu de 200. Pour diviser encore par deux la fourchette, il aurait
fallu n = 3200 interrogs

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS) La taille de lchantillon

A partir de combien dlments un chantillon est-il valable ?

Si la question est ainsi pose, il ny a pas de rponse directe. Cela dpend de la contrainte de
budget plus ou moins forte.

Soit C est le budget maximum allou lenqute et c est le cot unitaire de sondage, la taille
maximale possible est : C/c.

Mais, cette taille peut tre insuffisante pour assurer des rsultats suffisamment fiables. La
question qui se pose alors est :

Quel budget faudrait-il consacrer pour garantir une prcision acceptable ? .

Mme dans ces termes, il ny a pas de rponses toute faite. Il faut dabord dfinir ce quon entend par prcision
acceptable.
On peut convenir dun cartement maximum tolr de lintervalle de confiance, i.e. fixer une borne la prcision
absolue
S

2 (1 f)

Ou bien fixer une borne la prcision relative

2
y n

La difficult tient dans le fait quil faut avoir a priori une ide de lordre de grandeur des
quantits qui doivent intervenir et de leur variance.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS)

Il faut tenter dobtenir linformation utile.

On connat les rsultats dune enqute similaire ralise dans un pass pas trop
loign, ses rsultats peuvent permettre de calibrer lenqute actuelle.

Il y a, dans la base de sondage, des informations dtailles relatives une variable Z bien
corrle avec la variable Y de lenqute.

On ralise lenqute en deux phases : on prlve un premier chantillon pour valuer


grossirement Y et , et on en dduit une taille souhaitable pour lchantillon vritable.

Ces situations ne sont pas exhaustives. Elles illustrent le 1er devoir de tout sondeur :
Mobiliser toute linformation disponible a priori
et pertinente au regard de lenqute quil doit effectuer.

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS) Hypothse fondamentale du SAS :

Toutes les combinaisons de n lments parmi les N de la population sont ralisables avec la mme
probabilit. Chaque lment a la mme chance que les autres dtre slectionn. Il faut toujours
sassurer que cette condition est bien vrifie sous peine dutiliser un formulaire inadquat.

Lexemple des sondages sur place (enqute ralises la sortie des muses, de spectacles,
de centres commerciaux) montre que ce nest pas toujours chose aise :

Sil y a des variations daffluence, et si le rythme des interviews est constant, on ne peut plus parler de sondages avec
probabilits gales.
Si pendant la priode A laffluence est le double de celle de la priode B :
Les personnes prsentes en A ont deux fois moins de chance dtre interviewes quen B, sauf si, par exemple, on
double le nombre denquteurs en A.
Cela ne veut pas dire que le sondage soit mauvais, mais il faut traiter les observations de faon diffrente par des
pondrations adquates.

Il est parfaitement lgitime (et souvent souhaitable) de raliser des sondages avec des probabilits
dinclusion ingales selon les individus de la population.

Mais, le traitement des rsultats doit en tenir compte et ce nest pas celui du SAS (Attention donc au
maniement sans prcaution des logiciels de dpouillement denqute !).

M. NEVEU Techniques d'enqute et Mthode de Sondage. 2005

LApproche Probabiliste

- le Sondage Alatoire Simple (SAS)

Mthodes concrtes de ralisation, lorsque la base de sondage est constitue par un fichier dont
les units sont identifies par un numro de 1 N.

Le tirage systmatique (mthode encore plus simple et trs largement utilise) :

numroter les units de 1 N.


calculer le pas de sondage k = N / n.
choisir au hasard un dpart d entier compris entre 1 et k.
lchantillon est form des units identifies par les numros les plus proches de d, d+k, d+2.k, , d+(n-1).k

La simplicit du tirage systmatique fait son succs. Mais, ncessit de vigilance sur ses
proprits :

Tables de nombres au hasard.


Fonctions disponibles sur les ordinateurs et machines calculer ( random ) gnrant des nombres entre 0 et 1.

Si le rangement des units dans le fichier est indpendant de la variable dintrt, la mthode des tirages
systmatiques est un SAS.
Si les units sont tires selon un ordre corrl avec la variable dintrt : stratification implicite. Le rsultat peut
tre meilleur quun SAS au sens strict.
Si priodicit dans le fichier et si le pas des tirages est gal la priode (ou un multiple) : possibilit de
slectionner des individus trs particuliers.

En pratique :

Le SAS nest jamais utilis seul.


Il ne suppose quune seule chose, mais essentielle : lexistence dune base de sondage.
La stratification est la premire mthode quil doit mettre en uvre.

Anda mungkin juga menyukai