Anda di halaman 1dari 24

Mesures de dispersion

Dr Brulet

Rappel
Les mesures de tendance centrale (moyenne, mdiane et mode) sont utiles pour dcrire des distributions de frquence, mais ne donnent aucune indication quant la dispersion des observations qui ont la mme mesure de tendance centrale.

PLAN
I. Rappel II. Indices de dispersion III. Ltendue IV. Lcart type V. La Loi Normale

I. Rappel
Indices de position= moyenne, mdiane et mode
Moyenne Avantages Universellement rpandue et accpte Calcul facile Peu influence par les valeurs extremes Le choix de l'intervalle des classes agit peu sur sa valeur Bon indicateur pour les variables asymtriques N'est pas affect par les valeurs exceptionnelles Permet de reprsenter des populations htrognes qui prsentent plusieurs valeurs dominantes Inconvnients Fortement influence par les valeurs extremes Reprsente mal les valeurs d'une population heterogne ou asymetrique Se prte mal au clacul Ne reprsente que la valeur qui spare l'chantillon en deux parties de mme effectif sans tenir compte de l'ensemble des donnes Se prte mal aux calculs Varie beaucoup selon la lageur choisie pour les classes

Mdiane

Mode

II. Indices de dispertion


= variance, ecart type et tendue Pour la prise de dcisions concernant la prise en charge de maladies tropicales, comme dans beaucoup dautres applications de la sant publique, il est important de dfinir ce qui est normal . La loi dite normale de distribution des valeurs est un concept statistique qui dpend en grande partie de la distribution des attributs dans la population. Elle peut tre rsume par 2 mesures : ltendue lcart-type

II. Ltendue
Ltendue indique la distance entre la plus grande et la plus petite valeur observe dans la distribution. Exemple: Soit un jeu de 11 valeurs 3, 4, 4, 5, 6, 6, 6, 7, 7, 8, 10 ; ltendue de ces valeurs est de3 10. Elle peut galement tre exprime comme 10 - 3 = 7.

Ltendue est un concept facile comprendre et calculer. Elle ne donne nanmoins dinformations que sur les deux valeurs extrmes observes dans la distribution. Une valeur leve ou basse peut tre due une erreur de mesure, et la mesure de ltendue ne prend pas en compte la variabilit des observations entre les deux valeurs extrmes.

III. Lcart-type
Lcart-type est une mesure qui dcrit la dispersion des observations autour de la moyenne. Si toutes les observations avaient la mme valeur, lcart-type serait gal 0 ; plus les observations sont disperses autour de la moyenne, plus grand sera lcart-type. L o lcart-type dun chantillon est trs petit, chaque observation individuelle est trs proche de la moyenne de lchantillon ; un cart type lev indique linverse

Ecart type

Les tapes suivre pour calculer lcart-type selon cette formule sont les suivantes : Calculer la diffrence entre chaque observation et la moyenne (xi - x ) Porter chacune de ces diffrences au carr (xi - x)2 Additionner tous ces carrs et diviser la somme des carrs par le nombre dobservations moins 1 (n -1) Prendre la racine carre du rsultat obtenu.

Vous remarquerez que le dnominateur utilis est n - 1 plutt que n. En pratique, quand n est assez grand, il ny a pas de grande diffrence entre les deux. Nanmoins, pour des raisons thoriques, on prfrera utiliser n - 1.

Exemple: calculer lcart-type (SD) dun jeu de 11 valeurs : 3, 4, 4, 5, 6, 6, 6, 7, 7, 8, 10. 1/ Calculer la moyenne : 66 / 11 = 6 2/ Calculer la diffrence entre chaque observation et la moyenne

3/ Calculer la somme des carrs de la diffrence la moyenne Somme des carrs = 9 + 4 + 4 + 1 + 0 + 0 + 0 + 1 + 1 + 4 + 16 = 40 4/ Diviser la somme des carrs par le nombre dobservations moins 1 (n -1) soit (11 - 1) = 10 40/10= 4

5/ Lcart-type est la racine carre du rsultat obtenu : cart type =

On peut aussi calculer la valeur de lcart type de manire plus rapide en utilisant la formule :

V. La distribution normale
Lcart-type est surtout utile lorsque la distribution est peu prs normale (courbe de Gauss), cest--dire quelle est en forme de cloche symtrique (Figure 5-a).

De nombreuses caractristiques biologiques telles que la taille, le poids et la tension artrielle ont une distribution gaussienne. Dans cette distribution normale environ deux tiers des observations seront contenues dans un intervalle compris entre la valeur moyenne et +/- un cart-type de la moyenne ; 95% des observations entre la valeur moyenne et +/deux carts-type de la moyenne (Figure 5-a).

Pour une distribution gaussienne de moyenne 100 et dcart-type 2, par exemple, il y a moins de 5 chances sur 100 de rencontrer une valeur suprieure [100 + (2 * 2)] ou infrieure [100 - (2 * 2)], soit une valeur suprieure 104 ou infrieure 96.

Il faut nanmoins garder prsent lesprit que de nombreuses distributions biologiques (en parasitologie et en pidmiologie par exemple) ne suivent pas cette distribution normale.

Anda mungkin juga menyukai