Anda di halaman 1dari 6

LA DISTRIBUZIONE NORMALE

(Vittorio Colagrande)

Allo scopo di interpolare un istogramma di un carattere statistico X con una funzione continua (di densit), si pu far ricorso nellanalisi statistica alla distribuzione normale o distribuzione di Gauss come modello teorico di riferimento. Ci, in particolare, quando il numero delle classi dellistogramma elevato e lampiezza di ogni classe piccola. Ad esempio, la figura che segue si riferisce alla distribuzione empirica della statura di 700 maschi di et 13-18 anni; listogramma pu essere interpolato con una curva normale con media = 172.8 cm e varianza 2 = 56.7 cm2 (deviazione standard = 7.53 cm):
Statura di 700 maschi di et 13-18 anni
0 .0 6

D e n s i t

0 .0 0

0 .0 1

0 .0 2

0 .0 3

0 .0 4

0 .0 5

150

154

158

162

166

170

174

178

182

186

190

194

statura

In realt, la variabilit di alcuni caratteri biologici (peso, statura, pressione arteriosa, glicemia, temperatura corporea,) dipende dallapporto di molteplici fattori genetici e ambientali e le loro distribuzioni sono tanto pi vicine alla distribuzione normale quanto pi grande il numero di fattori che entrano in gioco. La densit di un carattere X distribuito normalmente individuata dalla funzione:
f ( x) =
1 2

e (x )

2 2

ed caratterizzata dai due parametri di media e varianza 2 . La figura seguente rappresenta la curva di una distribuzione normale con =5 e 2 = 6.3 e sullasse orizzontale sono evidenziati i valori di + = 2.5 , = 5 e + = 7.5 :

La curva normale risulta:


1

simmetrica rispetto alla retta parallela allasse verticale e passante per la media, ovvero, presi due punti qualsiasi sullasse orizzontale equidistanti dalla mediana (=media), uno a sinistra e laltro a destra, la funzione di densit assume per essi lo stesso valore; asintotica rispetto allasse delle ascisse, cio per valori sempre pi distanti dalla media lordinata della curva tende a zero; crescente nellintervallo (, ) e decrescente nellintervallo (,+ ) ; la crescita meno veloce fino a (punto di flesso) e pi rapida da tale valore a ; si ha un massimo in e poi landamento decrescente con ritmo pi veloce dal massimo a + (punto di flesso).

Un significato importante assume larea al di sotto della curva tra i valori X=x1 e X=x2: Area tra x1 e x2 = Frequenza % dei valori di X compresi tra x1 e x2 = P(x1<X x2)

Larea totale al di sotto della curva uguale a 1 e si pu osservare che:

P(X>x1) = 1 P(X x1) e P(x1<X x2) = P(X x2) P(X x1).


La media il parametro di posizione, nel senso che, al variare del suo valore, la curva non cambia nella forma ma subisce una traslazione rispetto allasse orizzontale; nella figura sono rappresentate tre distribuzioni di pesi aventi la stessa varianza ma media diversa:

La varianza il parametro di scala: al suo variare cambia la forma della curva di distribuzione. In particolare, per bassi valori di , larea sotto la curva concentrata intorno alla media, mentre per alti valori di , la curva schiacciata rispetto allasse orizzontale; nella figura sono riportate tre distribuzioni di pesi aventi ugual media, ma varianze diverse:
2

Evidentemente esiste un numero infinito di distribuzioni normali diverse tra loro, ottenute al variare dei due parametri. Tutte queste distribuzioni diverse possono essere ricondotte ad un unica distribuzione standard: la distribuzione normale standard, avente media = 0 e varianza 2 =1. Alluopo va considerata la trasformazione (standardizzazione):
Z= X ,
1 2

e Z la variabile normale standardizzata e ha densit f ( z ) = Graficamente:

z2 2

Per il calcolo delle aree al di sotto della curva normale standardizzata si pu far ricorso ad un programma informatico (ad esempio allambiente R) o a tavole della distribuzione normale standardizzata (come quella riportata in Appendice). In merito alle aree, un risultato importante schematizzato nella figura che segue:
3

Esempio 1. Una popolazione di maschi si distribuisce normalmente secondo la statura (X) con media = 173 cm e deviazione standard =13 cm. Determinare la frequenza relativa degli individui: 1. con statura maggiore di 200 cm; 2. con statura compresa tra 175 e 190 cm; 3. con statura minore di 156 cm.

Per rispondere alle domande poste necessario procedere alla standardizzazione dellaltezza e utilizzare la tavola riportata in Appendice. 1. standardizzando x = 200 cm: 200 173 z= = 2.08 , 13 si ha: P(X>200) = P(Z>2.08) = 1 P(Z 2.08) = (ricercando allinterno della tavola nellincrocio tra la riga del 2.0 e la colonna di 0.08) = 10.9812 = 0.019 = 1.9% 2% di individui; 2. standardizzando 175 e 190 cm: 175 173 190 173 z1 = = 0.15 e z 2 = = 1.31 , 13 13 si ha: P(175<X 199)=P(0.15<Z 1.31)=P(Z 1.31) P(Z 0.15)= (valori interni alla tavola nellincrocio tra la riga di 1.3 e 0.01 e nellincrocio tra la riga di 0.1 e 0.05) = 0.90490.5596 35% di maschi;
4

3. standardizzando 156 cm: 156 173 z= = 1.31 , 13 risulta: P(X 156)=P(Z 1.31)= (per la simmetria della curva) = P(Z >1.31) = 1 P(Z 1.31) = (valore interno alla tavola nellincrocio tra la riga 1.3 e la colonna 0.01) =1 0.9049 10% di individui. Sempre in riferimento allesempio considerato, ci si pu chiedere: 4. qual la statura massima del 10% degli individui pi bassi; 5. qual la statura minima del 5% degli individui pi alti. Per rispondere alle due domande necessario partire dai valori interni alla tavola (che sono valori di frequenze relative/probabilit). 4. Va determinato, anzitutto, il valore z1 della variabile Z per il quale risulta P(Z z1)=10%=0.1. Per la simmetria della curva (vedi grafico) risulta che: P(Z z1) = P(Z>z2)=1P(Z z2).Osservando allinterno della tabella di Appendice, il valore z2 di Z al quale corrisponde una probabilit di 0.90 (data da 10.1) pari a 1.28 (riga di 1.2 e colonna di 0.08). Pertanto, sempre per la simmetria, si ha: z1=1.28 e, per la standardizzazione, il valore x1 della variabile X corrispondente a z1 dato da (x1 173)/13= 1.28 x1 = 156 cm. Tale valore proprio la massima altezza del 10% degli individui pi bassi. 5. In questo caso il valore z1 di z tale che P(Z>z1) = 5% = 0.05 e va determinato in modo che risulti 1 P(Z z1) = 0.95. Dallinterno della tavola si evince che il valore di Z al quale corrisponde una probabilit del 95% pari a z1 = 1.645 (media dei valori di Z corrispondenti al probabilit di 0.9495 e 0.9505). Il valore x1 dellaltezza di ottiene da: (x1173)/13= 1.645 x1 = 194 cm, che rappresenta proprio la statura minima del 5% degli individui pi alti nella popolazione presa in esame.
Esempio 2. In una data popolazione noto che lHDL-colesterolo si distribuisce normalmente con media = 57 mg/100ml e deviazione standard = 5 mg/100ml. Determinare la percentuale di soggetti della popolazione con a) HDL maggiore di 60 mg/100ml, b) HDL compreso tra 40 e 45 mg/100ml, c) HDL minore di 58 mg/100ml, d) HDL tra 55 e 58 mg/100ml. (risultati: a) 27.43%, b) 0.79%, c) 57.93%, d) 23.47%).
5

APPENDICE

Anda mungkin juga menyukai