Anda di halaman 1dari 16

SCALE DI MISURA Si basano su tre elementi interconnessi: Un sistema empirico: insieme di entit non numeriche (persone, o stimoli, o item)

Un sistema numerico Una regola: per passare dalle entit ai numeri *le propriet del sistema empirico condizionano la scelta del sistema numerico * le propriet del sistema numerico determinano la scelta della regola di passaggio * i diversi tipi di scale di misura sono caratterizzati dai tre elementi Scale di misura che analizzeremo Scala nominale Scala ordinale Scala a rapporti equivalenti Scala a intervalli equivalenti

SCALA NOMINALE E il livello pi basso di misurazione. Qualitativo, si tratta di una semplice categorizzazione. I numeri stanno al posto dei nomi delle categorie, ma non hanno un valore vero e proprio ne una relazione dordine. Sistema empirico: suddivisione in categorie distinte che si escludono luna con laltra Sistema numerico: numeri usati come simboli Regola: attribuire numeri uguali agli elementi appartenenti alla stessa categoria, e numeri diversi ad elementi appartenenti a categorie diverse PROPRIETA' DEL SIMBOLO NUMERICO: SOLO FORMA DIVERSA DEL SIMBOLO Esempio 1: sistema empirico: genere, le entit (persone) sono suddivise in categorie maschi e femmine sistema numerico: numeri: 1 e 2 regola: attribuire 1 ai maschi e 2 alle femmine 1 = MASCHI 2 = FEMMINE ma anche sistema numerico: numeri 1 e 2 regola: attribuire 1 alle femmine e 2 ai maschi 1 = FEMMINE 2 = MASCHI oppure sistema numerico: numeri 3 e 7 regola: attribuire 3 ai maschi e 7 alle femmine 3 = MASCHI 7 = FEMMINE E PIU CORRETTO DEFINIRE QUESTE VARIABILI CON IL TERMINE DI MUTABILI 1

Esempio 2: sistema empirico: malattia mentale, le entit (persone) sono pazienti di un reparto psichiatric o suddivisi secondo la patologia sistema numerico: numeri: della scala naturale regola: attribuire 1 ai depressi, 2 ai nevrotici, 3 agli psicotici, ecc.

SCALA ORDINALE SI PUO' CONSIDERARE UNA PRIMA FORMA DI QUANTIFICAZIONE (CONFRONTO TRA ESEMPIO DI categorie per RELIGIONE e di RAGGRUPPAMENTO per CETO SOCIALE definito attraverso classi di reddito e livello di istruzione) 1 = CETO SUPERIORE 2 = CETO MEDIO 3 = CETO MEDIO-INFERIORE 4 = CETO SVANTAGGIATO E' INTRODOTTO IL CONCETTO DI ORDINE LE CATEGORIE POSSONO ESSERE ORDINATE RISPETTO A RELAZIONI DI TIPO "MAGGIORE DI...", "MINORE DI..." E' POSSIBILE FORMARE UNA GRADUATORIA ATTRIBUIRE UN RANGO IL "CETO MEDIO" E', IN UNA GRADUATORIA DI LIVELLO SOCIO-CULTURALE, SUPERIORE AL "CETO SVANTAGGIATO", MA NON E' DEFINITO "DI QUANTO" SUPERIORE. IL NUMERO CHE VIENE ASSOCIATO A CIASCUNA CATEGORIA ESPRIME QUINDI UNA RELAZIONE D'ORDINE TRA LE QUANTITA' SIA X LA CARATTERISTICA OGGETTO DI STUDIO (risposta ad una domanda su quante volte il soggetto si sente depresso la mattina al risveglio) in tre categorie cos definite: mai, qualche volta, spesso. 1 = mai 2 = qualche volta 3 = spesso Possiamo affermare che i soggetti cui viene attribuito lo stesso numero presentano la stessa quantit della caratteristica X (rispondono nello stesso modo) Possiamo affermare che la quantit di caratteristica X associata a spesso maggiore di quella associata a qualche volta, ma non che la distanza tra spesso e qualche volta la stessa di quella tra qualche volta e mai, anche se si attribuisce punteggio 3 a spesso, 2 a qualche volta e 1 a mai. Possiamo affermare che i soggetti a cui viene attribuito il numero 1 presentano una quantit della caratteristica X minore rispetto a quelli cui viene attribuito il numero 2, ma sarebbe un errore ritenere, per esempio, che i soggetti col numero 2 abbiano la caratteristica X in quantit doppia. OPERAZIONI POSSIBILI: CALCOLO DELLE FREQUENZE E ALTRI INDICI STATISTICI (COME MEDIANA, CORRELAZIONI TRA RANGHI)

DUE MODI DI CONSIDERARE UNA MISURA ORDINALE 1) POSSIAMO IMMAGINARE UN CONTINUUM SUL QUALE VENGONO POSTI I SOGGETTI IN ORDINE SECONDO LA QUANTITA' MAGGIORE O MINORE DI UNA CERTA CARATTERISTICA X. SE X E' LA GRADUATORIA SECONDO I RISULTATI DI UN TEST DI SELEZIONE, IN UN PUNTO DEL CONTINUUM CI SARA' UN SOLO SOGGETTO: NOME. CLASSIFICA ANT 3 BRU 6 CAR 1 DAR 4 ENZ 2 GIO .... 5

1 car
CAR > ENZ

2 enz

3 ant

4 dar

5 gio

6 bru

7 xxx

........

> ANT. ....

SE DUE SOGGETTI OTTENGONO RISULTATO IDENTICO (TAGLIANO INSIEME IL TRAGUARDO IN UNA GARA DEI 100m, O SONO GIUDICATI EQUIVALENTI NELLA PROVA DI SELEZIONE), IL RANGO ATTRIBUITO A CIASCUNO DEI DUE E' LA MEDIA DEI DUE RANGHI CHE AVREBBERO OCCUPATO IN GRADUATORIA: ES: GIO E DAR SONO EQUIVALENTI (pari merito) . A CHI ASSEGNARE IL 4 E A CHI IL 5 POSTO? SI ASSEGNA A TUTTI E DUE IL POSTO 4.5 [(4+5):2], POI BRU AVRA' NORMALMENTE IL 6

2) SE INVECE CONSIDERIAMO LA CLASSIFICAZIONE DI 55 SOGGETTI SECONDO LA CARATTERISTICA X = RISPOSTA ALLA DOMANDA, SI AVRANNO MOLTI SOGGETTI CLASSIFICATI IN CIASCUNA DELLE 3 DIFFERENTI CATEGORIE IDENTIFICATE (1 = mai, 2 = qualche volta, 3 = spesso). Risposta: 1 2 3 NUMERO DI SOGGETTI 10 20 25

MENTRE PER LA MUTABILE GENERE ERA INDIFFERENTE ASSEGNARE 1 = MASCHIO 2 = FEMMINA oppure 1 = FEMMINA 2 = MASCHIO NEL CASO della risposta X OCCORRE RISPETTARE L'ORDINE. NON SAREBBE CORRETTO, PER ESEMPIO 1 = qualche volta 2 = spesso 3 = mai ALTRO ESEMPIO DI VARIABILE ORDINALE:

X = ASSIDUITA' DI FREQUENZA ALLE LEZIONI RISPOSTE POSSIBILI: a) FREQUENTO TUTTE LE LEZIONI b) FREQUENTO UNA/DUE VOLTE A SETTIMANA c) FREQUENTO UNA/DUE VOLTE AL MESE d) FREQUENTO SALTUARIAMENTE e)NON FREQUENTO MAI LE LEZIONI 3

a = 1 (massima frequenza), b = 2, c = 3, d = 4, e = 5 (frequenza minima) oppure: a = 5 (massima frequenza), b = 4, c = 3, d = 2, e = 1 (frequenza minima) ma sarebbe scorretto 1 = c, 2 = e, 3 = b, ecc vedremo dopo la scala a intervalli. SCALA A RAPPORTI EQUIVALENTI Detta anche PROPORZIONALE e RAZIONALE E' IL LIVELLO SUPERIORE DI MISURA E' UNA VERA E PROPRIA MISURA QUANTITATIVA OLTRE ALLA RELAZIONE D'ORDINE, SI AGGIUNGE IL CONCETTO DI UNITA' DI MISURA COSTANTE (PER ES. METRI, MINUTI, CM), CHE PERMETTE DI INDICARE L'ESATTA DISTANZA TRA DUE SOGGETTI INOLTRE ESISTE LO "ZERO ASSOLUTO", CIOE' LA MANCANZA TOTALE DELLA CARATTERISTICA X (ANCHE SOLO TEORICA), CHE PORTA ALLA COSTANZA DEL RAPPORTO TRA I VALORI (ANCHE SE SI CAMBIA UNITA' DI MISURA) CON QUESTO LIVELLO DI MISURA, LE CUI CARATTERISTICHE SPECIFICHE SONO: LO ZERO ASSOLUTO e la COSTANZA DEL RAPPORTO TRA I VALORI UTILIZZATI SONO POSSIBILI TUTTI I TIPI DI CALCOLO MA NON ESISTONO SCALE DI QUESTO TIPO PER MISURARE CARATTERISTICHE PSICOLOGICHE. SI TRATTA, DI SOLITO, DI MISURE DI TIPO FISICO. Sistema empirico: possibile stabilire unUNITA DI MISURA (es. misura del tempo, secondo) e anche identificare un elemento di intensit nulla (lo zero assoluto) ESEMPIO: X = TEMPO IN MINUTI IMPIEGATO DAI SOGGETTI PER COMPLETARE UN TEST UNITA' DI MISURA = MINUTI Sistema numerico e Regola: gode di tutte le propriet dei numeri reali. E possibile stabilire le entit delle differenze di intensit della caratteristica ma anche luguaglianza del rapporto fra due elementi DISTANZA : TRA 3 MIN E 2 MIN, C'E' DISTANZA 3-2 = 1 TRA 4 MIN E 3 MIN, C'E' DISTANZA 4-3 = 1 E IL SECONDO VALORE "1" E' UNA QUANTITA' UGUALE AL PRIMO VALORE "1" (INVECE LA DISTANZA FRA qualche volta (2) E mai(1) NON SI PUO' DIRE CHE ABBIA VALORE "1" COME LA DISTANZA TRA spesso (3) E qualche volta (2)) RAPPORTO: A) 2 MINUTI E' IL DOPPIO DI 1 MINUTO: 2:1 = 2 B) 12 MINUTI E' IL TRIPLO DI 4 MINUTI: 12:4 = 3 E IL RAPPORTO RESTA COSTANTE ANCHE SE CAMBIAMO UNITA' DI MISURA, PER ES. TRASFORMANDO I MINUTI IN SECONDI 1 MINUTO = 60 SECONDI A) 120 SEC E' IL DOPPIO DI 60 SEC: 120:60 = 2 B) 720 SEC E' IL TRIPLO DI 240 SEC: 720:240 = 3 4

SCALA A INTERVALLI EQUIVALENTI E UN LIVELLO DI MISURA SUPERIORE ALLA SCALA ORDINALE, MA INFERIORE ALLA SCALA A RAPPORTI EQUIVALENTI. IN PSICOLOGIA E' RARO POTER MISURARE VARIABILI CON SCALA A RAPPORTI EQUIVALENTI SPESSO LO "ZERO" NON INDICA MANCANZA TOTALE DELLA CARATTERISTICA X, MA E' UN VALORE ARBITRARIO ASSEGNATO COME VALORE MINIMO SU UNA SCALA DI VALORI CHE RAPPRESENTANO UN CONTINUUM DELLA CARATTERISTICA X. NON SI PUO' PENSARE A INTELLIGENZA = 0, o NEVROTICISMO = 0 COSI' COME NON E' VERO CHE INTELLIGENZA 110 E' IL DOPPIO DI INTELLIGENZA 55 LA SCALA PIU' USATA IN PSICOLOGIA E' QUELLA A INTERVALLI EQUIVALENTI SI POSSONO APPLICARE TUTTE LE OPERAZIONI ALGEBRICHE TRA I PUNTEGGI E SULLE DIFFERENZE TRA NUMERI CONSENTE L'USO DI TUTTE LE TECNICHE STATISTICHE Sistema empirico: possibile stabilire unUNITA DI MISURA (QUESTA LA SUA CARATTERISTICA) Sistema numerico e Regola: possibile stabilire le entit delle differenze di intensit della caratteristica (ma non luguaglianza del rapporto fra due elementi) SE SI ADOPERA UNA SCALA CHE MISURA, PER ES, L'ANSIA, E SI ASSEGNANO PUNTEGGI DA 10 A 60: SOGGETTO A B C D E PUNTEGGIO 15 30 55 20 40

E' VERO CHE LA DISTANZA TRA I SOGGETTI E-B e B-D E' UGUALE (EQUIVALENTE) E-B B-D 40-30 = 10 30-20 = 10

MA NON E' VERO CHE IL SOGGETTO "E" HA UN PUNTEGGIO DOPPIO DEL SOGGETTO " D" ATTENZIONE E possibile passare da una scala di livello superiore a una di livello inferiore MA NON VICEVERSA Per esempio: passare da una scala a intervalli ad una ordinale 1) da et a classi di et 0-12 anni = 1 (bambini) 13-18 anni = 2 (adolescenti) 19-30 anni = 3 (giovani) 31-60 = 4 (adulti) > 60 = 5 (anziani) 2) da tempi impiegati dai piloti in una corsa di Formula1 a graduatoria di arrivo da voti ottenuti in un test attitudinale a graduatoria per la selezione del personale

ma non possibile fare il contrario, per esempio conoscendo solo la graduatoria di arrivo in Formula1, indurre le distanze tra i tempi impiegati dai vari piloti Ricordiamo VARIABILI CONTINUE LE VARIABILI CHE POSSONO ASSUMERE QUALSIASI VALORE DELLA SCALA NUMERICA ES: ALTEZZA, TEMPI DI REAZIONE VARIABILI DISCRETE LE VARIABILI CHE POSSONO ASSUMERE SOLO ALCUNI VALORI DELLA SERIE NUMERICA ES: IL NUMERO DI COMPONENTI IL NUCLEO FAMILIARE IN REALTA' LA MAGGIOR PARTE DELLE VARIABILI E' CONSIDERATA DISCRETA SOLO PER L'IMPRECISIONE DELLO STRUMENTO MA SI SUPPONGONO INSERITE IN UN CONTINUUM SOTTOSTANTE PER I TEMPI DI REAZIONE, POSSIAMO AVERE UNA MISURA ESPRESSA IN MINUTI. I VALORI CHE X PUO' ASSUMERE SARANNO SOLO 1, 2, ...10 ... ECC. SE DISPONIAMO DI UNO STRUMENTO CHE MISURA ANCHE I SECONDI, POSSIAMO AVERE MISURE DEL TIPO: 1' e 30", OPPURE 90". SE DISPONIAMO DI UN CRONOMETRO, I VALORI CHE X PUO' ASSUMERE SONO PIU' PRECISI, ANCHE FINO AI MILLESIMI DI SECONDO. ESPRIMERE IL TEMPO IN MINUTI (1,2, 4.....) NON VUOL DIRE CHE IL TEMPO E' UNA VARIABILE DISCRETA, MA SOLO CHE NON DISPONIAMO DI UNO STRUMENTO ADATTO A RILEVARNE LA CONTINUITA'.

LA RILEVAZIONE DEI DATI DATO: RISULTATO DI UNA MISURA EFFETTUATA SU DI UN ELEMENTO DELLA POPOLAZIONE OSSERVATA; PUO TRATTARSI DI UN OGGETTO O DI UN INDIVIDUO

LA SCELTA DEGLI STRUMENTI PER LA RILEVAZIONE (RACCOLTA) DEI DATI E' LEGATA: ALLA NATURA DELLE VARIABILI DA STUDIARE, MA ANCHE AD ASPETTI PRATICI COME COSTI E TEMPI

TRA I VARI METODI DI RACCOLTA DEI DATI:

OSSERVAZIONE IN LABORATORIO OSSERVAZIONE SUL CAMPO ANALISI DI FONTI UFFICIALI INTERVISTE SOMMINISTRAZIONE DI QUESTIONARI SCALE TIPO "LIKERT" SOMMINISTRAZIONE DI TEST

TABULAZIONE DEI DATI DOPO AVER RACCOLTO I DATI, BISOGNA ORGANIZZARLI PER POTERLI ELABORARE AI FINI DELLA LORO DESCRIZIONE, SINTESI, TRADURLI IN INFORMAZIONI. SUPPONIAMO DI AVER SVOLTO UNINDAGINE SOTTOPONENDO A 15 SOGGETTI DI VARIE ETA UNA SCALA CHE MISURA IL LIVELLO DI AUTORITARISMO. VARIABILE X = PUNTEGGIO DI AUTORITARISMO (10 = NON AUTORITARIO60 = MOLTO AUTORITARIO) VARIABILE Y = GENERAZIONE (1 = GIOVANI; N = NUMEROSITA' DEL CAMPIONE N = 15 DATI GREZZI: Il soggetto A , giovane, ha ottenuto X = 30; il soggetto H, anziano, ha ottenuto X = 20; e cos via. Dati grezzi Sogg A B Y 1 3 X 30 50 2 = ADULTI; 3 = ANZIANI)

C 2 40

D 1 20

E 1 30

F 3 60

G 2 40

H 3 20

I 2 20

L 1 50

M 2 30

N 3 40

O 1 30

P 2 40

Q 3 40

ORGANIZZIAMO, RAGGRUPPIAMO I DATI PER POTERLI DESCRIVERE: X INDICA GENERICAMENTE LA VARIABILE AUTORITARISMO CHE PUO' ASSUMERE K = 6 VALORI DIVERSI (10, 20, 30, 40, 50, 60) Xi i INDICE DEI K VALORI DIVERSI CHE PUO' ASSUMERE X (QUINDI i VA DA 1 A 6)

X1 =valore10; X2 = valore 20; X3 =valore 30....ECC. QUANTE VOLTE COMPARE, NEL CAMPIONE DI N= 15 SOGGETTI, IL VALORE X 2 = 20? CONTANDO RISULTA 3 VOLTE Fi INDICA LA FREQUENZA CON CUI COMPARE IL VALORE i-esimo; F2 = 3 indica che la FREQUENZA del valore X2 3

DISTRIBUZIONE DI FREQUENZA Xi X1 X2 X3 X4 X5 X6 X 10 20 30 40 50 60 Fi 0 3 4 5 2 1

Fi E' IL NUMERO DI VOLTE IN CUI SI VERIFICA UN DETERMINATO EVENTO IN UN GRUPPO DI EVENTI POSSIBILI CIOE' IL NUMERO DI CASI CHE ASSUMONO UN CERTO VALORE Xi DI X, TRA I K VALORI POSSIBILI

NATURALMENTE LA SOMMA DI TUTTE LE FREQUENZE Fi DEVE ESSERE UGUALE A N

F F 0 3 4 5 2 1 15
i 1 i i 1
X (PUNTEGGIO DI AUTORITARISMO) E' UNA VARIABILE MISURATA SU SCALA INTERVALLO E QUINDI POSSIBILE FARE LA SOMMA DEI 15 VALORI X PARTENDO DAI DATI GREZZI: Sogg A Y 1 X 30 B 3 50 C 2 40 D 1 20 E 1 30 F 3 60 G 2 40 H 3 20 I 2 20 L 1 50 M 2 30 N 3 40 O 1 30 P 2 40 Q 3 40

X = 30 + 50 + 40 + 20 + 30 +60 + 40 +20 +20 + 50 +30 + 40+ +30 + 40 +40 = 540 UTILIZZANDO LA DISTRIBUZIONE DI FREQUENZA Xi X Fi XiFi X1 X2 X3 X4 X5 X6 10 20 30 40 50 60 0 0 3 60 4 120 5 200 2 100 1 60 ----------------15 540 (10 x 0) (20 x 3) (30 x 4) (40 x 5) (50 x 2) (60 x 1)

Xi Fi = X1 F1 + X2 F2 +....+ X6 F6 =

0 + 60 + 120 +200 +100 +60 = 540

CONSIDERIAMO ORA Y, CIOE' LA "GENERAZIONE" SI TRATTA DI UNA VARIABILE MISURATA SU SCALA ORDINALE, SI TRATTA COMUNQUE DI CATEGORIE,: Y PUO' ASSUMERE K = 3 VALORI ( 1 = GIOVANI; 2 = ADULTI; 3 = ANZIANI)

DISTRIBUZIONE DI FREQUENZA Yi Y1 Y2 Y3 Y 1 2 3 Fi 5 5 5 ----15

NON HA SENSO FARE LA X DAI DATI GREZZI NE' LA XF SI PUO' FARE SOLO LA SOMMATORIA DELLE FREQUENZE, CHE DEVE NATURALMENTE RISULTARE UGUALE A N:

Fi = 5 + 5 + 5 = 15
8

DISTRIBUZIONE DELLE FREQUENZE PERCENTUALI N = NUMERO TOTALE DI CASI (SOGGETTI O OSSERVAZIONI) Fi = FREQUENZA DI CASI CHE ASSUMONO VALORE Xi Fi% = PERCENTUALE DEI CASI CHE ASSUMONO VALORI Xi Fi% SIGNIFICA CHE SI E' FATTA UNA TRASFORMAZIONE DA N A 100, IN MODO CHE LA PROPORZIONE SIA PIU' IMMEDIATAMENTE COMPRENSIBILE PER IL CALCOLO DELLA PERCENTUALE: DALLA PROPORZIONE . Fi% : 100 = Fi : N CHE SI PUO' SCRIVERE

Fi % Fi 100 N
SI RICAVA

Fi 100 Fi % N
NATURALMENTE LA SOMMA DI TUTTE LE Fi% DEVE RISULTARE = 100 ANCHE SE NON HA MOLTO SENSO FARE LA % QUANDO N E' PICCOLO PERCHE' SI "GONFIANO" I DATI E SEMPRE POSSIBILE TRASFORMARE UNA DISTRIBUZIONE DI FREQUENZA IN DISTRIBUZIONE PERCENTUALE PER L'ESEMPIO Yi Y1 Y2 Y3 Y 1 2 3 Fi 5 5 5 -----15 Fi% 33.33 33.33 33.34 ----------100.00 (5 x 100) : 15

PER LA VARIABILE AUTORITARISMO Xi X1 X2 X3 X4 X5 X6 X 10 20 30 40 50 60 Fi 0 3 4 5 2 1 -----15 Fi% 0.00 20.00 26.67 33.33 13.33 6.67 --------100.00

(3 x 100) : 15 = 20.00 (4 x 100) : 15 = 26.6666 (5 x 100) : 15 = 33.3333 (2 x 100) : 15 = 13.3333 (1 x 100) : 15 = 6.6666

(CONSIDERARE IL PROBLEMA DEGLI ARROTONDAMENTI)

PROBLEMA INVERSO CONOSCENDO LA PERCENTUALE E LA BASE N, SI PUO' RICOSTRUIRE LA Fi, USANDO LA FORMULA INVERSA

Fi

Fi % N 100

PER ES: percentuale 33.33 (del punteggio X = 40) e N = 15, a quale F corrisponde?

33.3315 4.999 100

(arrotondando) F = 5 ATTENZIONE A RISULTATI RIFERITI IN MODO DISTORTO ESEMPIO: DA UNA INDAGINE RISULTA CHE L'80% DEI SOGGETTI RITIENE CHE LA LEGGE SUL DIVORZIO VADA ABROGATA. BASE N = 350 DOMANDA 1 ) RITIENI CHE LA LEGGE SUL DIVORZIO DEBBA ESSERE MODIFICATA O LASCIATA COME E'? MODIFICATA F = 100 F% = 28.57% LASCIATA F = 250 F% = 71.43%

DOMANDA 2) SE HAI RISPOSTO "MODIFICATA", RITIENI CHE IL DIVORZIO DEBBA ESSERE ABROGATO O LIBERALIZZATO? BASE = 100 ABROGATO F = 80 F% = 80.00% LIBERALIZZATO F = 20 F% = 20.00% MA IN REALTA' QUANTI DEI 350 INTERVISTATI HA RISPOSTO "ABROGATA"? SOLO 80 SU UNA BASE DI 350, CIOE' IL 22.86% FREQUENZE CUMULATE Per ogni valore di Xi si calcola la somma delle frequenze FINO a quel valore compreso. La frequenza cumulata ci dice quanti soggetti/osservazioni hanno un valore X Xi

ESEMPIO Xi fi fcum ---------------------------------------18 2 2 19 2 4 20 3 7 21 1 8 22 2 10 23 2 12 ---12 10

Considerando X = 18, n = 2 soggetti hanno punteggio 18. Considerando X = 22, n = 10 soggetti hanno punteggio 22. Lultima frequenza cumulata, cio quella corrispondente allultimo valore di X, necessariamente = N (nellesempio = 12) Si possono cumulare anche le frequenze percentuali e si leggono nello stesso modo. Xi fi f% ------------------------------------18 2 16.7 19 2 16.7 20 3 25.0 21 1 8.3 22 2 16.7 23 2 16.6 ------------------12 100.0 f%CUM 16.7 33.4 58.4 66.7 83.4 100.00

Considerando X = 22, l83,4% dei soggetti ha punteggio 22. Lultima frequenza percentuale cumulata, cio quella corrispondente allultimo valore di X, necessariamente = 100,00 (nellesempio = 12) ESEMPIO 1) DATI GREZZI 18 19 20 X = voto esame universitario rilevato su 12 studenti: 20 22 18 22 19 20 23 21 23

X
1

i =[ i va da 1 a N (1 a 12), un indice del soggetto]

X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12 = 18 +19 +20 +20 +22+18 +22 +19 +20 +23 + 21 +23 = 245 costruiamo la 2) DISTRIBUZIONE DI FREQUENZA di 18 19 20 20 22 18 22 19 20 23 21 23

Xi fi Xi fi -------------------------------------------------i=1 18 2 36 i=2 19 2 38 i=3 20 3 60 i=4 21 1 21 i=5 22 2 44 i=6 23 2 46 ----- ----12 245 in questo caso i un indice dei k diversi valori che pu assumere X, e va da 1 a 6.

X f =
i i 1

[i va da 1 a k, (1 a 6) un indice del numero dei k valori diversi, ordinati, che X pu assumere]

= X1 f1 + X2 f2 + X3 f3 + X4 f4 + X5 f5 +X6 f6 = = 182 + 192 + 203 + 211 + 222 + 232 = 36 + 38 + 60 + 21 + 44 + 46 = 245 11

3) trasformiamo le frequenze in percentuali Xi fi f% ----------------------------------------18 2 16.7 19 2 16.7 20 3 25.0 21 1 8.3 22 2 16.7 23 2 16.6 ------ ---------12 100.0 classi di punteggi SE I VALORI DIVERSI CHE X PUO ASSUMERE SONO TANTI, E OPPORTUNO FARE UN ULTERIORE RAGGRUPPAMENTO, COSTRUENDO INTERVALLI DI AMPIEZZA SUPERIORE A 1, CIOE CLASSI DI VALORI CHE CONTENGANO PIU VALORI DI X PER ESEMPIO, SIA X LETA (UNITA DI MISURA: ANNI) MISURATA SU N = 30 SOGGETTI, DISTRIBUITA COME SEGUE: X (et) f ---------------------18 3 19 3 20 4 21 6 22 5 23 4 24 3 25 2 -------30 E POSSIBILE PERO RAGGRUPPARE I VALORI DI X IN CLASSI, per esempio DI AMPIEZZA 2, creare cio degli INTERVALLI CHE CONTENGONO ciascuno 2 VALORI DI X CLASSI f -----------------------------18 - 19 6 (3 + 3) fr. 3 di X = 18 + freq. 3 di X = 19 20 - 21 10 (4 + 6) 22 - 23 9 (5 + 4) 24 - 25 5 (3 + 2) --30 naturalmente N (numero totale di soggetti) rester uguale, N = 30 POTREMMO COSTRUIRE INTERVALLI DI AMPIEZZA superiore a due, MA ANCHE DI AMPIEZZE DIVERSE in diverse classi, DIPENDE DA QUANTI E QUALI VALORI PUO ASSUMERE X. LA DISTRIBUZIONE CON LE FREQUENZE ATTRIBUITE A CIASCUN SINGOLO VALORE DI X considerata come distribuzione in classi di AMPIEZZA UNITARIA X f --------------------18 3 19 3 20 4 21 6 22 5 23 4 24 3 25 2 ------30 12

AMPIEZZA 3 CLASSI ampiezza f -----------------------------------------18 - 20 3 10 21 - 23 3 15 24 - 26 3 5 ----------30 ESTREMI DI UNA CLASSE:

AMPIEZZE DIVERSE CLASSI ampiezza f ---------------------------------------------18 - 19 2 6 20 - 22 3 15 23 - 25 3 9 -----30

IN UNA CLASSE il VALORE PIU BASSO E IL LIMITE INFERIORE (limi) E IL VALORE PIU ALTO E IL LIMITE SUPERIORE (lims) Lampiezza (a) si calcola: classe 18 - 19 a = (lims - limi)+ 1 classe 20 - 22 a = (22 - 20) + 1 = 3

a = (19 - 18) + 1 = 2

QUESTI SI DICONO LIMITI TABULATI COSTRUENDO INTERVALLI DI AMPIEZZA > 1 SI SINTETIZZA ULTERIORMENTE LINFORMAZIONE PROBLEMI: QUANTI INTERVALLI/CLASSI COSTRUIRE? QUALE DEVE ESSERE LAMPIEZZA? TRE CRITERI - GUIDA DA TENERE PRESENTI: 1 - COPRIRE LINTERA GAMMA DEI PUNTEGGI 2 - INTERVALLI DI UGUALE AMPIEZZA (SE POSSIBILE) 3 - MUTUALMENTE ESCLUSIVI 1 - E INTUITIVO. SE, NELLESEMPIO, IL PRIMO INTERVALLO FOSSE 20-22, PERDEREIMMO TUTTI I SOGGETTI DI 18 E 19 ANNI 2 - DIPENDE DAL TIPO DI MISURA E DALLA DISTRIBUZIONE DEI PUNTEGGI. SE E POSSIBILE, E MEGLIO AVERE INTERVALLI DI UGUALE AMPIEZZA (SONO COMPARABILI TRA LORO, E PIU FACILE LA RAPPRESENTAZIONE GRAFICA ECC.). DI SOLITO AMPIEZZA 3, 5, 10, O MULTIPLI DI 10. NUMERO DI INTERVALLI: NON TROPPI (<= 20), NON TROPPO POCHI (>= 5)

3 -DEVE ESSERE CHIARO DOVE VA INSERITO OGNI SOGGETTO CLASSI ---------18 19 19 - 20 20 - 21 UN SOGGETO DI ET X = 19, DOVE VA INSERITO? NELLA PRIMA O NELLA SECONDA CLASSE

13

PER ESEMPIO, SE X E UNA VARIABILE DISCRETA CHE PUO ASSUMERE SOLO VALORI INTERI DA 4 A 12, QUESTA DISTRIBUZIONE IN CLASSI NON CREA PROBLEMI: CLASSI ---------4-6 7-9 10 - 12 MA SE X FOSSE UNA VARIABILE CONTINUA CHE PUO ASSUMERE VALORI FINO A DUE DECIMALI, IN QUALE CLASSE SI INSERIREBBE UN SOGGETTO CHE OTTIENE PUNTEGGIO DI X=6.35? E UNO CON X = 9.89? DIPENDE DAL TIPO DI MISURA, MA SEMPRE OCCORRE PRECISARE QUALI SONO I LIMITI REALI (O CONFINI) DELLA CLASSE, OLTRE QUELLI CHE SONO INDICATI NELLA TABELLA, CHE SI DICONO LIMITI TABULATI DI SOLITO SI AGGIUNGE 0.5 (O .05, O .005) AL LIMITE TABULATO SUPERIORE E SI SOTTRAE 0.5 AL LIMITE TABULATO INFERIORE, PER DARE IL SENSO DELLA CONTINUITA.

Limiti Limiti tabulati reali a f ------------ ------------------------------------------------------------18 - 20 17.5-20.5 3 10 21 - 23 20.5-23.5 3 15 24 - 26 23.5-26.5 3 5 30 oppure per ogni classe si pu calcolare la semisomma del lim(sup) tabulato della classe precedente e lim(inf) tabulato della classe successiva. Per esempio il limite reale superiore della prima classe : (20+21)/2 = 20.5 che anche il limite reale inferiore della seconda classe mentre il limite reale superiore della seconda classe sar: (23+24)/2 = 23.5 PER EVITARE AMBIGUITA, I LIMITI REALI (confini) DELLE CLASSI NON DOVREBBERO COINCIDERE CON LE OSSERVAZIONI REALI. SI PRECISA POI CHE UNA CERTA CLASSE, PER ES. LA 17.5-20.5, COMPRENDE I PUNTEGGI X FINO A 20.50 (X < = 20.50), MENTRE LA CLASSE SUCCESSIVA, LA 20.5-23.5, COMPRENDE I PUNTEGGI MAGGIORI DI 20.50 (CIOE DA 20.51 IN SU; X > 20.50) Con il simbolo -| si intende <= ALTRO ESEMPI: X assume tutti i valori da 0 a N, con due cifre decimali Limiti Disambiguazione Tabulati 0-1 0 -| 1 0.00 1.00 1-2 1 -| 2 1.01 2.00 2-3 2 -| 3 2.01 3.00 . Esempio di classi di ampiezza unitaria per X discreto: 18 19 20 17.5 - 18.5 18.5 - 19.5 19.5 - 20.5 Limiti reali 0.000 1.005 1.005 2.005 2.005 3.005

14

Quando X una misura discreta, per calcolare lampiezza di una classe si pu applicare la formula: a = LIM.REALE SUP. - LIM.REALE INF.

PUNTO CENTRALE DI UN INTERVALLO X f ---------------------18 3 19 3 20 4 21 6 22 5 23 4 24 3 25 2 -------30 possiamo calcolare la somma Xi fi = (18x3)+(19x3)+(20x4)+(21x6)+...+(25x2) = 641 CLASSI f ----------------------18 - 19 6 20 - 21 10 22 - 23 9 24 - 25 5 ------30 COME SI FA LA SOMMA X f ? PER OGNI INTERVALLO occorre calcolare un valore che rappre senta lintervallo stesso, cio IL PUNTO CENTRALE (O MEDIO) Indichiamo con Xc tale punto CHE, PER CONVENZIONE, RAPPRESENTA LA CLASSE: CLASSI f ----------------------18 - 19 6 20 - 21 10 22 - 23 9 24 - 25 5 ------30 Xc = SEMISOMMA DEI LIMITI (TABULATI O REALI) INTERVALLO 18-19 OPPURE 17.5-19.5 Xc = 18+19 = 37 = 18.5 2 2 Xc = 17.5+19.5 = 37 = 18.5 2 2

CLASSI lim.reali Xc f Xc f ------------------------------------------------------------------------------18 - 19 17.5-19.5 18.5 6 111 20 - 21 19.5-21.5 20.5 10 205 22 - 23 21.5-23.5 22.5 9 202.5 24 - 25 23.5-25.5 24.5 5 122.5 ----------30 641 15

IN CASO DI CLASSI DI AMPIEZZA UNITARIA, Xc CORRISPONDE ESATTAMENTE AL VALORE X: PER ES. ETA 19, LIMITI REALI 18.5-19.5, Xc =19. Per le frequenze cumulate delle distribuzioni in classi, si applica la stessa procedura vista precedentemente:

Classi

fcum 6 16 25 30

f% 20.0 33.3 30.0 16.7 -----100.0

f%cum 20.0 53.3 83.3 100.0

18 19 6 20 21 10 22 23 9 24 25 5 ---30

25 soggetti hanno un punteggio X

23

Il 53.3% dei soggetti ha un punteggio X

21

Esercizio: considerando la distribuzione di X:

X 10 20 30 40 50

f 2 3 4 5 7

Calcolare: N =

f Xf

Organizzazione dei calcoli X 10 20 30 40 50 Tot f 2 3 4 5 7 21 Xf 20 60 120 200 350 750 X2 100 400 900 1600 2500 X2 f 200 1200 3600 8000 17500 30500

Xf

16

Anda mungkin juga menyukai