Anda di halaman 1dari 4

Appunti SPSS

NB:
Allesame devi copiare tutti i file su Z. Devi aprire il file excel su SPSS ed eseguire la
sintassi.

Crea una nuova variabile


Anche reversando item (punteggio max + 1 della scala variabile di partenza)

Punti Z: (punteggio grezzo media)/dev. standard OPPURE da


Analizza > Statistiche descrittive > descrittive > salva valori standardizzati
come variabili.
Punti T: 50 + 10xZ (rendono tutti i valori positivi)

Funzione somma
+: se una variabile mancante, il risultato mancante
SUM: se ci sono mancanti li ignora, fa la somma su una gamma pi piccola
MEAN: serve per ponderare, si fa fra tutte le variabili e poi si moltiplica il tutto per il n
totale delle variabili

Ricodifica variabili in categorie


Trasforma > Ricodifica in variabili differenti

Conta valori allinterno dei casi


Trasforma > Conta valori allinterno dei casi
Crea una nuova variabile che conta quante volte un valore compare in certe variabili.

Analizza:
Statistiche descrittive > frequenza

Frequenza per le nominali e ordinali (qualitative)


Statistiche di tendenza centrale:
o Moda per le nominali
o Mediana per le ordinali
o Media per le quantitative
Deviazione standard e varianza solo per le quantitative
Percentili

Asimmetria e curtosi
Da Frequenza. Servono per capire se il comportamento di una variabile
approssimabile alla normale.
Metodo pragmatico: approssimabile alla normale se asimmetria e curtosi sono minori
di 1
Metodo dellerrore standard: si divide lindice per lerrore standard, ottenendo un
punto z; se il suo valore assoluto maggiore di 1.96 significativo al 5% e la
distribuzione non si pu considerare normale.

In caso non sia normale, la curtosi non si pu aggiustare, lasimmetria s (slide


trattamento dati)
Se asimmetrica, provo a togliere gli outlier che trovo col box-plot.

Grafici
Da frequenza
Istogramma, a barre, a torta.

Da esplora
Ramo foglia, box-plot, normalit.

Valori mancanti
1. Eliminazione dalle etichette: nella visuale variabili clicco su Mancante e scelgo i
valori
2. Ignorare dei casi temporaneamente: Dati > seleziona casi
3. Missing values analysis: Analizza > Analisi valori mancanti

Medie
Fa le medie di gruppi di una variabile quantitativa creata in base a una qualitativa

T test
Serve a confrontare medie.
Sig. minore del 5% (0,05) = significativo H1
Sig. maggiore = non significativo (non si possono categorizzare le 2 categorie in
diverse popolazioni) H0
3 tipi di t-test:
1) a campione singolo: vede se il campione ha una media diversa rispetto a
una media gi data (popolazione o altro campione)
Se sign. minore di 0,05 significativo e le medie sono abbastanza diverse da
farci dire che il campione non appartiene alla popolazione; se sign. maggiore di
0,05 non significativo e le medie sono simili.
2) a campioni indipendenti : una variabile divisa in due gruppi in base a una
nominale
con varianze uguali o diverse in base al test di Levene: se sign. maggiore 0,05
non sign. e le varianze sono uguali; se sign. minore di 0,05 sign. e le
varianze sono diverse). Es. output: Dati N praticanti con media x e deviazione
standard s e N non praticanti con media x e deviazione standard s, dal test di
Levene mediax1 mediax2 con p= 0,00 (oppure minore di 0,1)
3) a campioni appaiati: stessi soggetti prima (a tempo 0) e dopo
Se sign. minore di 0,05 significativo e le medie sono abbastanza diverse da
farci dire che il trattamento ha avuto un effetto; se sign. maggiore di 0,05 non
significativo tutto uguale.

Quali variabili hanno varianza statisticamente diverse nei due gruppi? Guardo
Levene

Effect size (d di Cohen)


D= (media1 media2) / dev. standard della popolazione (cio della variabile
quantitativa).

ANOVA
Serve a confrontare pi di 2 medie. E come il t-test a campioni indipendenti, ma con
una nominale a pi valori (es. orientamento politico). Chiedo anche il post hoc SNK (o
quello che ci chiedono). Il valore di anova F, riporto entrambi i gradi di libert e leggo
la significativit: se maggiore di 0,05 tutte le medie sono uguali, se minore almeno
una diversa. Per capire quale diversa uso post hoc: guardo la colonna con meno
medie. Se i risultati non coincidono, uso test pi preciso tipo Bonferroni. *Rossi usa
Tukey spesso

Chi-Quadro (X2)
Si usa con variabili qualitative. Test non parametrici finestre di legacy Chi quadro.

1) Equiprobabilit
Verifica se le categorie di una qualitativa hanno la stessa probabilit o meno. Quando
significativo NON equiprobabile. Valori previsti: tutte le categorie uguali.

2) Modello teorico
Per vedere se una qualitativa si distribuisce seguendo un modello da me scelto.
Quando significativo NON segue il modello teorico.

3) Indipendenza
Per capire se due qualitative sono dipendenti o meno.
Analizza > Statistiche descrittive > Tabelle di contingenza.
Nel men celle posso scegliere opzioni es. percentuali, conteggi attesi, residui
standardizzati adattati.
Nel men statistiche posso scegliere il chi quadro.
Guardo solo il chi-quadrato di Pearson. Se la sign. minore di 0,05 accetto h1 (esiste
un legame fra le due variabili). Ci avviene perch il chi-quadro calcola la differenza
fra freq. attese e osservate (residui): minore il residuo, pi sono indipendenti le
variabili (h0). Guardando solo i residui, di solito i residui significativi sono maggiori di
2, ma non ne basta uno solo, devessere una tendenza generale; comunque guardo
sign. e se mi chiede quali sono i residui che ci fanno accettare h1 gli indico i + alti. Con
i residui adattati guardo se sono significativi (maggiori di 1,96): i positivi hanno
frequenze osservate maggiori delle attese, i negativi il contrario.

Interpretazione
La a di fianco al risultato indica le celle con pochi elementi (massimo 20%). Se il
numero di righe x numero di colonne x 5 supera il totale, si pu ignorare il problema.
Altrimenti, si pu sistemare aggiungendo soggetti o segnando delle categorie come
mancanti/accorpandole.

Effect size
Si chiede insieme al chi-quadro. Phi se una tabella 2x2 (1 gl). Phi di Cramer se ha pi
celle.

Correlazione
Serve a trovare relazioni fra variabili quantitative.
Analizza correlazione bivariata.
Indice di correlazione varia fra 0 e 1 dove 0 significa no correlazione, e 1 che misuro la
stessa cosa.
Correlazioni sufficientemente alte sono quelle superiori a 0,5/0,6. Ma noi ci dobbiamo
attenere alle correlazioni significative rispetto allalfa soglia scelta.
Per escludere influenza di una terza variabile uso correlazione parziale: cos distinguo
correlazioni pure (vere) e spurie (che in realt non sono associate fra loro, ma sono
associate alla terza variabile). Per interpretare i risultati, semplicemente confronto il
risultato con quello della correlazione normale.