quando ricorrere allanalisi multilivello? quali vantaggi offre rispetto ai metodi convenzionali?
Clustering e design effect: vantaggi e svantaggi Il modello di regressione per lanalisi a 2 livelli:
assunzioni e definizioni il modello multilivello stima e interpretazione dei parametri stima dei parametri e interpretazione residui, bont di adattamento e confronto fra modelli strategia operativa
Questioni operative:
Introduzione
Lanalisi multilivello si applica quando esista una qualche forma di interrelazione (in senso lato) tra caratteristiche dellindividuo e del gruppo cui questo appartiene Interrelazione dovuta ai dati a disposizione:
dati organizzati secondo una struttura gerarchica campionamento a (due o) pi stadi da una popolazione con struttura gerarchica (clustering) misure ripetute per una stessa unit statistica (panel) scienze sociali (istruzione, mercato del lavoro, ) scienze mediche (medicina, psicologia, ) etc.
4
vivere stabilmente con entrambe i genitori dimensione della classe di appartenenza seleziono un certo numero di scuole sul territorio nazionale per ogni scuola seleziono alcune classi intervisto tutti gli alunni di quelle classi apprendimento scolastico -> punteggio PISA condizione familiare di ciascun studente-> dummy 0-1 dimensione della classe -> dagli archivi della scuola
5
Variabili a disposizione:
alunni nella stessa scuola provengono da localit, contesti socio-economici, etc., tra loro simili alunni della stessa classe oltre alla stesso numero di compagni di classe avranno anche gli stessi insegnanti, la stessa storia scolastica, gli stessi programmi,
Tutte queste caratteristiche simili tra alunni nella stessa classe fanno si che lapprendimento di questi alunni sia tra loro connesso La struttura gerarchica dei dati induce una forma di dipendenza tra le osservazioni
6
la correlazione (media) tra variabili misurate per alunni della stessa classe (o scuola) sar diversa (-> pi alta) della correlazione (media) tra variabili misurate per alunni di classi (o scuole) diverse
Linferenza statistica convenzionale (test t su medie, sui beta, ) si basa sullassunto di indipendenza tra le osservazioni Se lassunto di indipendenza non rispettato, varianze (e standard error) dei test sono pi piccoli di quanto dovrebbero Si tende a rifiutare le ipotesi nulle anche quando si dovrebbero accettare, quindi si trovano effetti che in realt non esistono
7
: intra-class correlation (-> rate of homogeneity) : media della dimensione dei cluster
gruppi (classi, filiali, aree geografiche, ) -> j individui (studenti, impiegati, comuni, ) -> i variabile risposta misurata a livello individuale variabili esplicative a tutti i livelli (X:individuale; Z: gruppo)
A livello individuale:
si osservi che i parametri variano per ogni gruppo: -> random coefficients model
10
ammette interazione fra le variabili individuali e di gruppo eteroschedasticit correlazione tra gli errori:
Consente la stima della intra-class correlation, considerando il modello con la sola intercetta: Var Tot = Var gruppo + Var indiv Quindi: = Correlazione attesa tra due unit scelte a caso nello stesso gruppo
12
il numero di variabili (e di parametri da stimare) ad ogni livello gli errori di previsione le interazioni cross-level -> inserite solo se motivate
Vera correlazione allinterno di una classe (tiene conto di quella tra scuole) 13