Disusun dalam rangka memenuhi tugas pada mata kuliah Analisis Data Longitudinal
Dosen pengampu :
Asep Solih Awalluddin, M.Si.
Disusun Oleh :
Kelompok 6
Nadila Miftahul Janah 1187010060
Sri Wulan Widia Astuti 1187010076
Syffa Putri Zahra Yasmin 11870100
π ( α i + x 'it β ) if y it =1
p ( y it ; β ∨α i ) =
{1−π ( ai + x 'it β ) if y it =0
Diringkas sebagai
yit 1− y it
p ( y it ; β ∨α i ) =π ( α i + x ' it β ) ( 1−π ( α i+ x ' it β ) )
Karena kebebasan antara tanggapan untuk subjek bersyarat pada i, likelihood bersyarat untuk
subjek ke-i adalah
Ti
yit 1− y it
p ( y i ; β∨α i ) =∏ π ( α + x 'it β ) ( 1−π ( α i + x 'it β ))
t=1
Mengambil harapan atas i menghasilkan likelihood tanpa syarat. Jadi, likelihood (tanpa syarat)
untuk subjek ke-i adalah
Ti
p ( y i ; , β , τ )=∫ {∏
t =1
y it
π ( a+ x 'it β ) (1−π ( a+ x 'it β ) )
1− y it
} d Fα ( a) (9.5)
Pada persamaan (9.5), τ adalah parameter dari distribusi α i, F α ( .). Meskipun tidak perlu, biasanya
digunakan distribusi normal untuk F α ( .). Dalam hal ini, τ mewakili varians dari distribusi nol
rata-rata. Dengan spesifikasi untuk F α, log likelihood untuk kumpulan data adalah
n
L ( β , τ ) =∑ ln p ( y i , β , τ )
i=1
Tidak ada keuntungan atau kerugian penting ketika memilih probabilitas bersyarat untuk menjadi
logit atau probit. Kemungkinannya melibatkan jumlah pekerjaan yang kira-kira sama untuk
dievaluasi dan dimaksimalkan, meskipun fungsi logit sedikit lebih mudah untuk dievaluasi
daripada fungsi distribusi normal standar. Model probit dapat lebih mudah diinterpretasikan
karena probabilitas tak bersyarat dapat dinyatakan dalam fungsi distribusi normal standar.
Artinya, dengan asumsi normalitas untuk i.
Contoh - Pembayaran pajak penghasilan dan pembuat pajak (Lanjutan)
Untuk melihat bagaimana model variabel dependen random effect bekerja dengan kumpulan
data, kita kembali ke contoh Bagian 9.1.3. Display 9.2 menunjukkan model yang dipasang,
menggunakan LNTPI, MR dan EMP sebagai variabel penjelas. Perhitungan dilakukan dengan
menggunakan prosedur SAS NLMIXED. Prosedur ini menggunakan teknik integrasi numerik
untuk model mixed effect, yang disebut kuadratur Gaussian adaptif (lihat Pinheiro dan Bates,
2000, untuk penjelasannya). Display 9.2 menunjukkan bahwa spesifikasi random effect ini
bukanlah model yang diinginkan untuk kumpulan data ini. Dengan mengkondisikan random
effect, estimasi parameter ternyata sangat berkorelasi satu sama lain.
x 'it β
prob ( y it =1 )=EФ ( α i + x 'it β ) =Ф ( )
√ 1+τ
Misalkan ada i = 1, …,n mata pelajaran (sekolah, misalnya), j = 1, …, klaster J i dalam setiap
mata pelajaran (contohnya ruang kelas), dan t = 1, …, T i pengamatan dalam setiap klaster (dari
waktu ke waktu, atau siswa dengan ruang kelas). Menggabungkan tiga level, Gibbons dan
Hedeker mempertimbangkan
α i mewakili istilah heterogenitas tingkat tiga, α ijmewakili vektor tingkat dua dari istilah
heterogenitas dan ε ijt mewakili istilah gangguan tingkat satu. Ketiga istilah tersebut memiliki
rata-rata nol; rata-rata setiap level sudah diperhitungkan dalam x 'it β . Variabel kiri dari
persamaan (9.6) adalah latent. Peluang bersyarat dari kejadian ini adalah
di mana π (.) adalah logit atau probit. Untuk melengkapi spesifikasi model, kita asumsikan
bahwa {α i }dan {α ij }adalah masing-masing i.i.d. dan independen satu sama lain.
Parameter model dapat diperkirakan melalui maksimum likelihood. Seperti yang ditunjukkan
oleh Gibbons dan Hedeker, teknik komputasi utama adalah untuk mengambil keuntungan dari
independensi yang biasanya di asumsikan di antara level dalam pemodelan bertingkat. Artinya,
mendefinisikan y ij =( y ij1 , … , y ij T ) ' , fungsi massa peluang bersyarat adalah
ij
T ij
y ijt 1− y ijt
p ( y ij ; β∨α i , α ij )=∏ π ( α i + z 'ijt α ij + x 'ijt β ) ( 1−π (α i + z 'ijt α ij+ x 'ijt β ))
t =1
p y ij ; β , ∑ ¿ α i =∫ p ( yij ; β∨α i , a ) d F a ,2 ( a )
( 2 ) а
(9.7)
F α , 2 (.) adalah fungsi distribusi dari {α ij } dan Σ₂ adalah parameter yang terkait dengannya.
Mengikuti Gibbons dan Hedeker, kita asumsikan bahwa α ij terdistribusi normal dengan rata-rata
nol dan varians-kovarians Σ₂.
Mengintegrasikan efek heterogenitas tingkat tiga
Ji
2
p y i 1 , … , y iJ ; β , ∑ , σ =∫ ∏ p y ij ; β , ∑ ¿ a d F a ,3 ( a ) (9.8)
( i
2
3
) a j=1
( 2
)
F α , 3 (.) adalah fungsi distribusi {α ij } dan σ 32 adalah parameter yang terkait dengannya (biasanya,
normal). Dengan persamaan (9.7) dan (9.8), log likelihoodnya adalah
n
L β , ∑ , σ 23 =∑ ln p y i 1 , … , y i J ; β , ∑ , σ 32 (9.9)
( 2 ) i=1 ( i
2 )
Perhitungan kemungkinan log likelihood membutuhkan integrasi numerik. Namun, integral
dalam persamaan (9.8) hanya 1 dimensi dan integral dalam persamaan (9.7) bergantung pada
dimensi {α ij }, misalnya q, yang biasanya hanya 1 atau 2. Hal ini berbeda dengan yang lebih
langsung pendekatan yang menggabungkan istilah heterogenitas (α ¿ ¿ i, α i1 ' , … , α i J ')' ¿ Dimensi i
dari vektor ini adalah (1+q J i) × 1; menggunakan ini secara langsung dalam persamaan (9.5) jauh
lebih intens secara komputasi
Contoh 9.2. Pencegahan merokok keluarga
Gibbons dan Hedeker (1997B) mempertimbangkan data dari Sekolah Televisi dan Proyek
Pencegahan dan Penghentian Merokok Keluarga. Dalam laporan studi mereka, Gibbons dan
Hedeker mempertimbangkan 1.600 siswa kelas tujuh, dari 135 ruang kelas dalam 28 sekolah.
Kumpulan data tidak seimbang; ada antara 1 dan 13 ruang kelas dari setiap sekolah dan antara 2
dan 28 siswa dari setiap kelas. Sekolah secara acak ditugaskan ke salah satu dari empat kondisi
studi:
kelas resistensi sosial di mana kurikulum berbasis sekolah digunakan untuk mempromosikan
pencegahan dan penghentian penggunaan tembakau
kurikulum berbasis televisi
kombinasi dari perlawanan sosial dan kurikulum berbasis televisi
tanpa perlakuan (kontrol)
Skala tembakau dan kesehatan digunakan untuk mengklasifikasikan setiap siswa sebagai
berpengetahuan atau tidak, baik sebelum dan sesudah intervensi.
Tabel 9.4 memberikan probabilitas empiris pengetahuan siswa setelah intervensi, berdasarkan
jenis intervensi. Tabel ini menunjukkan bahwa kurikulum kelas resistensi sosial efektif dalam
mempromosikan kesadaran pencegahan tembakau.
Tabel 9.4 Skala Kinerja Tembakau dan Kesehatan Pasca Intervensi
Probabilitas Empiris, dalam Persen
Kelas resistensi Kurikulum Perhitungan Berpengetahuan luas
sosial berbasis televisi Ya Tidak
Tidak Tidak 421 41.6 58.4
Tidak Ya 416 48.3 51.7
Ya Tidak 380 63.2 36.8
Ya Ya 383 60.3 39.7
Total 1,600 52.9 47.1
Gibbons dan Hedeker memperkirakan model logit dan probit menggunakan jenis intervensi dan
kinerja uji pra-intervensi sebagai variabel penjelas. Mereka menganggap model dengan random
effect serta model dengan kelas sebagai tingkat kedua dan sekolah sebagai tingkat ketiga (serta
dua model dua tingkat untuk tujuan ketahanan). Untuk kedua model, kurikulum kelas resistensi
sosial secara statistik signifikan. Namun, mereka juga menemukan bahwa model tanpa random
effect menunjukkan bahwa intervensi berbasis televisi signifikan secara statistik sedangkan
model tiga tingkat tidak mengungkapkan efek yang kuat.
DAFTAR PUSTAKA
Edward W. Frees, Longitudinal and Longitudinal Data: Analysis and Applications in Social
Science, Cambridge University Press, 2004.