Variabel Terikat Biner (Binary Dependent Variable)

VARIABEL TERIKAT BINER (BINARY DEPENDENT VARIABLE)
Disusun dalam rangka memenuhi tugas pada mata kuliah Analisis Data Longitudinal
Dosen pengampu :
Asep Solih Awalluddin, M.Si.
Disusun Oleh :
Kelompok 6
Nadila Miftahul Janah 1187010060
Sri Wulan Widia Astuti 1187010076
Syffa Putri Zahra Yasmin 11870100
PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS NEGERI SUNAN GUNUNG DJATI BANDUNG
2021
DAFTAR ISI
9.2 Model Effect Random

Random effect likelihood
Contoh - Pembayaran pajak penghasilan dan pembuat pajak (Lanjutan)
Ekstensi model bertingkat
Contoh 9.2. Pencegahan merokok keluarga
9.2 Model Random Effect
Pada bagian ini diperkenalkan model yang menggunakan random effect untuk
mengakomodasi heterogenitas. Bagian ini menindaklanjuti dengan formulasi fixed effects yang
sesuai. Sebaliknya, di bagian model linier dari teks, pertama-tama akan diperkenalkan fixed
effects diikuti oleh random effect. Konsistensi antara pendekatan yang tampaknya berbeda ini
adalah bahwa teks mendekati pemodelan data dari orientasi aplikasi. Formulasi fixed effects
lebih sederhana daripada random effect dalam model linier, karena model fixed effects hanyalah
kasus khusus analisis model kovarians, representasi dari analisis regresi terapan. Sebaliknya,
dalam kasus nonlinier seperti model dengan variabel terikat biner, model random effect lebih
sederhana daripada fixed effects. Pada bagian ini sebagian bersifat komputasional karena statistik
ringkasan random effect lebih mudah dihitung. Selanjutnya, rutinitas estimasi standar, seperti
maksimum likelihood, menghasilkan penduga fixed effects yang tidak memiliki sifat asimtotik
yang diinginkan. Dengan demikian, formulasi fixed effects memerlukan penaksir khusus yang
dapat menjadi rumit untuk dihitung dan dijelaskan kepada pengguna.
Probabilitas respons yang sama dengan satu sebagai fungsi kombinasi linier dari variabel
penjelas. Untuk mengakomodasi heterogenitas, masukkan variabel khusus subjek dalam bentuk
Prob ¿ Di sini, akun efek khusus subjek hanya untuk penyadapan dan tidak termasuk variabel
lain. Pada bagian ini diasumsi bahwa {α i } adalah random effect. Untuk perumusan random
effect, dapat mengasumsikan skema pengambilan sampel dalam dua tahap. Tahap 1: Gambarlah
sampel acak n subjek dari suatu populasi. Parameter khusus subjek α i dikaitkan dengan subjek
ke-i. Tahap 2: Bersyarat pada α i, gambarkan realisasi { y it , x 'it },untuk t = 1, …, T i untuk subjek
ke-i. Pada tahap pertama, seseorang menarik efek khusus subjek {α i }dari suatu populasi. Pada
tahap kedua, untuk setiap subjek i, diambil sampel acak dari T i respons y it ,, t = 1, …, T i dan juga
mengamati variabel penjelas {x it }.
Random effect likelihood
Untuk mengembangkan likelihood, perhatikan bahwa dari tahap pengambilan sampel
kedua, α ibersyarat, likelihood untuk subjek ke-i pada pengamatan ke-t adalah
π ( α i + x 'it β ) if y it =1
p ( y it ; β ∨α i ) =
{1−π ( ai + x 'it β ) if y it =0
Diringkas sebagai
yit 1− y it
p ( y it ; β ∨α i ) =π ( α i + x ' it β ) ( 1−π ( α i+ x ' it β ) )
Karena kebebasan antara tanggapan untuk subjek bersyarat pada i, likelihood bersyarat untuk
subjek ke-i adalah
Ti
yit 1− y it
p ( y i ; β∨α i ) =∏ π ( α + x 'it β ) ( 1−π ( α i + x 'it β ))
t=1
Mengambil harapan atas i menghasilkan likelihood tanpa syarat. Jadi, likelihood (tanpa syarat)
untuk subjek ke-i adalah
Ti
p ( y i ; , β , τ )=∫ {∏
t =1
y it
π ( a+ x 'it β ) (1−π ( a+ x 'it β ) )
1− y it
} d Fα ( a) (9.5)
Pada persamaan (9.5), τ adalah parameter dari distribusi α i, F α ( .). Meskipun tidak perlu, biasanya
digunakan distribusi normal untuk F α ( .). Dalam hal ini, τ mewakili varians dari distribusi nol
rata-rata. Dengan spesifikasi untuk F α, log likelihood untuk kumpulan data adalah
n
L ( β , τ ) =∑ ln p ( y i , β , τ )
i=1
Untuk menentukan estimasi maksimum likelihood, kita memaksimalkan log likelihood

L(β , τ) sebagai fungsi dariβ dan τ . Solusi analitik bentuk tertutup untuk masalah maksimalisasi
ini tidak ada secara umum, meskipun solusi numerik dapat dilakukan dengan peralatan
komputasi modern. Penduga maksimum likelihood dapat ditentukan dengan memecahkan akar
persamaan skor K + 1
∂ 0∧∂
L ( β , τ )= L ( β , τ )=0
∂β ∂τ
Selanjutnya, varians asimtotik dapat dihitung dengan mengambil matriks turunan kedua dari log
likelihood, yang dikenal sebagai matriks informasi.
Ada dua spesifikasi yang umum digunakan dari distribusi bersyarat dalam model random
effect.
 Model logit untuk distribusi bersyarat dari suatu respons adalah
1
prob ( y it =1∨α i )=π ( α i + x 'it β ) =
1+exp (−( α i + x 'it β ) )
 Sebuah model probit untuk distribusi bersyarat dari sebuah respon. Yaitu,
prob ( y it =1∨α i )=Ф ( α i + x 'it β ) , di mana Ф adalah fungsi distribusi normal standar.
Tidak ada keuntungan atau kerugian penting ketika memilih probabilitas bersyarat untuk menjadi
logit atau probit. Kemungkinannya melibatkan jumlah pekerjaan yang kira-kira sama untuk
dievaluasi dan dimaksimalkan, meskipun fungsi logit sedikit lebih mudah untuk dievaluasi
daripada fungsi distribusi normal standar. Model probit dapat lebih mudah diinterpretasikan
karena probabilitas tak bersyarat dapat dinyatakan dalam fungsi distribusi normal standar.
Artinya, dengan asumsi normalitas untuk i.
Contoh - Pembayaran pajak penghasilan dan pembuat pajak (Lanjutan)
Untuk melihat bagaimana model variabel dependen random effect bekerja dengan kumpulan
data, kita kembali ke contoh Bagian 9.1.3. Display 9.2 menunjukkan model yang dipasang,
menggunakan LNTPI, MR dan EMP sebagai variabel penjelas. Perhitungan dilakukan dengan
menggunakan prosedur SAS NLMIXED. Prosedur ini menggunakan teknik integrasi numerik
untuk model mixed effect, yang disebut kuadratur Gaussian adaptif (lihat Pinheiro dan Bates,
2000, untuk penjelasannya). Display 9.2 menunjukkan bahwa spesifikasi random effect ini
bukanlah model yang diinginkan untuk kumpulan data ini. Dengan mengkondisikan random
effect, estimasi parameter ternyata sangat berkorelasi satu sama lain.
Ekstensi model bertingkat

Ekstensi ke model nonlinier seperti model variabel dependen biner baru saat ini mulai digunakan
secara teratur dalam ilmu terapan. Subbagian ini menyajikan pengembangan tiga tingkat ekstensi
model probit dan logit karena Gibbons dan Hedeker (1997B).
x 'it β
prob ( y it =1 )=EФ ( α i + x 'it β ) =Ф ( )
√ 1+τ
Misalkan ada i = 1, …,n mata pelajaran (sekolah, misalnya), j = 1, …, klaster J i dalam setiap
mata pelajaran (contohnya ruang kelas), dan t = 1, …, T i pengamatan dalam setiap klaster (dari
waktu ke waktu, atau siswa dengan ruang kelas). Menggabungkan tiga level, Gibbons dan
Hedeker mempertimbangkan
y ijt =α i + z'ijt α ij + x 'ijt β +ε ijt (9.6)
α i mewakili istilah heterogenitas tingkat tiga, α ijmewakili vektor tingkat dua dari istilah
heterogenitas dan ε ijt mewakili istilah gangguan tingkat satu. Ketiga istilah tersebut memiliki
rata-rata nol; rata-rata setiap level sudah diperhitungkan dalam x 'it β . Variabel kiri dari
persamaan (9.6) adalah latent. Peluang bersyarat dari kejadian ini adalah
prob ( y ijt =1∨α i , α ij ) =π ( α i + z 'ijt α ij + x 'ijt β )
di mana π (.) adalah logit atau probit. Untuk melengkapi spesifikasi model, kita asumsikan
bahwa {α i }dan {α ij }adalah masing-masing i.i.d. dan independen satu sama lain.
Parameter model dapat diperkirakan melalui maksimum likelihood. Seperti yang ditunjukkan
oleh Gibbons dan Hedeker, teknik komputasi utama adalah untuk mengambil keuntungan dari
independensi yang biasanya di asumsikan di antara level dalam pemodelan bertingkat. Artinya,
mendefinisikan y ij =( y ij1 , … , y ij T ) ' , fungsi massa peluang bersyarat adalah
ij
T ij
y ijt 1− y ijt
p ( y ij ; β∨α i , α ij )=∏ π ( α i + z 'ijt α ij + x 'ijt β ) ( 1−π (α i + z 'ijt α ij+ x 'ijt β ))
t =1
Mengintegrasikan efek heterogenitas tingkat dua
p y ij ; β , ∑ ¿ α i =∫ p ( yij ; β∨α i , a ) d F a ,2 ( a )
( 2 ) а
(9.7)
F α , 2 (.) adalah fungsi distribusi dari {α ij } dan Σ₂ adalah parameter yang terkait dengannya.
Mengikuti Gibbons dan Hedeker, kita asumsikan bahwa α ij terdistribusi normal dengan rata-rata
nol dan varians-kovarians Σ₂.
Mengintegrasikan efek heterogenitas tingkat tiga
Ji
2
p y i 1 , … , y iJ ; β , ∑ , σ =∫ ∏ p y ij ; β , ∑ ¿ a d F a ,3 ( a ) (9.8)
( i
2
3
) a j=1
( 2
)
F α , 3 (.) adalah fungsi distribusi {α ij } dan σ 32 adalah parameter yang terkait dengannya (biasanya,
normal). Dengan persamaan (9.7) dan (9.8), log likelihoodnya adalah
n
L β , ∑ , σ 23 =∑ ln p y i 1 , … , y i J ; β , ∑ , σ 32 (9.9)
( 2 ) i=1 ( i
2 )
Perhitungan kemungkinan log likelihood membutuhkan integrasi numerik. Namun, integral
dalam persamaan (9.8) hanya 1 dimensi dan integral dalam persamaan (9.7) bergantung pada
dimensi {α ij }, misalnya q, yang biasanya hanya 1 atau 2. Hal ini berbeda dengan yang lebih
langsung pendekatan yang menggabungkan istilah heterogenitas (α ¿ ¿ i, α i1 ' , … , α i J ')' ¿ Dimensi i
dari vektor ini adalah (1+q J i) × 1; menggunakan ini secara langsung dalam persamaan (9.5) jauh
lebih intens secara komputasi
Contoh 9.2. Pencegahan merokok keluarga
Gibbons dan Hedeker (1997B) mempertimbangkan data dari Sekolah Televisi dan Proyek
Pencegahan dan Penghentian Merokok Keluarga. Dalam laporan studi mereka, Gibbons dan
Hedeker mempertimbangkan 1.600 siswa kelas tujuh, dari 135 ruang kelas dalam 28 sekolah.
Kumpulan data tidak seimbang; ada antara 1 dan 13 ruang kelas dari setiap sekolah dan antara 2
dan 28 siswa dari setiap kelas. Sekolah secara acak ditugaskan ke salah satu dari empat kondisi
studi:
 kelas resistensi sosial di mana kurikulum berbasis sekolah digunakan untuk mempromosikan
pencegahan dan penghentian penggunaan tembakau
 kurikulum berbasis televisi
 kombinasi dari perlawanan sosial dan kurikulum berbasis televisi
 tanpa perlakuan (kontrol)
Skala tembakau dan kesehatan digunakan untuk mengklasifikasikan setiap siswa sebagai
berpengetahuan atau tidak, baik sebelum dan sesudah intervensi.
Tabel 9.4 memberikan probabilitas empiris pengetahuan siswa setelah intervensi, berdasarkan
jenis intervensi. Tabel ini menunjukkan bahwa kurikulum kelas resistensi sosial efektif dalam
mempromosikan kesadaran pencegahan tembakau.
Tabel 9.4 Skala Kinerja Tembakau dan Kesehatan Pasca Intervensi
Probabilitas Empiris, dalam Persen
Kelas resistensi Kurikulum Perhitungan Berpengetahuan luas
sosial berbasis televisi Ya Tidak
Tidak Tidak 421 41.6 58.4
Tidak Ya 416 48.3 51.7
Ya Tidak 380 63.2 36.8
Ya Ya 383 60.3 39.7
Total 1,600 52.9 47.1
Gibbons dan Hedeker memperkirakan model logit dan probit menggunakan jenis intervensi dan
kinerja uji pra-intervensi sebagai variabel penjelas. Mereka menganggap model dengan random
effect serta model dengan kelas sebagai tingkat kedua dan sekolah sebagai tingkat ketiga (serta
dua model dua tingkat untuk tujuan ketahanan). Untuk kedua model, kurikulum kelas resistensi
sosial secara statistik signifikan. Namun, mereka juga menemukan bahwa model tanpa random
effect menunjukkan bahwa intervensi berbasis televisi signifikan secara statistik sedangkan
model tiga tingkat tidak mengungkapkan efek yang kuat.
DAFTAR PUSTAKA
Edward W. Frees, Longitudinal and Longitudinal Data: Analysis and Applications in Social
Science, Cambridge University Press, 2004.

Variabel Terikat Biner (Binary Dependent Variable)

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Variabel Terikat Biner (Binary Dependent Variable)

Diunggah oleh

Hak Cipta:

Format Tersedia

VARIABEL TERIKAT BINER (BINARY DEPENDENT VARIABLE)

PROGRAM STUDI MATEMATIKA

9.2 Model Effect Random

Untuk menentukan estimasi maksimum likelihood, kita memaksimalkan log likelihood

Ekstensi model bertingkat

y ijt =α i + z'ijt α ij + x 'ijt β +ε ijt (9.6)

prob ( y ijt =1∨α i , α ij ) =π ( α i + z 'ijt α ij + x 'ijt β )

Mengintegrasikan efek heterogenitas tingkat dua

Anda mungkin juga menyukai