Anda di halaman 1dari 16

LEMBAR KERJA MAHASISWA

Nama : Muchamad Nur Kholis


NIM : 19611095
Kelas : C

Praktikum Analisis Data Kategorik

Modul 5: Analisis Loglinear dengan R

1. Studi Kasus

Survey dilakukan di suatu universitas ternama di kota Y terhadap calon mahasiswa yang
mendaftarkan diri dan mengikuti ujian di kampus tersebut. Lokasi ujian diadakan di dua lokasi
yakni FMIPA (Fakultas Matematika dan Ilmu Pengetahuan Alam) dan FTSP (Fakultas Teknik
Sipil dan Perencanaan) dengan masing-masing jenis ujian yang bersifat PBT (Paper Based Test)
dan CBT (Computer Based Test), selain itu diketahui juga banyak calon mahasiswa yang
dinyatakan Lulus dan Tidak Lulus dalam variabel Hasil Ujian. Data dicatat dalam bentuk tabel
kontigensi 2 x 2 x 2. Faktor L sebagai Lokasi Ujian, faktor J sebagai Jenis Ujian, dan faktor H
sebagai Hasil Ujian.
Tabel 1. 1. Tabel Kontingensi Data Ujian
Lokasi Ujian Jenis Ujian Hasil Ujian (H)
Total
(L) (J) Lulus Tidak Lulus
PBT 850 550 1400
FMIPA
CBT 60 375 435
PBT 300 401 701
FTSP
CBT 200 30 230
Total 1410 1356 2766

Lakukan analisis log linier dengan menggunakan R, langkah mengikuti dengan video yang telah
diberikan.
2. Deskripsi Kerja
1. Sebelum mengerjakan studi kasus, praktikan menginstall package MASS dengan syntax
install.packages() dan mengaktikannya dengan syntax library() seperti pada
gambar berikut.

Gambar 2. 1. Import Packages “MASS”


2. Sebelum memasuki studi kasus, praktikan menginputkan data tabel kontingensi terlebih
dahulu dan menampilkannya dalam data frame menggunakan syntax data.frame() dan
expand.grid() dengan nama variabel “tabel_ujian” seperti pada gambar berikut.

Gambar 2. 2. Membuat Tabel Kontingensi


3. Selanjutnya, praktikan membentuk model loglinear dengan menggunakan syntax
loglm() dengan model lengkap (saturated model) untuk mengetahui efek individual
seperti pada gambar berikut.

Gambar 2. 3. Membentuk Model Saturated


4. Kemudian, praktikan membentuk model lain selain saturated model atau model (LJH).
Dalam hal ini, praktikan membentuk 4 model lain yaitu model (LJ,LH,JH), model
(LH,JH), model (LJ,H), dan model (L,J,H). Untuk membentuk model lainnya, bisa
memanfaatkan syntax update() untuk mengubah model sebelumnya. Sehingga syntax
yang digunakan seperti pada gambar berikut.

Gambar 2. 4. Membentuk Model Lainnya


5. Lalu, praktikan mencari nilai harapan (fitted value) dari tiap-tiap model dan
menampilkannya ke dalam bentuk data frame dengan syntax seperti pada gambar berikut.

Gambar 2. 5. Mencari Nilai Harapan


6. Selanjutnya, praktikan akan mencari nilai fitted atau nilai harapan dengan menggunakan
syntax fitted() seperti pada gambar berikut.

Gambar 2. 6. Mencari Fitted Value


7. Kemudian, praktikan membuat fungsi untuk mencari nilai odds ratio dengan tahapan
seperti pada gambar berikut.

Gambar 2. 7. Membuat Fungsi untuk Mencari Nilai Odds Ratio


8. Apabila sudah melakukan tahapan di atas, maka selanjutnya praktikan akan mencari nilai
odds ratio dengan menggunakan syntax odd.ratio() seperti pada gambar berikut.

Gambar 2. 8. Mencari Nilai Odds Ratio


9. Setelah mengetahui nilai odds ratio yaitu melakukan uji anova dari masing-masing
model untuk mengetahui model yang terbaik. Syntax yang digunakan adalah anova()
seperti pada gambar berikut.

Gambar 2. 9. Mencari Model Terbaik


10. Karena belum terdapat estimasi model, maka untuk mencari estimasi dari model loglm
dapat dituliskan syntax seperti pada gambar berikut.

Gambar 2. 10. Mencari Estimasi Model Loglm


11. Untuk melihat apakah faktor-faktornya saling dependen atau tidak maka perlu dilakukan
uji interaksi dengan yang pertama menggunakan syntax loglin() seperti pada gambar
berikut. Dari syntax ini, akan muncul hasil untuk uji goodness of fit dan nilai estimasi
untuk masing-masing parameter.

Gambar 2. 11. Loglinear dengan Fungsi “loglin”


12. Selanjutnya, untuk melihat apakah terdapat perbedaan efek yang dipakai sebelum uji
anova dapat digunakan syntax seperti pada gambar berikut.

Gambar 2. 12. Melihat Perbedaan Efek


13. Selain menggunakan syntax loglin(), dalam analisis loglinear dapat juga
menggunakan syntax glm() dengan nilai count sama dengan “^2” yang berarti model
yang dibuat hanya terdiri 2 interaksi dan menggunakan family = poisson yang berarti
pengambilan sampelnya berdasarkan distribusi poisson yang mana terbatas pada waktu
bukan jumlah sampelnya. Dilanjutkan dengan perintah summary() untuk mengetahui
variabel yang signifikan. Syntax yang digunakan seperti pada gambar berikut. Dari syntax
ini, akan muncul nilai estimasi untuk masing-masing parameter dan parameter mana saja
yang signifikan.

Gambar 2. 13. Loglinear dengan Fungsi “glm”


14. Kemudian, untuk mengetahui nilai pearson-nya dapat digunakan syntax seperti berikut.

Gambar 2. 14. Mencari Nilai Pearson


15. Selanjutnya, dilakukan modifikasi dari “fit.glm” dengan syntax update() seperti pada
gambar berikut. Update yang dilakukan terdapat pada constrasts.

Gambar 2. 15. Modifikasi dari Model “glm” Sebelumnya


3. Pembahasan
Sebelumnya telah dipaparkan deskripsi kerja mengenai langkah kerja untuk
menyelesaikan studi kasus. Pada bab kali ini praktikan akan menjelaskan lebih detail lagi
mengenai hal tersebut.
Pada studi kasus tersebut, praktikan diminta melakukan analisis loglinear dari Tabel
1. 1. dengan software R. Untuk menyelesaikan studi kasus dengan software R, praktikan
perlu menginputkan data tabel kontingensi terlebih dahulu dan menampilkannya dalam data
frame menggunakan syntax data.frame() dan expand.grid() dengan nama variabel
“tabel_ujian” seperti pada Gambar 2. 2.. Maka, akan didapat output seperti gambar berikut.

Gambar 3. 1. Tabel Kontingensi dari Data Ujian


Berdasarkan Gambar 3. 1. tersebut dapat dilihat jumlah orang yang mengikuti ujian
PBT di FMIPA dan lulus sebanyak 850, sedangkan yang tidak lulus sebanyak 550. Orang
yang mengikuti ujian CBT di FMIPA dan lulus sebanyak 60, sedangkan yang tidak lulus
sebanyak 375. Selain itu, dapat diketahui juga orang yang mengikuti ujian PBT di FTSP dan
lulus sebanyak 300, sedangkan yang tidak lulus sebanyak 401. Orang yang mengikuti ujian
CBT di FTSP dan lulus sebanyak 200, sedangkan yang tidak lulus sebanyak 30.
Untuk penyelesaian analisis loglinear dengan fungsi Loglm, langkah pertama yang
dilakukan adalah melakukan pemodelan dengan syntax Loglm() untuk model saturated atau
model lengkap seperti pada Gambar 2. 3.. Kemudian, praktikan membentuk model lain
selain saturated model atau model (LJH). Dalam hal ini, praktikan membentuk 4 model lain
yaitu model (LJ,LH,JH), model (LH,JH), model (LJ,H), dan model (L,J,H). Untuk
membentuk model lainnya, bisa memanfaatkan syntax update() untuk mengubah model
sebelumnya. Sehingga syntax yang digunakan seperti pada Gambar 2. 4.
Setelah menentukan model yang akan dibentuk, langkah selanjutnya yaitu mencari
nilai harapan dari tiap-tiap model yang ada. Nilai-nilai harapan ini kemudian disatukan dalam
sebuah data frame dengan syntax seperti pada Gambar 2. 5. Berikut adalah tampilan data
frame yang telah dibentuk.

Gambar 3. 2. Nilai Harapan Tiap-tiap Model


Berdasarkan output pada Gambar 3. 2., menunjukkan tabel yang praktikan buat dari
pemodelan sebelumnya. Dimana kita bisa melihat nilai harapan dari masing – masing model
yang telah dibuat sebelumnya. Pada syntax terdapat [,-4] yang artinya tanpa kolom ke 4
atau kolom count.
Kemudian ditampilkan fitted value atau nilai harapan. Dengan melakukan syntax
seperti pada Gambar 2. 6., maka akan diperoleh output seperti gambar berikut.

Gambar 3. 3. Fitted Value


Dari output pada Gambar 3. 3., dapat dilihat bahwa nilai harapan dibagi berdasarkan
hasil yang lulus dan tidak lulus.
Setelah itu, dilakukan perhitungan nilai odds ratio. Nilai odds ratio adalah peluang
terjadinya suatu kejadian dibandingkan peluang tidak terjadinya suatu kejadian. Dengan
syntax seperti pada Gambar 2. 7. Maka, akan didapat hasil sebagai berikut.

Gambar 3. 4. Mencari Nilai Odds Ratio


Syntax function(x) bentuknya merupakan matriks. Selain itu syntax
x[1,1]*x[2,2]/(x[2,1]*x[1,2]) berarti bahwa data dari baris 1 kolom 1 dikali data
dari baris 2 kolom 2 kemudian dibagi dengan data dari baris 2 kolom 1 dikali data dari baris
1 kolom 2. apply digunakan untuk melakukan perhitungan array di baris 1 kolom 2 dan
dimensi ke 3.

Gambar 3. 5. Nilai Odds Ratio


Dari output pada Gambar 3. 5., dapat diketahui bahwa nilai odds ratio 1.055962 adalah
nilai peluang dari orang yang mengikuti ujian PBT di FMIPA, karena nilai odds ratio > 1
berarti orang yang mengikuti ujian PBT di FMIPA lebih banyak dibandingkan dengan yang
mengikuti ujian CBT. Kemudian nilai odds ratio 1.883645 adalah nilai peluang dari orang
lulus ujian PBT, karena nilai odds ratio > 1 berarti orang yang lulus ujian PBT lebih banyak
dibandingkan dengan yang tidak lulus ujian PBT. Kemudian nilai odds ratio 0.8480216
adalah nilai peluang dari orang yang lulus ujian CBT berasal dari lokasi ujian FMIPA, karena
nilai odds ratio < 1 berarti orang yang lulus ujian CBT berasal dari lokasi ujian FMIPA lebih
sedikit dibandingkan dengan tidak lulus ujian CBT berasal dari lokasi ujian FMIPA.
Setelah mengetahui nilai odds ratio yaitu melakukan uji anova dari masing-masing
model untuk mengetahui model yang terbaik. Syntax yang digunakan adalah anova()
seperti pada Gambar 2. 9.

Gambar 3. 6. Output Uji Efek Interaksi


Uji Efek Interaksi
1. Hipotesis Uji
H0 : faktor i dan k saling independen
H1 : faktor i dan k tidak saling independen
2. Taraf signifikansi
𝛼 = 5% = 0.05
3. Daerah Kritis
2
H0 ditolak jika 𝐺 2 > 𝒳𝑡𝑎𝑏𝑒𝑙
4. Statistik Uji
Model 𝐺2
LJ,LH,JH 473.4048
LH,JH 473.0684
LJ,H 419.5234
L,J,H 418.7789

Untuk model (LJ,H) dan model (L,J,H)


𝐺12 = 419.5234 (LJ,H)
𝐺22 = 418.7789 (L,J,H)
𝐺 2 = 𝐺12 − 𝐺22 = 419.5234 − 418.7789 = 0.7445
𝑑𝑓 = 𝑑𝑓1 − 𝑑𝑓2 = 2 − 1 = 1
2
𝒳0.05;1 = 3.8415
5. Keputusan
2
Karena 𝐺 2 = 0.7445 < 𝒳0.05;1 = 3.8415, maka gagal tolak 𝐻0
6. Kesimpulan
Dengan tingkat kepercayaan 95% , data yang ada gagal tolak 𝐻0 , yang artinya faktor L
(lokasi ujian) dan J (jenis ujian) saling independen
Gambar 3. 6. merupakan output dari uji anova untuk semua model. Namun, output di
R langsung mengurutkan model dari yang terlengkap sampai tidak terlengkap tanpa adanya
keterangan . Sehingga untuk mengatasi hal itu praktikan melakukan uji anova pada masing-
masing model.

Uji Goodness of Fit Model (LJ,LH,JH)

Gambar 3. 7. Uji Goodness of Fit Model (LJ,LH,JH)


1. Hipotesis Uji
H0 : Model yang diuji sesuai dengan data (layak digunakan)
H1 : Model saturated sesuai dengan data
2. Taraf signifikansi
𝛼 = 5% = 0.05
3. Daerah Kritis
H0 ditolak jika p-value < 𝛼.
4. Statistik Uji
Didapat nilai p-value = 0
5. Keputusan
Karena nilai p-value = 0 < 𝛼 = 0.05, maka tolak H0
6. Kesimpulan
Dengan tingkat kepercayaan 95% data yang ada menolak H0 yang artinya yang
berarti model saturated sesuai dengan data. Dengan kata lain, model (LJ,LH,JH) belum
layak digunakan.

Uji Goodness of Fit Model (LH,JH)

Gambar 3. 8. Uji Goodness of Fit Model (LH,JH)


1. Hipotesis Uji
H0 : Model yang diuji sesuai dengan data (layak digunakan)
H1 : Model saturated sesuai dengan data
2. Taraf signifikansi
𝛼 = 5% = 0.05
3. Daerah Kritis
H0 ditolak jika p-value < 𝛼.
4. Statistik Uji
Didapat nilai p-value = 0
5. Keputusan
Karena nilai p-value = 0 < 𝛼 = 0.05, maka tolak H0
6. Kesimpulan
Dengan tingkat kepercayaan 95% data yang ada menolak H0 yang artinya yang berarti
model saturated sesuai dengan data. Dengan kata lain, model (LH,JH) belum layak
digunakan.
Uji Goodness of Fit Model (LJ,H)

Gambar 3. 9. Uji Goodness of Fit Model (LJ,H)


1. Hipotesis Uji
H0 : Model yang diuji sesuai dengan data (layak digunakan)
H1 : Model saturated sesuai dengan data
2. Taraf signifikansi
𝛼 = 5% = 0.05
3. Daerah Kritis
H0 ditolak jika p-value < 𝛼.
4. Statistik Uji
Didapat nilai p-value = 0
5. Keputusan
Karena nilai p-value = 0 < 𝛼 = 0.05, maka tolak H0
6. Kesimpulan
Dengan tingkat kepercayaan 95% data yang ada menolak H0 yang artinya yang berarti
model saturated sesuai dengan data. Dengan kata lain, model (LJ,H) belum layak
digunakan.

Uji Goodness of Fit Model (L,J,H)

Gambar 3. 10. Uji Goodness of Fit Model (L,J,H)


1. Hipotesis Uji
H0 : Model yang diuji sesuai dengan data (layak digunakan)
H1 : Model saturated sesuai dengan data
2. Taraf signifikansi
𝛼 = 5% = 0.05
3. Daerah Kritis
H0 ditolak jika p-value < 𝛼.
4. Statistik Uji
Didapat nilai p-value = 0
5. Keputusan
Karena nilai p-value = 0 < 𝛼 = 0.05, maka tolak H0
6. Kesimpulan
Dengan tingkat kepercayaan 95% data yang ada menolak H0 yang artinya yang berarti
model saturated sesuai dengan data. Dengan kata lain, model (L,J,H) belum layak
digunakan.

Karena belum terdapat estimasi model, maka untuk mencari estimasi dari model loglm
dapat dituliskan syntax seperti pada Gambar 2. 10. Maka, akan diapat hasil seperti gambar
berikut.

Gambar 3. 11. Estimasi Model


Berdasarkan Gambar 3. 11. didapat hasil estimasi sebagai berikut.
log(𝜇𝑖𝑗𝑘 ) = 0.07706 + 0.09534𝐿 + 0.08723𝐽 + 0.08796𝐻 + 0.09085𝐿𝐽 + 0.08139𝐿𝐻
+ 0.09470𝐽𝐻
Dengan keterangan L adalah lokasi ujian, J adalah jenis ujian, dan H adalah hasil ujian.
Gambar 3. 12. Margin untuk Odds Ratio
Margin pada gambar tersebut untuk menjelaskan dari hasil dari odds ratio yang tidak
diketahui itu nilai peluang odds ratio yang mana. Jadi, nilai peluang odds ratio untuk lokasi
dan jenis sebesar 1.055962, untuk jenis dan hasil sebesar 1.883645, dan untuk lokasi dan
hasil sebesar 0.8480216. Kemudian, terdapat juga hasil dari derajat bebas sebesar 1.

Gambar 3. 13. Output untuk Melihat Parameter


Dari hasil output pada Gambar 3. 13. terlihat ada parameter untuk intercept, lokasi,
jenis, hasil, lokasi.jenis, lokasi.hasil, dan jenis.hasil.
Selain menggunakan syntax loglin(), dalam analisis loglinear dapat juga
menggunakan syntax glm() dengan nilai count sama dengan “^2” yang berarti model yang
dibuat hanya terdiri 2 interaksi dan menggunakan family = poisson yang berarti
pengambilan sampelnya berdasarkan distribusi poisson yang mana terbatas pada waktu
bukan jumlah sampelnya. Dilanjutkan dengan perintah summary() untuk mengetahui
variabel yang signifikan. Syntax yang digunakan seperti pada Gambar 2. 13. Dari syntax
ini, akan muncul nilai estimasi untuk masing-masing parameter dan parameter mana saja
yang signifikan.

Gambar 3. 14. Analisis Loglinear dengan Fungsi “glm”


Berdasarkan output pada Gambar 3. 14. Didapat model sebagai berikut.
log(𝜇𝑖𝑗𝑘 ) = 6.61499 − 0.13219(ℎ𝑎𝑠𝑖𝑙𝑇𝑖𝑑𝑎𝑘𝐿𝑢𝑙𝑢𝑠) − 1.51635(𝑗𝑒𝑛𝑖𝑠𝐶𝐵𝑇)
− 0.61508(𝑙𝑜𝑘𝑎𝑠𝑖𝐹𝑇𝑆𝑃) + 0.63641(ℎ𝑎𝑠𝑖𝑙𝑇𝑖𝑑𝑎𝑘𝐿𝑢𝑙𝑢𝑠: 𝑗𝑒𝑛𝑖𝑠𝐶𝐵𝑇)
− 0.17432(ℎ𝑎𝑠𝑖𝑙𝑇𝑖𝑑𝑎𝑘𝐿𝑢𝑙𝑢𝑠: 𝑙𝑜𝑘𝑎𝑠𝑖𝐹𝑇𝑆𝑃) + 0.08187(𝑗𝑒𝑛𝑖𝑠𝐶𝐵𝑇: 𝑙𝑜𝑘𝑎𝑠𝑖𝐹𝑇𝑆𝑃)
Kemudian, untuk mengetahui nilai pearson-nya digunakan syntax seperti pada
Gambar 2. 14. Maka, didapat hasil sebagai berikut.

Gambar 3. 15. Nilai Pearson


Berdasarkan output pada Gambar 3. 15. Didapat nilai pearson dari analisis loglinear
dengan model glm sebesar 391.882.
Selanjutnya, dilakukan modifikasi dari “fit.glm” dengan syntax update() seperti pada
Gambar 2. 14. Update yang dilakukan terdapat pada constrasts.

Gambar 3. 16. Modifikasi Model “glm”


Berdasarkan output pada Gambar 3. 16. Didapat hasil persamaan model loglinear
dengan fungsi “glm” sebagai berikut.
log(𝜇𝑖𝑗𝑘 ) = 4.89634 − 0.32990𝐻1 + 0.79807𝐽1 + 0.70652𝐿1 + 0.63641𝐻1𝐽1
− 0.17432𝐻1𝐿1 + 0.08187𝐽1𝐿1

Anda mungkin juga menyukai