LAPORAN PRAKTIKUM
ANALISIS DATA KATEGORIK
Modul 4, 5,dan 6 : Analisis Loglinear dan Logistik Biner
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2021
Daftar Isi
4
1 Pendahuluan
1.1 Pengantar Program R
1.1.1 Rstudio
RStudio adalah integrated development environment (IDE) untuk R. Ini
mencakup konsol, editor penyorotan sintaks yang mendukung eksekusi kode
langsung, serta alat untuk merencanakan, riwayat, debugging, dan manajemen ruang
kerja. RStudio tersedia dalam edisi open source dan komersial dan berjalan di
desktop (Windows, Mac, dan Linux) atau di browser yang terhubung ke RStudio
Server atau RStudio Server Pro (Debian / Ubuntu, Red Hat / CentOS, dan SUSE
Linux)
Adapun kelebihan dari Rstudio sebagai berikut :
5
1.2 SPSS
SPSS adalah Statistical Product and Service Solutions. SPSS adalah sebuah
program aplikasi yang memiliki kemampuan untuk analisis statistik cukup tinggi
serta sistem manajemen data pada lingkungan grafis dengan menggunakan menu-
menu deskriptif dan kotak-kotak dialog yang sederhana sehingga mudah dipahami
untuk cara pengoperasiannya. Beberapa aktivitas dapat dilakukan dengan mudah
yaitu dengan menggunakan pointing dan clicking mouse SPSS banyak digunakan
dalam berbagai riset pemasaran, pengendalian dan perbaikan mutu (quality
improvement), serta riset-riset sains. SPSS pertama kali muncul dengan versi PC
(bisa dipakai untuk komputer desktop) dengan nama SPSS/PC+ (versi DOS). Tetapi,
dengan mulai populernya sistem operasi windows. SPSS dapat membaca berbagai
jenis data atau memasukkan data secara langsung ke dalam SPSS pada data editor.
6
Uji Pearso Chi Square (𝑋 2 ) yaitu
̂𝑖𝑗 )2
(𝑛𝑖𝑗 −𝑚
𝑋 2 = ∑𝐼𝑖=1 ∑𝐽𝑗=1 ̂𝑖𝑗
𝑚
7
1.7 Seleksi Model
Seleksi model log linier dilakukan dengan metode Backward Elimination.
Metode Backward Elimination pada dasarnya menyeleksi model dengan
menggunakan prinsip hierarki, yaitu dengan melihat model terlengkap sampai
dengan model yang sederhana. Langkah-langkah yang dilakukan adalah
1) Anggap model (0) yaitu model XY sebagai model terbaik.
2) Keluarkan efek interaksi dua faktor sehingga modelnya menjadi (X, Y)
yang disebut model (1).
3) Bandingkan model (0) dengan model (1) dengan hipotesis sebagai berikut.
H0 : Model (1) = model terbaik H1 : Model (0) = model terbaik Statistik
uji yang digunakan adalah Likelihood Ratio Test (G2 ) Kriteria penolakan
G 2 > χ 2 (db;α) maka tolak H0
4) Jika H0 ditolak, maka dinyatakan bahwa model (0) adalah model terbaik.
Tetapi jika gagal tolak H0, maka bandingkan model (1) tersebut dengan
model (0). Kemudian salah satu interaksi dua faktor dikeluarkan dari
model.
5) Untuk menentukan interaksi mana yang dikeluarkan terlebih dahulu maka
dipilih nilai G 2 terkecil.
8
2 Deskripsi Kerja
2.1 Studi Kasus
2.1.1 Modul 4
1. Berikut ini disajikan data penelitian yang dilakukan terhadap pelajar
Sekolah Menengah Atas (SMA/MA/Sederajat). Survey ini berkaitan dengan
strata sosial, pendidikan orang tua dan rencana studi lanjut.
Tabel 1. Survey Rencana Studi Lanjut Pelajar SMA/MA/Sederajat
Rencana Studi
Strata Sosial Pendidikan Orang Tua
Ya Tidak
Rendah 749 35
Pra Sejahtera
Tinggi 233 133
Rendah 627 38
Sejahtera 1
Tinggi 330 303
Rendah 470 37
Sejahtera 2
Tinggi 324 487
Berdasarkan data pada tabel 1 tersebut, maka:
a. Buatlah tabel kontigensinya.
b. Lakukan analisis bagaimana hubungan ketiga variabel tersebut (Strata
Sosial, Pendidikan Orang Tua, Rencana Studi) menggunakan analisis log
linier dan berikan modelnya.
2. Pada tabel 2 selesaikan menggunakan SPSS studi kasus tersebut dengan
menggunakan analisis log linier.
Tabel 2. Studi Kasus Kedua
Status
Konsumsi Alkohol
Merokok Tidak Merokok
Ya 325 360
9
2.1.2 Modul 5
2.1.3 Modul 6
1. Suatu perusahaan mengadakan open recruitment untuk posisi karyawan
baru yang ditujukan untuk fresh graduate. Penelitian dilakukan untuk
melihat pengaruh nilai IPK, skor TOEFL, dan keikutsertaan mengikuti
training leadership terhadap hasil kelulusan recruitment. Dimiliki data
berikut:
10
Hasil Skor Keikutsertaan
IPK
Recruitment TOEFL Training
0 2.76 410 1
0 2.87 530 1
0 3.03 560 1
1 3.92 607 1
0 2.63 520 1
0 3.32 520 1
0 3.57 563 1
1 3.26 600 1
0 3.53 365 1
0 2.74 550 1
0 2.75 467 1
0 2.83 467 1
0 3.12 550 0
1 3.16 611 0
0 2.06 563 0
1 3.62 650 0
0 2.89 389 0
0 3.51 620 0
1 3.54 600 0
1 2.83 635 0
1 3.39 467 0
0 2.67 600 0
1 3.65 550 0
1 4 580 0
0 3.1 550 0
1 2.39 490 0
11
b. Apabila seseorang dengan skor TOEFL = 550, IPK = 3.70, dan
mengikuti training leadership, hitung peluang lulus recruitment!
c. Apabila seseorang mahasiswa dengan skor TOEFL = 320, IPK = 2.65,
dan tidak mengikuti training leadership, hitung peluang lulus
recruitment!
2. Praktikan menginputkan data yang ada pada studi kasus pada jendela
Data View pada program SPSS. Adapun variable pada data tersebut
strata sosial, Pendidikan ortu, rencana studi, dan frekuensi.
12
3. Praktikan beralih ke jendela variable view untuk menambahkan
keterangan pada masig-masing variabel dengan memberi nama pada
masing-masing variabel, menambahkan values pada variabel
strata_sosial dengan ketentuan yang diberikan seperti 0 = “pra sejahtera”,
1 = “sejahtera 1”, dan 2 = “sejahtera 2”. Sedangkan untuk variabel
Pendidikan_ortu kententuannya seperti 0 = “rendah” dan 1= “tinggi”.
Adapun untuk ketentuan variabel rencana studi seperti 0 = “ya” dan 1=
“tidak”.
13
Gambar 2.5. Jendela Crosstabs.
6. Setelah itu memilih menu Statistics pada jendela Crostabs dan memilih
menu Chi-square.
14
Gambar 2.7. Memilih Model Seleksi.
15
Gambar 2.9. Pemberian Weight Case.
12. Selanjutnya, praktikan memilih Analyze > Loglinear > Model Selection
kemudian praktikan menginputkan variabel konsumsi_alkohol dan status
yang masing-masing diberikan Define Rangenya. Dan selanjutnya
memilih menu Model > Saturated > Options > Frequencies > Residuals.
16
Gambar 2.11. Analisis Loglinear.
2.2.2 Modul 5
1. Untuk menyelesaikan studi kasus pada modul 5 praktikan menggunakan
program RStudio.
18
Gambar 2.16. Menenetukan Odds Ratio.
19
9. Pada Langkah ini praktikan melakukan penentuan model.
20
2.2.3 Modul 6
1. Pertama, untuk menyelesaikan studi kasus praktikan terlebih dahulu
membuka program SPSS.
2. Praktikan terlebih dahulu menginputkan data yang ada pada studi kasus
pada program SPSS. Data tersebut diinputkan pada jendela halaman data
view.
3. Praktikan menuju jendela halaman variable view, yang mana pada bagian
tersebut praktikan menambahkan nilai label pada 2 variabel. Yaitu pada
variable hasil recruitment yang mana untuk nilai 0 = “tidak lulus”, 1 =
“lulus”, sedangkan untuk variable training 0 = “tidak ikut”, dan 1 =
“ikut”.
21
Gambar 2.26. Variabel View.
6. Selanjutnya, memilih menu save dan mencentang kolom seperti yang ada
pada gambar.
22
Gambar 2.29. Tampilan Jendela Logistic.
7. Pilih menu save, dan mencentang sesuai dengan pada gambar di bawah
ini.
23
3 Pembahasan
Dari hasil yang ditampilkan merupakan hasil dari analisis Crostabs, seperti
yang kita ketahui bahwa pada variabel strata_sosial terdapat 3 kategori yang mana
masing-masing kategorinya “pra sejahtaera”, “sejahtera 1”, dan “sejahtera 2” yang
masing-masing bernilai 0,1, dan 2. Sedangkan untuk variabel Pendidikan_ortu dan
rencana studi masing-masing memiliki kategori “rendah” “tinggi” dan “ya” “tidak”.
Jika dilihat dari hasil di atas dapat diketahui pula banyaknya siswa yang memiliki
recana studi sebanyak 2733 sedangkan yag tidak sebanyak 1033 dilihat dari angka
yang ada menunujukkan adanya selisish yang cukup tinggi antara yang memiliki dan
tidak dan jika dilihat dari masing-masing kategori pada strata_sosial pada kategori
pra sejahtera lah yang memiliki nilai tertinggi dalam memiliki rencana studi sebesar
982.
Adapun uji dalam penyelesaian ini dengan menggunakan uji K-Way and
Higher Order Effect yaitu menguji apakah adanya pengaruh orde ke i dengan
yang lebih tinggi adapun uji yang didapatkan seperti berikut :
24
• Hipotesis
𝐻0 : efek order kei dengan yang lebih tinggi = 0, i=1,2,3
(tidak adanya pengaruh interaksi)
𝐻1 : efek order kei dengan yang lebih tinggi ≠ 0, i=1,2,3
(adanya pengaruh interaksi)
• Tingkat signifikansi
𝛼 = 5%
• Daerah kritis
Tolak 𝐻0 jika p-value < 𝛼
• Statistik uji
25
• Tingkat signifikansi
𝛼 = 5%
• Daerah kritis
Tolak 𝐻0 jika p-value < 𝛼
• Statistik uji
26
• Statistik uji
Selanjutnya ada uji parameter yang mana uji ini untuk melihat apakah
ada pola hubungan signifikan dalam model. Adapun uji hipotesisnya seperti
berikut :
• Hipotesis
𝐻0 : pola hubungan tidak signifikan dalam model
𝐻1 : pola hubungan signifikan dalam model
• Tingkat signifikansi
𝛼 = 5%
• Daerah kritis
Tolak 𝐻0 jika p-value < 𝛼
27
• Statistik uji
• Hipotesis
𝐻0 : efek order kei dengan yang lebih tinggi = 0, i=1,2,3
(tidak adanya pengaruh interaksi)
𝐻1 : efek order kei dengan yang lebih tinggi ≠ 0, i=1,2,3
(adanya pengaruh interaksi)
• Tingkat signifikansi
29
𝛼 = 5%
• Daerah kritis
30
Gambar 3.9. Uji Parsial.
• Keputusan
Gagal tolak 𝐻0 karena p-value semua efek > 𝛼
• Kesimpulan
Dengan menggunakan tingkat kepercayaan sebesar 95% dan tingkat
signifikansi sebesar 5% data yang ada mendukung untuk gagal tolak 𝐻0 yang
mana artinya tidak adanya interaksi antar peubah
31
Selanjutnya ada uji parameter yang mana uji ini untuk melihat apakah ada
pola hubungan signifikan dalam model. Adapun uji hipotesisnya seperti berikut :
• Hipotesis
𝐻0 : pola hubungan tidak signifikan dalam model
𝐻1 : pola hubungan signifikan dalam model
• Tingkat signifikansi
𝛼 = 5%
• Daerah kritis
Tolak 𝐻0 jika p-value < 𝛼
• Statistik uji
32
• Statistik uji
3.1.2 Modul 5
Pada output di atas merupakan output dari data kecelakaan yang terdiri dari
empat variable yaitu Luka, Sabuk, Gender, dan Count yang mana variable Luka
memiliki label “Ya” dan “Tidak”, variable Sabuk memiliki label “Ya” dan “Tidak”,
dan variable Gender memiliki label “Wanita” dan “Laki”.
33
Gambar 3.14. Output Model.
Dari hasil model di atas dapat diketahui bahwa model terbaik untuk
digunakan yaitu pada model GS.GL.SL yang kemudian dilakukan perhitungan nilai
harapannya dan dihasilkan seperti pada gambar di bawah ini.
34
Gambar 3.16. Odds Ratio.
Setelah itu, praktikan melakukan analisis Chi-square dengan menggunakan
uji Goodness of Fit Test dan didapatkan hasil seperti berikut.
• Keputusan
Gagal tolak 𝐻0
Tolak 𝐻0
Tolak 𝐻0
Tolak 𝐻0
• Kesimpulan
Dengan menggunakan tingkat kepercayaan sebesar 95% data yang ada
mendukung untuk Gagal tolak 𝐻0 yang mana artinya model layak
digunakan.
36
Gambar 3.18. Model Loglinear.
Diketahui bahwa pola hubungan dari kejadian kecelakaan pada dua kondisi
pemakaian sabuk pengaman yang mengakibatkan terjadinya luka atau tidak adalah
signifikan. Adapun estimasinya seperti berikut.
37
Gambar 3.19. Estimasi Loglinear.
3.1.3 Modul 6
Setelah perhitungan menggunakan SPSS selesai dan mendapatkan hasil yang
kemudian dijelaskan seperti di bawah ini.
1. Uji Overall
• Hipotesis
𝐻0 : 𝛽0 = 0 (tidak adanya pengaruh paling sedikit satu variable bebas
secara simultan terhadap variable tak bebas)
𝐻1 : 𝛽𝑗 ≠ 0 (adanya pengaruh paling sedikit satu variable bebas secara
simultan terhadap variable tak bebas)
• Tingkat signifikansi
𝛼 = 5%
• Daerah kritis
Tolak 𝐻0 jika p-value < 𝛼
• Statistik uji
38
• Kesimpulan
Dengan menggunakan tingkat kepercayaan 95% data yang ada mendukung
untuk tolak 𝐻0 yang mana artinya tidak adanya pengaruh paling sedikit satu
variable bebas secara simultan terhadap variable tak bebas
2. Uji Parsial
• Hipotesis
𝐻0 : 𝛽𝑗 = 0 (variable bebas ke-j tidak mempunyai pengaruh secara
signifikan terhadap variable tidak bebas)
𝐻1 : 𝛽𝑗 ≠ 0 (variable bebas ke-j mempunyai pengaruh secara
signifikan terhadap variable tidak bebas)
• Tingkat signifikansi
𝛼 = 5%
• Daerah kritis
Tolak 𝐻0 jika p-value < 𝛼
• Statistik uji dan keputusan
Variable 𝛼 p-value Keputusan
IPK 0.05 0.086 Gagal tolak 𝐻0
Training 0.05 0.098 Gagal tolak 𝐻0
Skor_Toefl 0.05 0.254 Gagal tolak 𝐻0
Constant 0.05 0.037 Tolak 𝐻0
• Kesimpulan
Dengan menggunakan tingkat kepercayaan sebesar 95% data yang ada
menjelaskan bahwa variable constan berpengaruh terhadap variable
hasil recruitment, sedangkan untuk variable yang lainnya tidak
berpengaru terhadap variable dependen.
39
3. R-Squared Test
• Hipotesis
𝐻0 : 𝛽𝑗 = 0 (variable bebas ke-j tidak mempunyai pengaruh secara
signifikan terhadap variable tidak bebas)
𝐻1 : 𝛽𝑗 ≠ 0 (variable bebas ke-j mempunyai pengaruh secara
signifikan terhadap variable tidak bebas)
• Tingkat signifikansi
𝛼 = 5%
• Daerah kritis
Tolak 𝐻0 jika -2 log likelihood < table Chi-square(0.05,3)
• Statistik uji
41
4 Penutup
4.1 Kesimpulan
4.1.1 Kesimpulan Modul 4
Dari pembahasan studi kasus pada modul 4 didapatkan kesimpulan seperti
berikut :
1) Pada studi kasus nomor satu didapatkan analisi crosstabs menujukkan
bahwa banyaknya siswa yang memiliki recana studi sebanyak 2733
sedangkan yang tidak sebanyak 1033.
2) Pada uji K-Way didapatkan p-value (0.000) < 𝛼 : 0.05 maka tolak 𝐻0
atau adanya pengaruh interaksi.
3) Pada uji asosiasi parsial didapatkan data yang ada mendukung tolak 𝐻0
yang mana artinya adanya interaksi antar peubah.
4) Pada uji backward didapatkan p-value (0.000) < 𝛼 : 0.05 yang
mendukung tolak 𝐻0 yang mana artinya model 2 adalah model terbaik.
5) Pada uji parameter data yang ada mendukung tolak 𝐻0 yang mana
artinya pola hubungan signifikan dalam model.
6) Uji goodness of fit data yang ada mendukung tolak 𝐻0 yang mana artinya
model signifikan.
7) Pada studi kasus nomor 2 Sebanyak 325 orang yang mengkonsusmsi
alkhol dan juga merokok, dan 360 orang yang mengkonsusmsi alcohol
tetapi tidak merokok. Sedangkan untuk yang tidak mengkonsumsi
alkohol dan yang tidak merokok sebanyak 660 sedangkan untuk yang
mengkonsusmi alcohol dan juga merokok sebanyak 710.
8) Dilakukan uji K-Way mendukung tolak 𝐻0 yang mana artinya adanya
pengaruh interaksi.
9) Pada uji asosiasi parsial didapatkan keputusan Gagal tolak 𝐻0 karena p-
value semua efek > 𝛼 artinya tidak adanya interaksi antar peubah.
10) Pada uji backward data yang ada mendukung untuk tolak 𝐻0 yang mana
artinya model 1 merupakan model terbaik.
11) Uji parameter menunjukkan tolak 𝐻0 yang mana artinya pola hubungan
signifikan dalam model.
12) Sedangkan untuk uji goodness of fit mendukung tolak 𝐻0 yang mana
42
artinya model signifikan.
4.1.2 Modul 5
Dari pembahasan studi kasus pada modul 5 didapatkan kesimpulan seperti
berikut :
1) Diketahui bahwa model terbaik untuk digunakan yaitu pada model
GS.GL.SL.
2) Pada nilai harapan Wanita yang tidak menggunakan sabuk pengaman dan
tidak mengalami luka sebesar 3254.449, laki-laki sebesar 6114.551 dan
Wanita yang menggunakan sabuk pengaman tetapi mengalami luka
sebesar 964.5553 dan laki-laki sebesar 1092.4447.
3) Dilakukan analisis Chi-Square didapatkan data yang ada mendukung
untuk Gagal tolak 𝐻0 yang mana artinya model layak digunakan.
4) Dilakukan estimasi menggunakan model loglinear bahwa pola
hubungannya signifikan.
4.1.3 Modul 6
Dari pembahasan studi kasus pada modul 6 didapatkan kesimpulan seperti
berikut :
1) Pada uji overall didapatkan p-value (0.008) < 𝛼 (0.05) mendukung untuk
tolak 𝐻0 yang mana artinya tidak adanya pengaruh paling sedikit satu
variable bebas secara simultan terhadap variable tak bebas.
2) Uji parsial data yang ada menjelaskan bahwa variable constan
berpengaruh terhadap variable hasil recruitment, sedangkan untuk
variable yang lainnya tidak berpengaru terhadap variable dependen.
3) R-Squared Test didapatkan -2 log likelihood (22.818)< table Chi-
square(0.05,3) = 7.815 menjelaskan bahwa minimal ada satu variable
independent yang berpengaruh terhadap varaibel dependen.
4) Didapatkan model seperti berikut :
exp (−11.799 + 2.168𝑥1 − 1.880𝑥2 + 0.010𝑥3 )
𝑛(𝑥) =
1 + exp (−11.799 + 2.168𝑥1 − 1.880𝑥2 + 0.010𝑥3 )
43
5) Peluang Toefl = 550, IPK= 3,70
exp (−11.799+2.168(3.70)−1.880(1)+0.010(550))
𝑛(𝑥) = 1+exp (−11.799+2.168(3.70)−1.880(1)+0.010(550))
0.856
𝑛(𝑥) 1.856 = 0.461
44
5 Daftar Pustaka
Rosalia, Ayu Silvira. Analisis Model Log Linear Untuk Mengetahui Kecenderungan
Perilaku Anak Jalanan Binaan di Surabaya. Surabaya : ITS
45