LAPORAN PRAKTIKUM
Analisis Data Kategorik
Modul 3: Analisis Log Linear dan Regresi Logistic Biner
Tanggal Tandatangan
Nama Penilai Nilai
Koreksi Asisten Dosen
Iqbal Fathur Rahman
Putri Choirunisa
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2019
Daftar Isi
Daftar Isi.................................................................................................................. ii
Daftar Gambar......................................................................................................... ii
Daftar Isi.................................................................................................................. ii
Daftar Tabel ........................................................................................................... iii
Daftar Gambar........................................................................................................ iii
1 Pendahuluan ..................................................................................................... 1
1.1 Model Log Linear .......................................................................................... 1
1.2 Uji K-Way ...................................................................................................... 2
1.3 Regresi logistik biner ..................................................................................... 2
2 Deskripsi Kerja ................................................................................................ 4
2.1 Studi Kasus .................................................................................................... 4
2.2 Langkah Kerja ............................................................................................... 5
2.2.1 Langkah Kerja Studi Kasus Pertama................................................... 5
Adapun langkah-langkah kerja yang digunakan praktikan adalah sebagai berikut:
....................................................................................................................... 5
2.2.2 Langkah Kerja Studi Kasus Kedua ................................................... 10
Adapun langkah-langkah kerja yang digunakan praktikan adalah sebagai berikut:
..................................................................................................................... 10
3 Pembahasan.................................................................................................... 15
3.1 Pembahasan Studi Kasus Pertama ............................................................... 15
3.2 Pembahasan Studi Kasus Kedua .................................................................. 19
4 Penutup .......................................................................................................... 27
4.1 Kesimpulan .................................................................................................. 27
5 Daftar Pustaka ................................................................................................ 28
ii
Daftar Tabel
Daftar Gambar
iii
Gambar 3.4 Output Signifikansi Variabel ................................................... 17
iv
1 Pendahuluan
1.1 Model Log Linear
Model log-linear adalah model matematis yang mengambil bentuk fungsi
yang logaritmanya sama dengan kombinasi linear dari parameter model, yang
memungkinkan penerapan regresi linier (mungkin multivariat). Artinya, ia
memiliki bentuk umum.
(1)
Dimana fi (X) adalah jumlah yang merupakan fungsi dari variabel X, secara
umum merupakan vektor nilai, sedangkan c dan wi berada pada parameter model.
Istilah ini secara khusus dapat digunakan untuk sebuah plot atau grafik log-linear,
yang merupakan jenis plot semi-log dan regresi poisson untuk tabel kontingensi,
jenis model linier umum. Aplikasi spesifik model log-linear adalah di mana
kuantitas output terletak pada kisaran 0 sampai ∞, untuk nilai variabel independen
X, atau lebih segera, jumlah transformasi fi (X) dalam kisaran -∞ to + ∞. Ini
mungkin kontras dengan model logistik, mirip dengan fungsi logistik, dimana
kuantitas output berada pada kisaran 0 sampai 1. Dengan demikian konteks dimana
model ini berguna atau realistis seringkali bergantung pada kisaran nilai yang
dimodelkan.
Estimasi parameter dilakukan menggunakan data sampel salah satu metode
yang digunakan untuk mengestimasi parameter adalah maximum likelihood
estimator (MLE). Terdapat dua cara untuk inferensi parameter ƛ, yaitu metode
exsak dan metode pendekatan distribusi normal. Metode eksak digunakan pada
sampel kecil dan metode pendekatan distirbusi normal digunakan ketika jumlah
sampel besar.Dalam inferensi statistik, kita mengenal nilai α yang merupakan
probabilitas kesalahan tipe I yang biasa disebut dengan tingkat signifikansi.Untuk
1
menguji hipotesis H0, peneliti menetapkan nilai α yang digunakan. Nilai α terkecil
sedemikian hingga dapat menolak H0 disebut P-value.
(Jaka Nugraha, 2013)
2
sama dengan nol atau satu. Dalam keadaan demikian, variabel y mengikuti
distribusi Bernoulli untuk setiap observasi tunggal (Hosmer & Lameshow, 2000).
Bentuk spesifik dari model regresi logistik adalah seperti berikut:
(2)
Dengan π(x) adalah peluang kejadian sukses dengan nilai probabilitas
0≤π(x)≤1 dan βj adalah nilai parameter dengan j = 1,2,......,p. π(x) merupakan fungsi
yang non linier, sehingga perlu dilakukan transformasi ke dalam bentuk logit untuk
memperoleh fungsi yang linier agar dapat dilihat hubungan antara variabel bebas
dan variabel tidak bebas. Dengan melakukan transformasi dari logit π(x), maka
didapat persamaan yang lebih sederhana, yaitu:
(3)
3
2 Deskripsi Kerja
2.1 Studi Kasus
1. Suatu badan survey melakukan survey terkait jenis kelamin dan asal
partai. Kemudian ingin mengetahui hubungan antara jenis kelamin dan
asal partai ujian menggunakan data sebagai berikut
Tabel 2.1 Studi Kasus Satu
Jenis kelamin Partai
Buruh Konservatif
Laki-laki 222 195
perempuan 240 185
4
Pendidikan Pemohon 0 Perguruan Tinggi
1 SMA
2 <=SMP
Tugas :
1) Lakukan analisis regresi logistic biner dengan menggunakan Software SPSS,
mulai uji overall sampai Classification Table. (Bobot 50%)
2) Apabila seorang peminjam berumur 27 tahun dengan pendidikan terakhir
SMA membayar DP lebih dari 1.5 juta dan jangka waktu pembayaran kridit
12 bulan.
a. Hitunglah peluang peminjam tersebut mempunyai status kridit macet.
(Bobot 25%)
b. Hitunglah peluang peminjam tersebut mempunyai status kridit tidak
macet. (Bobot 25%)
5
Gambar 2.1 Membuka SPSS
2. Kemudian akan muncul tampilan awal saat membuka aplikasi IBM SPSS
Statistics 22. Lalu pilih tombol Exit dipojok kanan atas.
6
Gambar 2.3 Lembar Kerja SPSS
4. Masukkan variabel jk, partai, frek.
7
8. Masukkan masing-masing variabel yang dikehendaki ke dalam baris dan
kolom pada isian crosstabs.
8
Gambar 2.10 Analisis Loglinier
11. Kemudian menentukan define range, dengan nilai minimum sebesar 1 dan
nilai maksimum sebesar 2.
10
Gambar 2.15 Lembar Kerja SPSS
4. Masukkan variabel kredit, dp, jangka waktu, umur, dan pendidikan di
variable view.
11
6. Untuk melakukan analisis regresi logistik biner, pilih menu Analyze
Regression Binary logistic.
12
8. Kemudian masuan variabel dp dan pendidikan menjadi Categorical
Covariates
13
10. Lalu pilih Options centang Hosmer-Lemeshow goodness of fit,
Classification Plot, Casewise listing of residuals All case dan include
constant in model Continue OK.
14
3 Pembahasan
3.1 Pembahasan Studi Kasus Pertama
Berdasarkan soal yaitu suatu badan survey ingin mengetahui hubungan antara
jenis kelamin dan asal partai maka didaptkan tabel kontigensi sebagai berikut.
17
v) Keputusan
Gagal tolak H0 karena p-value > α yaitu 0,600 > 0.05
vi) Kesimpulan
Berdasarkan hasil pengujian di atas, dengan tingkat kepercayaan
sebesar 95%, maka dapat disimpulkan bahwa model 1 adalah model
terbaik (model yang lebih sederhana).
4. Parameter Estimates
i) Hipotesis
H0= pola hubungan tidak signifikan atau parameter tidak signifikan
dalam model
H1 = pola hubungan signifikan atau parameter signifikan dalam model
ii) Tingkat Signifikansi
α = 0.05
iii) Daerah Kritis
Tolak H0 jika p-value < α
iv) Statistika Uji
vi) Kesimpulan
Log(𝜇ij) = 𝜆 0.0996 partai
18
5. Godness of fit test
i) Hipotesis
H0 = Model signifikan
H1 = Model tidak signifikan
ii) Tingkat Signifikansi
α = 0.05
iii) Daerah Kritis
Tolak H0 jika p-value < α
iv) Statistika Uji
19
Pada kasus ini terdapat 35 data yang termasuk dalam analisis dan
tidak terdapat data yang hilang yang dilihat dari missing cases.
Atau
20
Sig. < 0,05
iv) Statistik uji
21
Gambar 3.10 Output Variabels in the Equation
v) Keputusan Uji
Xi P-value Tanda α Keputusan
dp 1 0,023 < 0,05 Tolak H0
Jangka waktu 0,037 < 0,05 Tolak H0
Pendidikan pemohon 0,021 < 0,05 Tolak H0
vi) Kesimpulan
Dengan menggunakan tingkat kepercayaan 95%, yang artinya
variabel independen dp 1 kategori ibu pemberi ASI yang tidak bekerja,
variabel jangka_waktu, dan pendidikan_pemohonan signifikan terhadap
model.
22
5. Nilai Eksponensial dari ODD RATIO
23
Tolak H0 jika Sig. < α
iv). Statistika uji
Hosmer and Lemeshow Test
Step Chi-square df Sig.
1 7.243 7 .404
2 5.116 7 .646
Model Summary
Cox & Snell R Nagelkerke R
Step -2 Log likelihood Square Square
1 28.435a .425 .571
2 29.195a .412 .554
Gambar 3.13 Output Hosmer and Lemeshow Test
Didapatkan nilai R2 sebesar 0.554, setelah itu nilai dari R2 dikalikan
dengan 100%. Jadi, nilai R2 sebesar 55,4% yang artinya sebesar 55,4%
keragaman Y mampu dijelaskan oleh X dalam model, sedangkan sisanya
yaitu 44,6% dijelaskan oleh peubah lain yang di luar model.
8. Classification Table
25
Jadi peluang peminjam tersebut mempunyai status kridit macet adalah
sebesar 0,775564.
26
4 Penutup
4.1 Kesimpulan
Dari uraian pembahasan di atas, dengan tingkat kepercayaan sebesar 95%
dapat disimpulkan bahwa:
1. Pada uji K-way studi kasus pertama adalah adanya pengaruh interaksi dari
orde ke-1 dan yang lebih tinggi dan tidak ada pengaruh interaksi dari orde
ke-2.
2. Pada uji Asosiasi Parsial studi kasus pertama adalah interaksi antar
variabel partai terkandung dalam model.
3. Pada uji Backward Elimination studi kasus pertama, model 1 adalah model
terbaik (model yang lebih sederhana).
4. Pada uji Parameter Estimates, model log linier yang didapat pada studi
kasus pertama yaitu Log(𝜇ij) = 𝜆 0.0996 partai.
5. Pada uji Goodness of Fit studi kasus pertama dan kedua adalah model yang
didapat signifikan.
6. Pada uji Overall studi kasus kedua adalah model regresi layak digunakan.
7. Pada uji Parsial studi kasus kedua, variabel independen yang ugnifikan
dalam model adalah dp 1 kategori ibu pemberi ASI yang tidak bekerja,
variabel jangka_waktu, dan pendidikan_pemohonan.
8. Pada uji Hosmer and Lemeshow Test studi kasus kedua adalah model
cukup mampu menjelaskan data.
9. Didapatkan nilai Pseudo R Square (Koefisien Determinasi) sebesar 55,4%.
10. Dari studi kasus kedua didaptkan peluang peminjam tersebut mempunyai
status kridit macet adalah sebesar 0,775564.
11. Dari studi kasus kedua didaptkan peluang peminjam tersebut mempunyai
status kridit tidak macet adalah sebesar 0,244.
27
5 Daftar Pustaka
Hosmer, D.W. and Lemeshow, S. 2000. Applied logistic regression. 2nd Edition,
John Wiley & Sons, Inc., New York. doi:10.1002/0471722146
Mahulae, E. 2013. Uji Homogenitas Marginal Dengan Model Log Linear Pada
Tabel Kontingensi Tiga Dimensi Atau Lebih. Diakses pada tanggal 20
November 2019 di http://repository.usu.ac.id.
Nugraha, Jaka. 2013. Modul Praktikum Analisis Kategorik . Yogyakarta.
Nugraha, Jaka. 2013. Pengantar Analisis Data Kategorik. Penerbit Deepublish (CV
BUDI UTAMA). Yogyakarta.
28