Kelompok 3
Anggota :
I Gusti Agung Ayu Ngurah Garnetia P 1607531077
Made Dita Wahyuni 1607531078
Ni Nyoman Putri Widiari 1607531080
Sri Ayu Wulandari 1607531082
Ni Putu Adinda Maharani Hermawan 1607531083
Ni Luh Mega Intarani 1607531085
A.A. Made Citra Adelia 1607531087
11.1 . Pengantar
Sebelumnya telah dibahas mengenai aplikasi data kualitatif sebagaivariabel bebas yang
disebut dengan dummy. Pada kenyataanya banyak sekali kasus data kualitatif yang dapat
diterapkan pada variabel terikat. Misalnya dikolomi kemampuan keluarga untuk memiliki
sebuah rumah dikota yang mungkin dipengaruhi oleh tingkat pendapatan keluarga, jumlah
anggota keluarga. Seorang peneliti kesehatan tertarik untuk mengetahui bagaimana
probabilitas suatu serangan jantung dapat diperkirakan apabila diketahui pasien yang mengidap
tekanan jantung, tingkat kolesterol, kalori yang dikonsumsi dan gaya hidup.
Bidang pemasaran dari Telkom tertarik untuk mengetahui kemungkinan suatu rumah
tangga akan berlangganan suatu jaringan telepon apabila diketahui tingkat pendapatan
perkapita, tingkat pendidikan, pekerjaan, status perkawinan, dan jumlah anak. Seorang auditor
tertarik untuk mengetahui kemungkinan bahwa sebuah perusahaan akan gagal apabila
diketahui sejumlah rasio finansial dan secala dan lain sebagainya.
Untuk melihat bagaimana model yang menggunakan variabel kualitatif atau kategori
terikat, khususnya dengan dua kategori (binary) dalam buku ini akan dibahas dengan dua cara
yaitu, pertama dengan regresi model probabilitas linear (linear probability model) = LPM) dan
kedua dengan regresi model logstik binary (binary logistics regression model).
Dalam menaksir agar Y minimal 0 dan maksimal 1 maka jumlah pengamalan harus
cukup banyak, yaitu sekitar 100 pengamatan. Apabila Y yang ditaksir tidak memenuhi syarat
tesebut, maka langkah pertama dapat diasumsikan bahwa apabila Y lebih dari satu maka
dianggap satu dan apabila Y lebih kecil dari nol, maka dapat dianggap nol. Langkah kedua
yang lebih ilmiah adalah dengan menggunakan fungsi logistik atau logit model yang akan
dijelaskan pada bagian berikutnya.
Persamaan 11.1 diatas dapat dikembangkan dengan beberapa variabel bebas, baik yang
menggunakan variabel kategori (dummy) atau menggunakan variabel kontinyu seperti yang
telah dibahas dalam regresi berganda sebelumnya. Sehingga persamaanya menjadi
Ý = 𝜷𝒐 + 𝜷𝟏𝑿𝟏 + 𝜷𝟐𝑿𝟐……𝜷𝒌𝑿𝒌………………………………………………(11.4)
Pengolahan data untuk LPM ini dapat digunakan metode kuadrat terkecil biasa
(ordinary least square = OLS), seperti yang telah banyak dibahas sebelumnya.
Contoh 11.1
Dibawah ini adalah data 24 Bank yang diambil secara random, diteliti mengenai tingkat
kinerjanya dengan kategori “bagus” dan “jelek” menurut skala usaha (BS) serta kinerja
keuangannya (FP) seperti tabel 1.1
Tabel 1.1, Kinerja Bank, Menurut Skala dan Kinerja Keuangannya (FP)
Olahan data Tabel 1.1, dengan menggunakan program SPSS adalah sbb:
Regression
Model Sumarry
Adjusted Std Eror of
R R
Model R square Square the Estimated
1 ,830a ,690 ,660 ,29779
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 4,138 2 2,069 23,331 ,000a
Residual 1,862 21 ,89
Total 6,000 23
Coefficients
Unstandarized Standarized
Coefficients Coefficients
Std.
Model B Error Beta t Sig
1 (Constant) -,076 ,115 -,662 ,515
Skala Bank (BS) ,448 ,162 ,447 2,770 ,011
Kinerja Keuangan (FP) ,221 ,077 ,466 2,887 ,009
Diminta:
Yi = Dummy tingkat kinerja = 1 = bagus;0 = jelek
BSi = Dummy Skala usaha = 1 = besar; 0 = kecil
FP = Financial Performance
I = 1,2………………..n
Hasil perkiraan kinerja dari Tabel 11.2 ini tentu tidak sesuai dengan asumsi probabilitas
yang besarnya minimal nol dan maksimal satu. Oleh karena itu apabila taksiran probabilitas
yang dihasilkan lebih besar dari satu dianggap satu, sedangkan apabila lebih kecil dari nol
dianggap nol. Agar hasilnya lebih memuaskan, maka kelemahan itu dapat ditanggulangi
dengan menambah sampel, atau menggunakan regresi model logistik.
1. Jika variabel bebas naik, maka P(Yi = 1|Xi) juga ikut naik, tetapi tidak pernah melewati
rentangan 0-1.
2. Hubungan antara Pi dan Xi adalah non linear sehingga tingkat perubahannya tidak
sama, tetapi kenaikannya semakin besar, kemudian mengecil. Ketika nilai
probabilitasnya mendekati nol, maka tingkat penurunannya semakin kecil, demikian
juga sebaliknya ketika nilai probabilitasnya mendekati satu maka tingkat kenaikannya
semakin kecil.
Secara umum persamaan regresi logistic untuk k variable terikat dapat ditulis sebagai berikut :
atau
𝑃
ln( ) = 0 + 1X1 + 2X2,….kXk
1−𝑝
𝑃
odds (T/X1,X2,….Xk = 1−𝑝
Fit model dalam analisi regresi logistik cukup dilihat dari Likelihood Ratio (LR) Chi-
Square statistic, dengan derajat bebas sebesar q dimana q adalah jumlah variabel dalam model.
Namun pada program SPSS disamping LR dan R-Square, juga mengeluarkan output Hosmer
and Lemeshow Test. Hosmer and Lemeshow Test bertujuan untuk mengetahui apakah data fit
sesuai dengan model. Jika signifikansi nilai Chi-Square dari Hosmer and Lemeshow Test lebih
besar atau sama dengan 0,05 berarti bahwa data fit atau sesuai dengan model
3. Masukkan variabel Kinerja Bank pada kotak Dependent, dan variabel BS dan FP dan
Covariates
5. Continue OK
Contoh 11.2
Di bawah ini adalah data 24 Bank yang diambil secara random, diteliti mengenai tingkat
kinerjanya dengan kategori “bagus” dan “jelek” menurut skala usaha (BS) serta kinerja
keuangannya (FP). Berdasarkan hasil olahan data :
3. Dari sampel yang diambil, jika diketahui bahwa sampel tersebut merupakan bank
berskala besar, dan kinerja keuangannya (FP) sebesar 0,58, prediksi apakah bank
tersebut berkinerja bagus apakah jelek ?
Chi-Square Df Sig.
Model Summary
1 10,450 8 ,235
Constan
Dependent Variable :Y
Included observations : 24
a) Persamaan regresi
Hasil olahan data yang tertampil dapat disajikan dalam bentuk persamaan :
𝑃̂
ln 1−𝑝̂ = -4,445 + 3,055 BS + 1,924 FP
b) Laporan regresi
Secara serempak variabel bebas Skala dan FP berpengaruh nyata terhadap kinerja bank.
Hal ini dapat dilihat dari perhitungan 𝑥2 = 21,482 yang lebih besar dibandingkan dengan nilai
tabel 𝑥2 yang besarnya 5,991 pada derajat bebas 2 pada level of significant 5 %. Chi-square
dari Hosmer and Lemeshow Test sebesar 10,450 dengan signifikansi sebesar 0,235.
Signifikansi tersebut lebih besar dari 0,05. Hal ini berarti bahwa data fit atau sesuai dengan
model.
Dari hasil olahan data contoh 11.2. juga dapat dilihat bahwa Negelkerke R2 sebesar
0,789 yang sama dengan koefision determinasi pada model regresi biasa. Hal ini berarti bahwa
78,9 persen variasi kinerja bank dipengaruhi oleh variasi variabel skala bank (BS) dan kinerja
keuangan (FP), sedangkan sisanya 21,1 persen juga dipengaruhi oleh variabel lain di luar
model.
Hasil olahan data juga dapat dilihat bahwa variabel bebas Skala Bank tidak berpengaruh
nyata terhadap kinerja bank pada level of significant 5% pada uji dua sisi, sedangkan kinerja
keuangan (FP) berpengaruh nyata terhadap kinerja bank pada level of significant 5%.
𝑃̂
ln 1−𝑝̂ = -4,445 + 3,055 BS + 1,924 FP
𝑃̂
ln 1−𝑝̂ = e (-4,445 + 3,055 SKALA + 1,924 FP)
Koefisien regresi logistik variabel skala bank sebesar 3,055 dapat dihitung probabilitasnya :
𝑝̂ = 1/ { 1 + e –(3,055)}
= 1/ ( 1 + 0,0471)
= 0,955
Angka itu dapat diinterprestasikan bahwa koefisien regresi logistik dan skala bank
sebesar 3,055 mempunyai arti bahwa untuk bank berskala besar (skala 1) mempunyai
probabilitasnya berkinerja bagus 0,955 juga dapat dibandingkan dengan bank berskala kecil.
Angka sebesar 0,955 juga dapat diperoleh dari Exp(B)/(1+Exp(B)), yaitu 21,226/(1+21,226).
Angka koefisien Exp(B) sebesar 21,226 memiliki arti, bahwa bank yang berskala besar
memiliki peluang berkinerja bagus 21,226 kali lebih besar dari bank berskala kecil.
Koefien regresi logistik dari kinerja keuangan (FP) sebesar 1,924 dapat dihitung
probabilitas sebesar 0,873 (yang diperoleh dari 1/(1 + e-1,924), juga dapat diperoleh dari nilai
eksponensial (6,851/(1+6,851). Hal ini dapat diinterpretasikan bahwa meningkatnya kinerja
keuangan sebesar satu satuan, maka probabilitas bank berkinerja bagus meningkat sebesar
0,873, dengan asumsi factor lainnya konstan.
Hasil SPSS juga menampilkan validitas model, yaitu bahwa ketepatan prediksi adalah
22 dari 24 pengamatan. Sehingga ketepatan model yang dibuat adalah 22/24 atau 91,7 persen.
Classification Table
Predicted
Kinerja Bank
Bagus 1 1 91,7
Dengan memasukkan nilai variabel bebas, yaitu bank berskala besar, dan kinerja
keuangannya (FP) sebesa 0,50. Maka probabilitas kinerja bank dapat diperkirakan :
= 1/(1+1,3153)
= 0,432
Oleh karena taksiran probabilitas bank tersebut sebesar 0,432 yang kurang dari 0,5
maka taksiran kinerja bank yang dianalisis adalah “jelek”. Taksiran probabilitas kinerja bank
berdasarkan berbagai skala dan skor kinerja keuangan (FP) secara lengkap disajikan pada tabel
11.3.
Berdasarkan tabel 11.3 dapat dilihat bahwa bank nomor 1 sebelumnya dinyatakan
berkinerja “bagus”, namun hasil prediksi ternyata berkinerja “jelek”, karena nilai
probabilitasnya 0,4320 yang kurang dari 0,50. Demikian juga bank nomor 13 sebelumnya
dinyatakan berkinerja “jelek”, namun hasil prediksinya ternyata berkinerja “bagus”. Hal ini
disebabkan karena nilai probabilitasnya 0,9525 yang lebih besar dari 0,50.
Tabel 11.3 Taksiran Probabilitas kinerja bank menurut skala usaha dan kinerja keuangan (FP).