Anda di halaman 1dari 13

APLIKASI ANALISIS KUANTITATIF

Regresi dengan Variabel Terikat Data Kualitatif

Kelompok 3
Anggota :
 I Gusti Agung Ayu Ngurah Garnetia P 1607531077
 Made Dita Wahyuni 1607531078
 Ni Nyoman Putri Widiari 1607531080
 Sri Ayu Wulandari 1607531082
 Ni Putu Adinda Maharani Hermawan 1607531083
 Ni Luh Mega Intarani 1607531085
 A.A. Made Citra Adelia 1607531087

JURUSAN S1 REGULER AKUNTANSI


FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS UDAYANA
2017
Regresi Dengan Variabel Terikat Data Kualitatif

11.1 . Pengantar
Sebelumnya telah dibahas mengenai aplikasi data kualitatif sebagaivariabel bebas yang
disebut dengan dummy. Pada kenyataanya banyak sekali kasus data kualitatif yang dapat
diterapkan pada variabel terikat. Misalnya dikolomi kemampuan keluarga untuk memiliki
sebuah rumah dikota yang mungkin dipengaruhi oleh tingkat pendapatan keluarga, jumlah
anggota keluarga. Seorang peneliti kesehatan tertarik untuk mengetahui bagaimana
probabilitas suatu serangan jantung dapat diperkirakan apabila diketahui pasien yang mengidap
tekanan jantung, tingkat kolesterol, kalori yang dikonsumsi dan gaya hidup.
Bidang pemasaran dari Telkom tertarik untuk mengetahui kemungkinan suatu rumah
tangga akan berlangganan suatu jaringan telepon apabila diketahui tingkat pendapatan
perkapita, tingkat pendidikan, pekerjaan, status perkawinan, dan jumlah anak. Seorang auditor
tertarik untuk mengetahui kemungkinan bahwa sebuah perusahaan akan gagal apabila
diketahui sejumlah rasio finansial dan secala dan lain sebagainya.
Untuk melihat bagaimana model yang menggunakan variabel kualitatif atau kategori
terikat, khususnya dengan dua kategori (binary) dalam buku ini akan dibahas dengan dua cara
yaitu, pertama dengan regresi model probabilitas linear (linear probability model) = LPM) dan
kedua dengan regresi model logstik binary (binary logistics regression model).

11.2. Regresi Model Probabilitas Linier (LPM)


Dalam teknis analisis ini variabel terikat yang berupa kualitatif (kategori) dianggap
sebagai variabel dummy, yang mana dalam bentuk sederhananya dapat ditujukkan dalam
modal probabilitas linier (LPM).
Ý𝐢 = 𝜶 + 𝜷𝑿………………………………………………………….…(11.1)
Keterangan: Y= 1 keluarga memiliki rumah
0 = tidak memiliki rumah
X= pendapatan keluarga

Dalam kasus tersebut E(Yi/Xi) menunjukkan probabilitas suatu keluarga memiliki


sebuah rumah apabila pendapatannya sebesar Xi. Variabel Y merupakan variabel binomial
sebagai syarat dari Xi, maka modelnya dapat dinyatakan :
𝑬(Yi/Xi) = 𝜶 + 𝜷𝑿……………………………………………………….(11.2)
Oleh karena E(Yi/Xi) merupakan probabilitas, maka besarnya akan minimal sama
dengan nol dan maksimal sama dengan satu, atau dapat dinyatakan
0≤E(Yi/Xi) ≤1……………………………………………………………(11.3)

Dalam menaksir agar Y minimal 0 dan maksimal 1 maka jumlah pengamalan harus
cukup banyak, yaitu sekitar 100 pengamatan. Apabila Y yang ditaksir tidak memenuhi syarat
tesebut, maka langkah pertama dapat diasumsikan bahwa apabila Y lebih dari satu maka
dianggap satu dan apabila Y lebih kecil dari nol, maka dapat dianggap nol. Langkah kedua
yang lebih ilmiah adalah dengan menggunakan fungsi logistik atau logit model yang akan
dijelaskan pada bagian berikutnya.
Persamaan 11.1 diatas dapat dikembangkan dengan beberapa variabel bebas, baik yang
menggunakan variabel kategori (dummy) atau menggunakan variabel kontinyu seperti yang
telah dibahas dalam regresi berganda sebelumnya. Sehingga persamaanya menjadi
Ý = 𝜷𝒐 + 𝜷𝟏𝑿𝟏 + 𝜷𝟐𝑿𝟐……𝜷𝒌𝑿𝒌………………………………………………(11.4)

Pengolahan data untuk LPM ini dapat digunakan metode kuadrat terkecil biasa
(ordinary least square = OLS), seperti yang telah banyak dibahas sebelumnya.

Contoh 11.1
Dibawah ini adalah data 24 Bank yang diambil secara random, diteliti mengenai tingkat
kinerjanya dengan kategori “bagus” dan “jelek” menurut skala usaha (BS) serta kinerja
keuangannya (FP) seperti tabel 1.1
Tabel 1.1, Kinerja Bank, Menurut Skala dan Kinerja Keuangannya (FP)

Kinerja "bagus" (B) Kinerja "jelek" (J)


No Y BS FP No Y BS FP
1 1 1 0,58 13 0 1 2,28
2 1 1 2,80 14 0 0 1.06
3 1 1 2,77 15 0 0 1,08
4 1 1 3,50 16 0 0 0,07
5 1 1 2,67 17 0 0 0,16
6 1 1 2,97 18 0 0 0,70
7 1 1 2,18 19 0 0 0,75
8 1 1 3,24 20 0 0 1,61
9 1 1 1,49 21 0 0 0,34
10 1 1 2,19 22 0 0 1,15
11 1 1 2,70 23 0 0 0,44
12 1 1 2,57 24 0 0 0,86
Keterangan: Kinerja Bank : 1 = “bagus”; 0 = “jelek”
Skala Bank (BS) 1= besar; 0 = kecil
FP = Financial Performance (kinerja keuangan)

Olahan data Tabel 1.1, dengan menggunakan program SPSS adalah sbb:
Regression
Model Sumarry
Adjusted Std Eror of
R R
Model R square Square the Estimated
1 ,830a ,690 ,660 ,29779

a. Predictorrs: (constant), Kinerja Keuangan (FP), Skala Bank (BS)

ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 4,138 2 2,069 23,331 ,000a
Residual 1,862 21 ,89
Total 6,000 23

a. Predictorrs: (constant), Kinerja Keuangan (FP), Skala Bank (BS)


b. Dependent Variable: Kinerja Bank

Coefficients
Unstandarized Standarized
Coefficients Coefficients
Std.
Model B Error Beta t Sig
1 (Constant) -,076 ,115 -,662 ,515
Skala Bank (BS) ,448 ,162 ,447 2,770 ,011
Kinerja Keuangan (FP) ,221 ,077 ,466 2,887 ,009

a. Dependent Variable : Kinerja Bank


Ý1 = -0,0759 + 0,448 BS + 0,221FP ………..(11.5)
Sb = (0,162) (0,077)
t = (2,770)** (2,887)**
Sig = (0,011) (0,009)
R2 = 0,69 F = 23,33 Sig = 0,000

Diminta:
Yi = Dummy tingkat kinerja = 1 = bagus;0 = jelek
BSi = Dummy Skala usaha = 1 = besar; 0 = kecil
FP = Financial Performance
I = 1,2………………..n

Laporan Regresi LPM


Secara simultan variabel skala usaha dan FP berpengaruh nyata terhadap kinerja Bank
pada level of significant 1 persen, hal ini dapat dilihat dimana F hitung = 23,33 sedangkan F
tabel pada derajat bebas (2;21) adalah 5,85. Ini berarti bahwa variabel skala usaha Bank dan
kinerja keuangan Bank (FP) berpengaruh secara serempak terhadap kinerja bank. Nilai R2 =
0,69 memberikan makna bahwa 69 persen variasi kinerja Bank dipengaruhi oleh variasi skala
usaha kinerja keuangan (FP), sedangkan sisanya 31 persen dipengaruhi oleh faktor lain di luar
model.
Dari persamaan 11,5 pada dapat dilihat bahwa variabel bebas BS dan Fp berpengatuh
nyata terhadap kinerja Bank, masing-masing pada tingkat signifikansi kurang dari 5 persen.
Koefisien regresi usaha 4,88 berarti bahwa bank berskala besar (1) mempunyai probabilitas
berkinerja bagus 0,448 lebih besar dibandingkan dengan bank dengan skala kecil (0), dengan
anggapan faktor lainnya konstan, Koefisien regresi FP sebesar 0,221 mempunyai arti bahwa
apabila FP naik satu satuan, maka probabilitas bank berkinerja bagus meningkat sebesar 0,221
dengan anggapan faktor lainnya konstan.
Dari persamaan 11.5 dapat dibuat taksiran probabilitas dari kinerja bank dengan
memasukkan nilai variabel bebas skala usaha (BS) dan kinerja keuangannya (FP) seperti tabel
11.2 .
Tabel 11.2 Taksiran probabilitas Kinerja Bank Menurut Skala Bank (BS) dan Kinerja
Keuangan (FP)
Kinerja "bagus" (B) Kinerja "jelek" (J)
Yi BS FP Ý Yi BS FP Ý
1 1 0,58 0,5003 0 1 2,28 0,8760
1 1 2,80 0,9909 0 0 1,06 0,1584
1 1 2,77 0,9843 0 0 1,08 0,1628
1 1 3,50 1,1456- 0 0 0,07 -0,0604
1 1 2,67 0,9622 0 0 0,16 -0,0405
1 1 2,97 1,0285 0 0 0,70 0,0788
1 1 2,18 0,8539 0 0 0,75 0,0899
1 1 3,24 10,881 0 0 1,61 0,2799
1 1 1,49 0,7014 0 0 0,34 -0,0008
1 1 2,19 0,8561 0 0 1,15 0,1783
1 0 2,70 0,5208 0 0 0,44 0,0213
1 0 2,57 0,4921 0 0 0,86 0,1142

Hasil perkiraan kinerja dari Tabel 11.2 ini tentu tidak sesuai dengan asumsi probabilitas
yang besarnya minimal nol dan maksimal satu. Oleh karena itu apabila taksiran probabilitas
yang dihasilkan lebih besar dari satu dianggap satu, sedangkan apabila lebih kecil dari nol
dianggap nol. Agar hasilnya lebih memuaskan, maka kelemahan itu dapat ditanggulangi
dengan menambah sampel, atau menggunakan regresi model logistik.

11.3 Regresi Logistik

Regresi logistik merupakan model cumulative distribution function (CDF), yang


mampu menjamin nilai variabel terikat (Y) terletak antara 0 dan 1 sesuai dengan teori
probabilitas. CDF memiliki dua sifat yaitu :

1. Jika variabel bebas naik, maka P(Yi = 1|Xi) juga ikut naik, tetapi tidak pernah melewati
rentangan 0-1.

2. Hubungan antara Pi dan Xi adalah non linear sehingga tingkat perubahannya tidak
sama, tetapi kenaikannya semakin besar, kemudian mengecil. Ketika nilai
probabilitasnya mendekati nol, maka tingkat penurunannya semakin kecil, demikian
juga sebaliknya ketika nilai probabilitasnya mendekati satu maka tingkat kenaikannya
semakin kecil.
Secara umum persamaan regresi logistic untuk k variable terikat dapat ditulis sebagai berikut :

ln[odds(T/X1,X2,…Xk)] = 0 + 1X1 + 2X2,… kXk

atau

𝑃
ln( ) = 0 + 1X1 + 2X2,….kXk
1−𝑝

𝑃
odds (T/X1,X2,….Xk = 1−𝑝

Pembahasan atau analisis dalam regresi logistik :

a) Menilai fit model

Fit model dalam analisi regresi logistik cukup dilihat dari Likelihood Ratio (LR) Chi-
Square statistic, dengan derajat bebas sebesar q dimana q adalah jumlah variabel dalam model.
Namun pada program SPSS disamping LR dan R-Square, juga mengeluarkan output Hosmer
and Lemeshow Test. Hosmer and Lemeshow Test bertujuan untuk mengetahui apakah data fit
sesuai dengan model. Jika signifikansi nilai Chi-Square dari Hosmer and Lemeshow Test lebih
besar atau sama dengan 0,05 berarti bahwa data fit atau sesuai dengan model

b) Menganalisis signifikansi estimasi parameter dan menginterpretasikannya.

Langkah-langkah pengolahan data dengan SPSS

1. Buka file contoh 11.1 LPM-Logit


2. Analyze  Regression  Binary Logistic

3. Masukkan variabel Kinerja Bank pada kotak Dependent, dan variabel BS dan FP dan
Covariates

4. Tekan tombol Option dan centangin Hosmer-Lemeshow goodness-of-fit

5. Continue  OK

Contoh 11.2

Di bawah ini adalah data 24 Bank yang diambil secara random, diteliti mengenai tingkat
kinerjanya dengan kategori “bagus” dan “jelek” menurut skala usaha (BS) serta kinerja
keuangannya (FP). Berdasarkan hasil olahan data :

1. Buatlah persamaan regresi.

2. Buat laporan regresi secara lengkap.

3. Dari sampel yang diambil, jika diketahui bahwa sampel tersebut merupakan bank
berskala besar, dan kinerja keuangannya (FP) sebesar 0,58, prediksi apakah bank
tersebut berkinerja bagus apakah jelek ?

Hasil olahan data SPSS


Logistic Regression

Omnibus Tests of Model Coefficients

Chi-Square Df Sig.

Step 1 Step 21,482 2 ,000

Block 21,482 2 ,000

Model 21,482 2 ,000

Model Summary

Step -2 Log Cox & Snell R Nagelkerke

Likelihood Square R Square

1 11,789a ,591 ,789

a. Estimation terminated at iteration number 6 because parameter estimetes changed by


less then ,001.

Hosmer and Lemeshow Test

Step Chi-square Df Sig.

1 10,450 8 ,235

Vareable in the Equation

B S.E. Wald Df Sig. Exp(B)

Step 1a D 3,055 1,598 3,655 1 ,056 21,226

X 1,924 ,912 4,457 1 ,035 6,851

Constan

T -4,445 1,843 5,816 1 ,016 ,012

a. Variable (s) entered on step 1: D,X.


Hasil olahan data jika menggunakan program EViews sebagai berikut :

Dependent Variable :Y

Method:ML –Binary Logit

Included observations : 24

Variable Coefficient Std.Error z-Statistic Prob.

C -4.445 1.843 -2.412 0.016

BS 3.055 1.598 1.912 0.056


FP
1.924 0.912 2.111 0.035

LR statistic (2 df) 21.482 S.E. of regression 0.275

Probability (LR stat) 0.000 R-squared 0.645

a) Persamaan regresi

Hasil olahan data yang tertampil dapat disajikan dalam bentuk persamaan :

𝑃̂
ln 1−𝑝̂ = -4,445 + 3,055 BS + 1,924 FP

Sb = (1,843) (1,598) (0,912)

T= (2,412) (1,912) (2,111)

Sig = (0,015) (0,055) (0,034)

𝑥2 = 21,482 (Sig. 0,000) R2 = 0,789

b) Laporan regresi

Secara serempak variabel bebas Skala dan FP berpengaruh nyata terhadap kinerja bank.
Hal ini dapat dilihat dari perhitungan 𝑥2 = 21,482 yang lebih besar dibandingkan dengan nilai
tabel 𝑥2 yang besarnya 5,991 pada derajat bebas 2 pada level of significant 5 %. Chi-square
dari Hosmer and Lemeshow Test sebesar 10,450 dengan signifikansi sebesar 0,235.
Signifikansi tersebut lebih besar dari 0,05. Hal ini berarti bahwa data fit atau sesuai dengan
model.
Dari hasil olahan data contoh 11.2. juga dapat dilihat bahwa Negelkerke R2 sebesar
0,789 yang sama dengan koefision determinasi pada model regresi biasa. Hal ini berarti bahwa
78,9 persen variasi kinerja bank dipengaruhi oleh variasi variabel skala bank (BS) dan kinerja
keuangan (FP), sedangkan sisanya 21,1 persen juga dipengaruhi oleh variabel lain di luar
model.

Hasil olahan data juga dapat dilihat bahwa variabel bebas Skala Bank tidak berpengaruh
nyata terhadap kinerja bank pada level of significant 5% pada uji dua sisi, sedangkan kinerja
keuangan (FP) berpengaruh nyata terhadap kinerja bank pada level of significant 5%.

Nilai t statistic dapat diperoleh dengan mengakarkan nilai Wald statistik ( t =


√𝑊𝑎𝑙𝑑𝑆𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑘 ). Nilai t table pada tingkat signifikansi 5% dengan pengujian dua sisi dan
pada derajat kebebasan 24 – 3 adalah sebesar ± 2,08. Nilai t table ini lebih kecil dari hasil t
hitung untuk variabel FP, namun lebih besar dari t hitung variable Skala Bank. Dari persamaan:

𝑃̂
ln 1−𝑝̂ = -4,445 + 3,055 BS + 1,924 FP

𝑃̂
ln 1−𝑝̂ = e (-4,445 + 3,055 SKALA + 1,924 FP)

𝑝̂ = 1/ { 1 + e (-4,445 + 3,055 SKALA + 1,924 FP)}

Koefisien regresi logistik variabel skala bank sebesar 3,055 dapat dihitung probabilitasnya :

𝑝̂ = 1/ { 1 + e –(3,055)}

= 1/ ( 1 + 0,0471)

= 0,955

Angka itu dapat diinterprestasikan bahwa koefisien regresi logistik dan skala bank
sebesar 3,055 mempunyai arti bahwa untuk bank berskala besar (skala 1) mempunyai
probabilitasnya berkinerja bagus 0,955 juga dapat dibandingkan dengan bank berskala kecil.
Angka sebesar 0,955 juga dapat diperoleh dari Exp(B)/(1+Exp(B)), yaitu 21,226/(1+21,226).
Angka koefisien Exp(B) sebesar 21,226 memiliki arti, bahwa bank yang berskala besar
memiliki peluang berkinerja bagus 21,226 kali lebih besar dari bank berskala kecil.

Koefien regresi logistik dari kinerja keuangan (FP) sebesar 1,924 dapat dihitung
probabilitas sebesar 0,873 (yang diperoleh dari 1/(1 + e-1,924), juga dapat diperoleh dari nilai
eksponensial (6,851/(1+6,851). Hal ini dapat diinterpretasikan bahwa meningkatnya kinerja
keuangan sebesar satu satuan, maka probabilitas bank berkinerja bagus meningkat sebesar
0,873, dengan asumsi factor lainnya konstan.

Hasil SPSS juga menampilkan validitas model, yaitu bahwa ketepatan prediksi adalah
22 dari 24 pengamatan. Sehingga ketepatan model yang dibuat adalah 22/24 atau 91,7 persen.

Classification Table

Predicted

Kinerja Bank

Observed Jelek Bagus Percentage Correct

Step 1 Kinerja Bank Jelek 11 11 91,7

Bagus 1 1 91,7

Overall Percentage 91,7

a. The cut value is ,500

c) Prediksi probabilitas kinerja bank

Dengan memasukkan nilai variabel bebas, yaitu bank berskala besar, dan kinerja
keuangannya (FP) sebesa 0,50. Maka probabilitas kinerja bank dapat diperkirakan :

𝑝̂ = 1/ {1 + e – [-4,445 + 3,055 (1) + 1,924 (0,50)]}

= 1/(1+1,3153)

= 0,432

Oleh karena taksiran probabilitas bank tersebut sebesar 0,432 yang kurang dari 0,5
maka taksiran kinerja bank yang dianalisis adalah “jelek”. Taksiran probabilitas kinerja bank
berdasarkan berbagai skala dan skor kinerja keuangan (FP) secara lengkap disajikan pada tabel
11.3.

Berdasarkan tabel 11.3 dapat dilihat bahwa bank nomor 1 sebelumnya dinyatakan
berkinerja “bagus”, namun hasil prediksi ternyata berkinerja “jelek”, karena nilai
probabilitasnya 0,4320 yang kurang dari 0,50. Demikian juga bank nomor 13 sebelumnya
dinyatakan berkinerja “jelek”, namun hasil prediksinya ternyata berkinerja “bagus”. Hal ini
disebabkan karena nilai probabilitasnya 0,9525 yang lebih besar dari 0,50.

Tabel 11.3 Taksiran Probabilitas kinerja bank menurut skala usaha dan kinerja keuangan (FP).

Kinerja “bagus” (B) Kinerja “Jelek” (J)

Yi BS FP* 𝑌̂i Group Yi BS FP* 𝑌̂i Group

1 1 0,58 0,4320 0 0 1 2,28 0,9525 1

1 1 2,80 0,9820 1 0 0 1,06 0,0828 0

1 1 2,77 0,9972 1 0 0 1,08 0,0858 0

1 1 3,50 0,9953 1 0 0 0,07 0,0133 0

1 1 2,67 0,9770 1 0 0 0,16 0,0157 0

1 1 2,97 0,9870 1 0 0 0,70 0,0432 0

1 1 2,18 0,9430 1 0 0 0,75 0,0474 0

1 1 3,24 0,9922 1 0 0 1,61 0,2066 0

1 1 1,49 0,8143 1 0 0 0,34 0,0221 0

1 1 2,19 0,9441 1 0 0 1,15 0,0970 0

1 0 2,70 0,6797 1 0 0 0,44 0,0266 0

1 0 2,57 0,6230 1 0 0 0,86 0,0579 0

Anda mungkin juga menyukai