Anda di halaman 1dari 17

A.

REGRESI LOGISTIK

Analisis Regresi dalam statistika adalah salah satu metode untuk

menentukan hubungan sebab-akibat antara satu variabel dengan variabel-variabel

yang lain. Variabel “penyebab” disebut dengan bermacam-macam istilah, di

antaranya seperti variabel penjelas, variabel eksplanatorik, variabel independen,

atau secara bebas, variabel X (karena seringkali digambarkan dalam grafik

sebagai absis, atau sumbu X). Variabel “terkena akibat” dikenal sebagai variabel

yang dipengaruhi, variabel dependen, variabel terikat, atau variabel Y. Kedua

variabel ini dapat merupakan variabel acak (random), namun variabel yang

dipengaruhi harus selalu variabel acak. Analisis Regresi adalah salah satu analisis
yang paling populer dan luas pemakaiannya. Hampir semua bidang ilmu yang

memerlukan analisis sebab-akibat boleh dipastikan mengenal analisis ini.

Adapun Regresi Logistik (kadang disebut model logistik atau model logit)
merupakan salah satu bagian dari Analisis Regresi, yang digunakan untuk
memprediksi probabilitas kejadian suatu peristiwa, dengan mencocokkan data
pada fungsi logit kurva logistik. Metode ini merupakan model linear umum yang
digunakan untuk regresi binomial. Seperti analisis regresi pada umumnya, metode
ini menggunakan beberapa variabel bebas, baik numerik maupun kategori.
Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada waktu
tertentu dapat diprediksi dari informasi usia, jenis kelamin, dan indeks massa
tubuh. Regresi Logistik juga digunakan secara luas pada bidang kedokteran, ilmu
sosial, dan bahkan pada bidang pemasaran, seperti prediksi kecenderungan
pelanggan untuk membeli suatu produk atau berhenti berlangganan. Regresi
Logistik tidak memerlukan asumsi normalitas, heteroskedastisitas, dan
autokorelasi, dikarenakan variabel terikat yang terdapat pada Regresi Logistik
merupakan variabel dummy (0 dan 1), sehingga residualnya, tidak memerlukan
ketiga pengujian tersebut. Untuk asumsi multikolinearitas, karena hanya
melibatkan variabel-variabel bebas, maka masih perlu untuk dilakukan pengujian.
Untuk pengujian multikolinearitas ini dapat digunakan uji kebaikan sesuai
(goodness of fit test), yang kemudian dilanjutkan dengan pengujian hipotesis (uji
X
X2
), guna melihat variabel-variabel bebas mana saja yang signifikan, sehingga

dapat tetap digunakan dalam penelitian. Selanjutnya, di antara variabel-variabel


bebas yang signifikan, dapat dibentuk suatu matriks korelasi, dan apabila tidak
terdapat variabel-variabel bebas yang saling memiliki korelasi yang tinggi, maka
dapat disimpulkan bahwa tidak terdapat gangguan multikolinearitas pada model
penelitian (David W. Hosmer, 2011).

Bentuk umum model peluang regresi logistik dengan p variabel penjelas,


diformulasikan sebagai berikut:

dengan π(x) adalah peluang kejadian sukses dengan nilai probabilita 0 ≤ π(x) ≤ 1
dan βj adalah nilai parameter dengan j = 1,2,......,p. π(x) merupakan fungsi yang
non linier, sehingga perlu dilakukan transformasi ke dalam bentuk logit untuk
memperoleh fungsi yang linier agar dapat dilihat hubungan antara variabel bebas
dan variabel tidak bebas. Dengan melakukan transformasi dari logit π(x), maka
didapat persamaan yang lebih sederhana, yaitu:

Jika dari beberapa variabel bebas ada yang berskala nominal atau ordinal,

maka variabel tersebut tidak akan tepat jika dimasukkan dalam model logit karena

angka-angka yang digunakan untuk menyatakan tingkatan tersebut hanya sebagai

identifikasi dan tidak mempunyai nilai numerik dalam situasi seperti ini

diperlukan variabel dummy. Untuk variabel bebas dengan skala ordinal maupun

nominal dengan k kategori, akan diperlukan sebanyak k-1 variabel dummy.


B. ASUMSI-ASUMSI DALAM REGRESI LOGISTIK
1. Tidak mengasumsikan hubungan linier antar variabel dependen dan
independent
2. Variabel dependen harus bersifat dikotomi (2 variabel)
3. Variabel independent tidak harus memiliki keragaman yang sama antar
kelompok variabel
4. Kategori dalam variabel independent harus terpisah satu sama lain atau
bersifat eksklusif
5. Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan

hingga 50 sampel data untuk sebuah variabel prediktor (bebas).

C. PENDUGAAN PARAMETER

Metode untuk mengestimasi parameter-parameter yang tidak diketahui


dalam model regresi logistik ada 3 yaitu:

1. Metode kemungkinan maksimum (Maximum Likelihood Method)


2. Metode kuadrat terkecil tertimbang noniterasi (Noniterative Weight Least
Square Method)
3. Analisis fungsi diskriminan (Discriminant Fuction Analysis)

Pada dasarnya metode maksimum Likelihood merupakan metode kuadrat


terkecil tertimbang dengan beberapa proses iterasi, sedangkan metode noniterative
weight least square method hanya menggunakan satu kali iterasi. kedua metode
ini asymptoticaly equivalent, artinya jika ukuran sampel besar keduanya akan
menghasilkan estimator yang identik. Penggunaan fungsi diskriminan
mensyaratkan variabel penjelas yang kuantitatif berdistribusi normal. Oleh karena
itu, penduga dari fungsi diskriminan akan over estimate bila variabel penjelas
tidak berdistribusi normal.

Dari Ketiga metodei di atas, metode yang banyak digunakan adalah


metode maksimum likelihood dengan alasan lebih praktis (Nachrowi dan Usman,
2002). Metode maksimu likelihoood ini menduga parameter dengan nilai yang
memaksimumkan fungsi likelihood (likelihood function).
D. UJI SIGNIFIKANSI MODEL

Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas


secara bersama-sama (overall) di dalam model, dapat menggunakan Uji
Likelihood Ratio. Hipotesisnya adalah sebagai berikut:

- Ho: β1 = β2 =....= βp = 0 (tidak ada pengaruh veriabel bebas secara


simultan terhadap variabel tak bebas)
- H1: minimal ada satu βj ≠ 0 (ada pengaruh paling sedikit satu veriabel
bebas terhadap variabel tak bebas)
Untuk j = 1,2,...,p

Statistik uji yang digunakan adalah:

Dengan :
Lo = Maksimum Lieklihood dari model reduksi (Reduced Model) atau model
yang terdiri dari konstanta saja
Lp = Maksimum Likelihood dari model penuh (Full Model) atau dengan semua
variabel bebas.
Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p
sehingga hipotesis ditolak jika p-value < α, yang berarti variabel bebas X secara
bersama-sama mempengaruhi variabel tak bebas Y.

E. UJI PARSIAL DAN PEMBENTUKAN MODEL

Pada umumnya, tujuan analsis statistik adalah untuk mencari model yang

cocok dan keterpautan yang kuat antara model dengan data yang ada. Pengujian
keberartian parameter (koefisien β) secara parsial dapat dilakukan melalui Uji
Wald dengan hipotesisnya sebagai berikut:
- Ho: βj = 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan
terhadap variabel tidak bebas)
- H1: βj ≠ 0 (variabel bebas ke j mempunyai pengaruh secara signifikan
terhadap variabel tidak bebas)
Untuk j = 1,2,....,p
Dengan statistik uji sebagai berikut:

Hipotesis akan ditolak jika p-value < α yang berarti variabel bebas Xj secara
partial mempengaruhi variabel tidak bebas Y.

F. ODDS RATIO

Odds Ratio merupakan ukuran risiko atau kecenderungan untuk mengalami


kejadian ‘sukses ‘ antara satu kategori dengan kategori lainnya, didefinisikan
sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan
risiko atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali
lipat jika dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas
yang berskala kontinyu maka interpretasi dari koefisien βj pada model regresi
logistik adalah setiap kenaikan c unit pada variabel bebas akan menyebabkan
risiko terjadinya Y = 1, adalah exp(c.βj) kali lebih besar.
Odds ratio dilambangkan dengan θ, didefinisikan sebagai perbandingan dua
nilai odds xj = 1 dan xj = 0, sehingga:

G. Regresi Logistik pada SPSS


Untuk dapat mengolah data spasial kategorik menggunakan analisis regresi
logistik, ada beberapa hal yang perlu didefinisikan pada tahap pra pengolahan :

1. Definisi atau dasar teoritik yang digunakan untuk pembentukkan


kelas/kategori. Dasar pengkelasan ini sangat penting khususnya untuk
mengelompokkan data-data yang memiliki tingkatan rasio, interval maupun
ordinal.
2. Unit analisis yang dipergunakan seperti apa. Pengamatan dapat dilakukan
dengan membandingkan antara kejadian dan tidak adanya kejadian pada
kondisi area tertentu. Area analisis dapat berupa unit spasial dimana area-area
dalam unit yang sama memiliki homogenitas. Dalam banyak kasus bidang
kehutanan, banyak peneliti menggunakan unit area analisis yang dibatasi oleh
wilayah administrasi, petak dan area hasil intersek data vector. Area analisis
juga dapat menggunakan piksel dengan luasan tertentu. Kelemahan
penggunaan batas piksel ini adalah batas-batas unit pengamatan tidak halus
sehingga menyulitkan interpretasi kejadian pada batas antar unit pengamatan
yang bersinggungan. Contohnya : terkadang ditemukan kebakaran di
mangrove padahal di kondisi nyatanya terjadi di savana dekat mangrove.
Sekali lagi, kondisi area dalam satu unit pengamatan diasumsikan homogen
3. Penentuan kelas yang berfungsi sebagai kontrol atau pembanding. Misalnya

ingin mengetahui pengaruh penunjukkan suatu kawasan dari semula bersatus

sebagai Hutan Produksi menjadi Cagar Alam terhadap penurunan tingkat

illegal logging. untuk kasus seperti ini maka dapat memilih area berstatus

Hutan Produksi dengan kondisi biofisik yang mirip di sekitarnya sebagai

kontrol/pembanding. Dari hasil analisis akan terlihat sejauh mana aktivitas

manajemen di Cagar Alam dapat menurunkan illegal logging.

a. Tahapan Pengolahan Data


Setelah ketiga pertanyaan tersebut terjawab, pembentukkan kelompok dan
input data spasial dapat dilakukan. Sebagai studi kasus teknik ini maka akan
dilakukan analisis faktor yang paling berpengaruh terhadap kejadian kebakaran
hutan dan lahan di Taman Nasional Rawa Aopa Watumohai.
Untuk mempermudah pemahaman, dalam contoh ini akan dilakukan
penyederhanaan. Faktor yang akan diuji meliputi 2 variabel, yaitu penutupan
lahan dan slope (dalam kondisi nyata tentunya banyak variabel). Variabel
responnya berupa kejadian kebakaran hutan dan lahan di TNRAW yang
diindikasikan oleh hotspot(asumsi : hotspot telah diverifikasi).
Langkah-langkah analisis regresi logistik dengan SPSS sebagai berikut :
Variabel penutupan lahan, slope dan hotspot dibuat dalam bentuk data
raster dengan ukuran tiap piksel 1 km x 1 km. Pengkelasan yang digunakan
sebagai berikut : Jenis tutupan lahan : Hutan rawa; hutan mangrove; hutan
pegunungan; pertanian dan pemukiman; badan air; savanna. Untuk
kelerengan (slope) : 0-8 (datar) ; 8-30 (sedang); >30 (curam). Variabel
respon : ada hotspot = 1; tidak ada hotspot = 0.
Lakukan intersek ketiga variabel dengan Arc GIS, maka akan terbentuk
unit-unit area dengan 3 atribut, yaitu penutupan lahan, slope dan variabel
respon.
Dengan ArcGIS lakukan ekspor data spasial menjadi data atribut
berbentuk Excel. Copy data Excel ini dan Paste kan di SPSS. Gunakan klik
kanan. Hasilnya akan tampak seperti Gambar di bawah ini.

Kelas 1, 2, 3 dst merupakan symbol untuk masing-masing kelas dalam


variabel. Untuk memberi definisi tiap symbol tersebut maka kita lakukan
langkah berikut.
Pertama kali klik ‘Variable View (1)’, lalu ‘Values (2)’. Pada ‘Value (3)’
masukkan nilai angka symbol yang digunakan pada Data View. Pada ‘Label
(4)’ isikan apa yang diwakili oleh symbol tersebut. Kalau sudah klik ‘Add
(5)’. Lakukan sampai semua symbol didefinisikan lalu tekan ‘OK (6)’.

Lakukan hal yang sama pada variabel kedua. Setelah selesai tekan ‘OK’

Lakukan analisis regresi logistik. Caranya tekan ‘Analysis (1)’,


‘Regression (2)’ lalu ‘Binary Logistic (3)’

Masukkan variabel respon pada ‘Dependent (1)’ dan variabel independent


di ‘Covariate (2)’
Lakukan pemilihan kelas pembanding. Caranya : klik tombol
‘Catagorical’, lalu pindahkan variabel bebas dari bar kiri ke kanan dengan
‘Panah (1)’, pilih ‘First (2)’ lalu klik ‘Change (3)’. Kalau sudah selesai klik
‘Continue (4)’

Sekarang klik tombol ‘Option (1)’, centrang ‘Hosmer and Lemeshow Test
(2)’ lalu ‘Continue (3)’

Tekan ‘OK’
Hasil out put regresi logistik akan keluar seperti gambar di atas.

b. Interpretasi Out Put Regresi Logistik

Interpretasi :
Unit analisis yang diolah dalam regresi ini berjumlah 1060 sel dan tidak
ada data missing.

Interpretasi :
Variabel bebas yang digunakan adalah penutupan lahan dan slope. Sebagai
kontrol (pembanding), variabel penutupan lahan menggunakan kelas hutan
mangrove (parameter coding 0.000 semua) dengan frekuensi 53 sel. Hutan rawa
dalam out put dikodekan dengan (1) ditandai angka 1.000 pada kolom (1),
demikian juga kelas-kelas lainnya. Ketentuan ini juga berlaku untuk variabel
slope.

Interpretasi :
Signifikansi model 0.000 < 0.05 berarti secara umum, model signifikan
secara statistik.

Interpretasi :
Cox and Snell sebesar 0,259 yang berarti 25,9 persen variasi dari kejadian
kebakaran (hotspot) di Taman Nasional Rawa Aopa Watumohai dapat
dijelaskan oleh variabel independent yang digunakan.
Nagelkerke sebesar 0,381 yang berarti 38,1 persen variasi dari kejadian

kebakaran (hotspot) di Taman Nasional Rawa Aopa Watumohai dapat

dijelaskan oleh variabel independent yang digunakan.

Interpretasi :
Probabilitas 0.552 > 0.05, artinya model regresi binary layak dipakai untuk
analisis selanjutnya karena tidak ada perbedaan yang nyata antara klasifikasi yang
diprediksi dengan klasifikasi yang diamati.

Interpretasi :
Kejadian kebakaran pada penutupan lahan savanna (sig. 0.000) berbeda
secara signifikan terhadap hutan mangrove, sedangkan peluang kejadian
kebakaran pada hutan rawa, hutan pegunungan dataran rendah, area
pertanian/pemukiman dan badan air (terbakar saat air surut) tidak berbeda secara
signifikan terhadap hutan mangrove.
Peluang terjadinya kebakaran di area savanna 17 kali lipat dibandingkan
area control. Dari sisi kelerengan, kelas lereng datar (sig. 0.000) berbeda
signifikan terhadap kelas lereng curam dimana peluang kejadian kebakaran pada
kelas lereng ini 5.5 kali dibandingkan control.

c. Kesimpulan
Berdasarkan hasil regresi logistik, area yang paling rawan kebakaran di
kawasan Taman Nasional Rawa Aopa Watumohai adalah pada area-area
bertopografi datar yang ditumbuhi vegetasi savanna. Berdasarkan kriteria
pembagian kelas slope di atas, maka pengaruh tutupan lahan savana lebih tinggi
dari pada pengaruh slope datar dengan pembanding kelas kontrol masing-masing,
dimana nilai Odd Rasio untuk penutupan lahan savanna 17.19 dan kelas topografi
datar 5.5.
B. REGRASI LINIER.
Analisis regresi linier sederhana adalah hubungan secara linear antara satu variabel
independen (X) dengan variabel dependen (Y). Analisis ini untuk mengetahui arah
hubungan antara variabel independen dengan variabel dependen apakah positif atau negatif
dan untuk memprediksi nilai dari variabel dependen apabila nilai variabel independen
mengalami kenaikan atau penurunan.. Data yang digunakan biasanya berskala interval atau
rasio.
Rumus regresi linear sederhana sebagi berikut:
Y’ = a + bX
Keterangan:
Y’ = Variabel dependen (nilai yang diprediksikan)
X = Variabel independen
a = Konstanta (nilai Y’ apabila X = 0)
b = Koefisien regresi (nilai peningkatan ataupun penurunan)

Contoh kasus:
Seorang mahasiswa bernama Hermawan ingin meneliti tentang pengaruh biaya
promosi terhadap volume penjualan pada perusahaan jual beli motor. Dengan ini di dapat
variabel dependen (Y) adalah volume penjualan dan variabel independen (X) adalah biaya
promosi. Dengan ini Hermawan menganalisis dengan bantuan program SPSS dengan alat
analisis regresi linear sederhana. Data-data yang di dapat ditabulasikan sebagai berikut:

Tabel. Tabulasi Data Penelitian (Data Fiktif)

No Biaya Promosi Volume Penjualan


1 12,000 56,000
2 13,500 62,430
3 12,750 60,850
4 12,600 61,300
5 14,850 65,825
6 15,200 66,354
7 15,750 65,260
8 16,800 68,798
9 18,450 70,470
10 17,900 65,200
11 18,250 68,000
12 16,480 64,200
13 17,500 65,300
14 19,560 69,562
15 19,000 68,750
16 20,450 70,256
17 22,650 72,351
18 21,400 70,287
19 22,900 73,564
20 23,500 75,642

Langkah-langkah pada program SPSS


a) Masuk program SPSS
b) Klik variable view pada SPSS data editor
c) Pada kolom Name ketik y, kolom Name pada baris kedua ketik x.
d) Pada kolom Label, untuk kolom pada baris pertama ketik Volume Penjualan, untuk kolom
pada baris kedua ketik Biaya Promosi.
e) Untuk kolom-kolom lainnya boleh dihiraukan (isian default)
f) Buka data view pada SPSS data editor, maka didapat kolom variabel y dan x.
g) Ketikkan data sesuai dengan variabelnya
h) Klik Analyze - Regression - Linear
i) Klik variabel Volume Penjualan dan masukkan ke kotak Dependent, kemudian klik
variabel Biaya Promosi dan masukkan ke kotak Independent.
j) Klik Statistics, klik Casewise diagnostics, klik All cases. Klik Continue
k) Klik OK, maka hasil output yang didapat pada kolom Coefficients dan Casewise
Diagnostics adalah sebagai berikut:

Tabel. Hasil Analisis Regresi Linear Sederhana


Persamaan regresinya sebagai berikut:

Y’ = a + bX
Y’ = -28764,7 + 0,691X

Angka-angka ini dapat diartikan sebagai berikut:


- Konstanta sebesar -28764,7; artinya jika biaya promosi (X) nilainya adalah 0, maka volume
penjulan (Y’) nilainya negatif yaitu sebesar -28764,7.
- Koefisien regresi variabel harga (X) sebesar 0,691; artinya jika harga mengalami kenaikan
Rp.1, maka volume penjualan (Y’) akan mengalami peningkatan sebesar Rp.0,691. Koefisien
bernilai positif artinya terjadi hubungan positif antara harga dengan volume penjualan,
semakin naik harga maka semakin meningkatkan volume penjualan.
Nilai volume penjualan yang diprediksi (Y’) dapat dilihat pada tabel Casewise
Diagnostics (kolom Predicted Value). Sedangkan Residual (unstandardized residual) adalah
selisih antara Volume Penjualan dengan Predicted Value, dan Std. Residual (standardized
residual) adalah nilai residual yang telah terstandarisasi (nilai semakin mendekati 0 maka
model regresi semakin baik dalam melakukan prediksi, sebaliknya semakin menjauhi 0 atau
lebih dari 1 atau -1 maka semakin tidak baik model regresi dalam melakukan prediksi).

Uji Koefisien Regresi Sederhana (Uji t)


Uji ini digunakan untuk mengetahui apakah variabel independen (X) berpengaruh
secara signifikan terhadap variabel dependen (Y). Signifikan berarti pengaruh yang
terjadi dapat berlaku untuk populasi (dapat digeneralisasikan).
Dari hasil analisis regresi di atas dapat diketahui nilai t hitung seperti pada tabel 2.
Langkah-langkah pengujian sebagai berikut:
1. Menentukan Hipotesis
Ho : Ada pengaruh secara signifikan antara biaya promosi dengan volume penjualan
Ha : Tidak ada pengaruh secara signifikan antara biaya promosi dengan volume
penjualan
2. Menentukan tingkat signifikansi
Tingkat signifikansi menggunakan a = 5% (signifikansi 5% atau 0,05 adalah ukuran
standar yang sering digunakan dalam penelitian)
3. Menentukan t hitung
Berdasarkan tabel diperoleh t hitung sebesar 10,983
4. Menentukan t tabel
Tabel distribusi t dicari pada a = 5% : 2 = 2,5% (uji 2 sisi) dengan derajat kebebasan
(df) n-k-1 atau 20-2-1 = 17 (n adalah jumlah kasus dan k adalah jumlah variabel
independen). Dengan pengujian 2 sisi (signifikansi = 0,025) hasil diperoleh untuk t
tabel sebesar 2,110 (Lihat pada lampiran) atau dapat dicari di Ms Excel dengan cara
pada cell kosong ketik =tinv(0.05,17) lalu enter.
5. Kriteria Pengujian
Ho diterima jika –t tabel < t hitung < t tabel
Ho ditolak jika -thitung < -t tabel atau t hitung > t tabel
6. Membandingkan t hitung dengan t tabel
Nilai t hitung > t tabel (10,983 > 2,110) maka Ho ditolak.

7. Kesimpulan
Oleh karena nilai t hitung > t tabel (10,983 > 2,110) maka Ho ditolak, artinya bahwa
ada pengaruh secara signifikan antara biaya promosi dengan volume penjualan. Jadi
dalam kasus ini dapat disimpulkan bahwa biaya promosi berpengaruh terhadap
volume penjualan pada perusahaan jual beli motor.

Anda mungkin juga menyukai