AGUNG ANGGORO
1200053
MATEMATIKA C 2012
Pendahuluan
Regresi logistik merupakan teknik pemodelan pada suatu kondisi dimana variabel
dependennya (variabel respon) bersifat memiliki dua buah nilai (dikotomi), sedangkan variabel
independennya berskala interval atau rasio. Misalkan pengaruh kemampuan matematika pada
peserta tes SNMPTN terhadap keberhasilan peserta diterima di Program Studi Pendidikan
Matematika. Kemampuan matematika adalah variabel independen sedangkan keberhasilan peserta
adalah variabel terikat dimana bernilai 1 jika diterima dan 0 jika tidak diterima di Program Studi
Pendidikan Matematika UPI. Persamaan regresi logistik tidak menghasilkan nilai pada variabel
dependen, namun menghasilkan peluang kejadian pada variabel dependen. Pada kasus diatas
berarti akan dihasilkan probabilitas peserta tes SNMPTN diterima di Program Studi Pendidikan
Matematika berdasarkan kemampuan matematikanya.
Asumsi
(Ariyoso, 2009)
Pada model regresi logistik, asumsi-asumsi berikut harus dipenuhi :
1. Kategori dalam variabel independen harus terpisah satu sama lain atau bersifat eksklusif.
2. Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel
data untuk sebuah variabel bebas.
“Model regresi logistik adalah model linear logit(P) sebagai kombinasi linier dari variabel
penjelas x. Seperti halnya dalam regresi linear, kita bisa mendapatkan nilai-nilai intercept dan slope
dari model tersebut” (Sartono, 2010). Sehingga, persamaan regresi logistik juga dapat dinyatakan
sebagai berikut : (ekuivalen dengan persamaan di atas)
𝑃 𝑖
Dengan logit(Pi) = ln(1−𝑃 )
𝑖
Variabel independen pada tingkat yang paling rendah akan menyebabkan probabilitasnya
mendekati 0. Ketika nilai pada variabel independen meningkat, probabilitasnya juga meningkat
(kurva naik), tetapi pada titik tertentu kemudian slopenya mulai menurun, pada berbagai tingkat
variabel independen probabilitasnya akan mendekati 1 tetapi tidak pernah lebih dari 1. (Regresi
logistik positif)
𝑃𝑖
Nilai pada disebut sebagai odds ratio responden ke-i. Odds ratio merupakan
1−𝑃𝑖
perbandingan antara keberhasilan dan ketidakberhasilan.
Sumber : ats.ucla.edu
Gambar di atas merupakan contoh kurva pada model regresi logistik dengan satu macam
variabel bebas. Sumbu x pada kurva merepresentasikan nilai-nilai pada variabel bebas, sedangkan
sumbu y merepresentasikan probabilitas kejadian variabel dependen bernilai 1.
Logit(Pi) = 𝛽0 + 𝛽1 𝑥𝑖
(Sartono, 2010) Pengujian peranan variabel bebas dalam model dapat dilakukan
menggunakan uji likelihood ratio dengan formula :
atau
Statistik G ini secara teoritis mengikuti sebaran χ2 dengan derajat bebas k, untuk k variabel
bebas. Kriteria keputusan yang diambil yaitu menolak H0 bila Ghitung > χ2α(k).
Kita akan menduga 𝛽0 dan 𝛽1 untuk persamaan berikut yaitu model regresi logistik dari data di
atas.
𝑒 𝛽0+𝛽1 𝑥𝑖
𝑃(𝑌 = 1) =
1 + 𝑒𝛽0+𝛽1 𝑥𝑖
Koefisien 𝛽0 dan 𝛽1 merupakan solusi sedemikian sehingga memaksimumkan fungsi berikut :
𝑛
𝐿𝐿 = ∑ 𝑦𝑖 ln 𝑃𝑖 + (1 − 𝑦𝑖 )ln(1 − 𝑃𝑖 )
𝑖=1
Menurut Bagus Sartono, solusi dalam memaksimumkan fungsi LL dapat dilakukan dengan
bantuan fasilitas Solver pada Microsoft Excell. Langkah-langkah yang harus dilakukan diuraikan
seperti berikut ini.
Seluruh data dari 56 responden diinput pada sel-sel Excell dan masukkan formula pada sel-sel
tertentu seperti seperti gambar berikut. (Tambahkan tanda sama dengan (=) di awal). Formula-
formula yang digunakan merupakan rumus-rumus yang telah dibahas sebelumnya yaitu rumus
probabilitas dan fungsi Log-Likehood (LL). Sedangkan, sel C3 dan C4 pertama-tama diisi sebarang
nilai.
Kemudian digunakan fasilitas Solver untuk menemukan solusi untuk LL model maksimum.
Solver harus diaktifkan terlebih dahulu pada Options > Add-ins jika belum diaktifkan. Kemudian klik
sel F3, klik tap data kemudian klik Solver.
Penggunaan Solver untuk memaksimumkan nilai fungsi LL (sel F3) yaitu dengan mengganti
nilai pada sel C3 dan C4 (𝛽0 dan 𝛽1 ) yang sebelumnya telah diisi sembarang nilai adalah sebagai
berikut
Diperoleh G sama dengan 15,544. Sedangkan χ20,05(1) = 3,841. Karena G > 3,841 maka H0
ditolak. sehingga dapat disimpulkan bahwa variabel x (kemampuan matematika peserta tes)
memiliki pengaruh signifikan terhadap keberhasilan diterima di program studi matematika.
“Interpretasi regresi logistik menggunakan odds ratio (ψ). yang menjelaskan berapa kali
lipat kenaikan atau penurunan peluang y = 1, jika nilai variabel penjelas (x) berubah sebesar nilai
tertentu” (Olis). Nilai odds ratio selalu positif. Hubungan antara odds ratio (ψ) dan koefisien
variabel x (β) dijelaskan oleh persamaan berikut :
Ψab = e β(b-a)
Ψab adalah odds ratio antara objek dengan nilai x=b terhadap objek dengan nilai x=a. Dalam
contoh kasus untuk a=80 dan b=82, Ψ = e 0,719(82-80) = 4,212. Artinya, peserta dengan nilai 82
memiliki peluang diterima 4,212 kali lebih besar daripada peserta dengan nilai 80 atau peluang
diterima bertambah 4,212 kali lipat ketika kemampuan matematika bertambah sebesar 2.
Referensi
Ariyoso. (2009, November 11). Regresi Logistik Biner. Diambil kembali dari Statistik 4 Life:
http://ariyoso.wordpress.com/2009/11/11/regresi-logistik/
Olis. (t.thn.). Hand Out Materi Pelatihan Analisis Statistik untuk Kesehatan. Diambil kembali dari
Statistika Unhalu.