Logistic Regression
Logistic Regression
Regression with a
Binary
Dependent Variable
OLEH :
DIAN FITRIANI
Y U N I W U L A N D A R I ( 0 4 2 11 4 1 5 3 0 2 2 )
Regresi Logistik
Beda dengan Analisis Diskriminan
Analisis Regresi Logistik
Regresi logistik dalam
1 2
Teknik statistik yang
digunakan ketika variabel bentuk dasarnya terbatas
dependen adalah variabel pada dua kelompok untuk
kategorikal (nominal atau variabel terikat, meskipun
nonmetrik) dan variabel formulasi lain dapat
independennya adalah menangani lebih banyak
variabel metrik atau kelompok
nonmetri
Tujuan Regresi Logistik
3 4
Regresi Logistik Lebih disukai dibanding Regresi logistik memiliki aplikasi yang
An, Diskrimina karena : luas dalam situasi di mana tujuan
utamanya adalah untuk
1. Regresi logistik tidak menghadapi mengidentifikasi kelompok tempat
asumsi ketat dan jauh lebih kuat suatu objek (misalnya, orang,
ketika asumsi ini tidak terpenuhi, perusahaan, atau produk). Aplikasi
sehingga penerapannya sesuai potensial termasuk memprediksi apa
dalam banyak situasi pun yang hasilnya biner (mis.,
2. Mirip Dengan An. Regresi Berganda Ya/Tidak).
Tahapan Proses Analisis Regresi
Logistik
01 Tujuan Regresi Logistik.
05 Interpretasi Hasil.
06 Validasi
01 Tujuan Regresi Logistik.
Jika kelompok mewakili karakteristik (misalnya, jenis kelamin), maka salah satu kelompok dapat diberi nilai 1 (misalnya, perempuan) dan
kelompok lainnya diberi nilai 0 (misalnya, laki-laki). Dalam situasi seperti itu, koefisien akan mencerminkan dampak variabel independen
terhadap kemungkinan orang tersebut menjadi perempuan (yaitu, kelompok berkode 1).
Jika kelompok mewakili hasil atau peristiwa (misalnya, keberhasilan atau kegagalan, pembelian atau nonpembelian), penetapan kode
kelompok berdampak pada interpretasi juga. Asumsikan bahwa kelompok yang berhasil diberi kode 1, dengan kegagalan diberi kode 0.
Kemudian, koefisien mewakili dampak pada kemungkinan keberhasilan. Sama mudahnya, kode dapat dibalik (kode 1 sekarang menunjukkan
kegagalan) dan koefisien mewakili kekuatan yang meningkatkan kemungkinan kegagalan.
Regresi logistik Bagaimanapun Juga berbeda dari regresi berganda, karena secara khusus dirancang
untuk memprediksi probabilitas suatu peristiwa yang terjadi (yaitu, probabilitas pengamatan berada
dalam kelompok berkode 1). Meskipun nilai probabilitas adalah ukuran metrik, ada perbedaan
mendasar antara regresi berganda dan regresi logistik..
Sifat biner dari variabel dependen (0 atau 1) memiliki sifat yang melanggar asumsi regresi berganda.Antara
lain :
1. Error dari variabel diskrit mengikuti distribusi binomial bukan distribusi normal, sehingga membatalkan
semua pengujian statistik berdasarkan asumsi normalitas.
2. Varians dari variabel dikotomis tidak konstan, menyebabkan Heterokedastisitas.
3. Tidak ada pelanggaran yang dapat diperbaiki melalui transformasi variabel dependen atau independen
REGRESI LOGISTIK
UKURAN SAMPEL
1. Ukuran Sampel Keseluruhan :
Menggunakan Metode Maximum Likelihood Estimation (MLE), Sehingga dalam Estimasi membutuhkan
sampel yang besar.
Misalnya, Hosmer dan Lemeshow merekomendasikan ukuran sampel lebih besar dari 400 .
Ukuran sampel yang direkomendasikan untuk setiap kelompok setidaknya 10 pengamatan per parameter
yang diestimasi. Ini jauh lebih besar daripada regresi berganda, yang memiliki minimal lima pengamatan
perparameter, dan itu untuk sampel keseluruhan, bukan ukuran sampel untuk setiap kelompok, seperti
yang terlihat dengan regresi logistik.
Keuntungan regresi logistik dibandingkan dengan analisis diskriminan dan bahkan regresi berganda
sebagian besar berasal dari kurangnya asumsi umum yang diperlukan dalam analisis regresi logistik
1. Tidak memerlukan bentuk distribusi spesifik dari variabel independen dan isu-isu seperti
heteroskedastisitas
2. Tidak memerlukan hubungan linier antara variabel independen dan variabel.
04 Estimation of the logistic regression model and assessing overall fit
Salah satu karakteristik unik dari regresi logistik adalah penggunaan hubungan logistik yang
dijelaskan sebelumnya baik dalam memperkirakan model logistik dan membangun hubungan
antara variabel dependen dan independen.
Regresi logistik memiliki variate tunggal yang terdiri dari koefisien estimasi untuk setiap
variabel independen, seperti yang ditemukan dalam regresi berganda.
Regresi logistik mendapatkan namanya dari transformasi logit yang digunakan dengan
variabel dependen, menciptakan beberapa perbedaan dalam proses estimasi.
• Transforming the dependent variable
Gambar 2 menggambarkan dua contoh hipotetis untuk menyesuaikan
hubungan logistik dengan data sampel. Data aktual mewakili apakah
suatu peristiwa terjadi atau tidak dengan menetapkan nilai 1 atau 0 untuk
hasil (dalam hal ini 1 diberikan ketika peristiwa itu terjadi, 0 sebaliknya .
Pada bagian (a), kurva logistik tidak dapat memuat data dengan baik,
karena sejumlah nilai variabel independen memiliki hasil (1 dan 0).
Namun, pada bagian (b), hubungan yang jauh lebih terdefinisi dengan
baik didasarkan pada variabel bebas
ESTIMASI KOEFISIEN
Dalam regresi berganda, memperkirakan hubungan linier yang paling sesuai dengan
data. Dalam regresi logistik, mengikuti proses yang sama untuk memprediksi variabel
dependen dengan suatu variasi yang terdiri dari koefisien logistik dan variabel
independen yang sesuai. Apa yang berbeda adalah bahwa dalam regresi logistik, nilai
prediksi tidak pernah bisa berada di luar kisaran 0 hingga 1
Proses estimasi koefisien logistik serupa dengan yang digunakan dalam regresi, meskipun dalam kasus ini hanya dua nilai aktual
yang digunakan untuk variabel dependen (0 dan 1). Dalam regeresi liner Estimasi menggunaka OLS (Ordinary Least Square)
Sedangkan dalam Regresi Logistik menggunakan Metode MLE (Maximum Likelihood Estimation)
Research Article
Analysis of Haematological Parameters as Predictors of Malaria Infection Using a Logistic Regression Model: A Case
Study of a Hospital in the Ashanti Region of Ghana
Tujuan Penelitian menentukan sejauh mana parameter hematologis dan karakteristik demografis pasien dapat
digunakan untuk memprediksi infeksi malaria menggunakan regresi logistik
Sumber Data : Data sekunder dari departemen laboratorium St.Rumah Sakit Patrick, Ofnso
Rentang Waktu : Januari-Juni 2018
Sampl : 2076 pasien
Laki-laki : 876 pasien
Perempuan: 1200 pasien
Usia : 1-102 Tahun
Parameter hematologi : hemoglobin (Hb), sel darah putih (WBC), trombosit (Plt), limfosit (Limfa), jumlah sel
campuran (MXD), dan neutrofil (Neut).
Untuk penelitian ini, data yang diperoleh diberi kode sebagai berikut:malaria (positif = 1 dan negatif = 0); jenis kelamin
(1 = laki-laki, 0 = perempuan). Usia dan semua parameter hematologi yang digunakan dalam penelitian ini adalah
variabel numerik dan oleh karena itu tidak memerlukan pengkodean
Analisis yang digunakan untuk menganalisis Parameter hematologi sebagai predictor Infeksi Malaria Adalah Regresi
Logistik.
untuk memprediksi apakah seorang
pasien menderita malaria atau tidak,
usia, kadar hemoglobin (Hb),
trombosit (Plt), dan limfosit (Limfa)
pasien itu bisa menjadi faktor yang
relevan. Oleh karena itu, peningkatan
variabel-variabel ini dapat
menurunkan kemungkinan pasien
terkena malaria.
PRAKTEK SPSS
Sebuah perusahaan pembiayaan sepeda motor ingin mengetahui faktor-faktor apa saja yang mempengaruhi sebuah kridit
kendaraan dapat mengalami kemacetan. Data digunakan sampel sebanyak 35 peminjam untuk mencari penyebab dimana
faktor-faktor yang dicurigai diantaranya, DP (Besar uang muka), jangka waktu pembayaran, umur peminjam dan
pendidikan peminjam
Langkah-langkah SPSS
2
3