I. PENDAHULUAN
Analisis regresi logistik adalah salah satu pendekatan model matematis yang digunakan
untuk menganalisis hubungan satu atau beberapa variabel independen dengan sebuah variabel
dependen katagori yang bersifat dikotom/binary. Variabel katagori yang dikotom adalah variabel
yang mempunyai dua nilai variasi misalnya: sakitt dan tidak sakit, bayi BBLR dan Normal,
merokok dan tidak merokok, dan lain-lain.
Perbedaan antara regresi liniear dengan regresi logistik terletak pada jenis variabel dependennya.
Regresi linier digunakan apabila variabel dependennya numerik sedangkan regresi linear
digunakan pada data yang dependennya berebentuk katagori yang dikotom.
Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh nalisis
penelitian yang mempelajari hubungan antara variabel umur dengan kejadian penyakit jantung
koroner. Pengamatan dilakukan pada 100 orang sampel didapatkan hasil sebagai berikut:
ID : 1 2 3 4 5 6 7 8 9 10 11 100
Umur : 20 22 23 24 25 27 28 29 30 32 33 .. 70
PJK : 0 0 1 0 0 1 0 1 1 0 0 .. 1
ID merupakan nomor urut responden dan PJK merupakan variabel kejadian penyakit jantung
koroner. Varibel PJK diberi kode 1 bila responden menderita sakit jantung dan diberi kode 0 bila
mereka tidak menderita sakit jantung.
Bila data tersebut kita perlakukan analisisnya dengan menggunakan regresi linier misalnya
dibuat penyajian dalam bentuk diagram tebar( scatter plot) maka pola hubungannya tidak jelas
terlihat. Tebaran data pada scatter plot membentuk dua garis yang sejajar. Diagram tebar
menunjukkan adanya kecenderungan kejadian penyakit jantung koroner yang lebih sedikit pada
responden yang berusia muda. Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan
variabel dependen (kejadianjantung) yang cukup jelas, namun grafik tersebut tidak mampu
menggambarkan dengan lebih tajam/jelas hubungan antara umur dengan kejadian penyakit jantung
koroner.
30-34 15 13 2 0.13
35-39 12 9 3 0.25
40-44 15 10 5 0.33
45-49 13 7 6 0.46
50-54 8 3 5 0.63
55-59 17 4 13 0.76
60-69 10 2 8 0.80
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada kelompok umur
yang semakin tua/lanjut. Kemudian kita coba sajikan data tersebut denga grafik dan hasilnya dapat
dilihat pada grafik berikut:
Pada grafik terlihat jelas tentang adanya peningkatan yang tidak linear antara proporsi
kejadian jantung koroner dengan peningkatan umur. Diawali peningkatan yang landai, kemudian
meningkat tajam dan kemudian landai kembali, garis tersebut menyerupai bentuk huruf S.
Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara untuk
mendeteksi/mengetahui hubungan pada analisis regresi linear namun ada sedikit perbedaan dalam
hal meringkas variabel dependennya. Seperti kita ketahui bahwa pada regresi liniear kita ingin
mengestimasi nilai mean variabel dependen berdasarkan setiap nilai variabel independen. Nilai
tersebut disebut sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai
dependen dan x sebagai independen. E(Y/x) adalah nilai Y yang diharapkan berdasarkan nilai x.
Misal Y variabel tekanan darah dan x variabel umur, maka untuk mengetahui estimasi tekanan
darah berdasarkan umur, dihitung rata-rata( mean) tekanan darah pada masing-masing nilai umur.
Pada regresi linier nilai E(Y/x) akan berkisar antara 0 s/d (0E(Y/x) ).
Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada sedikit perbedaan
dalam menghitung rata-rata variabel dependennya (Y). Oleh karena pada regresi logistik variabel
dependenya adalah dikotom maka variabel dependen dihitung bukan dengan mean namun dengan
menggunakan proporsi. Seperti pada data diatas variabel Y kejadian jantung dan x variabel umur,
maka untuk mengatui estimasi kejadian penyakit jantung koroner berdasarkan umur, dihitung nilai
proporsi kejadian jantung koroner pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x)
akan selalu berada antara nol dan satu (0E(Y/x)1).
Fungsi Logiistik
f(Z) =
1 + e -Z
f(Z) merupakan probabilitas kejadian suatu penyakit berdasarkan faktor risiko tertentu
1 + e
1 + e
Terlihat bahwa fungsi f(Z) nilai berkisar antara 0 dan 1 berapapun nilai Z. Kisaran pada
regresi logistik ini berarti cocok/sesuai digunakan untuk model hubungan yang variabel
dependennya dikotom. Grafik dari f(Z) membentuk garis yang berbentuk S ini berarti sesuai
dengan contoh plot hubungan antara PJK dengan umur pada kasus yang telah kita bahas diatas.
Bentuk S ini mencerminkan tentang pengaruh nilai Z pada risiko individu yang menimal pada nilai
Z rendah kemudian seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan dapat
ketinggian tertentu garisnya akan mendatar mendekati nilai 1. Berdasarkan uraian tersebut maka
bila ingin mengestimasi suatu probabilitas kejadian pada dependen yang dikotom maka model
regresi logistik adalah pilihan yang tepat.
Model logistik dikembangkan dari fungsi logistik dengan nilai Z merupakan penjumlahan
linear konstanta () ditambah dengan 1X1, ditambah 2X2 dan sterusnya sampai iXi. Variabel
X adalah variabel independen.
f(Z) =
Contoh suatu studi follow-up selama 9 tahun. Dalam studi ini dipelajari mengenai hubungan antara
kejadian penyakit jantung koroner (dengan nama variabel PJK) dengan tinggi rendahnya kadar
katekolamin dalam darah (nama varoabel KAT).
Pertanyaan:
a) Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko untuk terjadi PJK?
b) Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko untuk terjadi
PJK?
c) Bandingkan risiko terjadi jantung koroner antara mereka yang kadar katekolaminnya tinggi
dengan yang kadar katekolaminnya rendah.
Jawab:
Dengan model regresi logistik maka pada soal tsb bentuk modelnya adalah:
1
f(Z) =
1 + e -Z
P(X) =
1 + e -Z
P(X) =
1 + e -(+1KAT)
maka:
P(X) =
1 + e -(3,911+0,652KAT)
a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi.
Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai KAT=1 pada model
diatas. Hasilnya:
1 + e -(3,911+0,652 1)
jadi mereka dengan kadar katekolamin tinggi dalam darah mempunyai risiko untuk terjadinya PJK
sebesar 4 %.
b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah.
Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai KAT=0 pada model
diatas. Hasilnya:
1 + e -(3,911+0,652 0)
jadi mereka dengan kadar katekolamin rendah dalam darah mempunyai risiko untuk terjadinya
PJK sebesar 2 %.
P1(X) 0.037
= = 1,947 = 2,0
P0(X) = 0,019
Angka tersebut diatas sebenarnya adalah risiko relatif (RR) yang diperoleh secara direk.
Arti dari angka diatas adalah, mereka yang kadar katekolaminnya tinggi mempunyai risiko terjadi
PJK dua (2) kali lebih tinggi dibandingkan mereka yang kada kotakolaminnya rendah.
Model regrsi logsitik dapat digunakan pada data yang dikumpulkan melalui rancangan
kohor, case control maupun cross sectional. Namun pada dua rancangan terakhir, parameternya
dicari melalui estimsi rasio odds (OR) yang merupakan perhitungan eksponensial dari persamaa
garis regresi logistik. Jadi nilai OR dapat dihitung dari nilai relatif risk (RR) dengan cara indirek.
Rasio Odds = e
Analisis Regresi Linear Sederhana (Simple
Linear Regression)
Dickson Kho Ilmu Statistika
Analisis Regresi Linear Sederhana Regresi Linear Sederhana adalah Metode Statistik yang
berfungsi untuk menguji sejauh mana hubungan sebab akibat antara Variabel Faktor Penyebab
(X) terhadap Variabel Akibatnya. Faktor Penyebab pada umumnya dilambangkan dengan X atau
disebut juga dengan Predictor sedangkan Variabel Akibat dilambangkan dengan Y atau disebut
juga dengan Response. Regresi Linear Sederhana atau sering disingkat dengan SLR (Simple
Linear Regression) juga merupakan salah satu Metode Statistik yang dipergunakan dalam
produksi untuk melakukan peramalan ataupun prediksi tentang karakteristik kualitas maupun
Kuantitas.
Contoh Penggunaan Analisis Regresi Linear Sederhana dalam Produksi antara lain :
1. Hubungan antara Lamanya Kerusakan Mesin dengan Kualitas Produk yang dihasilkan
2. Hubungan Jumlah Pekerja dengan Output yang diproduksi
3. Hubungan antara suhu ruangan dengan Cacat Produksi yang dihasilkan.
Y = a + bX
Dimana :
Y = Variabel Response atau Variabel Akibat (Dependent)
X = Variabel Predictor atau Variabel Faktor Penyebab (Independent)
a = konstanta
b = koefisien regresi (kemiringan); besaran Response yang ditimbulkan oleh Predictor.
Berikut ini adalah Langkah-langkah dalam melakukan Analisis Regresi Linear Sederhana :
Penyelesaian
Tujuan : Memprediksi Jumlah Cacat Produksi jika suhu ruangan tidak terkendali
Rata-rata Suhu
Tanggal Jumlah Cacat
Ruangan
1 24 10
2 22 5
3 21 6
4 20 3
5 22 6
6 19 4
7 20 5
8 23 9
9 24 11
10 25 13
11 21 7
12 20 4
13 20 6
14 19 3
15 25 12
16 27 13
17 28 16
18 25 12
19 26 14
20 24 12
21 27 16
22 23 9
23 24 13
24 23 11
25 22 7
26 21 5
27 26 12
28 25 11
29 26 13
30 27 14
Berikut ini adalah tabel yang telah dilakukan perhitungan X, Y, XY dan totalnya :
Rata-rata Suhu Jumlah
Tanggal X2 Y2 XY
Ruangan (X) Cacat (Y)
1 24 10 576 100 240
2 22 5 484 25 110
3 21 6 441 36 126
4 20 3 400 9 60
5 22 6 484 36 132
6 19 4 361 16 76
7 20 5 400 25 100
8 23 9 529 81 207
9 24 11 576 121 264
10 25 13 625 169 325
11 21 7 441 49 147
12 20 4 400 16 80
13 20 6 400 36 120
14 19 3 361 9 57
15 25 12 625 144 300
16 27 13 729 169 351
17 28 16 784 256 448
18 25 12 625 144 300
19 26 14 676 196 364
20 24 12 576 144 288
21 27 16 729 256 432
22 23 9 529 81 207
23 24 13 576 169 312
24 23 11 529 121 253
25 22 7 484 49 154
26 21 5 441 25 105
27 26 12 676 144 312
28 25 11 625 121 275
29 26 13 676 169 338
30 27 14 729 196 378
Total () 699 282 16487 3112 6861
a = -24,38
b = 1,45
Y = a + bX
Y = -24,38 + 1,45X
I. Prediksikan Jumlah Cacat Produksi jika suhu dalam keadaan tinggi (Variabel X), contohnya :
30C
Jadi Jika Suhu ruangan mencapai 30C, maka akan diprediksikan akan terdapat 19,12 unit
cacat yang dihasilkan oleh produksi.
II. Jika Cacat Produksi (Variabel Y) yang ditargetkan hanya boleh 4 unit, maka berapakah suhu
ruangan yang diperlukan untuk mencapai target tersebut ?
4 = -24,38 + 1,45X
1,45X = 4 + 24,38
X = 28,38 / 1,45
X = 19,57
Jadi Prediksi Suhu Ruangan yang paling sesuai untuk mencapai target Cacat Produksi adalah
sekitar 19,57C
REGRESI LOGISTIK : Alat Analisis Spasial
dan Evaluasi Kawasan (Bagian 2)
Mei 21, 2013 by dwi putro sugiarto
Untuk dapat mengolah data spasial kategorik menggunakan analisis regresi logistik, ada
beberapa hal yang perlu didefinisikan pada tahap pra pengolahan :
1. Definisi atau dasar teoritik yang digunakan untuk pembentukkan kelas/kategori. Dasar
pengkelasan ini sangat penting khususnya untuk mengelompokkan data-data yang
memiliki tingkatan rasio, interval maupun ordinal.
2. Unit analisis yang dipergunakan seperti apa. Pengamatan dapat dilakukan dengan
membandingkan antara kejadian dan tidak adanya kejadian pada kondisi area tertentu.
Area analisis dapat berupa unit spasial dimana area-area dalam unit yang sama memiliki
homogenitas. Dalam banyak kasus bidang kehutanan, banyak peneliti menggunakan unit
area analisis yang dibatasi oleh wilayah administrasi, petak dan area hasil intersek data
vector. Area analisis juga dapat menggunakan piksel dengan luasan tertentu. Kelemahan
penggunaan batas piksel ini adalah batas-batas unit pengamatan tidak halus sehingga
menyulitkan interpretasi kejadian pada batas antar unit pengamatan yang bersinggungan.
Contohnya : terkadang ditemukan kebakaran di mangrove padahal di kondisi nyatanya
terjadi di savana dekat mangrove. Sekali lagi, kondisi area dalam satu unit pengamatan
diasumsikan homogen
3. Penentuan kelas yang berfungsi sebagai kontrol atau pembanding. Misalnya ingin
mengetahui pengaruh penunjukkan suatu kawasan dari semula bersatus sebagai Hutan
Produksi menjadi Cagar Alam terhadap penurunan tingkat illegal logging. untuk kasus
seperti ini maka dapat memilih area berstatus Hutan Produksi dengan kondisi biofisik
yang mirip di sekitarnya sebagai kontrol/pembanding. Dari hasil analisis akan terlihat
sejauh mana aktivitas manajemen di Cagar Alam dapat menurunkan illegal logging.
Setelah ketiga pertanyaan tersebut terjawab, pembentukkan kelompok dan input data spasial
dapat dilakukan. Sebagai studi kasus teknik ini maka akan dilakukan analisis faktor yang paling
berpengaruh terhadap kejadian kebakaran hutan dan lahan di Taman Nasional Rawa Aopa
Watumohai.
Untuk mempermudah pemahaman, dalam contoh ini akan dilakukan penyederhanaan. Faktor
yang akan diuji meliputi 2 variabel, yaitu penutupan lahan dan slope (dalam kondisi nyata
tentunya banyak variabel). Variabel responnya berupa kejadian kebakaran hutan dan lahan di
TNRAW yang diindikasikan oleh hotspot (asumsi : hotspot telah diverifikasi).
Lakukan intersek ketiga variabel dengan Arc GIS, maka akan terbentuk unit-unit area
dengan 3 atribut, yaitu penutupan lahan, slope dan variabel respon.
Dengan ArcGIS lakukan ekspor data spasial menjadi data atribut berbentuk Excel. Copy
data Excel ini dan Paste kan di SPSS. Gunakan klik kanan. Hasilnya akan tampak seperti
Gambar di bawah ini.
Tekan OK
Hasil out put regresi logistik akan keluar seperti gambar di atas.
Interpretasi : Variabel bebas yang digunakan adalah penutupan lahan dan slope. Sebagai kontrol
(pembanding), variabel penutupan lahan menggunakan kelas hutan mangrove (parameter coding
0.000 semua) dengan frekuensi 53 sel. Hutan rawa dalam out put dikodekan dengan (1) ditandai
angka 1.000 pada kolom (1), demikian juga kelas-kelas lainnya. Ketentuan ini juga berlaku untuk
variabel slope.
Cox and Snell sebesar 0,259 yang berarti 25,9 persen variasi dari kejadian kebakaran
(hotspot) di Taman Nasional Rawa Aopa Watumohai dapat dijelaskan oleh variabel
independent yang digunakan.
Nagelkerke sebesar 0,381 yang berarti 38,1 persen variasi dari kejadian kebakaran
(hotspot) di Taman Nasional Rawa Aopa Watumohai dapat dijelaskan oleh variabel
independent yang digunakan.
Interpretasi :
Kejadian kebakaran pada penutupan lahan savanna (sig. 0.000) berbeda secara signifikan
terhadap hutan mangrove, sedangkan peluang kejadian kebakaran pada hutan rawa, hutan
pegunungan dataran rendah, area pertanian/pemukiman dan badan air (terbakar saat air surut)
tidak berbeda secara signifikan terhadap hutan mangrove.
Peluang terjadinya kebakaran di area savanna 17 kali lipat dibandingkan area control. Dari sisi
kelerengan, kelas lereng datar (sig. 0.000) berbeda signifikan terhadap kelas lereng curam
dimana peluang kejadian kebakaran pada kelas lereng ini 5.5 kali dibandingkan control.
IV. Kesimpulan
Berdasarkan hasil regresi logistik, area yang paling rawan kebakaran di kawasan Taman
Nasional Rawa Aopa Watumohai adalah pada area-area bertopografi datar yang ditumbuhi
vegetasi savanna. Berdasarkan kriteria pembagian kelas slope di atas, maka pengaruh tutupan
lahan savana lebih tinggi dari pada pengaruh slope datar dengan pembanding kelas kontrol
masing-masing, dimana nilai Odd Rasio untuk penutupan lahan savanna 17.19 dan kelas
topografi datar 5.5.
Artikel Terkait:
Analisis Risiko Kebakaran Hutan Dan Lahan Di Taman Nasional Rawa Aopa
Watumohai Dengan Pemanfaatan Pemodelan Spasial*
Menggunakan Band 8 Pankromatik untuk Mempertajam Citra Landsat 8
Tips Penelitian di Taman Nasional Rawa Aopa Watumohai, Sulawesi Tenggara
SK Dirjen PHKA No SK 133 Tahun 2014 Penetapan Rayon PNBP Taman Nasional :
TNRAW di Rayon III
GRATIS PNBP : Pemanfaatan Kawasan Taman Nasional untuk Penelitian Pelajar
dan Mahasiswa
Lokasi Mancing Mania : Berburu Ikan Kerapu Monster di Taman Nasional Rawa
Aopa Watumohai
Penyesuaian Tarif Masuk (PNBP) Pengunjung Di Kawasan Taman Nasional Tahun 2014
Konversi Atribut Data Spasial Format shp dari ArcGIS ke MS Excel untuk Persiapan
Regresi dengan SPSS
Cara Memasukkan Titik Hotspot Kebakaran ke Dalam GPS untuk Ground Check
Merasakan dari dekat Ekowisata Rawa Aopa (In Memorian 2010)
MOSAIC TO NEW RASTER
Assalamualaikum Wr.Wb
Pada kesempatan kali ini, INFO-GEOSPASIAL akan membagikan cara untuk membuat peta
kemiringan lereng dari data Digital Elevation Model (DEM) dengan menggunakan software
ArcGIS versi 10.1.
Bahan yang diperlukan untuk kegiatan ini diantaranya :
DEM Model SRTM resolusi 30 meter (Dapat menggunakan model lainnya semisal
AsterGDEM)
Area Pemotong format vektor yang akan digunakan untuk memotong Raster (Dapat berupa
area kabupaten, provinsi, ataupun negara)
Dalam kegiatan ini, daerah yang akan dibuat peta kemiringan lereng, adalah daerah Kabupaten
Ciamis, Jawa Barat.
Jalankan program ArcMap, panggil data DEM dan area Pemotong yang sebelumnya sudah
dipersiapkan.
Overlay DEM dan Area Pemotong
Kemudian potong DEM dengan area pemotong, caranya masuk ke ArcToolbox, kemudian pilih
Spatial Analyst Tools>Extraction>Extract By Mask.
Extract By Mask
Lalu tentukan raster yang akan di potong dan area pemotongnya. Sehingga hasilnya kurang lebih
akan seperti berikut :
DEM yang sudah dipotong
Apabila menggunakan data kontur, sebelumnya kontur tersebut harus dikonversi terlebih dahulu
menjadi format raster dengan cara masuk ke ArcToolbox, piih 3D Analyst Tools>Raster
Interpolation>Topo to Raster. Kemudian ikuti langkah-langkah berikutnya.
Selanjutnya buat kemiringan lerengnya dengan masuk ke ArcToolBox, pilih 3D Analyst
Tools>Raster Surface>Slope. Sehingga akan terbentuk raster baru dengan tampilan berdasarkan
kemiringan lereng. Akan tetapi kelas kemiringan lereng tersebut belum sesuai dengan yang di
inginkan, oleh karena itu berikan kelas sesuai dengan yang di inginkan, dengan menggunakan
pedoman yang sudah ada seperti Van Zuidam, Arsyad, USSSM, USLE, dan masih banyak lagi.
Dalam kegiatan ini digunakan pedoman Penyusunan Rehabilitasi Lahan dan Konservasi Tanah
tahun 1986, dengan ketentuan sebagai berikut :
Kemiringan Lereng
Apabila akan dilakukan analisis lanjut, maka sebaiknya konversi data raster kemiringan lereng
menjadi format vektor, caranya menggunakan tools yang berada di dalam
ArcToolbox>Cconversion Tools>From Raster>Raster to Polygon. lalu lakukan analisis lanjutan,
seperti menghitung luasan per kelas kemiringan.
Agar tampilan peta lebih menarik, buat tampilan hillshade dari data DEM yang sebelumnya sudah
di potong. Caranya dapat di lihat di artikel berikut :
Tools Hillshade
Kita akan menemukan jendela baru untuk pengaturan pembuatan hillshade. Pada isian Azimuth
isikan nilai dengan interval antara 1 sampai 360 dan pada Altitude isikan dengan nilai interval 1
sampai 90. Untuk Z factor isi dengan nilai 1.
Azimuth merupakan sudut putar sinar matahari dari arah barat hingga timur.
Altitude merupakan sudut ketinggian penyinaran sinar matahari terhadap objek di bumi.
Pengaturan Hillshade
Setelah semua tahapan di ikuti, maka hasilnya akan seperti gambar di bawah ini.
Hillshade
Untuk memodifikasi tampilan hillshade di atas, kita bisa mengganti warna dari hillshade terebut
dengan masuk ke propertis dari layer hillshade kemudian masuk ke pilihan symbology dan ganti
warna nya sesuai dengan pilihan warna yang tersedia.
Apabila hasil hillshade akan di overlay dengan layer region caranya seperti berikut ini :
Panggil layer yang akan di overlay. Di sini saya memanggil layer area kecamatan ciamis yang
sudah memiliki field tersendiri. Kemudian masuk ke properties layer yang di overlay, pilih
symbology dan masuk pilihan categories, pada Value Field isi dengan nama field yang akan di
munculkan. Kemudian Pilih Add All Value dan Ganti warna tampilan nya sesuai kehendak.
Selanjutnya pada Pilihan Display pada menu properties layer yang di overlay. Beri nilai
transparent sesuai keinginan agar layer hillshade dapat terlihat ketika di overlay.
Hillshade yang sudah di Overlay
Gambar di atas merupakan hasil dari overlay antara Layer Hillshade dengan Layer region Area
Kecamatan.
Semoga Bermanfaat . . .
Hillshade
Tempatkan layer hillshade di bawah layer Kemiringan Lereng, lalu berikan nilai transparansi
terhadap layer Kemiringan Lereng agar efek Hillshade dapat terlihat. Lalu buat layout dari hasil
pembuatan peta Kemiringan Lereng tersebut, berikan efek seni untuk membuat layout sesuai
dengan yang di inginkan. Dan berikut hasil layout sederhana buatan saya :
Peta Kemiringan Lereng Kab.Ciamis
Tabel 2. Hubungan kelas lereng dengan sifat - sifat proses dan
kondisi lahan disertai simbol warna yang disarankan.
(sumber : Van Zuidam, 1985).