Anda di halaman 1dari 27

Kelas A

LAPORAN PRAKTIKUM
ANALISIS REGRESI TERAPAN
Modul 6 : Regresi Logistik

Nomor Tanggal Tanda Tangan


Nama Praktikan Praktikan
Mahasiswa Kumpul
Novendri Isra Asriny 17611040

Tanggal Tanda tangan


Nama Penilai Nilai
Koreksi Asisten Dosen
Rohmat Apriyanto
Salsabilla Novianingrum

Dina Tri Utari, S.Si., M.Sc

JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2018

1
Daftar Isi

1 Pendahuluan .................................................................................................... 1
1.1 R-Studio.................................................................................................... 1
1.2 Pengertian Regresi Logistik ..................................................................... 1
1.3 Analisis Regresi Logistik Biner ............................................................... 2
2 Deskripsi Kerja................................................................................................ 5
2.1 Studi Kasus ............................................................................................... 5
2.2 Langkah Kerja ........................................................................................ 13
3 Pembahasan ................................................................................................... 17
3.1 Baseline model ....................................................................................... 18
3.2 Random split data ................................................................................... 18
3.3 Uji Parsial ............................................................................................... 19
3.4 Ringkasan Prediksi Data Latih ............................................................... 20
3.5 Ringkasan Prediksi Data Latih ............................................................... 21
3.5.1 Prediksi Data Uji ............................................................................. 21
3.6 Interpretasi .............................................................................................. 22
4 Penutup.......................................................................................................... 23
4.1 Kesimpulan ............................................................................................. 23
Daftar Pustaka ....................................................................................................... 24

2
Daftar Tabel

Tabel 2.1 Data idealisme dan relativisme dengan tujuan keputusan melakukan
research ........................................................................................................... 6
Tabel 3.1 Statistik Uji ........................................................................................... 20

Daftar Gambar

Gambar 2.1.Double klik RStudio......................................................................... 13


Gambar 2.2.Tampilan awal RStudio. ................................................................... 14
Gambar 2.3. Syntax penginputan data kedalam RStudio ..................................... 14
Gambar 2.4. Window memilih file yang akan di input ........................................ 15
Gambar 2.5. Syntax library packages .................................................................. 15
Gambar 2.6. Syntax untuk memasukkan data kolom kedalam variabel .............. 15
Gambar 2.7. Syntax baseline model .................................................................... 15
Gambar 2.8. Syntax random split data ................................................................ 15
Gambar 2.9. Syntax membuat data train dan data test ....................................... 16
Gambar 2.10. Syntax membuat model regresi logistic ........................................ 16
Gambar 2.11. Syntax ROCRpred ......................................................................... 16
Gambar 2.12. Syntax plot ROC Curve ................................................................. 16
Gambar 2.13. Syntax pewarnaan plot .................................................................. 16
Gambar 2.14. Syntax menambahkan label dan threshold ................................... 17
Gambar 2.15. Syntax prediksi data uji dengan menggunakan threshold ............. 17
Gambar 2.16. Syntax untuk menghitung tingkat akurasi data uji ........................ 17
Gambar 3.1. Output baseline ............................................................................... 18
Gambar 3.2. Output random split data ................................................................ 19
Gambar 3.3. Banyaknya baris data train dan test ................................................ 19
Gambar 3.4. Hasil analisis regresi linear berganda ............................................. 19
Gambar 3.5 Ringkasan data latih ......................................................................... 21
Gambar 3.6 Tampilan kurva ................................................................................ 21
Gambar 3.7 Tampilan untuk melihat keakuratan prediksi data uji...................... 21
Gambar 3.8 Perhitungan akurasi data uji............................................................. 22

3
1 Pendahuluan

1.1 R-Studio
R adalah salah satu dari program sumber terbuka yang dapat diunduh gratis
di http://cran.r-project.org/, yang mana situs resminya ada di http://www.r-
project.org/. R pertama kali diciptakan oleh Ross Ihaka dan Robert Gentleman (-
nama R berasal dari huruf pertama nama depan kedua orang ini-), R diluncurkan
pertama kali tahun 1997, dan versi terakhir ketika tulisan ini dibuat adalah 3.0.1.
(Nurmansyah, 2015)
1.2 Pengertian Regresi Logistik
Regresi logistik merupakan salah satu jenis regresi yang menghubungkan
antara satu atau beberapa variabel independen (variabel bebas) dengan variabel
dependen yang berupa kategori; biasanya 0 dan 1. Jenis variabel independen berupa
kategori inilah yang membedakan regresi logistik dengan regresi berganda atau
regresi linear lainnya.
Nilai kategori biasanya tertulis 0 dan 1, saat artikel ini ditulis, kebanyakan
peneliti menggunakan regresi logistik untuk memproses 2 kategori saja. 0 biasanya
digunakan untuk kategori “tidak” atau “belum”. Sedangkan angka 1 biasanya
digunakan untuk mendeskripsikan responden yang bersesuaian dengan maksud
penelitian. (Agung, 2017).
Pada prinsipnya, regresi logistik mempunyai tujuan untuk memperkirakan
besarnya probabilitas kejadian tertentu di dalam suatu populasi sebagai suatu fungsi
eksplanatori. Regresi ini menggunakan variabel respon/terikat berbentuk dummy.
Tidak seperti regresi linier biasa, penggunaan regresi logistik memiliki kelebihan
dalam hal pelanggaran beberapa asumsi yang harus ada pada regresi linier biasa
seperti asumsi kenormalan dan homokedastisitas. Estimasi nilai Y juga terletak
pada range yang sangat luas (dapat berada di luar interval 0-1). Dengan demikian
secara matematis penggunaan regresi logistik menjadi lebih mudah digunakan.
(Sugiarto, 2013)

1
1.3 Analisis Regresi Logistik Biner
Analisis regresi logistik biner digunakan untuk menjelaskan hubungan antara
variabel respon yang berupa data dikotomik/biner dengan variabel bebas yang
berupa data berskala interval dan atau kategorik.
Regresi logistik biner (logistic regression) sebenarnya sama dengan analisis
regresi berganda, hanya variabel terikatnya merupakan variabel dummy (0 dan 1).
Sebagai contoh, pengaruh beberapa rasio keuangan terhadap keterlambatan
penyampaian laporan keuangan. Maka variabel terikatnya adalah 0 jika terlambat
dan 1 jika tidak terlambat (tepat). Regresi logistik tidak memerlukan asumsi
normalitas, meskipun screening data outliers tetap dapat dilakukan.
Asumsi-asumsi dalam regresi logistik biner:
 Tidak mengasumsikan hubungan linier antar variabel dependen dan
independent
 Variabel dependen harus bersifat dikotomi (2 variabel)
 Variabel independen tidak harus memiliki keragaman yang sama antar
kelompok variabel
 Kategori dalam variabel independent harus terpisah satu sama lain atau
bersifat eksklusif
 Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan
hingga 50 sampel data untuk sebuah variabel prediktor (bebas).
Tidak seperti regresi linier biasa, regresi logistik biner tidak mengasumsikan
hubungan antara variabel independen dan dependen secara linier.
Langkah-langkah dalam penggunaan Analisis Regresi Logistik biner adalah:
1. Uji Signifikansi Model
Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas
secara bersama-sama (overall) di dalam model, dapat menggunakan Uji
Likelihood Ratio. Hipotesisnya adalah sebagai berikut:
Ho: β1 = β2 =….= βp = 0 (tidak ada pengaruh veriabel bebas secara
simultan terhadap variabel tak bebas)
H1: minimal ada satu βj ≠ 0 (ada pengaruh paling sedikit satu veriabel
bebas terhadap variabel tak bebas)

2
Untuk j = 1,2,…,p)
Statistik uji yang digunakan adalah:

Dengan :
Lo = Maksimum Likelihood dari model reduksi (Reduced Model) atau
model yang terdiri dari konstanta saja
Lp = Maksimum Likelihood dari model penuh (Full Model) atau dengan
semua variabel bebas.
Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p
sehingga hipotesis ditolak jika p-value < α, yang berarti variabel bebas X
secara bersama-sama mempengaruhi variabel tak bebas Y.
2. Uji Parsial dan Pembentukan Model
Pada umumnya, tujuan analisis statistik adalah untuk mencari model yang
cocok dan keterpautan yang kuat antara model dengan data yang ada.
Pengujian keberartian parameter (koefisien β) secara parsial dapat
dilakukan melalui Uji Wald dengan hipotesisnya sebagai berikut:
Ho: βj = 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan
terhadap variabel tidak bebas)
H1: βj ≠ 0 (variabel bebas ke j mempunyai pengaruh secara signifikan
terhadap variabel tidak bebas)
Untuk j = 1,2,….,p
Dengan statistik uji sebagai berikut:

Hipotesis akan ditolak jika p-value < α yang berarti variabel bebas Xj secara
partial mempengaruhi variabel tidak bebas Y.
3. Odds Ratio
Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami
kejadian ‘sukses’ antara satu kategori dengan kategori lainnya, didefinisikan
sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini

3
menyatakan risiko atau kecenderungan pengaruh observasi dengan xj = 1
adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj = 0.
Untuk variabel bebas yang berskala kontinyu maka interpretasi dari
koefisien βj pada model regresi logistik adalah setiap kenaikan c unit pada
variabel bebas akan menyebabkan risiko terjadinya Y = 1, adalah exp(c.βj)
kali lebih besar.
Odds ratio dilambangkan dengan θ, didefinisikan sebagai perbandingan dua
nilai odds xj = 1 dan xj = 0, sehingga:

Regresi logistik biner juga menghasilkan rasio peluang (odds ratios) terkait
dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan
sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas
suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios)
merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio
peluang bagi prediktor diartikan sebagai jumlah relatif dimana peluang hasil
meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai
variabel prediktor meningkat sebesar 1 unit.
Regresi logistik biner akan membentuk variabel prediktor/respon (log (p/(1-
p)) yang merupakan kombinasi linier dari variabel independen. Nilai
variabel prediktor ini kemudian ditransformasikan menjadi probabilitas
dengan fungsi logit. Regresi logistik juga menghasilkan rasio peluang (odds
ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu
kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi
dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio
peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh
peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah
relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio
peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.
(Huang, n.d.)

4
2 Deskripsi Kerja

2.1 Studi Kasus


Seorang peneliti akan melakukan penelitian mengenai tidak ada hewan
merasakan sakit lebih banyak di lain waktu berdasarkan dari kosmetik yang
dipakai daging yang dimakan dan penyakit otak pada hewan, namun sebelum
hal itu di lakukan sang peneliti ingin mengetahui terlebih dahulu ketika
penelitian telah di lakukan apakah hasil penelitian dapat di terima atau tidak di
khalayak, dengan harapan masyarakat umum dapat menerima penelitian yang
mana dalam konotasi merupakan penelitian idealis dari sang peneliti.

5
Tabel 2.1 Data idealisme dan relativisme dengan tujuan keputusan melakukan
research
Decisio Idealis Relatives Cosmeti
n m m Gender c Theory Meat Veterin
0 82.000 51.000 0 1 0 0 0
1 68.000 53.000 1 1 0 0 0
1 82.000 60.000 0 1 0 0 0
0 74.000 62.000 0 1 0 0 0
1 17.000 31.000 0 1 0 0 0
1 56.000 77.000 1 1 0 0 0
0 72.000 67.000 0 1 0 0 0
0 78.000 40.000 1 1 0 0 0
0 78.000 47.000 0 1 0 0 0
0 80.000 76.000 0 1 0 0 0
0 50.000 59.000 1 1 0 0 0
0 52.000 57.000 0 1 0 0 0
1 55.000 47.000 1 1 0 0 0
0 75.000 57.000 0 1 0 0 0
0 77.000 76.000 0 1 0 0 0
0 74.000 73.000 1 1 0 0 0
0 53.000 50.000 0 1 0 0 0
1 60.000 79.000 0 1 0 0 0
0 65.000 69.000 0 1 0 0 0
0 76.000 39.000 0 1 0 0 0
1 57.000 56.000 0 1 0 0 0
1 47.000 74.000 0 1 0 0 0
0 66.000 67.000 0 1 0 0 0
1 56.000 50.000 1 1 0 0 0
0 75.000 62.000 0 1 0 0 0
1 51.000 73.000 0 1 0 0 0
1 65.000 55.000 0 1 0 0 0
1 45.000 58.000 1 1 0 0 0
0 69.000 57.000 1 1 0 0 0
0 80.000 67.000 0 1 0 0 0
0 85.000 32.000 0 1 0 0 0
0 84.000 78.000 0 1 0 0 0
1 61.000 57.000 1 1 0 0 0
1 74.000 64.000 1 1 0 0 0
1 41.000 53.000 1 1 0 0 0
0 62.000 59.000 1 1 0 0 0
1 67.000 61.000 1 1 0 0 0

6
1 67.000 58.000 1 1 0 0 0
1 79.000 59.000 1 1 0 0 0
0 73.000 58.000 0 1 0 0 0
0 53.000 59.000 0 1 0 0 0
1 54.000 73.000 1 1 0 0 0
0 85.000 74.000 0 1 0 0 0
0 67.000 62.000 1 1 0 0 0
1 46.000 84.000 1 1 0 0 0
0 86.000 69.000 0 1 0 0 0
0 77.778 71.111 1 1 0 0 0
0 59.000 60.000 0 1 0 0 0
1 69.000 56.667 1 1 0 0 0
1 67.000 78.000 1 1 0 0 0
0 62.000 72.000 0 1 0 0 0
0 59.000 55.000 1 1 0 0 0
0 66.000 70.000 0 1 0 0 0
0 70.000 68.000 0 1 0 0 0
0 69.000 57.000 0 1 0 0 0
0 81.000 57.000 0 1 0 0 0
0 61.000 62.000 1 1 0 0 0
1 76.000 61.000 1 1 0 0 0
1 64.000 65.000 0 1 0 0 0
0 61.000 60.000 1 1 0 0 0
0 89.000 39.000 1 1 0 0 0
1 62.000 75.000 1 1 0 0 0
1 66.000 61.000 1 0 1 0 0
0 68.000 57.000 0 0 1 0 0
0 60.000 54.000 0 0 1 0 0
0 78.000 83.000 1 0 1 0 0
1 54.000 72.000 1 0 1 0 0
0 83.000 62.000 0 0 1 0 0
1 80.000 70.000 1 0 1 0 0
0 62.500 51.000 1 0 1 0 0
0 50.000 80.000 1 0 1 0 0
0 81.111 45.000 1 0 1 0 0
0 64.000 63.000 0 0 1 0 0
1 70.000 69.000 0 0 1 0 0
1 64.000 63.000 1 0 1 0 0
0 73.000 60.000 1 0 1 0 0
0 79.000 40.000 0 0 1 0 0
0 34.000 62.000 0 0 1 0 0

7
1 74.000 67.000 1 0 1 0 0
0 78.000 42.000 1 0 1 0 0
1 49.000 67.000 0 0 1 0 0
0 84.000 60.000 0 0 1 0 0
1 54.000 59.000 1 0 1 0 0
1 70.000 63.000 1 0 1 0 0
0 48.000 38.000 0 0 1 0 0
0 81.000 60.000 1 0 1 0 0
0 58.000 62.000 0 0 1 0 0
0 83.000 52.000 0 0 1 0 0
1 47.000 40.000 0 0 1 0 0
1 68.000 65.000 1 0 1 0 0
1 36.000 61.000 0 0 1 0 0
0 63.000 67.000 0 0 1 0 0
0 52.000 63.000 0 0 1 0 0
0 74.000 89.000 0 0 1 0 0
0 70.000 59.000 0 0 1 0 0
0 86.000 64.000 0 0 1 0 0
1 49.000 59.000 1 0 1 0 0
1 61.000 54.000 1 0 1 0 0
0 64.000 59.000 0 0 1 0 0
0 70.000 81.000 1 0 1 0 0
1 50.000 70.000 0 0 1 0 0
1 48.000 66.000 1 0 1 0 0
0 81.000 65.000 0 0 1 0 0
1 63.000 59.000 0 0 1 0 0
0 68.000 51.000 0 0 1 0 0
0 73.000 68.000 0 0 1 0 0
1 58.000 48.000 1 0 1 0 0
0 82.000 54.000 0 0 1 0 0
0 41.000 68.000 0 0 1 0 0
0 85.000 37.000 0 0 1 0 0
0 70.000 51.000 1 0 1 0 0
0 44.000 49.000 1 0 1 0 0
0 82.000 50.000 1 0 1 0 0
0 86.000 43.000 0 0 1 0 0
0 52.000 50.000 1 0 1 0 0
0 90.000 42.000 1 0 1 0 0
1 51.000 65.000 0 0 1 0 0
0 72.000 54.000 0 0 1 0 0
0 55.000 74.000 0 0 1 0 0

8
0 62.000 61.000 0 0 1 0 0
0 67.000 51.000 0 0 1 0 0
1 40.000 33.000 0 0 1 0 0
0 76.000 42.000 0 0 1 0 0
0 55.000 57.000 1 0 1 0 0
0 88.000 51.000 0 0 1 0 0
0 68.000 68.000 0 0 1 0 0
1 57.000 56.000 1 0 0 1 0
0 62.000 79.000 0 0 0 1 0
0 82.000 31.000 0 0 0 1 0
0 72.000 61.000 0 0 0 1 0
1 86.000 60.000 0 0 0 1 0
0 73.000 63.000 0 0 0 1 0
1 58.000 70.000 1 0 0 1 0
1 43.000 49.000 0 0 0 1 0
1 59.000 74.000 0 0 0 1 0
0 66.000 54.000 0 0 0 1 0
0 77.000 70.000 0 0 0 1 0
1 74.000 48.000 1 0 0 1 0
1 57.000 71.000 0 0 0 1 0
1 65.000 58.000 0 0 0 1 0
0 86.000 35.000 1 0 0 1 0
0 80.000 54.000 0 0 0 1 0
1 53.000 32.000 0 0 0 1 0
0 86.000 47.000 0 0 0 1 0
0 37.000 59.000 0 0 0 1 0
0 78.000 59.000 0 0 0 1 0
1 43.000 69.000 1 0 0 1 0
1 66.000 65.000 0 0 0 1 0
0 68.000 72.000 1 0 0 1 0
1 34.000 53.000 1 0 0 1 0
0 44.000 61.000 1 0 0 1 0
0 77.778 44.000 0 0 0 1 0
1 81.000 66.000 0 0 0 1 0
0 57.000 66.667 0 0 0 1 0
0 67.000 64.000 1 0 0 1 0
0 68.000 32.000 0 0 0 1 0
0 69.000 63.000 1 0 0 1 0
0 50.000 56.000 1 0 0 1 0
1 60.000 71.000 1 0 0 1 0
0 61.000 61.000 0 0 0 1 0

9
0 67.000 62.000 0 0 0 1 0
1 80.000 71.000 1 0 0 1 0
0 69.000 31.000 0 0 0 1 0
0 45.000 62.000 0 0 0 1 0
0 64.000 62.000 0 0 0 1 0
0 79.000 56.000 0 0 0 1 0
1 32.000 67.000 1 0 0 1 0
0 57.000 53.000 0 0 0 1 0
1 64.000 66.000 1 0 0 1 0
1 83.000 77.000 0 0 0 1 0
0 68.000 42.000 0 0 0 1 0
0 68.000 56.000 0 0 0 1 0
0 66.000 59.000 0 0 0 1 0
0 65.000 71.000 0 0 0 1 0
0 66.000 62.000 1 0 0 1 0
1 63.000 60.000 0 0 0 1 0
0 60.000 76.000 0 0 0 1 0
0 62.000 58.000 0 0 0 1 0
1 54.000 63.000 1 0 0 1 0
0 74.000 77.000 0 0 0 1 0
0 80.000 62.000 0 0 0 1 0
0 49.000 54.444 1 0 0 1 0
0 77.000 49.000 0 0 0 1 0
1 51.000 54.000 1 0 0 1 0
0 60.000 65.000 0 0 0 1 0
1 56.000 58.000 1 0 0 1 0
1 51.000 51.000 0 0 0 1 0
0 63.333 79.000 1 0 0 1 0
0 61.000 51.000 0 0 0 1 0
0 74.000 56.000 0 0 0 0 1
0 75.000 67.000 0 0 0 0 1
0 76.000 52.000 0 0 0 0 1
0 71.000 53.000 0 0 0 0 1
0 63.000 83.000 0 0 0 0 1
0 72.000 46.000 0 0 0 0 1
1 79.000 57.000 1 0 0 0 1
1 47.000 68.000 1 0 0 0 1
1 75.000 74.000 1 0 0 0 1
0 75.000 69.000 0 0 0 0 1
1 44.000 71.000 0 0 0 0 1
1 58.000 78.000 0 0 0 0 1

10
0 71.000 83.000 0 0 0 0 1
1 50.000 64.000 1 0 0 0 1
0 83.000 65.000 0 0 0 0 1
1 81.000 58.000 0 0 0 0 1
1 64.000 48.000 0 0 0 0 1
1 38.000 66.000 1 0 0 0 1
0 85.000 65.000 0 0 0 0 1
1 77.000 74.000 1 0 0 0 1
1 37.000 68.000 1 0 0 0 1
1 61.000 62.000 0 0 0 0 1
0 78.000 50.000 1 0 0 0 1
0 65.000 70.000 0 0 0 0 1
0 58.000 41.000 1 0 0 0 1
0 80.000 76.000 0 0 0 0 1
0 71.000 58.000 0 0 0 0 1
0 66.000 58.000 0 0 0 0 1
0 70.000 57.000 1 0 0 0 1
0 58.000 55.000 1 0 0 0 1
0 60.000 34.000 0 0 0 0 1
1 75.000 69.000 0 0 0 0 1
1 64.000 76.000 1 0 0 0 1
1 55.000 64.000 0 0 0 0 1
1 56.667 62.000 1 0 0 0 1
1 52.000 52.000 1 0 0 0 1
0 60.000 62.000 0 0 0 0 1
0 62.000 51.000 0 0 0 0 1
1 44.000 63.000 0 0 0 0 1
1 68.000 68.000 1 0 0 0 1
0 56.000 63.000 0 0 0 0 1
0 72.000 45.000 1 0 0 0 1
1 62.000 77.000 0 0 0 0 1
1 63.000 58.000 0 0 0 0 1
1 51.000 52.000 0 0 0 0 1
0 83.000 71.000 0 0 0 0 1
1 68.000 58.000 0 0 0 0 1
0 69.000 63.000 0 0 0 0 1
0 57.000 56.000 0 0 0 0 1
0 85.000 81.000 0 0 0 0 1
0 60.000 34.000 1 0 0 0 1
1 65.000 66.000 1 0 0 0 1
0 77.000 73.000 1 0 0 0 1

11
1 49.000 61.000 0 0 0 0 1
0 76.000 37.000 0 0 0 0 1
0 32.000 56.000 0 0 0 0 1
0 64.000 70.000 0 0 0 0 1
0 90.000 65.000 0 0 0 0 1
0 52.000 46.000 0 0 0 0 1
1 63.000 75.000 0 0 0 0 1
0 70.000 39.000 0 0 0 0 1
0 73.000 65.000 1 0 0 0 1
0 60.000 75.000 0 0 0 0 1
0 82.000 54.000 0 0 0 0 0
0 79.000 62.000 0 0 0 0 0
0 73.000 54.000 0 0 0 0 0
0 83.000 58.000 0 0 0 0 0
1 72.000 50.000 0 0 0 0 0
1 64.000 58.000 0 0 0 0 0
1 50.000 62.000 1 0 0 0 0
0 77.000 62.000 0 0 0 0 0
1 32.000 72.000 1 0 0 0 0
1 56.000 53.000 1 0 0 0 0
1 58.000 68.000 0 0 0 0 0
0 85.000 71.000 1 0 0 0 0
1 50.000 60.000 1 0 0 0 0
1 67.000 59.000 1 0 0 0 0
1 58.000 69.000 1 0 0 0 0
0 72.000 63.000 1 0 0 0 0
0 71.000 45.000 0 0 0 0 0
1 52.000 44.000 0 0 0 0 0
1 64.000 70.000 1 0 0 0 0
0 72.000 50.000 0 0 0 0 0
0 77.000 51.000 0 0 0 0 0
1 62.000 52.000 0 0 0 0 0
0 75.000 65.000 0 0 0 0 0
0 49.000 56.000 0 0 0 0 0
1 68.000 47.000 1 0 0 0 0
0 65.000 50.000 0 0 0 0 0
0 80.000 58.000 0 0 0 0 0
0 60.000 57.000 0 0 0 0 0
0 87.000 78.000 0 0 0 0 0
1 58.000 60.000 0 0 0 0 0
1 61.000 71.000 0 0 0 0 0

12
1 52.000 77.000 0 0 0 0 0
1 65.000 69.000 1 0 0 0 0
1 80.000 79.000 1 0 0 0 0
1 48.000 68.000 0 0 0 0 0
0 47.000 57.000 0 0 0 0 0
0 89.000 86.000 0 0 0 0 0
0 54.000 71.000 1 0 0 0 0
1 45.000 61.000 0 0 0 0 0
0 58.000 58.000 0 0 0 0 0
1 56.000 80.000 1 0 0 0 0
1 60.000 69.000 0 0 0 0 0
0 78.000 82.000 0 0 0 0 0
0 68.000 59.000 1 0 0 0 0
1 62.000 63.000 0 0 0 0 0
1 67.000 47.000 0 0 0 0 0
1 73.000 71.000 1 0 0 0 0
1 43.000 64.000 1 0 0 0 0
0 86.000 57.000 0 0 0 0 0
1 56.000 71.000 0 0 0 0 0
0 50.000 44.000 1 0 0 0 0
0 88.000 78.000 0 0 0 0 0
1 72.000 60.000 1 0 0 0 0
0 85.000 52.222 0 0 0 0 0
1 48.000 60.000 0 0 0 0 0
0 68.000 60.000 0 0 0 0 0
1 62.000 60.000 1 0 0 0 0
1 48.000 62.000 0 0 0 0 0
0 75.000 60.000 0 0 0 0 0
1 54.000 61.000 0 0 0 0 0
1 40.000 66.000 0 0 0 0 0
0 32.000 67.000 0 0 0 0 0
1 54.000 58.000 0 0 0 0 0

2.2 Langkah Kerja

1. Double klik pada icon RStudio pada desktop.

Gambar 2.1.Double klik RStudio

13
2. Akan muncul tampilan awal dari RStudio.

Gambar 2.2.Tampilan awal RStudio.


3. Memasukkan data kedalam RStudio yang mana menggunakan syntax yang di
masukkan kedalam variable.

#Input data
0 secure=read.csv(file.choose(), header=TRUE, sep=';')
nrow(secure)
secure
Gambar 2.3. Syntax penginputan data kedalam RStudio

4. Setelah membuat sytax maka akan muncul window browse data

14
Gambar 2.4. Window memilih file yang akan di input
5. Packages yang akan digunakan untuk menjalankan regresi logistik

#packages
0 library(caTools)
library(ROCR)

Gambar 2.5. Syntax library packages


6. Syntax untuk memasukkan data per kolom kedalam variabel

#variable (1=Continue Research;0=Stop Research)


Y=secure$Decision
X1=secure$Idealism
X2=secure$Relativesm

Gambar 2.6. Syntax untuk memasukkan data kolom kedalam variabel


7. Syntax baseline model atau yang bisa diartikan apakah orang menyetujui
untuk melanjutkan penelitian atau tidaknya

#baseline model
table (Y)
187/315

Gambar 2.7. Syntax baseline model


8. Membagi data secara acak dengan tingkat pembagiannya 75%

#Random split data


set.seed(40) #persentase untuk memisahkan data, antara data
latih dengan data uji dengan perulangan secara random.
split=sample.split (secure$Decision, SplitRatio = 0.75)
split

Gambar 2.8. Syntax random split data

9. Membuat pembagian data latih dan data uji

#Create training and testing sets


secureTrain=subset(secure,split==TRUE)
secureTest=subset(secure,split==FALSE)
nrow(secureTrain)
nrow(secureTest)

15
Gambar 2.9. Syntax membuat data train dan data test

10. Membuat model dari regresi logistik, mencari nilai dari ringkasan data, dan
mencari prediksi dari data test

#Logistic Regression Model


secureLog=glm(Decision~Idealism + Relativesm,
data=secureTrain, family=binomial)
summary(secureLog)
predictTrain=predict(secureLog, type="response")
summary(predictTrain)

ROCRpred=prediction(predictTrain, secureTrain$Decision)

Gambar 2.10. Syntax membuat model regresi logistic

11. Menjalankan syntax ROCRpred yang berfungsi untuk membuat grafik atau
plot dengan nilai prediksi

#Performance function
ROCRpref=performance(ROCRpred, "tpr","fpr")

Gambar 2.11. Syntax ROCRpred

12. Membuat plot ROC Curve

#Plot ROC Curve


plot(ROCRpref)

Gambar 2.12. Syntax plot ROC Curve

13. Menambahkan warna kedalam garis plot

#Add Colors
plot(ROCRpref, colorize=TRUE)

Gambar 2.13. Syntax pewarnaan plot

16
14. Menambahkan label pada garis garis serta menambahkan titik-titik dari
threshold
#Add threshold labels
plot(ROCRpref, colorize=TRUE,
print.cutoffs.at=seq(0,1,by=0.1),text.adj=c(-0.2,1.7))

Gambar 2.14. Syntax menambahkan label dan threshold

15. Mencari nilai prediksi yng menggunakan threshold 0.5 untuk prediksi data
uji dan menciptakan table dari hasil prediksi.

#Use threshold 0.5 to predict testing data


predictTest=predict(secureLog,type="response",
newdata=secureTest)
table(secureTest$Decision,predictTest>=0.5)

Gambar 2.15. Syntax prediksi data uji dengan menggunakan threshold

16. Menghitung tingkat ke akurasian prediksi data uji

#Accurracy
((34+20)/(34+13+12+20))

Gambar 2.16. Syntax untuk menghitung tingkat akurasi data uji

3 Pembahasan

Berdasarkan studi kasus yang ada, praktikan mengkategorikan variabel yang ada
kedalam variabel dependen dan independent agar dapat dibuat analisisnya, yang
mana variabel dependen (Y) yakni Decision yang mana 0 berarti stop research dan
1 mengartikan continue research , pada variabel X1 atau dependen pertama,
praktikan memasukkan variabel idealism dan dependen kedua atau X2 sebagai
variabel relativesm yang dapat di lihat pada gambar 2.6, untuk melihat data yang
ada dapat di lihat pada table 2.1.

17
3.1 Baseline model
Pertama, praktikan akan melihat baseline dari model untuk menentukan
apakah ada kemungkinan atau tidaknya melanjutkan penelitian.

Gambar 3.1. Output baseline


Dapat dilihat pada Gambar 3.1 dapat di lihat bahwa nilai model yang di
dapatkan yakni 0.5936508 yang mana mengartikan masih terdapat kemungkinan
untuk melanjutkan penelitian serta melanjutkan analisis, dapat di lihat juga nilai
dari baseline sendiri hampir mendekati 60% sehingga praktikan melanjutkan
analisis hingga ke tahap regresi logistik.

3.2 Random split data


Pada output ke-2 ini merupakan cara praktikan untuk memisahkan data yang
mana data tersebut data train yang mana melakukan perulangan secara acak
sebanyak 40 kali dengan 75% kemungkinan teracaknya

18
Gambar 3.2. Output random split data
Pada gambar 3.2 menampilkan banyaknya perulangan yang teracak true / false dari
data train yang mana pada pembagian data dengan 75% yang mana selanjutnya
akan di jelaskan dengan syntax selanjutnya.

Gambar 3.3. Banyaknya baris data train dan test


Berdasarkan output pada gambar 3.2 pada pembagian true dan false yang di
masukkan kedalam tipe data yang mana pada data train akan bernilai true dan pada
nilai false di masukkan kedalam data test yang mana dapat dilihat bahwa jumlah
dari banyaknya true yang telah di acak sebesar 236 dan pada pengacakan false
sebesar 79.

3.3 Uji Parsial

3.1.1.

Gambar 3.4. Hasil analisis regresi linear berganda

19
Dari hasil output diatas, maka selanjutnya dapat praktikan simpulkan seperti
yang dipaparkan dibawah ini.
1. Hipotesis Uji
H0: β0=0, dimana i=0,1 (model tidak layak digunakan)
H1: β1≠0, dimana i=0,1 (variabel berpengaruh secara signifikansi terhadap
model)
2. ii). Tingkat Signifikansi
α = 5% = 0,05
3. Daerah Kritis
Jika p-value≤𝛼 : Tolak H0
4. Statistik Uji
Tabel 3.1 Statistik Uji
No Koefisien p-value Tanda 𝛼 Keputusan
1 𝛽0 0.3639 > 0.05 Gagal Tolak Ho
2 𝛽1 2.14e-7 < 0.05 Tolak Ho
3 𝛽2 0.0012 < 0.05 Tolak Ho

5. Kesimpulan
Dengan menggunakan tingkat kepercayaan 95%, data yang ada
menyatakan bahwa intercept, koefisien regresi X1 dan koefisien regresi X2
signifikan terhadap model, dan model layak di gunakan.
Setelah melakukan uji parsial hingga didapat model yang koefisien
regresinya layak maka praktikan melakukan prediksi data latih dan data uji.

3.4 Ringkasan Prediksi Data Latih


Praktikan melakukan prediksi data latih dengan mengetikan syntax seperti
pada gambar berikut.

20
Gambar 3.5 Ringkasan data latih
Didapatkan bahwa ringkasan dari data latih memiliki nilai terendahnya
sebesar 0.04392 dengan nilai tengah yang di dapatkan adalah 0.38934 dan nilai
tertingginya 0.91259, yang mana pula di dapatkan nilai rata-rata yang mana jumlah
dari data dibagi dengan banyaknya data yang menghasilkan nilai 0.40678

3.5 Ringkasan Prediksi Data Latih

Gambar 3.6 Tampilan kurva


3.5.1 Prediksi Data Uji
Syntax ‘predict’ berfungsi untuk memprediksi data uji yang ada di
dataLog3. Sedangkan keterangan ‘type=”response”’ menunjukan tipe datanya yaitu
response karena Y yg akan di prediksi yaitu peluang. Lalu, praktikan akan melihat
keakuratan dari prediksi data uji tersebut dengan mengetikan syntax sebagai
berikut.

Gambar 3.7 Tampilan untuk melihat keakuratan prediksi data uji

21
Syntax ‘table’ berfungsi untuk menampilkan tabel kebenaran data uji
tersebut dengan ambang 0,5 untuk memprediksi data uji tersebut. Untuk
menghitung keakuratan data yaitu (TN+TP)/jumlah data. Sehingga, dapat dilihat
pada syntax tersebut bahwa keakuratan data uji sebesar 68.35%, yang mana dapat
di lihat pada gambar di bawah ini syntax pencarian tingkat akurasinya.

Gambar 3.8 Perhitungan akurasi data uji


3.6 Interpretasi
 Cara membaca model
Y = -0.6643X1+0.04764X2+ Ԑ
Untuk X2 :
Dengan mengangggap faktor lain konstan, yang mana setiap
perubahan satu satuan X1, menyebabkan perubahan Y sebesar -
0.6643 dan setiap perubahan satu satuan X2, menyebabkan
perubahan Y sebesar 0.04764.

22
4 Penutup

4.1 Kesimpulan
1. Analisis logistik selalu mengharapkan hasil yang baik.
2. Didapatkan nilai dari baseline data sebesar 0.5936508 atau yang dapat di
konversi kedalam persen yakni 59.36% atau dapat di bulatkan menjadi
60%
3. Pada pembagian data memerlukan pengacakan secara acak yang mana
perulangan dapat dilakukan tergantung dari praktikan sendiri.
4. Pada pembagian data yang mana yang di bagi yakni antara data latih dan
data uji , untuk data latih bersifat nilainya true dan untuk data test
merupakan sifat nilainya false.
5. Untuk melakukan analisis regresi logistik memerlukan pembagian untuk
data latih dan data uji yang mana data latih yang akan di olah untuk
mendapatkan analisis serta keputusan.
6. Model yang di dapatkan berdasarkan data di atas adalah :
Y = -0.6643X1+0.04764X2+ Ԑ
Model yang di dapatkan layak di gunakan yang mana dapat di lihat pada
table 3.1.

23
Daftar Pustaka

Draper, N., & Smith, H. (1998). Applied Regression Analysis. 3th Edition. New
York: Wiley.
Hosmer, D. W., & Lemeshow, S. (2000). Applied Logistic Regression. New York:
John Wiley & Sons, Inc.
Nurmansyah. 2015. R Bahasa Pemrograman untuk analisis data dan Statistik..
Diakses pada tanggal 24 Juni pukul 12.08
dari :
https://www.kompasiana.com/nurmansyah/552fab4f6ea8349b138b456f/r-
bahasa-pemrograman-untuk-analisis-data-dan-statistik
Purwaningsih Tuti dan Utari Dina Tri. 2017. Modul Praktikum Analisis Regresi
Terapan. Yogyakarta : Universitas Islam Indonesia.

Anda mungkin juga menyukai