Anda di halaman 1dari 6

Statistika, Vol. 5, No.

1, Mei 2017

KLASIFIKASI WAKTU KELULUSAN MAHASISWA STIKOM BALI


MENGGUNAKAN CHAID REGRESSION – TREES DAN REGRESI
LOGISTIK BINER

1I Ketut Putu Suniantara, 2Muhammad Rusli


1,2
Program Studi Sistem Informasi, STMIK- STIKOM Bali
Email :1suniantaraputu@gmail.com

ABSTRAK
Ketidaktepatan waktu kelulusan mahasiswa dipengaruhi oleh banyak faktor. Masalah
ketidaktepatan waktu kelulusan mahasiswa perlu mendapatkan perhatian khusus, untuk
mengantisipasi masalah tersebut perlu dilakukan analisis klasifikasi faktor-faktor apa yang
mempengaruhi ketidaktepatan waktu kelulusan mahasiswa. Salah satu metode klasifikasi
adalah analisis regresi logistik dan CHAID Regression Trees. Penelitian ini bertujuan untuk
mengetahui variabel-variabel yang memengaruhi waktu kelulusan mahasiswa STIKOM
BALI dengan menggunakan CHAID regressión trees dan regresi logistik biner. Adapun
variabel-variabel yang digunakan yaitu variabel responnya adalah status kelulusan
mahasiswa tepat waktu dan tidak tepat waktu dan variabel penjelasnya adalah
Jurusan/prodi, IPK, IPS semester 6, Lama menyusun skripsi, Jenis Kelamin, dan Nilai
ujian masuk. Hasil klasifikasi dengan menggunakan metode CHAID regresión trees
menghasilkan 5 klasifikasi yang berdasarkan nilai indek di atas 100. Hasil klasifikasi ini
dipengaruhi oleh lama menyusun skripsi, IPK, IP semester 6 dan program studi.
Sedangkan hasil klasifikasi dengan menggunakan metode regresi logistik biner
dipengaruhi oleh Program studi, IPK dan lama menyusun skripsi. Ketepatan klasifikasi
dengan metode CHAID Regression Tress lebih baik dibandingkan dengan menggunakan
metode regresi logistik biner.
Kata Kunci : CHAID Regression Trees, regresi logistik biner, klasifikasi

berupa latar belakang mahasiswa,


PENDAHULUAN
Lulus pada tingkat pendidikan sarjana diantaranya aktivitas belajar, umur, jenis
dengan tepat waktu dan langsung kelamin, motivasi, status mahasiswa,
mendapatkan kerja adalah harapan setiap fasilitas belajar, tingkat sosial ekonomi,
mahasiswa. Lulus tepat waktu dipengaruhi minat jurusan, dan latar belakang yang
oleh banyak faktor. Faktor-faktor tersebut lain.
dapat bersumber dari diri mahasiswa Menurut [2] dalam penelitiannya yang
(faktor internal) atau dari luar diri berjudul “identifikasi faktor-faktor yang
mahasiswa (lingkungan/faktor eksternal). ketepatan waktu kelulusan mahasiswa
Faktor yang bersumber dari diri mahasiswa program pasca sarjana IPB” dengan
yaitu intelektual. Namun hal lain yang ada menggunakan analisis regresi logistik
pada diri individu mahasiswa yang juga biner bahwa faktor yang mempengaruhi
berpengaruh terhadap kondisi belajar ketepatan kelulusan adalah fakultas, jenis
adalah situasi afektif, seperti ketenangan, kelamin, jalur masuk, IPK, dan beasiswa.
ketentraman psikis juga motivasi untuk [3] dalam penelitiannya yang berjudul
belajar [1]. Faktor-faktor dari diri “analisis classification and regression trees
mahasiswa yang dimaksudkan di sini (CART) pada lama studi mahasiwa

27
Statistika, Vol. 5, No. 1, Mei 2017

STIKOM Bali menyatakan bahwa faktor METODE PENELITIAN


yang memengaruhi lama studi mahasiswa
Sumber Data dan Variabel Penelitian
adalah lama penyusunan skripsi, IPK dan
jurusan mahasiswa. Sedangkan menurut Penelitian ini dilakukan di STIKOM –
[4] dalam penelitiannya yang berjudul Bali dengan waktu penelitian lima bulan,
“Analisis Waktu Kelulusan Mahasiswa dimana data yang digunakan dalam
Dengan Metode CHAID (Studi Kasus: penelitian ini data lulusan mahasiswa
Fmipa Universitas Udayana)” menyatakan STIKOM Bali periode 2016 sebanyak 683
bahwa waktu kelulusan mahasiswa mahasiswa. Variabel yang digunakan
disebabkan oleh jenis kelamin, jurusan, Ipk dalam penelitian ini sebagai berikut:
dan lama skripsi. Y : Status Kelulusan mahasiswa
Langkah pertama yang harus dilakukan X1 : jenis kelamin
oleh pihak kampus adalah mencari X2 : Program studi
informasi variabel – variabel apa yang X3 : lama skripsi
mempengaruhi tepat atau tidaknya X4 : IPK
mahasiswa lulus dengan menggunakan X5 : IP semester 6
analisis klasifikasi. Analisis yang dapat X6 : Nilai ujian masuk
digunakan untuk klasifikasi metode Metode Analisis
CHAID regression trees dan metode Adapun langkah–langkah untuk
regresi logistik biner. Pada penelitian [5] mencapai tujuan penelitian tersebut
menyatakan bahwa metode CART sebagai berikut:
memiliki ketepatan prediksi lebih baik 1. Analisis CHAID regression trees,
dibandingkan dengan metode regresi dengan tahapan sebagai berikut:
logistik biner dalam prediksi variabel a. Menentukan semua kemungkinan
respon. Penelitian klasifikasi kelulusan penyekatan pada tiap variabel
dengan menggunakan data mining penjelas.
memang telah banyak dilakukan, akan b. Menghitung kehomogenan simpul
tetapi klasifikasi dengan perbandingan pada semua variabel penjelas.
metode CHAID regression trees dan c. Jika simpul induk telah didapat,
Regresi Logistik Biner pada ketidaktepatan maka simpul anak kiri dan kanan
kelulusan mahasiswa masih sedikit. Untuk dibuat dengan cara yang sama
penelitian ini akan dilakukan analisis untuk semua variabel penjelas
klasifikasi ketidaktepatan waktu kelulusan berdasarkan data yang sudah
mahasiswa STIKOM BALI dengan dikelompokkan oleh simpul induk.
menggunakan CHAID regression trees dan d. Pembentukan pohon dilakukan
regresi logistik biner. Penelitian ini sampai dipenuhi suatu aturan
bertujuan untuk mengetahui klasifikasi penghentian tertentu.
waktu kelulusan mahasiswa STIKOM e. Pemangkasan pohon dilakukan
BALI dengan menggunakan CHAID untuk mendapatkan pohon akhir
regression trees dan regresi logistik biner yang lebih sederhana.
dan membandingkan tingkat akurasi f. Setelah diperoleh pengelompokan,
analisis CHAID regression trees dan kemudian melakukan interpretasi.
analisis regresi logistik biner dalam 2. Analisis regresi logistik biner, dengan
pengklasifikasian waktu kelulusan tahapan sebagai berikut:
mahasiswa STIKOM Bali. a. Menduga parameter
b. Melakukan pengujian parameter
secara simultan dengan Uji – G.

28
Statistika, Vol. 5, No. 1, Mei 2017

c. Melakukan pengujian parameter oleh lama menyusun skripsi sekitar 1


secara parsial dengan sampai 2 bulan dengan IPK berkisar antara
menggunakan Uji Wald. 3,18 sampai dengan 3,39 pada prodi
d. Melakukan analisis regresi logistik Sistem Informasi.
bertatar. Simpul 1 sebagai terminal ketiga
e. Interpretasi koefisien model dengan prediksi waktu ketepatan lulusan
regresi. 96,2% bila lama menyusun skripsi kurang
3. Membandingkan hasil analisis CHAID dari atau sama dengan 1 bulan.
dan regresi logistik biner dengan Simpul 17 atau simpul terminal
melihat ketepatan prediksi hasil keempat dengan prediksi waktu ketepatan
klasifikasi. kelulusan sebesar 77,3% yang dipengaruhi
Tahapan-tahapan di atas dilakukan oleh lama menyusun skripsi sekitar 1
secara otomatis oleh komputer dengan sampai 2 bulan dengan IPK lebih dari 3,39
menggunakan software Statistika. pada prodi Sistem Komputer.
Simpul 10 yang merupakan simpul
terminal kelima dengan prediksi waktu
HASIL PENELITIAN ketepatan kelulusan sebesar 60% yang
1. Klasifikasi dengan Metode CHAID dipengaruhi oleh lama menyusun skripsi
regression trees sekitar 2 sampai 3 bulan dengan IP
Hasil klasifikasi ketepatan waktu semester 6 lebih besar dari 3,48.
kelulusan mahasiswa STIKOM Bali tahun Berdasarkan kelima simpul terminal di
2016 menghasilkan 20 simpul dengan 13 atas, terlihat simpul 1 memiliki gain
simpul terminal dengan 3 kedalaman yaitu percent lebih besar yaitu 33,4% yang
jumlah hierarki pada pohon klasisfikasi artinya jika lama menyusun skripsi kurang
berdasarkan LMS, IPK, IPS dan program dari atau sama dengan 1 bulan maka target
studi (Gambar 1). prediksi ketepatan waktu lulusan pada
Ketepatan klasifikasi waktu lulusan dan mahasiswa sekitar 33,4% nilai ini
tidak tepat waktu, yang nantinya mendekati 42,2%. (Tabel 1).
diharapakan adalah prediksi kelulusan
Tabel 1. Simpul Target Ketepatan Lulusan
tepat waktu, maka target prediksinya Gain
adalah ketepatan waktu lulusan. Simpul Response Index
N Percent
Berdasarkan target kategori yaitu 18 80 26.5% 100.0% 226.2%
ketapatan lulusan (Tepat Waktu) yang 16 38 12.6% 97.4% 220.4%
dilihat dari indek di atas 100 dari 13 1 101 33.4% 96.2% 217.5%
simpul terminal diperoleh 5 simpul 17 34 11.3% 77.3% 174.8%
10 12 4.0% 60.0% 135.7%
terminal sebagai klasifikasi yaitu simpul 14 10 3.3% 34.5% 78.0%
18, 16, 1, 17, dan simpul 10 (Tabel 1). 15 13 4.3% 30.2% 68.4%
Adapun klasifikasi kelulusan sebagai 20 4 1.3% 21.1% 47.6%
berikut: 12 2 0.7% 20.0% 45.2%
Simpul 18 adalah simpul terminal 9 6 2.0% 17.6% 39.9%
13 2 0.7% 5.4% 12.2%
pertama dengan klasifikasi prediksi 11 0 0.0% 0.0% 0.0%
ketepatan waktu kelulusan 100% pada 19 0 0.0% 0.0% 0.0%
lama menyusun skripsi sekitar 1 sampai 2
bulan dengan IPK lebih dari 3,39 dan Berdasarkan Tabel 2 di atas terlihat
program studi Sistem Informasi. ketepatan klasifikasi berada pada tingkat
Simpul selanjutnya adalah simpul 16 akurasi 91,2% dengan standar error yang
yang di tandai dengan simpul terminal sangat kecil yaitu 0,011 dengan resiko
kedua yaitu prediksi waktu ketepatan kesalahan 8,8%.
kelulusan sebesar 97,4% yang dipengaruhi

29
Statistika, Vol. 5, No. 1, Mei 2017

Gambar 1. Pohon Klasifikasi Optimal

Tabel 2. Ketepatan Klasifikasi


Tabel 3. Uji Model
Prediksi
Chi-square Df Signifikan
Tidak
Aktual Tepat Ketepatan 597,195 6 0,000
Tepat
Waktu Klasifikasi 597,195 6 0,000
Waktu
597,195 6 0,000
Tepat Waktu 265 37 87.7%
Tidak Tepat Adapun model logit yang diperoleh
23 358 94.0%
Waktu sebagai berikut:
Ket. Klasifikasi Keselurahan 91.2%
g  x   13,446  2,224 Pr odi 1
 4,551IPK  1,070 IPs  0,041
2. Klasifikasi dengan Regresi Logistik
Biner JK 1  0,010 Nilai Ujian Masuk
 2,898 Lama Skripsi
Analisis regresi logistik merupakan
suatu analisis untuk mencari hubungan Tabel 4. Uji Koefisien Model
atau pengaruh, dimana variabel responya Variabel B Sig. Exp(B)
berbentuk kategori dengan satu atau lebih Prodi(1) 2.224 0.000 0.108
IPK 4.551 0.000 0.011
variabel bebas. IPS 1.070 0.210 0.343
Pada Tabel 3 dijelaskan bahwa ada JK(1) 0.041 0.911 0.960
pangaruh secara bersama antara status NUM 0.010 0.424 0.990
kelulusan (Y) dengan variabel bebas (X) LMS 2.898 0.000 18.142
yaitu Prodi, IPK, IP Semester 6, Jenis Constant 13.446 0.000 691139.578
Kelamin, Nilai Ujian Masuk dan Lama
Menyusun Skripsi hal ini ditandai oleh Pada uji koefisien model terlihat terlihat
nilai G2 pada model sebesar 597,195 dan variabel prodi (1), IPK dan lama menyusun
nilai probabilitas 0,000 yang lebih kecil skripsi (LSM) berpengaruh secara parsial
dari 0,05. terhadap status kelulusan mahasiswa yang
ditandai dengan nilai probabilitasnya lebih
kecil dari alpha (0,000 < 0,05). Hasil uji
koefisien model dapat dilihat pada (Tabel

30
Statistika, Vol. 5, No. 1, Mei 2017

4) sebagai berikut: program studi, IPK dan lama


Model regresi di atas memiliki makna menyusun skripsi
berdasarkan nilai odds ratio (exp B). c. Hasil perbandingan ketepatan klasifi-
Exp(B) = 0,108 artinya kecendrungan kasi diperoleh bahwa klasifikasi
mahasiswa untuk lulus tidak tepat waktu dengan menggunakan metode CHAID
pada program studi SK sebesar 0,108 kali regression trees lebih baik yaitu 91,2%
dibandingan mahasiswa SI. Exp(B) = sedangkan dengan regresi logistik
0,011 artinya kecendrungan mahasiswa ketepatan klasifikasi mencapai 90,2%.
untuk lulus tepat waktu sebasar 0,011 kali Saran yang dapat diberikan dalam
bila nilai IPK besar. Sedangkan Exp(B) = penelitian ini adalah memberikan perhatian
18,142 artinya kecendrungan mahasiswa khusus kepada mahasiswa dalam
lulus tidak tepat waktu bila lama menyelesaikan/menyusun skripsi supaya
menyusun skripsi meningkat 18,142 kali. dipersingkat, karena berdasarkan kedua
Nilai keragaman (R2) 0,781 yang artinya metode dinyatakan bahwa lama menysusn
berarti model yang diperoleh mampu skripsi menjadi salah satu alasan
menjelaskan status kelulusan mahasiswa klasifikasi dalam status kelulusan
dipengaruhi oleh variabel bebas sebanyak mahasiswa tapat waktu atau tidak tepat
78,1%. waktu.
Tabel 5. Ketepatan Klasifikasi pada Regresi UCAPAN TERIMA KASIH
Logistik Biner
Prediksi
Penulis mengucapkan terima kasih
Tidak kepada STIKOM Bali yang telah memberi
Aktual Tepat Ketepatan dukungan financial terhadap penelitian ini.
Tepat
Waktu Klasifikasi
Waktu
Tepat Waktu 265 36 88,0% DAFTAR PUSTAKA
Tidak Tepat
31 350 91,9% [1] Suryabrata, S., 2008, Psiklogi
Waktu
Ket. Klasifikasi Keselurhan 90.2% Pendidikan. Raja Grafindo Persada:
Jakarta.
Berdasarkan Tabel 5, diketahui
[2] Nurgenita, Nita, 2015, Identifikasi
ketepatan pada regresi logistik biner sudah
Faktor-faktor Yang Mempengaruhi
cukup baik, karena mampu menebak
Ketepatan Waktu Kelulusan
dengan benar 90,2% kondisi yang terjadi.
Mahasiswa Program Sarjana IPB.
Skripsi Departemen Statistika
KESIMPULAN
FMIPA IPB Bogor. (Tidak
Berdasarkan hasil dan pembahasan dipublikasikan).
dapat diambil kesimpulan sebagai berikut: [3] Suniantara, IKP, 2016, Pendugaan
a. Hasil klasifikasi dengan menggunakan Lama Studi Mahasiswa STIKOM
metode CHAID regression trees bahwa BALI dengan Menggunakan Regresi
status kelulusan mahasiswa dikelompo- Berstruktur Pohon. Penelitian
kan ke dalam 5 klasifikasi yang Internal Tahap I STIKOM BALI
berdasarkan nilai indek lebih dari 100. 2016.
Masing–masing klasifikasi dipengaruhi [4] Padmini, I.A.S., NLH Suciptawati
oleh lama menyusun skripsi, IPK, IP dan Made Susilawati., 2012, Analisis
semester 6 dan program studi. Waktu Kelulusan Mahasiswa dengan
b. Hasil klasifikasi dengan menggunakan Metode CHAID, (studi kasus:
metode Regresi logistik Biner FMIPA Universitas Udayana). E-
diperoleh bahwa klasifikasi status jurnal Matematika, Vol. 1, No. 1,
kelulusan mahasiswa dipengaruhi oleh Agustus 2012, 89-93.

31
Statistika, Vol. 5, No. 1, Mei 2017

[5] Margasari, A., 2014, Penerapan


metode CART (Classification and
Regression Trees) dan analisis
regresi logistik Biner pada klasifikasi
profil mahasiswa FMIPA Universitas
Brawijaya. Studen Journal UB, vol 2
no 4.
http://statistik.studentjournal.ub.ac.id
/index.php/statistik/article/view/151
[diakses tanggal 7 Agustus 2015]

32

Anda mungkin juga menyukai