Oleh:
Nama: Devina
NIM: 42140354
Skripsi
Diajukan sebagai salah satu syarat
untuk memperoleh gelar Sarjana Komputer
GIE JAKARTA
AGUSTUS 2018
ABSTRAK
Devina / 42140354 / 2018 / Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk
Memprediksi Kelulusan Mahasiswa Institut Bisnis Dan Informatika Kwik Kian Gie /
Pembimbing: Akhmad Budi, S.Kom, M.M., M.Kom.
Penelitian ini dilatarbelakangi oleh data mahasiswa yang belum dapat memberi informasi
yang bermanfaat, terutama dalam melihat tingkat kelulusan mahasiswa. Selain itu, untuk
melakukan pengolahan data mahasiswa diperlukan algoritma yang sesuai dengan karakteristik
data mahasiswa. Hal ini menyebabkan sulitnya menentukan satu teknik atau algoritma data
mining yang harus digunakan dalam melihat tingkat kelulusan mahasiswa.
Peneliti menerapkan konsep data mining untuk melakukan pengolahan data dengan
menggunakan algoritma klasifikasi. Dalam penerapannya, data mining adalah seni dan ilmu
dalam menemukan pengetahuan, pengertian yang mendalam, dan pola inovatif yang berguna dari
data. Terdapat berbagai macam jenis pola yang dapat ditemukan pada data.
Dalam melakukan penelitian, peneliti melakukan wawancara terstruktur, observasi
langsung, dan studi pustaka dalam mengumpulkan data mahasiswa dan fakta-fakta yang ada.
Peneliti juga menggunakan Cross-Industry Standard Process for Data Mining (CRISP-DM)
dalam analisis data. Selain itu, dalam teknik perhitungan penulis menggunakan 3 rumus dari
algoritma klasifikasi yaitu Decision Tree, K-Nearest Nieghbor dan Naïve Bayes.
Hasil dari penelitian ini memperlihatkan tree dari Decision Tree, penjelasan singkat dari
KNN, probability dari Naïve Bayes, serta tingkat keakuratan dan nilai AUC dari masing-masing
algoritma yaitu Decision Tree, K-Nearest Nieghbor dan Naïve Bayes. Kemudian dilakukan
perbandingan dari tingkat akurasi dan AUC setiap algoritma sehingga akan didapatkan algoritma
terbaik dalam melakukan klasifikasi tingkat kelulusan mahasiswa.
Kesimpulan yang peneliti dapatkan adalah dalam melihat tingkat kelulusan, algoritma
Decision Tree adalah algoritma terbaik karena memiliki tingkat akurasi tertinggi yaitu sebesar
98,02% diikuti dengan K-Nearest Neighbor pada urutan kedua yaitu sebesar 97,69% dan terakhir
Naïve Bayes sebesar 90,53%. Ketiga algoritma merupakan excellent classification karena
memiliki nilai AUC diantara 0,90-1,00 yang dapat diartikan sebagai excellent classification.
Kata kunci: Data mining, Klasifikasi, Prediksi, Decision Tree, K-Nearest Neighbor, Naïve
Bayes
ABSTRACT
Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa, karena anugrah-Nya
penulis dapat menyelesaikan laporan skripsi yang berjudul “Analisis Komparasi Algoritma
Klasifikasi Data Mining Untuk Memprediksi Kelulusan Mahasiswa Institut Bisnis Dan
Penulisan skripsi ini diajukan untuk memenuhi salah satu syarat dalam memperoleh gelar
Sarjana Komputer. Selain sebagai syarat untuk meraih gelar S1, skripsi ini juga dibuat untuk
memberi wawasan kepada pembaca mengenai proses pengolahan menggunakan teknik algoritma
data mining klasifikasi baik menggunakan perangkat lunak yang telah tersedia dan perhitungan
Pada kesempatan ini, penulis mengucapkan terima kasih kepada pihak-pihak yang
membantu:
1. Bapak Budi Wasito, S.Kom., M.M., M.Kom., selaku Ketua Program Studi Sistem
Informasi, Institut Bisnis dan Informatika Kwik Kian Gie yang senantiasa telah
2. Bapak Akhmad Budi, S.Kom, M.M., M.Kom., selaku dosen pembimbing yang telah turut
membantu penulis dalam memberikan panduan dari proses persiapan hingga penyelesaian
laporan skripsi.
3. Bapak Budi Berlinton Sitorus, S.T., M.Sc.., selaku Kepala Bagian Administrasi
Akademik dan Kemahasiswaan (BAAK) yang telah turut membantu penulis sebagai
studi Sistem Informasi yang telah memberikan pengetahuan dalam mengajar selama
perkuliahan
5. Jean Rijkaard, Richard Vinc, Jonathan Simanta, dan Winston sebagai senior dan teman
yang membantu, memberikan saran, dan mendukung penulis selama proses pembuatan
skripsi.
6. Keluarga dan teman-teman yang memberikan dukungan dalam proses pembuatan skripsi
dan penulisan laporan ini sehingga dapat selesai tepat pada waktunya.
Akhir kata penulis mengucapkan permintaan maaf apabila penulisan laporan ini masih
belum sempurna dan masih terdapat banyak kesalahan. Penulis mengharapkan kritik dan saran
kesempatan.
Devina
BAB I
PENDAHULUAN
organisasi sehingga membuat segala aktivitasnya menjadi lebih efisien dan dapat
dengan jasa dan produk apa yang diinginkan oleh pelanggan. Hal tersebut dapat
membantu perusahaan atau organisasi dalam pengambilan keputusan strategi yang tepat
oleh perusahaan atau organisasi salah satunya melalui business intelligence. Setiap
perusahaan membutuhkan alat untuk mengontrol performa dari segi bisnis perusahaan,
salah satu caranya adalah dengan mencatat setiap data dan merancang setiap laporan yang
akan diberikan kepada pihak eksekutif dalam format yang mudah untuk dimengerti.
Business intelligence adalah satu set teknologi informasi yang dapat menyediakan solusi
berupa alat yang dapat mengumpulkan, menganalisis dan melaporkan informasi kepada
Informasi yang diberikan kepada pihak eksekutif berupa data visualisasi yang
menyajikan sebuah pola yang lebih mudah dipahami. Pola tersebut dapat menghilangkan
informasi dalam bentuk format laporan dalam bentuk tulisan. Pattern atau pola
ditemukan
pada proses data mining. Data mining merupakan gabungan dari seni dan ilmu dalam
menemukan pola yang inovatif dan berguna dalam data. Terdapat berbagai macam teknik
dalam data mining untuk mencari sebuah pola. Teknik tersebut seperti decision tree yang
yang merupakan teknik yang mudah untuk dipahami dari data statis, analisis klastering
yaitu teknik untuk membagi data set dalam jumlah besar, aturan asosiasi atau market
Data mining dapat digunakan dalam berbagai bidang organisasi yang memiliki
data dalam jumlah yang banyak, salah satunya adalah perguruan tinggi. Perguruan tinggi
memiliki peranan yang penting di Indonesia. Melalui perguruan tinggi, mahasiswa dilatih
untuk dapat menyelesaikan masalah yang sistematis dan kompleks. Oleh karena itu,
mahasiswa. Pendidikan yang berkualitas akan menghasilkan sumber daya manusia yang
Mahasiswa adalah salah satu unsur dalam perguruan tinggi, oleh karena itu perlu
diperhatikan berbagai macam aspek mahasiswa, salah satunya yaitu tingkat kelulusan
mahasiswa yang tepat waktu. Presentase dari tingkat kelulusan merupakan salah satu
penilaian dari suatu perguruan tinggi. Oleh karena itu, perlu diperhatikan tingkat
Setiap perguruan tinggi pasti menyimpan data mahasiswanya baik yang aktif
maupun sudah tidak aktif dalam kegiatan perkuliahan. Data tersebut dapat berupa data
pribadi setiap mahasiswa, indeks prestasi, absensi kehadiran, tahun masuk dan tahun
kelulusan, dan lain-lain. Banyak dari perguruan tinggi yang hanya menyimpan data
tersebut dan tidak melakukan pengolahan lebih lanjut. Hal tersebut terjadi karena sulitnya
untuk melakukan pengolahan data, dimana data tersebut harus dikumpulkan terlebih
dahulu dan dilakukan pembersihan data yang memakan waktu cukup lama. Pada akhirnya
data tersebut hanya berbentuk data mentah yang tidak dapat memberikan informasi yang
bermanfaat bagi perguruan tinggi, salah satunya dalam melihat tingkat kelulusan
mahasiswa.
Data mining memiliki fungsi untuk mengolah dan pengklasifikasian data untuk
menghasilkan sebuah pola atau informasi yang bermanfaat. Namun dibutuhkan teknik
atau metode klasifikasi yang sesuai dengan karakter dari data yang ada. Belum adanya
komparasi antara teknik atau algoritma klasifikasi untuk pengolahan data mahasiswa
menjadi salah satu masalah dalam pemilihan algoritma yang ada. Data mining memiliki
berbagai macam teknik pengolahan data, hal ini menyulitkan penelitian untuk
menentukan teknik atau algoritma klasifikasi data mining yang harus digunakan dalam
B. Identifikasi Masalah
Berdasarkan latar belakang masalah diatas, maka masalah yang dapat diidentifikasi
1. Data mahasiswa belum dapat memberi infromasi yang bermanfaat, salah satunya
3. Belum adanya komparasi antara teknik atau algoritma untuk pengolahan data
mahasiswa.
C. Batasan Masalah
1. Data mahasiswa belum dapat memberi infromasi yang bermanfaat, terutama dalam
2. Sulit menentukan satu teknik atau algoritma klasifikasi data mining yang harus
3. Belum adanya komparasi antara teknik atau algoritma klasifikasi untuk pengolahan
data mahasiswa.
D. Tujuan Penelitian
Berdasarkan batasan masalah diatas, maka tujuan dari penelitian ini adalah:
1. Menyajikan data mahasiswa yang telah diolah sehingga dapat menyajikan informasi
2. Dapat melihat teknik atau algoritma klasifikasi mana yang terbaik untuk digunakan
Institut Bisnis dan Informatika Kwik Kian Gie dapat menggunakan hasil olahan data
tersebut untuk dijadikan dasar dalam pembuatan keputusan. Hasil penelitian dapat
2. Penulis
pengunaan teknik atau algoritma kasifikasi pada data mining untuk melihat tingkat
3. Pembaca
Pembaca dapat melihat hasil kajian penelitian dan dapat dijadikan referensi untuk
wawasan baru mengenai perbandingan antara beberapa teknik atau algoritma yang
Astuti, Puji (2016), Komparasi Penerapan Algoritma C45, Knn Dan Neural Network Dalam
Proses Kelayakan Penerimaan Kredit Kendaraan Bermotor, Jakarta: Universitas
Indraprasta PGRI
Bourgeois, David T. (2014), Information Systems for Business and Beyond, Saylor.org Academy.
Badan Akreditasi Nasional Perguruan Tinggi (2008), Buku VI Matriks Penilaian Instrumen
Akreditasi Program Studi, Jakarta: Badan Akreditasi Nasional Perguruan Tinggi
Conford, Tony dan Maha Shaikh (2013), Introduction to Information Systems, United Kingdom:
University of London
Elmasri, Ramez, Shamkant B. Navathe (2016), Fundamentals Of Database Systems, Edisi Ke-7,
United States of America: Pearson.
Gorunescu, Florin (2011), Data Mining: Concepts, Models and Techniques, Berlin: Springer
Han, Jiawei, Michelin Kamber dan Jian Pei (2012), Data Mining Concepts and Techniques:
Third
Edition, United States of America: Morgan Kaufmann Publishers
Hastuti, Khafiizh (2012), Analisis Komparasi Algoritma Klasifikasi Data Mining Untuk Prediksi
Mahasiswa Non Aktif. Prosiding Seminar Nasional Teknologi Informasi & Komunikasi
Terapan, Semarang.
Maheshwari, Anil K (2015), Business Intelligence and Data Mining, New York: Business Expert
Press
Saefulloh, Asep dan Moedjiono (2013), Penerapan Metode Klasifikasi Data Mining Untuk
Prediksi Kelulusan Tepat Waktu, InfoSys Journal. Vol.12
Tutorials Point (2014), Data Warehousing, India: Tutorials Point (I) Pvt. Ltd.
Zaki, Mohammed J. dan Wagner Meira Jr (2013), Data Mining and Analysis: Fundamental
Concepts and Algorithms, Inggirs: Cambridge University Press.