Anda di halaman 1dari 9

PROPOSAL TKP

PERBANDINGAN ALGORITMA DATA MINING


CLUSTERING UNTUK MEMPREDIKSI JUMLAH
PENDAFTAR MAHASISWA BARU UNIVERSITAS XYZ

Oleh

Muhammad Rohmattullah
1461600051

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS 17 AGUSTUS 1945 SURABAYA
2019
BAB I
PENDAHULUAN

1.1. LATAR BELAKANG


Universitas merupakan sebuah tempat di mana berlangsungnya sebuah proses
belajar-mengajar. Proses belajar-mengajar tersebut melibatkan peran serta sumber daya
manusia yaitu Dosen dan Mahasiswa. Universitas memiliki sarana dan prasarana kuliah
seperti ruang praktek dan ruang kuliah. Sarana dan prasarana merupakan hal penting dalam
proses belajar-mengajar yang mampu mempengaruhi hasil akademik mahasiswa.
Data Mining adalah Serangkaian proses untuk menggali nilai tambah berupa
informasi yang selama ini tidak diketahui secara manual dari suatu basis data dengan
melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi
informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali
pola yang penting atau menarik dari data yang terdapat dalam basis data.
Lembaga pendidikan formal setiap tahun rutin mengadakan kegiatan penerimaan
mahasiswa baru. Jumlah mahasiswa pada penerimaan siswa tahun ajaran baru dapat
mengalami peningkatan dan penurunan. Sehingga diperlukan adanya prediksi untuk
mengetahui perolehan jumlah mahasiswa baru. Dengan harapan agar semua kebijakan dan
keputusan dalam menyusun perencanaan akademik ke depan dapat terpenuhi dengan baik.
Teknik Data mining merupakan solusi berdasarkan permasalahan yang ada. Metode
yang dilakukan adalah membandingkan setiap Algoritma clustering agar bisa mengetahui
prediksi. Dengan analisis perbandingan tersebut, diharapkan dapat membantu memprediksi
jumlah mahasiswa yang mendaftar. Diharapan agar semua kebijakan dan keputusan dalam
menyusun perencanaan akademik ke depan dapat terpenuhi dengan baik.

1.2. RUMUSAN MASALAH


Berdasarkan latar belakang masalah, maka permasalahan yang didapati adalah
1. Bagaimana cara memprediksi jumlah penerimaan mahasiswa baru di Universitas XYZ
dengan menggunakan algoritma data mining clustering?
2. Bagaimana perbandingan tingkatan algoritma data mining clustering untuk
memprediksi jumlah penerimaan mahasiswa baru di Universitas XYZ?

2
3

1.3. MAKSUD DAN TUJUAN


Adapun tujuan penelitian adalah sebagai berikut :
1. Memprediksi jumlah penerimaan mahasiswa baru di Universitas XYZ dengna
menggunakan algoritma data mining clustering
2. Membandingkan tingkatan algoritma data mining clustering untuk memprediksi
jumlah penerimaan mahasiswa baru di Universitas XYZ

1.4. BATASAN MASALAH


Untuk menjawab permasalahan dalam penelitian tersebut, dalam penelitian ini masalah
akan dibatasi dalam ruang lingkup sebagai berikut :
a. Penelitian dilakukan di Universitas XYZ
b. Data dan informasi yang digunakan adalah data target penerimaan, jumlah pendaftar,
data jumlah mahasiswa yang diterima 10 tahun yang lalu.
c. Metode Data Mining yang digunakan adalah clustering
d. Algoritma yang digunakan dalam perbandingan untuk memprediksi jumlah
mahasiswa baru adalah K-Apriori, K-Means, KNN
BAB II
LANDASAN TEORI

2.1. ALGORITMA APRIORI


Apriori merupakan salah satu teknik data mining dengan mengolah informasi ke
dalam bentuk itemset berdasarkan jumlah kemunculan data sehingga didapatkan
association rule. Secara garis besar terdapat dua tahapan yaitu dengan penggabungan (join)
dan pemangkasan (prune). Dalam algoritma ini diperlukan beberapa kondisi yang dipenuhi
yaitu minimum support, confidence lift ratio dan benchmark. Support merupakan
banyaknya itemset yang muncul secara bersamaan dalam sebuah transaksi sehingga
disebut juga support count sebagaimana dinyatakan dalam persamaan 1.
Penentuan nilai minimum support digunakan sebagai nilai acuan untuk menentukan
batas minimum itemset yang menyatakan kelayakan dari association rule yang terbentuk.
Itemset yang tidak layak akan dilakukan pemangkasan, sedangkan itemset yang layak akan
dilakukan penggabungan. Setelah terbentuk rule, dicari nilai confidence sebagaimana
ditunjukkan dalam persamaan 3 dan 4. Nilai minimum confidence digunakan sebagai
parameter untuk menentukan batas terendah tingkat kepercayaan sebuah rule terhadap
asosiasi yang telah dibentuk.

2.2. ALGORITMA K-MEANS


Algoritma k-means adalah metode clustering nonhierarchical berbasis jarak yang
membagi data ke dalam cluster dan algoritma ini bekerja pada atribut numerik. Algoritma
k-means termasuk dalam partitioning clustering yang memisahkan data ke daerah bagian
yang terpisah. Algoritma k-means sangat terkenal karena kemudahannya dan
kemampuannya untuk meng-cluster data besar dan outlier dengan sangat cepat. K-Means
merupakan metode clustering yang sangat terkenal dan banyak digunakan di berbagai
bidang karena sederhana, mudah diimplementasikan, memiliki kemampuan untuk meng-
cluster data yang besar, mampu menangani data outlier dan kompleksitas waktunya linear
O(nKT) dengan n adalah jumlah dokumen, K adalah jumlah kluster, dan T adalah jumlah
iterasi. Dalam Algoritma k-means, setiap data harus termasuk dapat berpindah ke cluster
yang lain. Pada dasarnya penggunaan Algoritma k-means dalam melakukan proses

4
5

clustering tergantung dari data yang ada dan konklusi yang ingin dicapai. Untuk itu
digunakan K-Means Algorithm yang di dalamnya memuat aturan sebagai berikut:
 Jumlah input dari cluster
 Memiliki atribut yang bersifat numerik

2.3. ALGORITMA KKN


Algoritma k-Nearest Neighbor (kNN) merupakan sebuah metode untuk melakukan
klasifikasi terhadap objek berdasarkan data pembelajaran yang jaraknya paling dekat
dengan objek tersebut. kNN termasuk algoritma supervised learning dimana hasil dari
query instance yang baru diklasifikan berdasarkan mayoritas dari kategori pada kNN. Kelas
yang paling banyak muncul itu yang akan menjadi kelas hasil klasifikasi. Tujuan dari
algoritma ini adalah mengklasifikasikan objek baru berdasarkan atribut dan training
sample. Algoritma k- Nearest Neighbor menggunakan klasifikasi ketetanggaan (neighbor)
sebagai nilai prediksi dari query instance yang baru. Algoritma ini sederhana, bekerja
berdasarkan jarak terpendek dari query instance ke training sample untuk menentukan
ketetanggaannya. Langkah-langkah untuk menghitung metode k-Nearest Neighbor antara
lain:
1 Menentukan parameter k
2 Menghitung jarak antara data yang akan dievaluasi dengan semua pelatihan
3 Mengurutkan jarak yang terbentuk
4 Menentukan jarak terdekat sampai urutan k
5 Memasangkan kelas yang bersesuaian
6 Mencari jumlah kelas dari tetangga yang terdekat dan tetapkan kelas tersebut sebagai
kelas data yang akan dievaluasi
BAB III
METODE PENELITIAN

Kerangka pemikiran dari penelitian ini, dimulai dari algoritma yang diambil dari The Top Ten
Algorithms in Data Mining dan kemudian digunakan untuk memprediksi jumlah mahasiswa baru
di Universitas XYZ, maka kerangka pemikiran yang dilakukan adalah :

Gambar 1 Kerangka Penelitian

Dalam Gambar 1 mencangkup bagian penting yang dilakukan dalam penelitian ini yaitu :
 Data Manual
Input : Studi Literatur, Observasi, Wawancara
Proses : Melakukan Pengumpulan Data
Output : Data Manual yang dibutuhkan untuk membangun sistem
 Metodologi Perbandingan Algoritma Data Mining Clustering terdiri dari 4 tahap terstruktur
dan saling berketegantungan pada setiap tahap. Tahap yang dimaksud adalah tahap Inception,
Tahap Construction, Tahap Prototyping, dan Tahap Transition

6
7

Berikut proses perancangan Perbandingan Algoritma Data Mining Clustering


3.1 Tahap Inception
Tujuan dari tahap awal atau tahap inception ini yaitu menderfinisikan batasan-batasan
lingkungan proyek, estimasi kasar terhadap biaya dan waktu mendefinisikan resiko,
menentukan kelayakan serta mempersiapkan lingkungan pengerjaan proyek.
a. Identifikasi Masalah
Permasalahan pada penelitian ini adalah bagaimana cara memprediksi jumlah
pendaftar mahasiswa baru di Universitas XYZ dengan membandingkan Algoritma
Data Mining Clustering.
b. Menganalisa Masalah
Merupakan langkah untuk dapat memahami dampak dari permasalahan yang ada.
c. Menentukan Tujuan
Tujuan dari penelitian ini adalah membandingkan Algoritma Data Mining Clustering
untuk memprediksi mahasiswa baru di universitas XYZ
d. Mempelajari Literatur
Untuk mencapai tujuan penelitian, maka dipelajari literatur yang berkaitan dengan
topik penelitian dan dapat dijadikan dasar atau sumber rujukan penelitian ini
e. Mengumpulkan Data
Dalam pengumpulan data, terdapat sumber data dua jenis yaitu sumber premier dan
sumber sekunder. Sumber premier merupakan sumber data yang langsung dihimpun,
sedangkan sumber sekunder merupakan sumber data yang dihimpun dari tangan
kedua. Data yang diperoleh adalah data sekunder karena diperoleh dari database
mahasiswa yang dimiliki oleh Universitas XYZ. Data yang diperoleh adalah data
kualitatif dan kuantitatif. Data yang dikumpulkan adalah jumlah pendaftar mahasiswa
Universitas XYZ 10 tahun terakhir.
f. Pengolahan Data
Data yang diperoleh harus melewati tahap pengolahan awal data. Data yang telah
diperoleh tidak semua dapat digunakan dan tidak semua atribut pada data dapat yang
digunakan. Untuk mendapatkan data yang berkualitas digunakan teknik data validation
yang digunakan untuk mengidentifikasi dan menghapus data yang ganjil
8

(outlier/noise), data yang tidak konsisten, dan data yang tidak lengkap (missing value),
Missing data terlihat

3.2 Tahap Construction


Tujuan dari tahap kedua atau tahap construction ini yaitu memodelkan dan membangun
sistem aplikasi. Dalam penelitian ini, data yang digunakan adalah data dari jumlah
mahasiswa yang diterima setiap tahun di Universitas XYZ. Data jumlah mahasiswa
tersebut akan diolah menggunakan metode data mining clustering sehingga hasilnya dapat
digunakan sebagai rules dalam memprediksi jumlah penerimaan mahasiswa baru.
Dalam penelitian ini akan dilakukan beberapa tahapan penelitian seperti yang digambarkan
pada gambar

Gambar 2 Flowchart Mekanisme Penelitian


9

3.3 Tahap Prototyping


Pada Tahap ini proses dalam pembuatan prototype dari aplikasi sehingga sebelum
memasuki tahap development tidak terlalu banyak perubahan dari segi tampilan maupun
sistem aplikasi

3.4 Tahap Trasition


Tujuan dari tahap terakhir atau tahap transition ini yaitu menguji dan mereview sistem.
Tahap ini merupakan adalah tahap final dari metodologi perbandingan Algoritma Data
Mining Clustering untuk memprediksi jumlah mahasiswa baru
Dalam penelitian ini akan dilakukan perbandingan dengan menggunakan metode data
mining clustering K-Apriori, K-Means, KNN terhadap data jumlah mahasiswa baru. Data
kemudian akan di ujikan, evaluasi dan di validasi sesuai dengan rumus algoritma.

Anda mungkin juga menyukai