Anda di halaman 1dari 24

CLUSTERING PENERIMAAN BEASISWA KULIAH DI

UNIVERSITAS MUHAMMADIYAH GRESIK


MENGGUNAKAN METODE K-MEANS

Dosen Pembimbing :
Muhammad Bachtiyar Rosyadi, S.Kom.

Di Susun Oleh :
M. Rizky Abriyanto S. (13.621.034)

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH GRESIK
2016

BAB I
PENDAHULUAN

1.1

Latar Belakang
Beasiswa adalah pemberian berupa bantuan keuangan yang diberikan kepada
perorangan yang bertujuan untuk digunakan demi keberlangsungan pendidikan yang
ditempuh (Putranto, 2011). Pemberian beasiswa merupakan program kerja yang ada
di setiap universitas atau perguruan tinggi. Program beasiswa diadakan untuk
meringankan beban mahasiswa dalam menempuh masa studi kuliah khususnya dalam
masalah biaya. Pemberian beasiswa kepada mahasiswa dilakukan secara selektif
sesuai dengan jenis beasiswa yang diadakan. Universitas Muhammadiyah Gresik
menyediakan beberapa program beasiswa, sebagai contoh yaitu beasiswa Peningkatan
Prestasi Akademik, Beasiswa Bantuan Belajar Mahasiswa, beasiswa astra, dan lain
sebagainya. Indeks Prestasi Komulatif (IPK), jumlah tanggungan keluarga, dan
penghasilan total orang tua (penghasilan ayah ditambah penghasilan ibu) menjadi
kriteria dalam proses rekruitmen beasiswa.
Di Universitas Muhammadiyah Gresik proses seleksi penerimaan beasiswa
secara manual yaitu dengan menginputkan satu persatu data mahasiswa ke dalam file
spreadsheet kemudian melakukan sorting data mahasiswa seringkali menimbulkan
beberapa permasalahan, antara lain membutuhkan waktu yang lama dan ketelitian
yang tinggi. Selain itu, transparansi serta ketidakjelasan metodologi yang digunakan
dalam proses komputasi penerimaan beasiswa juga menjadi salah satu permasalahan,
sehingga dibutuhkan suatu sistem yang dapat membantu dalam proses pengambilan
keputusan siapa saja mahasiswa yang direkomendasikan menerima beasiswa
berdasarkan kriteria-kriteria yang telah ditentukan secara cepat dan tepat sasaran.
Dari permasalahan diatas Salah satu metode yang dapat digunakan untuk
menyelesaikan permasalahan tersebut adalah metode K-Means Clustering. K-Means
Clustering merupakan salah satu metode data clustering non hirarki yang berusaha
mempartisi data yang ada ke dalam bentuk satu atau lebih cluster/kelompok. Metode
ini mempartisi data ke dalam cluster/kelompok sehingga data yang memiliki
karakteristik sama dikelompokkan ke dalam satu cluster yang sama.
Didasari dari permasalahan tersebut maka dapat dilakukan penelitian yang
berjudul "CLUSTERING PENERIMAAN BEASISWA KULIAH DI UNIVERSITAS

MUHAMMADIYAH GRESIK MENGGUNAKAN METODE K-MEANS." dengan


penelitian ini diharapkan proses penerimaan beasiswa di Universitas Muhammadiyah
Gresik dapat dilakukan dengan baik dan sesuai kriteria serta tepat sasaran.
1.2

Rumusan Masalah
Berdasarkan latar belakang yang telah dijelaskan sebelumnya, rumusan masalah yang
akan diselesaikan adalah bagaimana mengelompokkan data mahasiswa untuk
mendukung keputusan penentuan penerima beasiswa dengan metode K-Means
Clustering.

1.3

Batasan Masalah
Batasan masalah dalam tugas akhir ini adalah :
1. Kriteria yang digunakan dalam clustering antara lain Indeks Prestasi Kumulatif
(IPK), jumlah tanggungan keluarga, dan penghasilan total orang tua (penghasilan
ayah ditambah dengan penghasilan ibu).
2. Sistem bersifat general (tidak mengacu pada satu jenis beasiswa) dan hanya
melakukan clustering data mahasiswa berdasarkan kriteria-kriteria yang telah
disebutkan pada poin pertama, sedangkan keputusan penerima beasiswa
tergantung pada salah satu kriteria yang lebih diprioritaskan pada beasiswa
tersebut, yaitu salah satu dari prioritas kriteria IPK dan prioritas kriteria
penghasilan total orang tua dibagi dengan jumlah tanggungan keluarga.
3. Jumlah cluster yang akan digunakan pada kasus ini adalah tiga (3) berdasarkan
perhitungan validasi cluster optimal, yaitu mahasiswa yang direkomendasikan
menerima beasiswa, dipertimbangkan menerima beasiswa, dan tidak menerima
beasiswa.
4. Quota penerima beasiswa dan pendanaan tidak termasuk dalam pengklasteran.

1.4

Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah mengelompokkan data
mahasiswa untuk mendukung keputusan penetuan penerima beasiswa dengan metode
K-Means Clustering.

1.5

Manfaat Penelitian

Manfaat penelitian dalam tugas akhir ini adalah pendukung keputusan yang dihasilkan
diharapkan mampu membantu untuk membuat keputusan dalam menentukan
mahasiswa penerima beasiswa.
1.6

Sistematika Penulisan
Agar mudah dipahami, laporan ini dibuat dalam suatu sistematika penulisan yang
dapat dijadikan acuan mengenai keterkaitan antar bab yang ada dalam laporan,
dengan uraian sebagai berikut :
BAB 1 : PENDAHULUAN
Pada Bab ini menjelaskan paparan mengenai maksud dan tujuan penulisan
penelitian yang terdiri dari latar belakang, rumusan masalah, tujuan
penelitian, manfaat penelitian, metodologi penelitian, batasan penelitian dan
sistematika penelitian.
BAB 2 : LANDASAN TEORI
Pada Bab ini menjelaskan tentang dasar teori yang diperlukan serta literatur
yang mendukung dalam penelitian ini. diantaranya tinjauan pustaka dan
tinjauan studi.
BAB 3 : METODE PENELITIAN
Pada Bab ini menjelaskan tentang metode atau langkah-langkah dalam
pemecahan masalah.

BAB II
LANDASAN TEORI

2.1

Tinjauan Pustaka
2.1.1. Data Mining

Data mining adalah suatu proses ekstraksi atau penggalian data yang
belum diketahui sebelumnya, namun dapat dipahami dan berguna dari
database yang besar serta digunakan untuk membuat suatu keputusan bisnis
yang sangat penting (Connolly dan Begg, 2010).
Data mining sering juga disebut sebagai Knowledge Discovery in
Database (KDD). KDD adalah kegiatan yang meliputi pengumpulan,
pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan
dalam set data berukuran besar (Santoso, 2007).
Pada prosesnya data mining akan mengekstrak informasi yang
berharga dengan cara menganalisis adanya pola-pola ataupun hubungan
keterkaitan tertentu dari data-data yang berukuran besar. Data mining
berkaitan dengan bidang ilmu-ilmu lain, seperti Database System, Data
Warehousing, Statistic, Machine Learning, Information Retrieval, dan
Komputasi Tingkat Tinggi. Selain itu data mining didukung oleh ilmu lain
seperti Neural Network, Pengenalan Pola, Spatial Data Analysis, Image
Database, Signal Processing.
Ada banyak metode atau fungsi data mining yang bisa digunakan
untuk menemukan, menggali dan menambang pengetahuan. Menurut (Larose,
2005), (Moertini, 2002) dan (Susanto & Suryadi, 2010) ada enam fungsi
utama data mining, yaitu :
1. Description (deskripsi), untuk memberi gambaran secara ringkas bagi
sekumpulan data yang jumlahnya sangat besar dan banyak jenisnya.
Termasuk dalam fungsi ini adalah metode Decision Tree, Neural Network,
danExploratory Data Analysis.
2. Estimation (estimasi), untuk menerka sebuah nilai yang belum diketahui,
misal menerka penghasilan seseorang ketika informasi mengenai orang
tersebut

diketahui.

Metode

Estimation dan Confidence

yang

Interval

digunakan

antara

Estimations, Simple

lain Point
Linear

Regression dan Correlation, dan Multiple Regression.


3. Prediction (prediksi), untuk memperkirakan nilai masa mendatang, missal
memprediksi stok barang satu tahun ke depan. Fungsi ini mencakup
metodeNeural Network, Decision Tree, dan kNearest Neighbor.
4. Classification (klasifikasi), merupakan proses penemuan model atau fungsi
yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan
untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak

diketahui. Metode yang digunakan antara lain Neural Network, Decision


Tree, k-Nearest Neighbor, dan Naive Bayes.
5. Clustering (pengelompokan), yaitu pengelompokan mengidentifikasi data
yang

memiliki

karakteristik

diantaranya Hierarchical

tertentu.

Clustering,

Metode

dalam

metode K-Means,

fungsi

ini

dan Self

Organizing Map (SOM).


6. Association (asosiasi), dinamakan juga analisis keranjang pasar dimana
fungsi ini mengidentifikasi item-item produk yang kemungkinan dibeli
konsumen bersamaan dengan produk lain. Metode atau algoritma dalam
fungsi ini adalahApriori, Generalized Sequential Pattern (GSP), FPGrowth dan GRI algorithm.
Karakteristik data mining sebagai berikut:
a. Data mining berhubungan dengan penemuan sesuatu yang tersembunyi
dan pola data tertentu yang tidak diketahui sebelumnya.
b. Data mining biasa menggunakan data yang sangat besar. Biasanya data
yang besar digunakan untuk membuat hasil lebih dapat dipercaya.
c. Data mining berguna untuk membuat keputusan kritis.
Berdasarkan beberapa pengertian tersebut dapat ditarik kesimpulan bahwa
Data Mining adalah suatu teknik menggali informasi berharga yang terpendam
atau tersembunyi pada suatu koleksi data (database) yang sangat besar
sehingga ditemukan suatu pola yang menarik yang sebelumnya tidak
diketahui.

Proses pengambilan keputusan dilakukan dengan menggunakan


beberapa tahapan.Tahap-tahap data mining ada 6 yaitu :
1. Pembersihan data (data cleaning)
Pembersihan data merupakan proses menghilangkan noise dan data
yang tidak konsisten atau data tidak relevan. Pada umumnya data yang
diperoleh, baik dari database suatu perusahaan maupun hasil eksperimen,
memiliki isian-isian yang tidak sempurna seperti data yang hilang, data
yang tidak valid atau juga hanya sekedar salah ketik. Selain itu, ada juga
atribut-atribut data yang tidak relevan dengan hipotesa data mining yang
dimiliki. Data-data yang tidak relevan itu juga lebih baik dibuang.

Pembersihan data juga akan mempengaruhi performasi dari teknik data


mining karena data yang ditangani akan berkurang jumlah dan
kompleksitasnya.
2. Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari berbagai
database ke dalam satu database baru. Tidak jarang data yang diperlukan
untuk data mining tidak hanya berasal dari satu database tetapi juga
berasal dari beberapa database atau file teks. Integrasi data dilakukan pada
atribut-aribut yang mengidentifikasikan entitas-entitas yang unik seperti
atribut nama, jenis produk, nomor pelanggan dan lainnya. Integrasi data
perlu dilakukan secara cermat karena kesalahan pada integrasi data bisa
menghasilkan hasil yang menyimpang dan bahkan menyesatkan
pengambilan aksi nantinya. Sebagai contoh bila integrasi data berdasarkan
jenis produk ternyata menggabungkan produk dari kategori yang berbeda
maka akan didapatkan korelasi antar produk yang sebenarnya tidak ada.
3. Seleksi Data (Data Selection)
Data yang ada pada database sering kali tidak semuanya dipakai,
oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil
dari database. Sebagai contoh, sebuah kasus yang meneliti faktor
kecenderungan orang membeli dalam kasus market basket analysis, tidak
perlu mengambil nama pelanggan, cukup dengan id pelanggan saja.

4. Transformasi data (Data Transformation)


Data diubah atau digabung ke dalam format yang sesuai untuk
diproses dalam data mining. Beberapa metode data mining membutuhkan
format data yang khusus sebelum bisa diaplikasikan. Sebagai contoh
beberapa metode standar seperti analisis asosiasi dan clustering hanya bisa
menerima input data kategorikal. Karenanya data berupa angka numerik
yang berlanjut perlu dibagi-bagi menjadi beberapa interval. Proses ini
sering disebut transformasi data.
5. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk
menemukan pengetahuan berharga dan tersembunyi dari data.

6. Evaluasi pola (pattern evaluation)


Untuk mengidentifikasi pola-pola menarik kedalam knowledge
based yang ditemukan. Dalam tahap ini hasil dari teknik data mining
berupa pola-pola yang khas maupun model prediksi dievaluasi untuk
menilai apakah hipotesa yang ada memang tercapai. Bila ternyata hasil
yang diperoleh tidak sesuai hipotesa ada beberapa alternatif yang dapat
diambil seperti menjadikannya umpan balik untuk memperbaiki proses
data mining, mencoba metode data mining lain yang lebih sesuai, atau
menerima hasil ini sebagai suatu hasil yang di luar dugaan yang mungkin
bermanfaat.
7. Presentasi pengetahuan (knowledge presentation)
Merupakan visualisasi dan penyajian pengetahuan mengenai
metode yang digunakan untuk memperoleh pengetahuan yang diperoleh
pengguna. Tahap terakhir dari proses data mining adalah bagaimana
memformulasikan keputusan atau aksi dari hasil analisis yang didapat. Ada
kalanya hal ini harus melibatkan orang-orang yang tidak memahami data
mining. Karenanya presentasi hasil data mining dalam bentuk pengetahuan
yang bisa dipahami semua orang adalah satu tahapan yang diperlukan
dalam proses data mining. Dalam presentasi ini, visualisasi juga bisa
membantu mengkomunikasikan hasil data mining (Han, 2006).

2.1.2. Clustering
Clustering adalah mengelompokkan item data ke dalam sejumlah kecil
grup sedemikian sehingga masing-masing grup mempunyai sesuatu persamaan
yang esensial (Andayani, 2007).
Ada beberapa pendekatan yang digunakan dalam mengembangkan
metode clustering. Dua pendekatan utama adalah clustering dengan
pendekatan partisi dan clustering dengan pendekatan hirarki. Clustering
dengan pendekatan partisi atau sering disebut dengan partition-based
clustering mengelompokkan data dengan memilah-milah data yang dianalisa
ke dalam cluster-cluster yang ada. Clustering dengan pendekatan hirarki atau
sering disebut dengan hierarchical clustering mengelompokkan data dengan

membuat suatu hirarki berupa kurva yang menggambarkan pengelompokan


cluster dimana data yang mirip akan ditempatkan pada hirarki yang berdekatan
dan yang tidak pada hirarki yang berjauhan.
Menurut Andayani (2007), Algoritma clustering dibagi ke dalam
beberapa kelompok besar, antara lain :
1. Partitioning algorithms : algoritma dalam kelompok ini membentuk
bermacam partisi dan kemudian mengevaluasinya dengan berdasarkan
beberapa kriteria.
2. Hierarchy algorithms : pembentukan dekomposisi hirarki dari sekumpulan
data menggunakan beberapa kriteria.
3. Density based : pembentukan cluster berdasarkan pada koneksi dan fungsi
densitas.
4. Grid based : pembentukan cluster berdasarkan pada struktur multiple level
granularity.
5. Model based : sebuah model dianggap sebagai hipotesa untuk masing
masing cluster dan model yang baik dipilih diantara model hipotesa
tersebut.

2.1.3. K-Means Clustering


Metode K-Means pertama kali diperkenalkan oleh MacQueen JB
padatahun 1976. Metode ini adalah salah satu metode non hierarchi yang
umum digunakan. Metode ini termasuk dalam teknik penyekatan (partition)
yang membagi atau memisahkan objek ke k daerah bagian yang terpisah. Pada
K-Means, setiap objek harus masuk dalam kelompok tertentu, tetapi dalam
satu tahapan proses tertentu, objek yang sudah masuk dalam satu kelompok,
pada satu tahapan berikutnya objek akan berpindah ke kelompok lain.
Hasil cluster dengan dengan metode K-Means sangat bergantung pada
nilai pusat kelompok awal yang diberikan. Pemberian nilai awal yang berbeda
bisa menghasilkan kelompok yang berbeda. Ada beberapa cara memberi nilai
awal misalnya dengan mengambil sampel awal dari objek, lalu mencari nilai
pusatnya, memberi nilai awal secara random, menentukan nilai awalnya atau
menggunakan hasil dari kelompok hierarki dengan jumlah kelompok yang
sesuai (Santosa 2007).

K-Means adalah suatu metode penganalisaan data atau metode Data


Mining yang melakukan proses pemodelan tanpa supervisi (unsupervised) dan
merupakan salah satu metode yang melakukan pengelompokan data dengan
sistem partisi. Metode K-Means berusaha mengelompokkan data yang ada ke
dalam beberapa kelompok, dimana data dalam satu kelompok mempunyai
karakteristik yang sama satu sama lainnya dan mempunyai karakteristik yang
berbeda dengan data yang ada di dalam kelompok yang lain. Dengan kata lain,
metode ini berusaha untuk meminimalkan variasi antar data yang ada di dalam
suatu cluster dan memaksimalkan variasi dengan data yang ada di cluster
lainnya (Agusta, 2011).
Dalam perhitungan Algoritma K-Means memerlukan 3 komponen, yaitu :
1. Jumlah Cluster K
K-Means merupakan bagian dari metode non-hirarki sehingga dalam
metode ini jumlah k harus ditentukan terlebih dahulu. Jumlah cluster k
dapat ditentukan melalui pendekatan metode hirarki. Namun perlu
diperhatikan bahwa tidak terdapat aturan khusus dalam menentukan
jumlah cluster k, terkadang jumlah cluster yang diinginkan tergantung
pada subyektif seseorang.
2. Cluster Awal
Cluster awal yang dipilih berkaitan dengan penentuan pusat cluster awal
(centroid awal). pemilihan cluster awal dapat ditentukan berdasarkan
interval dari jumlah setiap observasi. Oleh karena adanya pemilihan cluster
awal yang berbeda ini maka kemungkinan besar solusi cluster yang
dihasilkan akan berbeda pula.
3. Ukuran Jarak
Metode k-means dimulai dengan pembentukan prototipe cluster di awal
kemudian secara iteratif prototipe cluster ini diperbaiki hingga konvergen
(tidak terjadi perubahan yang signifikan pada prototipe cluster). Perubahan
ini diukur dengan ukuran jarak Euclidean, City Block / Manhattan. ukuran
jarak ini digunakan untuk menempatkan observasi ke dalam cluster
berdasarkan centroid terdekat.
Algoritma K-Means adalah sebagai berikut:
1. Menentukan k sebagai jumlah cluster yang ingin dibentuk.
2. Membangkitkan nilai random untuk pusat cluster awal (centroid) sebanyak
k.

3. Menghitung jarak setiap data input terhadap masing-masing centroid


menggunakan rumus jarak Euclidean (Euclidean Distance) hingga
ditemukan jarak yang paling dekat dari setiap data dengan centroid.
Berikut adalah persamaan Euclidean Distance :

Dimana :
xi : data kriteria
j : centroid pada cluster ke-j
4. Mengklasifikasikan setiap data berdasarkan kedekatannya dengan centroid
(jarak terkecil).

5. Memperbaharui nilai centroid. Nilai centroid baru diperoleh dari rata-rata


cluster yang bersangkutan dengan menggunakan rumus :
Dimana :
j (t+1) : centroid baru pada iterasi ke (t+1),
Nsj : banyak data pada cluster Sj
6. Melakukan perulangan dari langkah 2 hingga 5 hingga anggota tiap cluster
tidak ada yang berubah.
7. Jika langkah 6 telah terpenuhi, maka nilai pusat cluster (j) pada iterasi
terakhir akan digunakan sebagai parameter untuk menentukan klasifikasi
data. Ilustrasi dari perubahan cluster/kelompok data ditunjukkan pada
Gambar 2.2. Ilustrasi algoritma k-means.

Untuk lebih jelasnya proses perhitungan menggunakan metode K-Means. Berikut


ini merupakan flowchart Algoritma K-Means :
START

Tentukan Jumlah Cluster K

Tentukan Asumsi titik pusat Cluster (Centroid)

YA

Hitung Jarak Obyek Ke pusat (Centroid)

TIDAK
Kelompokkan obyek berdasarkan
jarak terkecil/minimum

Gambar 2.1 flowchart


/ Diagram
Adakah
obyek alir Algoritma K-Means.
yang
berpindah ?

END

Gambar 2.2 Ilustrasi Algoritma K-Means

2.1.4. Beasiswa
Beasiswa adalah pemberian berupa bantuan keuangan yang diberikan
kepada perorangan yang bertujuan untuk digunakan demi keberlangsungan
pendidikan yang ditempuh (Putranto, 2011).
Pemberian beasiswa merupakan program kerja yang ada di setiap
universitas atau perguruan tinggi. Program beasiswa diadakan untuk
meringankan beban mahasiswa dalam menempuh masa studi kuliah khususnya
dalam masalah biaya. Pemberian beasiswa kepada mahasiswa dilakukan
secara selektif sesuai dengan jenis beasiswa yang diadakan.
Adapun jenis beasiswa yang diselenggarakan antara lain Beasiswa
Peningkatan Prestasi Akademik (PPA), Beasiswa Bantuan Belajar Mahasiswa
(BBM), Beasiswa yang diberikan pihak swasta, seperti beasiswa djarum, astra,
dan sebagainya.
Tujuan diselenggarakan beasiswa antara lain (Dikti, 2011) :
1. Meningkatkan akses dan pemerataan kesempatan belajar di perguruan
tinggi bagi rakyat Indonesia.
2. Mengurangi jumlah mahasiswa yang putus kuliah, karena tidak mampu
membiayai pendidikan.
3. Meningkatkan prestasi dan motivasi mahasiswa, baik pada bidang
akademik/kurikuler, ko-kurikuler, maupun ekstrakurikuler.

Sasaran mahasiswa penerima beasiswa antara lain (Dikti, 2011) :


1. Mahasiswa berprestasi (baik pada bidang akademik/kurikuler, kokurikuler maupun ekstra kurikuler).
2. Mahasiswa dengan prestasi minimal yang orang tua/wali-nya tidak
mampu membiayai pendidikannya.
Adapun urutan prioritas kriteria yang digunakan untuk penetapan
mahasiswa penerima beasiswa adalah tidak sama untuk setiap jenis beasiswa.
Sebagai contoh urutan prioritas kriteria penerima beasiswa PPA dan BBM
adalah berbeda. Penentuan mahasiswa penerima beasiswa PPA sesuai dengan
urutan prioritas sebagai berikut (Dikti, 2011) :
1. Mahasiswa yang mempunyai IPK paling tinggi.
2. Mahasiswa yang mempunyai SKS paling banyak (jumlah semester
paling sedikit).
3. Mahasiswa yang memiliki prestasi di kegiatan ko/ekstra kurikuler
(olahraga,

teknologi,

seni/budaya

tingkat

internasional/dunia,

regional/Asia/Asean dan Nasional).


4. Mahasiswa yang (orang tuanya) paling tidak mampu.
Sedangkan penentukan mahasiswa penerima beasiswa BBM sesuai
dengan urutan prioritas sebagai berikut (Dikti, 2011) :
1. Mahasiswa yang (orang tuanya) paling tidak mampu.
2. Mahasiswa yang memiliki prestasi di kegiatan ko/ekstra kurikuler
(olahraga,

teknologi,

seni/budaya

tingkat

internasional/dunia,

regional/Asia/Asean dan nasional).


3. Mahasiswa yang mempunyai IPK paling tinggi.
4. Mahasiswa yang mempunyai SKS paling banyak (jumlah semester
paling sedikit).

2.2
2.2.1. PENGELOMPOKAN

PRESTASI

Tinjauan Studi
AKADEMIK

MAHASISWA

TEKNIK INFORMATIKA UNIVERSITAS MUHAMMADIYAH GRESIK


MENGGUNAKAN METODE K-MEANS
2014).

(ALIFAH UMI FATHONAH,

Penelitian ini membahas pengelompokan prestasi akademik mahasiswa


sesuai dengan tingkatannya yaitu tinggi, sedang, dan rendah. dengan
menggunakan metode K-Means Clustering.
Prestasi akademik mahasiswa adalah salah satu kunci suksesnya universitas
dalam mendidik mahasiswanya, oleh karena itu universitas wajib meningkatkan
mutu pendidikan agar dapat bersaing di dunia kerja maka dibutuhkan sebuah
sistem yang dapat mengetahui kelompok-kelompok mahasiswa berprestasi di
akademik. maka Bagaimana menentukan kelompok prestasi akademik
Mahasiswa Teknik Informatika UMG menggunakan metode K-Means.
Dari hasil pengujian pengelompokan mahasiswa teknik informatika
universitas muhammadiyah gresik angkatan 2009 dan 2010 berdasarkan prestasi
akademik dengan menggunakan metode k-means, yang paling konsisten adalah
2 cluster karena nilai DBI yang paling kecil yaitu 0.007149 dan cluster terbaik
terdapat pada cluster pertama. dari 10 kali percobaan pada 3 cluster dapat dapat
digolongkan menjadi 3 kelompok yaitu baik, sedang dan rendah. Dari hasil
pengujian ini memiliki rata-rata nilai DBI 0.01405414. hasil pengelompokan
yang paling baik terdapat pada percobaan ke 2 yaitu memiliki nilai DBI
0.010275. dari hasil pengujian didapatkan peringkat untuk 116 mahasiswa, yaitu
74.14% prestasi baik, 20.69% prestasi sedang dan 5.17% prestasi rendah.
penetuan titik pusat pada data uji, walaupun dilakukan secara acak, metode ini
dapat menghasilkan hasil yang konsisten.
2.2.2. APLIKASI PENGELOMPOKAN BARANG UNTUK MEMBANTU
PENATAAN MENGGUNAKAN METODE CLUSTERING K-MEANS DI
GUDANG RAW MATERIAL PT. INDOSPRING. Tbk (DARMAJI, 2012)
Penelitian ini membahas mengenai bagaimana untuk merancang dan
membuat implementasi clustering pada penataan barang untuk pelayanan barang
ke produksi dengan metode K-Means.
Dalam pelaksaan penataan barang sering tercampur pada area tertentu
sehingga membutuhkan waktu yang lama untuk melakukan pembongkaran
material dan menimbulkan delay. Sehingga tidak bisa mencapai target yang
direncanakan sebelumnya. Bagaimana merancang dan membangun sebuah
aplikasi yang dapat digunakan untuk pengelompokan data penataan barang
sehingga barang tersebut dapat dikelompokkan menjadi tiga kelompok
berdasarkan rata-rata pemakaian barang setiap bulan.

Dari

penelitian

yang

telah

dilakukan

bahwa

dengan

aplikasi

pengelompokan dan pengambilan barang dengan metode K-Means clustering ini


dapat memudahkan dalam membantu penataan barang untuk digunakan dalam
pelayanan pada bagian produksi. Sehingga bisa mengurangi delay dalam
pelayanan barang. Artinya aplikasi secara visual ini dapat membantu penataan
dan pengambilan barang.
2.3

Rencana Penelitian
Proses seleksi penerimaan beasiswa dengan cara yang sudah ada yaitu dengan
menginputkan satu persatu data mahasiswa ke dalam file excel kemudian melakukan
sorting data mahasiswa menimbulkan beberapa permasalahan, antara lain
membutuhkan waktu yang lama dan ketelitian yang tinggi.
Salah satu cara untuk membantu dalam proses seleksi penerimaan beasiswa
adalah dengan cara mengelompokkan mahasiswa berdasarkan kriteriakriteria yang
telah ditentukan, antara lain IPK, jumlah tanggungan keluarga, dan penghasilan total
orang tua. Pengelompokan dilakukan dengan menerapkan algoritma K-Means
Clustering. Pengelompokan ini akan menunjukkan siapa saja yang akan masuk ke
dalam masing-masing kelompok.
Jumlah cluster yang digunakan pada kasus ini adalah tiga berdasarkan
perhitungan validasi cluster optimal, yaitu mahasiswa yang direkomendasikan
menerima beasiswa, dipertimbangkan menerima beasiswa, dan tidak menerima
beasiswa.

BAB III
ANALISIS DAN PERANCANGAN SISTEM

3.1 Analisis Masalah


Universitas Muhammadiyah Gresik menyediakan beberapa program beasiswa,
sebagai contoh yaitu beasiswa Peningkatan Prestasi Akademik, Beasiswa Bantuan
Belajar Mahasiswa, dan lain sebagainya. dengan persyaratan Indeks Prestasi
Komulatif (IPK), jumlah tanggungan keluarga, dan penghasilan total orang tua

(penghasilan ayah ditambah penghasilan ibu) menjadi kriteria dalam proses


rekruitmen penerima beasiswa.
Di Universitas Muhammadiyah Gresik ketika akan melakukan seleksi calon
penerima beasiswa dibutuhkan suatu keputusan yang tepat dan akurat untuk
menentukan mahasiswa yang berhak menerima beasiswa sesuai dengan kriteria yang
ditentukan. Karena relatif sulit dalam menentukan penerima beasiswa tepat pada
sasaran yang berakibat kurang efektif dan efesien. jika tanpa perhitungan untuk
pengelompokan dari setiap kriteria yang tepat, sehingga dapat merugikan pihak
kampus ataupun lembaga yang selaku penyedia program beasiswa ataupun mahasiswa
yang mengajukan beasiswa tersebut.
Analisis permasalahan yang terdapat pada penelitian ini yaitu bagaimana cara
untuk menyeleksi mahasiswa yang berhak menerima beasiswa kuliah agar sesuai
kriteria yang ditentukan dengan bantuan alat sederhana yang berbasis teknologi dan
mengimplementasikanya kedalam sistem aplikasi sederhana sebagai solusi dari pihak
kampus khususnya panitia penyeleksi penerimaan beasiswa agar dapat menentukan
mahasiswa yang lolos dan berhak mendapatkan beasiswa kuliah dengan efesien dan
tepat sasaran.
3.2 Analisis Sistem
Analisis sistem ini bertujuan untuk mengetahui penyebab permasalahan yang
terjadi ketika seleksi mahasiswa yang berhak menerima beasiswa. Langkah ini dapat
dilakukan dengan mempelajari secara terperinci bagaimana sistem yang ada
beroperasi, dan untuk selanjutnya dilakukan identifikasi terhadap masalah yang
ditemukan.
Beberapa hal yang dilakukan untuk identifikasi terhadap masalah yang ada
sebagai berikut :
1. Mencari penyebab permasalahan
Ditemukan permasalahannya adalah kurang tepat sasaran dalam menetukan
ataupun menyeleksi mahasiswa yang berhak menerima beasiswa kuliah.
2. Mencari titik keputusan
Dimana pada bagian ini akan memberi solusi dari permasalahan yang terjadi.
Jika penyebab terjadinya masalah berhasil di identifikasi, maka langkah
selanjutnya akan diidentifikasi untuk mendapatkan titik keputusan penyebab masalah
tersebut.
3.3 Hasil Analisis
Sistem yang akan dibangun ditunjukkan kepada pihak kampus khususnya
bagian yang menangani seleksi calon penerima beasiswa kuliah, sehingga dapat
membantu serta mempermudah dalam proses seleksi calon penerima beasiswa.

Metode yang digunakan untuk seleksi calon penerima beasiswa adalah metode
Clustering K-Means karena Metode ini termasuk dalam teknik penyekatan (partition)
yang membagi atau memisahkan objek ke k daerah bagian yang terpisah. Pada KMeans, setiap objek harus masuk dalam kelompok tertentu, tetapi dalam satu tahapan
proses tertentu, objek yang sudah masuk dalam satu kelompok, pada satu tahapan
berikutnya objek akan berpindah ke kelompok lain. hasil cluster dengan dengan
metode K-Means sangat bergantung pada nilai pusat kelompok awal yang diberikan.
dimana metode ini diharapkan dapat meningkatkan kinerja sistem dan memberikan
solusi dalam pengelompokan mahasiswa yang berhak menerima beasiswa kuliah Di
Universitas Muhammadiyah Gresik.
Hasil analisis yang sudah dikumpulkan dari proses penelitian adalah
dihasilkannya beberapa keputusan antara lain perlunya sistem yang diguanakan dalam
penentuan serta pengelompokan mahasiswa yang berhak menerima beasiswa.
Pembuatan laporan yang diharapkan dapat membantu pihak kampus dalam
memberikan beasiswa kuliah agar tepat sasaran dan sesuai kriteria yang ditentukan.

3.4 Perancangan Sistem


Proses merupakan suatu rangkaian tindakan sistematis yang diarahkan untuk
mencapai suatu tujuan tertentu. Sebelum proses dijalankan perlu dilakukan suatu
perancangan terhadap proses. Perancangan
START proses mendefinisikan relasi antara
elemen-elemen struktural utama, pola yang digunakan untuk mencapai kebutuhan
yang ditentukan sistem dan batasan batasan yang mempengaruhi bagaimana desain
Pengumpulan Data

proses diterapkan. Desain ini dibuat berdasarkan spesifikasi sistem, model analisa
seperti yang dijelaskan dibawah ini :
Pemodelan
Data
3.4.1 Flowchart Perancangan
Sistem
Berikut ini adalah perancangan flowchart dari aplikasi sistem calon penerima
beasiswa kuliah :
Proses Clustering

Klasifikasi Hasil Clustering

Implementasi Sistem

Pengujian Clustering

FINISH

Gambar 3.1 Flowchart Perancangan Sistem


Keterangan :
Langkah pertama sebelum sistem dimulai yaitu terlebih dulu melakukan
pengumpulan data yang nantinya akan diolah serta digunakan dalam pada
pemodelan data dan selanjutnya akan dilakukan proses clustering
menggunakan metode k-means yang kemudian dapat diketahui hasil
klasifikasi clustering, setelah itu dilakukan tahap implementasi clustering pada
sistem dan barulah dilakukan pengujian clustering sampai dihsilkanya sebuah
hasil cluster yang telah terpenuhi dan sesuai kriteria.
3.4.2 Diagram Konteks
Hakekatnya sebuah sistem mempunyai keterkaitan dengan sejumlah entitas,
baik itu keterkaitan dengan entisitas luar sistem maupun keterkaitan dalam
sistem. hubungan antara entitas dengan sistem digambarkan dengan diagram
konteks. Diagram konteks pada Clustering Penerimaan Beasiswa Kuliah Di
Universitas Muhammadiyah Gresik Menggunakan Metode K-Means yang
digunakan untuk penyelesaian permasalahan yang ada yaitu untuk menentukan
adalah sebagai
berikut : Data Mahasiswa
Menampilkan
Menampilkan beasiswa
Data Mahasiswa
Data Mahasiswa yang mengikuti seleksi penerimaan Beasiswa
Data seleksi mahasiswa penerima beasiswa

Clustering Penerimaan Beasiswa Kuliah


User

Admin

Mengolah Data Mahasiswa


Melihat Data Mahasiswa
Menyeleksi
Data Mahasiswa yang lolos seleksi
Beasiswa Data Mahasiswa yang lolos mendapatkan Beasiswa

Gambar 3.2 Diagram Konteks


Keterangan diagram konteks aplikasi sistem secara otomatis yaitu :
entitas luar yang berhubungan pengaplikasian clustering penerimaan beasiswa
kuliah dengan metode K-Means sebagai

solusi memberi keputusan yang bisa

memberikan rekomendasi untuk menentukan pemberian beasiswa kuliah dengan baik


secara otomatis meliputi pihak kampus ataupun lembaga pemberi beasiswa
khususnya admin yang menangani seleksi pemberian beasiswa kuliah.
Sistem seluruhnya menerima inputan dari entitas admin berupa ipk, jumlah

tanggungan keluarga, dan penghasilan total orang tua (penghasilan ayah


ditambah penghasilan ibu) menjadi kriteria yang digunakan sebagai data yang
diolah dalam proses rekruitmen penentuan penerima beasiswa kuliah.
3.4.3 DFD (Data Flow Diagram)
3.4.4 Perancangan Database
Database yang digunakan dalam sistem ini dimodelkan dalam
relational database model. Database Management Sistem yang digunakan
adalah MySQL 5.0.11. Data data yang digunakan dalam proses clustering
penentuan penerima beasiswa disimpan dalam database, yang terdiri dari tabel
tb_admin, tb_mahasiswa, tb_dokumentasi, dan tb_login.
Adapun penjelasan mengenai tabel-tabel pada database adalah sebagai
berikut :
1. Tabel Admin
Nama Tabel : tb_admin
Keterangan : Tabel ini adalah tabel untuk menyimpan data user atau admin
yang terdaftar
Key
PK

Field
Type Data
Id_admin
Integer
Nama
Varchar
Alamat
Varchar
Jabatan
Varchar
Tabel 3.1 Tabel Admin

Size
11
50
50
30

2. Tabel Mahasiswa
Nama Tabel : tb_mhs
Keterangan : Tabel ini adalah tabel untuk menyimpan data mahasiswa
seleksi beasiswa kuliah.
Key
PK

Field

Type Data
Nim
Integer
Nama
Varchar
Alamat
Varchar
Semester
Integer
IPK
Integer
Jml_total_kel
Integer
Gaji_ortu
Double
Total_gaji
Double
Tabel 3.2 Tabel Mahasiswa

Size
11
50
50
11
11
11
20
20

3. Tabel Dokumentasi
Nama Tabel : tb_dokumentasi
Keterangan : Tabel ini adalah tabel untuk menyimpan data dokumentasi
mahasiswa yang lolos seleksi beasiswa kuliah.
Key
PK
FK

Field
Type Data
Id_dok
Integer
Nim
Integer
Nama
Varchar
Alamat
Varchar
Semester
Integer
IPK
Integer
Jml_total_kel
Integer
Gaji_ortu
Double
Total_gaji
Double
Jenis_beasiswa
Varchar
Tabel 3.3 Tabel Dokumentasi

Size
11
11
50
50
11
11
11
20
20
30

4. Tabel Login
Nama Tabel : tb_login
Keterangan : Tabel ini adalah tabel untuk menyimpan data admin yang
login.
Key
PK
FK

3.4.5 Design Interface

Field
Type
Id_login
Integer
Username
Varchar
Password
Varchar
Id_Admin
Integer
Tabel 3.4 Tabel Login

Size
11
30
30
11

Interfacae adalah bagian yang menghubungkan antara sistem dalam


clustering penentuan penerimaan beasiswa kuliah dengan menggunakan
metode K-Means dari admin untuk user. Interface yang digunakan dalam
sistem adalah dengan menggunakan source code yang dipakai menggunakan
PhpMysql. Halaman yang akan dibuat adalah sebagai berikut :
1. Form Login admin
Pada gambar 3. dibawah ini digunakan untuk akses login admin sebelum
masuk ke halaman utama disini hak akses yang bertanggung jawab penuh
adalah admin dengan mengisikan user dan password, sebagai berikut :
SELEKSI CALON PENERIMAAN BEASISWA UNIVERSITAS MUHAMMADIYAH GRESIK

Username :
Password :

Gambar 3. FormLogin
Login Admin

3.5 Skenario Pengujian


Untuk proses pengujian aplikasi dari sistem ini dimulai dengan analisis dan
perancangan sistem yang akan dibuat. Selanjutnya tahap implementasi sistem dengan
tujuan menghasilkan prototype program yang sesuai dengan hasil perancangan yang
telah ditentukan sebelumnya, yaitu penulisan kode program (coding) menggunakan
lingkungan bahasa pemrograman PHP. Data yang digunakan akan disimpan dalam
database. Debugging dilakukan untuk menguji aplikasi serta mencari error yang
masih terdapat pada program untuk diperbaiki.
Sistem penentuan penerima beasiswa ini akan mengelompokkan data dengan
kecenderungan cluster yang sama ke dalam satu cluster. Cluster center yang
dihasilkan oleh proses clustering digunakan sebagai variabel penentu klasifikasi.
Sistem ini tidak memberi keleluasaan bagi pengguna untuk menentukan jumlah
cluster dan penambahan kriteria yang digunakan dalam proses clustering. Dalam
kasus ini, jumlah cluster yang digunakan adalah tiga yaitu cluster yang
direkomendasikan menerima beaiswa, dipertimbangkan menerima beasiswa, dan

tidak menerima beasiswa. Jumlah cluster tiga didasarkan pada perhitungan validasi
cluster optimal.
Sedangkan kriteria pokok yang digunakan dalam proses clustering adalah dua
kriteria yaitu IPK dan PO (penghasilan orangtua). Penentuan cluster mana yang
direkomendasikan menerima beasiswa didasarkan pada kriteria mana yang lebih
diprioritaskan, dan keputusan mahasiswa penerima beasiswa sepenuhnya berada
ditangan pengambil keputusan. Implementasi sistem menggunakan metode metode KMeans Clustering menghasilkan prototype sistem.
3.6 Gambaran Umum Sistem
Sistem penentuan penerima beasiswa merupakan sistem berbasis web yang
diharapkan dapat membantu mendukung keputusan untuk menetukan siapa saja
mahasiswa yang berhak untuk menerima beasiswa. Dalam sistem ini data mahasiswa
akan diolah menjadi beberapa kelompok data dengan metode K-Means Clustering.
Dari kelompok-kelompok tersebut kemudian diklasifikan menjadi kelompok yang
direkomendasikan menerima, dipertimbangkan menerima, dan tidak menerima
beasiswa. Selama ini, penentuan penerima beasiswa dilakukan dengan cara manual
dan seringkali menimbulkan beberapa permasalahan, antara lain membutuhkan waktu
yang lama dan ketelitian yang tinggi karena data mahasiswa akan dibandingkan
dengan kriteria beasiswa satu persatu.
Sistem penentuan penerima beasiswa ini dibangun dengan menggunakan
bahasa pemrograman PHP dan dilengkapi basis data MySql. Sebelum diolah dengan
metode K-means Clustering, data input disimpan ke sebuah database. Kemudian data
akan diolah oleh sistem dan hasilnya akan disimpan ke dalam database dan
ditampilkan pada user interface.

DAFTAR PUSTAKA

http://globallavebookx.blogspot.co.id/2015/01/pengertian-definisi-dan-fungsidata.html (diakses pada tanggal 22 mei 2016)


https://pobersonaibaho.wordpress.com/2011/05/15/definisi-data-mining-tugas-utamadata-mining-proses-dan-cara-kerja-data-miningmetodologi-data-mining/(diakses
pada tanggal 22 mei 2016)
http://ariplie.blogspot.co.id/2015/04/pengertian-dan-tahap-tahap-data-mining.html
(diakses pada tanggal 22 mei 2016)
https://ellymunig.wordpress.com/2014/03/24/metode-data-mining/

(diakses

pada

tanggal 22 mei 2016)


http://gorbyrashid.blogspot.co.id/2010/06/data-mining.html (diakses pada tanggal 22
mei 2016)

Anda mungkin juga menyukai