Skripsi Yang Tergabung CX

ANALISIS DATA MAHASISWA UNTUK MENDUKUNG
STRATEGI PROMOSI PADA UNIVERSITAS MEDAN AREA

MENGGUNAKAN K-MEANS CLUSTERING
TUGAS AKHIR
Oleh
Muhammad Rishakim Marajari
71160915020
PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS TEKNIK
UNIVERSITAS ISLAM SUMATERA UTARA
2020
7
KATA PENGANTAR
Assalammualaikum Wr. Wb
Alhamdulillah, segala puji dan syukur saya panjatkan kepada Allah SWT,
yang telah memberikan Rahmat dan Hidayah-Nya kepada saya sehingga dapat
menyelesaikan Skripsi ini dengan judul “ANALISIS DATA MAHASISWA
UNTUK MENDUKUNGNG STRATEGI PROMOSI PADA UNIVERSITAS
MEDAN AREA MENGGUNAKAN K-MEANS CLUSTERING”.Tidak lupa
shalawat beriring salam saya hadiahkan kepada Nabi Besar Muhammad SAW
yang telah membawa kita dari alam kegelapan menuju alam yang terang
benderang seperti sekarang ini.
Skripsi ini ditujukan untuk memenuhi salah satu syarat kelulusan Program
Sarjana di Jurusan Teknik Informatika Fakultas Teknik Universitas Islam
Sumatera Utara. Hal tersebut tentunya tidak terlepas dari bantuan dosen
pembimbing tugas akhir. Dalam penyelesaian penulisan skripsi ini, penulis
banyak mendapatkan bimbingan dan bantuan dari pihak lain berupa materil,
spiritual, dan informasi secara langsung maupun tidak langsung.
Pada kesempatan ini penulis mengucapkan terima kasih yang sebesar
besarnya kepada :
1. Bapak Abdul Haris Nasution, selaku Dekan Fakultas Teknik Universitas
Islam Sumatera Utara.
8
2. Bapak Mhd. Zulfansyuri Siambaton, ST.,M.Kom, selaku Plt. Ketua Jurusan
S1 Teknik Informatika UISU.
3. Bapak Mhd. Zulfansyuri Siambaton, ST.,M.Kom, selaku Dosen Penasehat
Akademik 2016 Jurusan Teknik Informatika UISU.
4. Bapak Khairuddin Nasution, ST,M.Kom selaku Dosen Pembimbing 1(satu)
Saya,yang telah Membantu Menyelesaikan Skripsi ini.
5. Ibu Tasliyah Haramaini,S.Si.,M.Kom Selaku Dosen Pembimbing 2(dua)
yang telah Membantu Menyelesaikan skripsi ini
6. Seluruh staf pengajar di Jurusan Teknik Informatika UISU.
7. Kedua orang tua tercinta: Alm IR.Ibrahim dan Tuti Indrawati , serta seluruh
keluarga yang telah memberikan do’a restu dan dorongan kepada penulis
dalam menyelesaikan skripsi ini.
8. Seluruh teman-teman di Jurusan Teknik Informatika UISU yang senantiasa
mensupport dan memberikan masukan dalam penyelesaian tugas akhir ini.
9. Semua pihak yang tidak dapat disebutkan satu persatu.
Penulis menyadari sepenuhnya, bahwa skripsi ini masih terdapat banyak
kekurangan yang perlu diperbaiki, baik dari segi penyajian, bentuk maupun isi.
Dengan kerendahan hati penulis sangat mengharapkan kritik dan saran dari semua
pihak yang sifatnya membangun demi kesempurnaan skripsi ini.
9
Akhirul kalam kepada Allah SWT penulis berserah diri, karena hanya
pada-Nyalah segala kesempurnaan berada. Akhir kata penulis berharap semoga
Skripsi ini dapat berguna bagi semua pihak yang membacanya, amin.
Penulis
Muhammad Rishakim Marajari
10
DAFTAR ISI
Halaman
KATA PENGANTAR ............................................................... I
DAFTAR ISI ........................................................................... IV
DAFTAR GAMBAR ................................................................. VII
DAFTAR TABEL .................................................................... VIII
DAFTAR PUSTAKA.................................................................. IX
DAFTAR LAMPIRAN ..............................................................
ABSTRAK...................................................................................
BAB I PENDAHULUAN
1.1 Latar Belakang...............................................................................1
1.2 Rumusan Masalah........................................................................3
1.3 Manfaat Masalah..........................................................................3
1.4 Tujuan Penelitian ..........................................................................4
1.5 Batasan Masalah............................................................................5
1.6 Metode Penelitian ........................................................................5
1.7 Sistematika Penulisan ...................................................................6
BAB II TINJAUAN PUSTAKA

2.1 Data Mining................................................................................... 9
2.1.1 Teknik-Teknik Data Mining.................................................11
2.1.2 Tahapan Proses Data Mining................................................14
2.2 K-Means Clustering ......................................................................14
2.3 Unified Modeling Language(UML) .............................................17
2.3.1 Use Case...............................................................................18
2.3.2 Activity Diagram..................................................................20
2.3.3 Class Diagram......................................................................21
2.4 Flowchart........................................................................................23
11
2.5 XAMPP..........................................................................................25
2.6 PHP.................................................................................................26
2.7 MySQL……………………………………………………………28
2.7.1 Sejarah Universitas Medan Area……………………………30
2.7.2 Struktur Organisasi Universitas Medan Area……………….32
BAB III METODE PENELITIAN

3.1 Analisis Permasalah....................................................................... 32
3.2 Penerapan Metode K-Means Clustering........................................ 36
3.2.1 Transfromasi Data................................................................ 36
3.2.2 Pengolahan Data Dengan K-Means Clustering……………36
3.3 Rancangan Flowchart..................................................................... 53
3.4 Pemodelan/Perancangan Sistem…………………………………..54
3.4.1 Unifield Modeling Languange(UML)......................................... 54
3.4.1.1 Use Case Diagram........................................................... 54
3.4.1.2 Activity Diagram ............................................................ 57
3.4.1.3 Class Diagram................................................................. 57
3.4.2 Desain Database.......................................................................... 60
3.4.2.1 Desain Tabel……………………………………………..60
3.4.3 Perancangan Antar Muka………………………………….62
BAB IV HASIL DAN PEMBAHASAN
4.1 Kebutuhan Sistem..........................................................................67

4.2 Implementasi Sistem ..............................................................67
4.2.1 Login .....................................................................................68
4.2.2 Menu Utama..........................................................................68
4.2.3 Form Mahasiswa...................................................................69
4.2.4 Form Titik Cluster................................................................70
4.3 Pengujian Sistem ..........................................................................71
12
4.3.1 Form Proses Clustering……………………………………….71
4.3.2 Laporan Hasil Clustering……………………………………...73
4.4 Kelemahan dan Kelebihan Sistem..................................................74
BAB V KESIMPULAN DAN SARAN

5.1 Kesimpulan ...................................................................................76
5.2 Saran..............................................................................................76
DAFTAR PUSTAKA
LAMPIR
13
DAFTAR GAMBAR
HALAMAN
Gambar 2.1 Tampilan XAMPP .........................................................26

Gambar 2.2 Struktur Organisasi Medan Area....................................32
Gambar 3.1 FlowChart Metode K-Means Clustering........................53
Gambar 3.2 Use Case Diagram .........................................................55
Gambar 3.3 Activity Diagram Program K-Means Clustering...........58
Gambar 3.4 Class Diagram ...............................................................59
Gambar 3.5 Rancangan Form Login..................................................53
Gambar 3.6 Rancangan Menu Utama................................................54
Gambar 3.7 Rancangan Halaman Mahasiswa...................................63
Gambar 3.8 Rancangan Halaman Titik Cluster.................................64
Gambar 3.9 Rancangan Halaman Clustering.....................................65
Gambar 3.10 Rancangan Laporan Hasil Clustering...........................66
Gambar 4.1 Form Login....................................................................68
Gambar 4.2 Tampilan Form Menu Utama.........................................69
Gambar 4.3 Tampilan Form Input Data Mahasiswa..........................69
Gambar 4.4 Tampilan Form Titik Cluster ........................................70
Gambar 4.5 Tampilan Form Proses Titik Cluster...............................71
Gambar 4.6 Tampilan Form Clustering (Cluster 1)...........................72
Gambar 4.7 Tampilan Form Clustering (Cluster 2)............................72
Gambar 4.8 Tampilan Form Clustering (Cluster 3)...........................72
Gambar 4.9 Tampilan Preview Laporan Hasil Clustering.................73
Gambar 4.10 Tampilan Preview Laporan Hasil Clustering (2).........74
DAFTAR TABEL
HALAMAN
Tabel 2.1 Simbol-Simbol Use Case Diagram.....................................18

Tabel 2.2 Simbol Activity Diagram....................................................20
Tabel 2.3 Simbol Class Diagram........................................................22
Tabel 2.4 Simbol-Simbol Flowchart...................................................27
Tabel 3.1 Data Riset Mahasiswa.........................................................34
Tabel 3.2 Inisialisasi Data Jenis Kelamin Mahasiswa........................36
Tabel 3.3 Inisialisasi Data Kota Asal..................................................37
Tabel 3.4 Inisialisasi Data Prodi.........................................................38
Tabel 3.5 Hasil Inisialisasi Seluruh Data Mahasiswa.........................38
Tabel 3.6 Titik Pusat Awal Setiap Cluster..........................................40
Tabel 3.7 Inisialisasi Titik Pusat Awal Setiap Cluster.........................40
Tabel 3.8 Hasil Perhitungan Setiap Data Ke Pusat Cluster................42
Tabel 3.9 Anggota Cluster 1...............................................................44
Tabel 3.10 Anggota Cluster 2 .............................................................45
Tabel 3.11 Anggota Cluster 3..............................................................46
Tabel 3.12 Titik Pusat Cluster Pada Iterasi 2.......................................46
Tabel 3.13 Hasil Perhitungan Setiap Data Pusat Pada Iterasi 2...........48
Tabel 3.14 Anggota Cluster 1 Hasil Iterasi 2.......................................50
Tabel 3.17 Login..................................................................................60
Tabel 3.18 Data Mahasiswa.................................................................60
Tabel 3.19 Tabel Proses Clustering.....................................................61
BAB I
PENDAHULUAN
1.1 Latar Belakang
Kemajuan teknologi informasi sudah semakin berkembang
pesat disegala bidang kehidupan. Banyak sekali data yang
dihasilkan oleh teknologi informasi yang canggih, mulai dari bidang
industri, ekonomi, ilmu dan teknologi serta berbagai bidang
kehidupan lainnya. Penerapan teknologi informasi dalam dunia
pendidikan juga dapat menghasilkan data yang berlimpah mengenai
siswa dan proses pembelajaran yang dihasilkan.
Pada institusi pendidikan perguruan tinggi, data dapat
diperoleh berdasarkan data historis, sehingga data akan bertambah
secara terus menerus, misalnya data mahasiswa. Proses
penerimaan mahasiswa baru dalam sebuah perguruan tinggi
menghasilkan data yang berlimpah berupa profil dari mahasiswa

baru tersebut. Tahap selanjutnya mahasiswa akan melakukan
kegiatan belajar mengajar, sehingga dapat diketahui data prestasi
mereka setiap akhir semester. Hal ini akan terjadi secara berulang
pada sebuah perguruan tinggi. Penumpukan data mahasiswa
secara menerus akan memperlambat pencarian informasi terhadap
data tersebut.
Berdasarkan berlimpahnya data mahasiswa, informasi yang
tersembunyi dapat diketahui dengan cara melakukan pengolahan
terhadap data tersebut sehingga berguna bagi pihak universitas.
Pengolahan data mahasiswa perlu dilakukan untuk mengetahui
informasi penting berupa pengetahuan baru (knowledge discovery),
misalnya informasi mengenai pengelompokan data mahasiswa
berpotensi berdasarkan kota asal mahasiswa. Pengetahuan baru
tersebut dapat membantu pihak universitas dalam menentukan
strategi promosi terhadap calon mahasiswa baru dengan tepat
sasaran.
Salah satu langkah yang dapat dilakukan untuk meningkatkan
jumlah mahasiswa baru adalah dengan memanfaatkan data
mahasiswa diintegrasikan dengan teknik data mining sehingga
menghasilkan kesimpulan. Kesimpulan tersebut dapat digunakan
untuk pengambilan keputusan dalam menentukan wilayah promosi
yang tepat sasaran. Pengolahan data mahasiswa seharusnya
dilakukan agar dapat menentukan wilayah promosi yang tepat
sasaran sehingga dapat meningkatkan jumlah mahasiswa pada
tahun berikutnya.
Penelitian ini akan melakukan pengelompokan menggunakan
teknik Data Mining, berdasarkan pada data mahasiswa Universitas
Medan Area. Data mining didefinisikan sebagai proses menemukan pola dalam
data. Proses ini harus otomatis atau biasanya secara semi-otomatis. Pola yang
dihasilkan harus berarti bahwa pola tersebut memberikan beberapa keuntungan.
Pola tersebut diidentifikasi, divalidasi, dan digunakan untuk membuat sebuah
prediksi.
Data mining memiliki berbagai macam teknik analisa,
diantaranya adalah teknik Clustering. Clustering merupakan data

mentah yang sangat besar sulit untuk dianalisis dan dipahami, oleh
karena itu perlu adanya pengelompokan/clustering. Dalam hal ini
pengelompokan bertujuan untuk meningkatkan pemahaman terhadap
data, untuk menilai kualitas dari data tersebut (Yahya, 2019).
K-Means adalah salah satu algoritma dalam data mining yang bisa
digunakan untuk melakukan pengelompokan/clustering suatu data. Ada banyak
pendekatan untuk membuat cluster, diantaranya adalah membuat aturan yang
mendikte keanggotaan dalam group yang sama berdasarkan tingkat persamaan
diantara anggota-anggotanya (Windha Mega, 2015).
Algoritma K-Means merupakan metode non-hierarchial yang pada awalnya
mengambil sebagian dari banyaknya komponen dari populasi untuk dijadikan
pusat cluster awal. Pada step ini pusat cluster dipilih secara acak dari sekumpulan
populasi data. Berikutnya K-Means menguji masing-masing komponen di dalam
populasi data dan menandai komponen tersebut ke salah satu pusat cluster yang
telah didefinisikan tergantung dari jarak minimum antar komponen dengan tiap-
tiap pusat cluster (Silvi Agustina, 2016).
Adapun atribut/variabel yang akan digunakan dalam penentuan
pengelompokan wilayah untuk menentukan strategi promosi pada
Universitas Medan Area adalah program studi mahasiswa, kota asal
mahasiswa dan jenis kelamin.

Hal-hal tersebut yang mendorong untuk melakukan penelitian ini dengan
judul “Analisis Data Mahasiswa Untuk Mendukung Strategi Promosi Pada
Universitas Medan Area Menggunakan K-Means Clustering”, diharapkan
dengan dibuatnya skripsi ini dapat berguna untuk meningkatkan ketepatan
promosi terhadap calon mahasiswa baru.
1.2 Rumusan Masalah
Dengan mengacu pada uraian latar belakang masalah diatas, maka
permasalahan yang dibahas dan diteliti yaitu :
1. Bagaimana penerapan algoritma K-Means menganalisis data mahasiswa dalam
proses Data Mining untuk menentukan strategi promosi pada Universitas
Medan Area?
2. Bagaimana mengimplementasikan data mining dengan menggunakan bahasa
pemrograman berbasis website untuk mendukung strategi promosi pada
Universitas Medan Area?
1.3 Manfaat Penelitian
Adapun manfaat yang bisa didapat dari penulisan penelitian ini adalah:
1. Mempermudah pengelompokan data mahasiswa dengan menggunakan
algoritma K-Means.
2. Memberikan data dan informasi secara cepat mengenai pengelompokan data
mahasiswa baru.
3. Mempermudah pihak universitas dalam menentukan strategi promosi untuk
meningkatkan jumlah mahasiswa baru

1.4 Tujuan Penelitian
Adapun beberapa tujuan dari penelitian ini adalah :
1. Untuk menerapkan algoritma K-Means menganalisis data mahasiswa dalam
proses Data Mining untuk menentukan strategi promosi pada Universitas
Medan Area.
2. Untuk mengimplementasikan data mining dengan menggunakan bahasa
pemrograman berbasis website untuk mendukung strategi promosi pada
Universitas Medan Area.
1.5 Batasan Masalah
Untuk menghindari pembahasan yang meluas, maka ada beberapa batasan
permasalahan yaitu :
1. Proses clustering dengan algoritma K-Means akan diterapkan pada data
mahasiswa Universitas Medan Area.
2. Data mahasiswa yang dianalisis adalah data mahasiswa yang masuk pada
periode tahun 2019.
3. Sampel data yang digunakan sebanyak 50 data mahasiswa dari berbagai
jurusan.
4. Aplikasi yang dibangun berbasis website dengan PHP dan database MySQL.
1.6 Metode Penelitian.
Pada penelitian ini peneliti menggunakan pendekatan R&D (Research and
Developement), maka berikut ini adalah metode penelitiannya yaitu sebagai
berikut:
1. Teknik Pengumpulan Data (Data Collecting)
Adapun beberapa teknik yang digunakan dalam pengumpulan data dari
penelitian yaitu:
a. Observasi
Observasi merupakan teknik pengumpulan data dengan melakukan
tinjauan langsung ke tempat studi kasus dimana akan dilakukan
penelitian. Dalam hal ini peneliti melakukan observasi ke Universitas
Medan Area.
b. Wawancara
Teknik wawancara ini dilakukan untuk mendapatkan informasi tambahan
dari Universitas Medan Area yang memiliki wewenang dan berinteraksi
langsung dengan sistem yang akan dirancang sebagai sumber data.
2. Studi Kepustakaan (Library Research)
Studi Kepustakaan merupakan salah satu elemen yang mendukung sebagai
landasan teoritis peneliti untuk mengkaji masalah yang dibahas. Dalam hal
ini, peneliti menggunakan beberapa sumber kepustakaan diantaranya: buku,
jurnal nasional, jurnal internasional dan sumber-sumber lainnya.
3. Teknik Perancangan Sistem (Design System)
Sesuai dengan rumusan masalah yang menggunakan pendekatan Classic or
Waterfall Algorithm maka berikut ini adalah teknik perancangan sistem yang
digunakan:
a. Analisis Masalah dan Kebutuhan
b. Perancangan Sistem dan Pemodelan

c. Pengkodean
d. Pengujian
e. Implementasi Sistem
1.7 Sistematika Penulisan
Agar penelitian ini tersusun dengan mudah dan dapat dimengerti dengan
baik maka penyusunan penelitian ini ada 5 (lima) bab, dengan sistematika
penulisan sebagai berikut :
BAB I PENDAHULUAN
Pada bab pendahuluan menguraikan tentang latar belakang masalah,
rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode
penelitian, dan sistematika penulisan.
BAB II TINJAUAN PUSTAKA
Bab ini membahas dasar teori tentang, data mining, teknik-teknik data
mining, algoritma K-Means Clustering, pemodelan sistem, flowchart, aplikasi-
aplikasi yang digunakan dan teori-teori yang mendukung pengembangan sistem
serta analisa perancangan sistem yang digunakan.
BAB III METODE PENELITIAN
Bab ini berisi tentang menganalisan dan mendefinisikan masalah dan
solusinya untuk pembentukan sistem terkomputerisasi.

BAB IV HASIL DAN PEMBAHASAN
Bab ini membahas implementasi dari sistem yaitu hasil rancangan aplikasi
Data Mining disertai cara kerja dan penggunaanya. Adapun pengujian-pengujian
aplikasi dilakukan untuk mengetahui kekurangan yang terdapat pada perangkat
lunak. Analisa dilakukan untuk memperbaiki aplikasi apabila terdapat kesalahan
atau kekurangan pada program yang diperoleh.
BAB V KESIMPULAN DAN SARAN
Bab ini berisi kesimpulan yaitu merupakan jawaban dari permasalahan
penelitian ini sedangkan untuk saran adalah pengembangan dan perbaikan serta
penyempurnaan terhadap program aplikasi yang telah dibuat untuk meningkatkan
kualitas algoritma K-Means Clustering

BAB II
TINJAUAN PUSTAKA
2.1 Data Mining
Data adalah kumpulan informasi yang digunakan dalam proses pengambilan
kesimpulan maupun pengambilan keputusan. Data merupakan bentuk jamak dari
bentuk tunggal datum atau data-item. Data adalah kenyataan yang menggambarkan
suatu kejadian dan kesatuan nyata (Eka Iswandy, 2016).
Data Mining merupakan suatu proses untuk mendapatkan informasi baru dari
kumpulan data dengan menggunakan algoritma dan teknik yang melibatkan bidang ilmu
statistik, mesin pembelajaran dan sistem manajemen database. Data Mining digunakan
untuk ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Dengan
adanya Data Mining maka akan didapatkan suatu permata berupa pengetahuan di
dalam kumpulan data yang banyak jumlahnya.
Banyak istilah yang digunakan untuk menunjukkan proses Data Mining. Untuk
dapat memberikan pemahaman tentang Data Mining, berikut ini adalah beberapa fakta
yang terjadi seperti banyaknya organisasi, baik dari dunia bisnis maupun pemerintah
berurusan dengan sejumlah informasi dan juga pengelolaan basis data informasi
tersebut dan bukan tidak mungkin termasuk didalamnya kebutuhan akan pembangunan
Data Warehouse dalam skala besar. Seringkali data yang tersimpan tidak dapat secara
langsung dianalisa dengan metode statistik standar, hal ini disebabkan karena adanya
beberapa record yang hilang ataupun karena datanya dalam dimensi ukuran kualitatif
bukan kuantitatif.
Data mining merupakan sebuah proses ekstraksi data menjadi informasi atau
pengetahuan yang baru. Data yang diolah sebelumnya merupakan data yang bersifat
implisit dan biasanya dianggap tidak berguna serta data dalam jumlah besar (Robi Yanto,
2017).
Terdapat empat tugas utama data mining yaitu sebagai berikut :
1. Predictive Modelling
Predictive modelling digunakan untuk membangun sebuah model untuk target
variable sebagai fungsi dari explanatory variable. Explanatory variable dalam hal ini
merupakan semua atribut yang digunakan untuk melakukan prediksi, sedangkan
variabel target merupakan atribut yang akan diprediksi nilainya. Predictive modelling
dibagi menjadi dua tipe yaitu : Classification digunakan untuk memprediksi nilai dari
target variable yang discrete (diskrit) dan regression digunakan untuk memprediksi
nilai dari target variable yang continue (berkelanjutan).
2. Association Analysis
Association analysis digunakan untuk menemukan aturan asosiasi yang
memperlihatkan kondisi-kondisi nilai atribut yang sering muncul secara bersamaan
dalam sebuah himpunan data.
3. Cluster Analysis
Tidak seperti klasifikasi yang menganalisa kelas data obyek yang mengandung label.
Clustering menganalisa objek data tanpa memeriksa kelas label yang diketahui. Label-
label kelas dilibatkan di dalam data training. Karena belum diketahui sebelumnya.
Clustering merupakan proses pengelompokkan sekumpulan objek yang sangat mirip.
4. Anomaly Detection
Anomaly detection merupakan metode pendeteksian suatu data dimana tujuannya
adalah menemukan objek yang berbeda dari sebagian besar objek lain. Anomaly
dapat dideteksi dengan menggunakan uji statistik yang menerapkan model distribusi
atau probabilitas untuk data.
2.1.1 Teknik-Teknik Data Mining
Data Mining merupakan ilmu baru yang berakar dari berbagai bidang ilmu
seperti kecerdasan buatan (Artificial Intelligence), mesin learning, statistik dan database.
Oleh karena itu dalam menggali informasi, Data Mining menggunakan beberapa teknik,
antara lain :
1.Association Discovery
Association Discovery adalah teknik mempelajari sekumpulan data dan untuk
menunjukkan hubungan antara kemunculan atribut-atribut dalam data. Teknik ini
mencoba untuk menyiapkan nilai-nilai yang muncul pada saat bersamaan dalam
setiap barisnya dan menampilkan hasil keluaran yang disimpulkan dalam sebuah rule.
2.Clustering
Clustering adalah proses pengumpulan data yang serumpun dari sebuah dataset yang
lebih besar. Teknik ini menyingkapkan sejumlah kelompok-kelompok yang digunakan
sebagai masukan datanya. Dengan Clustering kelompok minoritas yang tersebar
dikelompokkan dalam sebuah kelompok besar yang memiliki kemiripan entitas.

Clustering dapat juga digunakan untuk mendeteksi secara otomatis cluster dari
record-record yang berdekatan dengan pengertian tertentu di dalam keseluruhan
variabel-variabel.
3.Sequential Discovery
Sequential Discovery adalah teknik mencari pola-pola diantara peristiwa-peristiwa
yang muncul dalam periode waktu. Metode ini dapat digunakan untuk mencari pola
komoditas yang terjadi berulang kali. Teknik ini terkonsentrasi pada kebiasaan yang
sama yang sering muncul dikemudian hari. Menurut laporan tersebut diungkapkan
bahwa algoritma yang dipakai memiliki kriteria sebagai berikut :
a. One Scan : algoritma ini membutuhkan paling sedikit satu kali penelusuran basis
data untuk membuat cluster yang diinginkan.
b. Anytime Algorithm : algoritma ini selalu dapat menyediakan jawaban yang terbaik
setiap saat selama komputasi dijalankan.
c. Interruptable and Incremental : algoritma ini dapat ditunda, dapat dihentikan dan
dijalankan lagi, dan hasil sementara yang muncul dapat disimpan untuk
kelanjutan komputasi data baru lebih lanjut.
d. Limitted RAM Requirement : algoritma ini mampu bekerja dalam kondisi memori
yang terbatas.
e. Forward-only Cursor : algoritma ini mampu untuk beroperasi pada basis data
dengan kursor (proses) bergerak maju hingga akhir data.
4.Classification
Classification adalah proses pengumpulan data bersama-sama yang didasarkan atas
sekumpulan kesamaan yang awalnya telah ditentukan oleh seorang analis sebelum
analisa dimulai. Teknik ini memeriksa data yang telah diklasifikasikan dan
dikumpulkan dalam grup bersama-sama sesuai dengan aturan keanggotaannya.
Aturan keanggotaan bisa mempunyai komponen waktu, komponen geografis,
komponen kuantitatif. Proses klasifikasi ini dapat dibagi menjadi tiga fase :
a. Learning : algoritma yang mencari sejumlah record dari training set dan
menciptakan sebuah deskripsi tentang model klasifikasi. Model ini dibuat kecil
dan persis pada saat yang sama.
b. Model yang sudah dibuat harus diuji dengan serangkaian uji coba dalam sebuah
basis data. Sebagai training set, record-record uji coba harus merupakan
kumpulan yang sudah lebih dahulu diklasifikasikan. Record untuk uji coba harus
berbeda dengan training set. Model classification akan selalu bekerja dengan
sempurna dalam training set yang digunakan.
c. Classification, model iterasi yang digunakan untuk membuat klasifikasi pada sisa
record-record dalam basis data yang ada.
5.Neural Network
Neural Network merupakan sebuah metode khusus untuk pengendalian
identifikasi pola yang digunakan pada trend perkiraan berdasarkan kebiasaan yang
telah diketahui sebelumnya. Suatu trend atau kecenderungan dapat diidentifikasikan
sebagai pergerakan yang ditujukan berdasarkan pada kebiasaan yang lama. Inti dari
pemrosesan didasarkan pada pengolahan data yang meniru dari fungsi sistem saraf
tubuh manusia. Pengetahuan dapat dipelajari dari suatu kumpulan data yang
terpisah dan kompleks. Ada tiga lapisan (layers) pada network, lapisan kiri yang
menerima masukan (input), lapisan tersembunyi (hidden layer neurons) yang
menjalankan fungsi kerja pemrosesan datanya, dan lapisan kanan yang menampilkan
analisa hasil keluaran. Ketika network dilatih (trained) dengan informasi yang
dimasukkan melalui masukan (input) akan diproses oleh lapisan tengah (neurons)
yang menjadikannya cerdas dalam sejumlah elemen data yang ada dan
mengeluarkan hasil pada lapisan keluarnya.
2.1.2 Tahapan Proses Data Mining
Data mining serangkaian proses seperti yang dijelaskan sebagai berikut:
1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise).
2. Integrasi data (penggabungan data dari beberapa sumber)
3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk ditambang)
4. Aplikasi teknik data mining, proses ekstraksi pola dari data yang ada
5. Evaluasi pola yang ditemukan (proses interpretasi pola menjadi pengetahuan yang
dapat digunakan untuk mendukung pengambilan keputusan).
6. Presentasi pengetahuan (dengan teknik visualisasi).
2.2 K-Means Clustering
K-Means adalah salah satu algoritma dalam clustering yang berulang-ulang.
Algoritma K-Means dimulai dengan memilih secara acak K, K di sini merupakan
banyaknya cluster yang ingin dibentuk. Kemudian menetapkan nilai K secara random,
untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan
centroid, mean atau “means”.
Clustering adalah studi formal untuk partisi atau mengelompokkan data dengan
tidak menggunakan pelabelan kategori. Clustering bersifat unsupervised learning atau
tidak mempunyai tahap pelatihan data, berbeda dengan klasifikasi. Clustering digunakan
untuk mengelompokkan data secara alamiah berdasarkan kemiripan pada objek data
dan sebaliknya meminimalkan kemiripan terhadap cluster lain (Beta Estri, 2018).
Menggunakan pendekatan partitional clustering. Tiap cluster dihubungkan dengan
sebuah centroid (titik pusat). Tiap titik ditempatkan ke dalam cluster dengan centroid
terdekat. Jumlah cluster, K, harus ditentukan. Berikut adalah langkah-langkah algoritma
K-Means (Sulistyowati, 2018) :
1. Pilih jumlah cluster k
2. Inisialisasi k pusat cluster bisa dilakukan dengan berbagai cara. Cara yang sering
dilakukan adalah dengan cara acak. Pusat-pusat cluster diberi nilai awal dengan
angka-angka random
3. Alokasikan semua data/objek ke cluster terdekat. Kedekatan dua objek ditentukan
berdasarkan jarak kedua objek tersebut. Demikian juga kedekatan suatu data ke
cluster tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini
perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak antara satu data dengan
satu cluster tertentu akan menentukan suatu data masuk dalam cluster mana. Untuk
menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori
jarak Euclidean.
4. Hitung kembali pusat cluster dengan keanggotaan cluster yang sekarang. Pusat
cluster adalah rata-rata dari semua data/objek dalam cluster tertentu. Jika
dikehendaki bisa juga menggunakan median (nilai tengah) dari cluster tersebut. Jadi
rata-rata (mean) bukan satu-satunya ukuran yang bisa dipakai.
5. Tugaskan lagi setiap objek memakai pusat cluster yang baru. Jika pusat cluster tidak
berubah lagi maka proses clustering selesai. Jika pusat cluster berubah maka kembali
ke langkah nomor 3 lagi.

Pada langkah 3 lokasi centroid (titik pusat) setiap kelompok yang diambil dari rata-
rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M
menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke-i dalam sebuah
kelompok, dan p menyatakan dimensi data, untuk menghitung sentroid fitur ke-i
digunakan formula :
M
1
Ci = ∑x
M j =1 j
……………………………………………. (2.1)
Formula tersebut dilakukan sebanyak p dimensi sehingga i mulai dari 1 sampai p.
Ada beberapa cara yang dapat digunakan untuk mengukur jarak data ke pusat
kelompok, diantaranya Euclidean, Manhattan/City Block serta Minkowsky. Masing-
masing cara mempunyai kelebihan dan kekurangan.
Pengukuran jarak pada ruang jarak (distance space) Euclidean menggunakan
formula
p
D(x2,x1) = ||x2 – x1||2 = √∑j=1
¿ x 2 j−x 1 j∨¿ ¿ 2 ………………... (2.2)
D adalah jarak antara data x2 dan x1, dan | . | adalah nilai mutlak. Pengukuran jarak
pada ruang jarak Manhattan menggunakan formula
p
D(x2,x1) = ||x2 – x1||1 = ∑ ¿ x 2 j −x1 j∨¿ ¿ ……………….......… (2.3)
j=1
Pengukuran jarak pada ruang jarak Minkowsky menggunakan formula
p
D(x2,x1) = ||x2 – x1||λ = √∑
λ
j=1
¿ x 2 j−x 1 j∨¿ ¿ λ ……………..… (2.4)
λ adalah parameter Minkowsky. Secara umum, λ merupakan parameter penentu
dalam karakteristik jarak. Jika λ=1, ruang jarak pada Minkowsky sama dengan
Manhattan. Jika λ=2, ruang jaraknya akan sama dengan Euclidean; jika λ=∞, ruang
jaraknya akan sama dengan ruang jarak Chebyshev. Namun demikian, cara yang paling
banyak digunakan adalah Euclidean dan Manhattan. Euclidean menjadi pilihan jika kita
ingin memberikan jarak terpendek antara dua titik (jarak lurus), sedangkan Manhattan
memberikan jarak terjauh pada dua data. Manhattan juga sering digunakan karena
kemampuannya dalam mendeteksi keadaan khusus, seperti keberadaan outlier, dengan
lebih baik.
2.3 Unified Modeling Language (UML)
Untuk memberikan pemahaman secara jelas terhadap sistem yang akan
dirancang, maka dapat digunakan Unified Modeling Language (UML). Dalam Unified
Modeling Language (UML) ini akan terlihat dengan jelas aktifitas yang terjadi pada
proses pembentukan aplikasinya dari awal hingga akhir.
Unified Modeling Language (UML) adalah keluarga notasi grafis yang didukung
oleh meta-model tunggal, yang membantu pendekskripsian dan desain sistem perangkat
lunak, khususnya sistem yang dibangun menggunakan pemrograman berorientasi objek
(Tofik Isa, 2017).
Unified Modeling Language (UML) merupakan bahasa standar yang digunakan
untuk mendokumentasikan, menspesifikasikan dan membanngun perangkat lunak. UML
merupakan metodologi dalam mengembangkan sistem berorientasi objek dan
merupakan alat untuk mendukung pengembangan sistem.

2.3.1 Use Case Diagram
Use case diagram merupakan pemodelan untuk kelakuan (behavior) sistem
informasi yang akan dibuat. Use case mendeskripsikan sebuah interaksi antara satu atau
lebih aktor dengan sistem informasi yang akan dibuat. Secara kasar, use case digunakan
untuk mengetahui fungsi apa saja yang ada di dalam sebuah sistem dan siapa saja yang
berhak menggunakan fungsi-fungsi tersebut (Yunahar Heriyanto, 2018).
Use case diagram menunjukkan 3 aspek dari sistem yaitu: actor, use case dan
system/sub system boundary. Actor mewakili peran orang, sistem yang lain
atau alat ketika berkomunikasi dengan use case.
Tabel 2.1 Simbol-Simbol Use Case Diagram
No Nama Simbol Deskripsi
Menerangkan “apa” yang
dikerjakan sistem, bukan

1 Use case
“bagaimana” sistem
mengerjakannya.
Menggambarkan orang,
sistem atau external entitas
2 Actor atau stakeholder yang
menyediakan atau menerima

Actor1
informasi dari sistem.

Sistem Menggambarkan jangkauan
3
Boundary sistem
Menggambarkan bagaimana
4 Association
actor terlibat dalam use case
Dibuat ketika ada sebuah
5 Generalization keadaan yang lain/perlakuan
khusus.
<< Extend >> Perluasan dari use case lain
6 Extend jika kondisi atau syarat
terpenuhi
<< Include >> Menjelaskan bahwa use case
7 Include termasuk didalam use case
lain
Use case diagram menggambarkan fungsionalitas yang diharapkan dari sebuah
sistem. Yang ditekankan adalah “apa” yang diperbuat sistem, dan bukan “bagaimana”.
Sebuah use case merepresentasikan sebuah interaksi antara aktor dengan sistem.
Menggambarkan sejumlah external actors dan hubungannya ke use case yang diberikan
oleh sistem. Use case adalah deskripsi fungsi yang disediakan oleh sistem dalam bentuk
teks sebagai dokumentasi dari use case symbol namun dapat juga dilakukan dalam
activity diagrams.
2.3.2 Activity Diagram

Activity diagram menggambarkan berbagai alir aktivitas dalam sistem yang
sedang dirancang, bagaimana masing-masing alir berawal, decision yang mungkin
terjadi, dan bagaimana mereka berakhir. Activity diagram juga dapat menggambarkan
proses paralel yang terjadi pada beberapa eksekusi (Hadi Wijaya, 2015).
Activity diagram atau diagram aktivitas menggambarkan workflow (aliran kerja)
atau aktivitas dari sebuah sistem atau menu yang ada pada sebuah perangkat lunak.
Tabel 2.2 Simbol Activity Diagram
1. Start Titik Awal
2. Final Titik Akhir
3. Activity Aktifitas
Pilihan untuk pengambilan

4. Decission
keputusan
Untuk menunjukkan kegiatan

5. Fork /Join
yang dilakukan secara paralel
Menunjukkan adanya
6. Rake
dekomposisi
7. Tanda waktu Tanda waktu

8. Tanda penerimaan Tanda penerimaan
2.3.3 Class Diagram
Class diagram menggambarkan struktur sistem dari segi pendefinisian kelas-
kelas yang akan dibuat untuk membangun sistem. Kelas memiliki apa yang disebut
atribut dan metode atau operasi. Atribut merupakan variabel-variabel yang dimiliki oleh
suatu kelas, sedangkan operasi atau metode adalah fungsi-fungsi yang dimiliki oleh
suatu kelas.
Kelas sebagai suatu set objek yang memiliki atribut dan perilaku yang sama,
kelas kadang disebut kelas objek. Class memiliki tiga area pokok yaitu (Suendri, 2018):
1. Nama, kelas harus mempunyai sebuah nama.
2. Atribut, adalah kelengkapan yang melekat pada kelas. Nilai dari suatu kelas hanya
bisa diproses sebatas atribut yang dimiliki.
3. Operasi, adalah proses yang dapat dilakukan oleh sebuah kelas, baik pada kelas itu
sendiri ataupun kepada kelas lainnya
Class dalam UML digambarkan dengan kotak. Nama class menggunakan huruf
besar di awal kalimatnya dan diletakkan diatas kotak. Bila class mempunyai nama yang
terdiri dari 2 suku kata atau lebih maka semua suku kata digabungkan tanpa spasi
dengan huruf awal tiap suku kata menggunakan huruf besar.
Attribute adalah property dari sebuah class, attribute ini melukiskan batas nilai
yang mungkin ada pada obyek dari class. Sebuah class mungkin mempunyai nol atau
lebih attribute. Secara konvensi jika nama attribute terdiri atas satu suku kata maka
ditulis dengan huruf kecil. Akan tetapi jika nama attribute menggandung lebih dari satu
suku kata maka semua suku kata digabungkan dengan suku kata pertama menggunakan
huruf kecil dan awal suku kata berikutnya menggunakan huruf besar.
Tabel 2.3 Simbol Class Diagram
Nama_Kelas
1 Kelas Kelas pada struktur sistem
+atribut
+operasi()
Sama dengan konsep interface
2 Antarmuka dalam pemrograman berorientasi
objek
Relasi antar kelas dengan makna
3 Asosiasi umum, biasanya juga disertai
dengan multiplicity
4 Asosiasi Berarah kelas yang satu digunakan oleh
kelas yang lain
5 Generalisasi generalisasi-spesialisasi
(umumkhusus)
6 Kebergantungan
kebergantungan antar kelas

7 Agregasi
semua-bagian (whole-part)
2.4 Flowchart
Flowchart adalah representasi secara simbolik dari suatu algoritma atau prosedur
untuk menyelesaikan suatu masalah, dengan menggunakan flowchart akan
memudahkan pengguna melakukan pengecekan bagian-bagian yang terlupakan dalam
analisis masalah disamping itu flowchart juga berguna sebagai fasilitas untuk
berkomunikasi antara pemrogram yang bekerja dalam tim suatu proyek (Santoso, 2017).
Tabel 2.4 Simbol-Simbol Flowchart
Simbol titik terminan
digunakan untuk menunjukkan

1. Terminator
awal dan akhir dari suatu
proses.
Simbol arah data/arus

2. Data Flow
data/aliran data.
3. Proses Proses yang dilakukan
komputer dalam pengolahan

data-data.
Simbol input/output
digunakan untuk mewakili

4. Input/Output
data input dan output.
Simbol Keputusan yang
digunakan untuk suatu

5. Keputusan
penyelesaian kondisi di dalam
program.
Simbol konektor menunjukkan
hubungan flowchart ke
6. Connector Off Page
halaman lain
Simbol yang menunjukkan
hubungan bagian-bagian
7. Connector On Page
flowchart yang berada dalam
satu halaman.
Simbol untuk menunjukkan
bahwa langkah yang dimaksud
terdapat flowchart lain yang

8. Predefined Process
menggambarkan langkah
tersebut lebih rinci.

2.5 XAMPP
XAMPP merupakan alat bantu yang menyediakan paket perangkat lunak ke
dalam satu buah paket. Dengan menginstall XAMPP maka tidak perlu lagi melakukan
instalasi dan konfigurasi web server Apache, PHP dan MySQL secara manual. XAMPP
akan menginstalasi dan mengkonfigurasikannya secara otomatis atau auto
configuration. XAMPP merupakan paket PHP yang berbasis open source yang
dikembangkan oleh sebuah komunitas Open Source (Santoso, 2017).
Dengan menggunakan XAMPP tidak dibingungkan dengan penginstalan
program-program lain, karena semua kebutuhan telah tersedia oleh XAMPP. Beberapa
aplikasi yang terdapat pada XAMPP diantaranya : Apache, MySQL, PHP, FileZilla FTP
Server, PHPmyAdmin dll.
Gambar 2.1 Tampilan XAMPP
Beberapa bagian XAMPP yang biasa digunakan pada umumnya:

1. htdocs adalah folder tempat meletakkan berkas-berkas yang akan dijalankan, seperti
berkas PHP, HTML dan skrip lain.
2. phpMyAdmin merupakan bagian untuk mengelola basis data MySQL yang ada di
komputer. Untuk membukanya, buka browser lalu ketikkan alamat
http://localhost/phpMyAdmin, maka akan muncul halaman phpMyAdmin.
3. Control Panel yang berfungsi untuk mengelola layanan (service) XAMPP. Seperti
menghentikan (stop) layanan, ataupun memulai (start).
2.6 PHP
PHP (Hypertext Preprocessor) adalah bahasa pemrograman web server-side yang
bersifat open source. PHP merupakan script yang terintegrasi dengan HTML dan berada
pada server (server side HTML embedded scripting). PHP adalah sricpt yang digunakan
untuk membuat halaman yang akan ditampilkan, dibuat saat halaman itu diminta oleh
client.
Database menyimpan data yang diolah oleh bahasa pemrograman PHP yang ada
di Web Server kemudian data tersebut ditampilkan dengan Web Server dengan cara
menuliskan alamat atau URL sesuai nama file yang terdapat pada Web Server.
Mekanisme ini menyebabkan informasi yang diterima client selalu yang terbaru
atau up to date. Semua script PHP dieksekusi pada server dimana script tersebut
dijalankan. Sebenernya saat kita menjalankan internet menggunakan browser seperti
Mozilla, Internet Explorer, Opera, dan Safari. Web server adalah aplikasi yang berfungsi
untuk melayani permintaan pemanggilan alamat dari pengguna melalui web server,
dimana web server mengirimkan kembali informasi yang diminta tersebut melalui HTTP
(Hyper Text Transfer Protocol) untuk ditampilkan ke layar monitor komputer. Isi dari
website yang kita buat dapat diubah dengan menggunkan program PHP, script-script
PHP tersebut yang berfungsi membuat halaman website menjadi dinamis. Dinamis
artinya pengunjung web dapat memberikan komentar saran masukan pada website
client.
Beberapa kelebihan PHP yaitu :
1. PHP memiliki tingkat akses yang lebih cepat.
2. PHP memiliki tingkat lifecycle yang cepat sehingga selalu mengikuti perkembangan
teknologi internet.
3. PHP memiliki tingkat keamanan tinggi.
4. PHP mampu berjalan di beberapa server yang ada, misalnya Apache, Microsoft IIS,
PWS, AOL Server, phttpd dan Xitami.
5. PHP mampu berjalan di linux sebagai platform sistem operasi utama bagi
6. PHP, namun juga dapat berjalan di FreeBSD,Unix, Solaris, Windows dan yang lain.
7. PHP juga mendukung akses ke beberapa database yang sudah ada, baik yang bersifat
free ataupun komersial. Database itu antara lain MySQL, PostgreSQL, mSQL, Informix,
dan Microsoft SQL server.
8. PHP bersifat free atau gratis.
2.7 MySQL
MySQL merupakan software database open source yang paling populer di dunia.
MySQL menjadi pilihan utama bagi banyak pengembang software dan aplikasi hal ini
dikarenakan kelebihan MySQL diantaranya sintaksnya yang mudah dipahami, didukung

program-program umum seperti C, C++, Java, PHP, Pyton. Pengguna MySQL tidak hanya
sebatas pengguna perseorangan maupun perusahaan kecil, namun perusahaan seperti
Yahoo, Google, Nokia, Youtube, Wordpress juga menggunakan DBMS MySQL (Indra
Warman, 2018).
MySQL merupakan database server yang memiliki konsep
database modern, Mysql mempunyai beberapa kelebihan, antara lain :
1. Portability
MySQL dapat berjalan stabil pada berbagi sistem operasi di antaranya
adalah
Windows, Linux, FreBSSD, Mac OS X Server, Solaris, Amiga, HP-UX ,
dan lain-lain.
2. Open Source
MySQL didistribusikan secara gratis ( open source), dibawah lisensi
GPL sehingga dapat digunakan tanpa dipungut biaya.
3. Multiuser
MySQL memiliki beberapa security seperti level subnet mask, nama
host, dan izin akses user dengan sistem yang mendetail serta
password yang menggunakan sistem enkripsi.

4. Connectivity
MySQL dapat melakukan koneksi dengan client melalui penggunaan
protocol
TCP/IP, Unix soket (Unixx), atau Name Pipes (NT).
5. Interface
MySQL memiliki interface terhadap berbagai aplikasi dan bahasa
pemograman dengan menggunakan fungsi Aplication Programming.
2.7 Universitas Medan Area
Universitas Medan Area merupakan salah satu universitas swasta yang cukup
terkenal di Kota Medan. Universitas Medan Area yang telah memiliki lima Fakultas yaitu
Fakultas Teknik, Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, serta Fakultas
Ilmu Sosial dan Ilmu Politik. Berikut mengenai sejarah dan struktus organisasi
Universitas Medan Area.
2.7.1 Sejarah Universitas Medan Area
Latar belakang mendirikan Universitas Medan Area, adalah sebagai salah
satu wujud penjabaran UUD 1945 yaitu turut serta mencerdaskan kehidupan
bangsa serta merupakan wadah penampungan aspirasi dan hasrat masyarakat yang
terus berkembang untuk menikmati pendidikan tinggi. Nama Universitas Medan
Area diambil sebagai penghargaan atas perjuangan mempertahankan kemerdekaan
oleh pejuang-pejuang 1945 di sekitar kota Medan yang lebih dikenal dengan
nama “Pejuang-Pejuang Medan Area”.
Pada tahun 1983-1984 adalah sebagai tahun akademik pertama dimulainya
Universitas Medan Area yang telah memiliki lima Fakultas yaitu Fakultas
Teknik, Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, serta
Fakultas Ilmu Sosial dan Ilmu Politik. Masing-masing Fakultas semuanya
berstatus izin operasional, menyelenggarakan program pendidikan strata satu (S1).
Dalam waktu yang relatif singkat sekitar pertengahan 1984 semua Fakultas telah
memperoleh status terdaftar. Pengakuan dan kepercayaan pemerintah ini tertuang
dalam surat Keputusan Menteri Pendidikan dan Kebudayaan Republik Indonesia
No. 054/0/1984 tanggal 6 Maret 1984.
Pada tahun akademik 1985/1986, Universitas Medan Area membuka
Fakultas baru yaitu Fakultas Psikologi. Fakultas ini merupakan satu-satunya
Fakultas Psikologi di luar pulau Jawa. Pada tahun akademik pertamanya Fakultas
ini menampung 204 orang mahasiswa. Pada tahun akademik 1988/1989
Universitas Medan Area kembali membuka satu Fakultas baru, yaitu Fakultas
Biologi. Fakultas ini juga merupakan satu-satunya Fakultas Biologi di luar pulau
Jawa.
Pada tahun 2018 Universitas Medan Area resmi mendapat Akreditasi secara
Institusi dengan nilai B dengan nomor SK : 414/SK/BAN-PT/Akred/PT/XII/2018,
Tanggal SK: 19 Desember 2018 dan berlaku sampai dengan 19 Desember
2023. Sampai saat ini Universitas Medan Area telah memiliki tujuh Fakultas
dengan 16 program studi untuk Strata 1 (S1), 4 program studi untuk Strata 2 (S2)
dan 1 program Doktor (S3). Ketujuh Fakultas tersebut yaitu Fakultas Teknik,
Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, Fakultas Ilmu Sosial dan
Ilmu Politik, Fakultas Psikologi serta Fakultas Sains dan Teknologi telah memiliki
status TERAKREDITASI untuk semua program studi yang diselenggarakannya
dengan grade “A“ dan grade "B".
Pada tahun 2000, Universitas Medan Area membuka Program Pascasarjana
dengan Program Studi Magister Administrasi Publik (MAP) dan saat ini telah
terakreditasi “B“ dengan SK BAN PT Depdiknas No. 024/BAN-PT/Ak-
V/S2/XII/2007 tanggal 14 Desember 2007. Tahun 2003, Program Pascasarjana
UMA membuka 2 Program Studi lagi yaitu Magister Agribisnis (MA) dengan
akreditasi “B“ dan Magister Ilmu Hukum (MH) juga telah terakreditasi oleh
BAN-PT, dan pada tahun 2008 dibuka pula Program Studi Magister Psikologi
(MPsi).
2.7.2 Struktur Organisasi Universitas Medan Area
Struktur organisasi yang baik memiliki gambaran yang jelas mengenai
pembagian tugas, wewenang, dan tanggung jawab kepada individu maupun bagian–
bagian dari suatu organisasi yang meningkatkan tercapainya komunikasi, koordinasi dan
pengintegrasian segenap kegiatan organisasi sehingga memperlancar proses menuju
sarana yang tersedia semaksimal mungkin, baik dalam jangka panjang maupun pendek.
Untuk lebih jelasnya, struktur organisasi Universitas Medan Area dapat dilihat
pada gambar di bawah ini :
Gambar
2.2 Struktur Organisasi Universitas Medan Area

32
BAB III
METODE PENELITIAN
3.1 Analisis Permasalahan
Kehadiran data mining dilatarbelakangi dengan masalah data explosion yang

dialami akhir-akhir ini dimana banyak perusahaan/bank/organisasi telah mengumpulkan
data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data
transaksi, dan lain-lain). Seperti yang terjadi pada sebuah perusahaan asuransi, data
yang tersimpan selama ini hanya sebagai dokumentasi dan hanya dipakai untuk
kebutuhan transaksi saja. Pertanyaannya sekarang, apakah data tersebut akan dibiarkan
menggunung, tidak berguna lalu dibuang, ataukah kita dapat menambangnya untuk
mencari ‘emas’ dan ‘berlian’ yaitu informasi yang berguna untuk organisasi kita.
Sama halnya dengan Universitas Medan Area yang telah beroperasi sejak lama,
sehingga banyak sekali data-data yang sebenarnya dapat digali untuk keperluan
informasi dunia pendidikan. Maka permasalahasan data ini dimanfaatkan untuk Untuk
mendukung strategi promosi terhadap Universitas Medan Area, dengan menimbang
atribut-atribut yang telah ada pada database yang ada pada Universitas Medan Area.
Untuk itu penerapan metode clustering merupakan metode yang paling

cocok untuk mencapai tujuan tersebut. K-Means Clustering merupakan metode
data mining yang telah populer di dunia pendidikan yang berguna untuk membuat
pengelompokkan atau klasifikasi di masa yang akan datang.
Ada beberapa tahapan dalam membuat penyelesaian masalah
dengan metode K-Means Clustering yaitu sebagai berikut:
1. Pilih jumlah cluster k.
2. Inisialisasi k pusat cluster ini bisa dilakukan dengan berbagai
cara. Namun yang paling sering dilakukan adalah dengan cara
random. Pusat-pusat cluster diberi nilai awal dengan angka-angka
random.
3. Alokasikan semua data/objek ke cluster terdekat. Kedekatan dua
objek ditentukan berdasarkan jarak kedua objek tersebut.
Demikian juga kedekatan suatu data ke cluster tertentu
ditentukan jarak antara data dengan pusat cluster. Dalam tahap
ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak
paling antara satu data dengan satu cluster tertentu akan
menentukan suatu data masuk dalam cluster mana. Untuk
menghiutng jarak semua data ke setiap tiitk pusat cluster dapat
menggunakan teori jarak Euclidean yang dirumuskan sebagai
berikut:
D(i , j ) = √ ¿ ¿ …………..(3.1)
dimana:
D (i,j) = Jarak data ke i ke pusat cluster j
X ki = Data ke i pada atribut data ke k
X kj= Titik pusat ke j pada atribut ke k

4. Hitung kembali pusat cluster dengan keanggotaan cluster yang
sekarang. Pusat cluster adalah rata-rata dari semua data/objek
dalam cluster tertentu. Jika dikehendaki bisa juga menggunakan

median dari cluster tersebut. Jadi rata-rata (mean) bukan satu-
satunya ukuran yang bisa dipakai.
5. Tugaskan lagi setiap objek memakai pusat cluster yang baru.
Jika pusat cluster tidak berubah lagi maka proses clustering
selesai. Atau, kembali ke langkah nomor 3 sampai pusat cluster
tidak berubah lagi
Dalam kasus ini akan diambil dari Database hasil survei yang
ada pada Universitas Medan Area dalam periode tahun 2020. Data
tersebut akan digunakan dalam perhitungan metode K-Means
Clustering untuk menganalisa mengenai mahasiswa. Data survei
tersebut selanjutnya akan dilakukan pra-proses untuk menghasilkan
data khusus yang siap untuk dibentuk menjadi sebuah informasi
baru.
Tabel 3.1 Data Riset Mahasiswa
NIM NAMA JKEL KOTAASAL PRODI
178400008 TASYA NURUL HUDA PEREMPUAN SIANTAR ILMU HUKUM
178400003 PUTRIE RIZKY ANANDA PEREMPUAN KOTA PINANG ILMU HUKUM
178400011 CUT MUTIA SARI PEREMPUAN ACEH ILMU HUKUM
178400009 AINUR RIZA PEREMPUAN LANGSA ILMU HUKUM
178400026 RAVITA RAMBE PEREMPUAN MEDAN ILMU HUKUM
178400012 SRI HARTINI PEREMPUAN MEDAN ILMU HUKUM
178400011 PUTRY AMALIA BR PEREMPUAN MEDAN ILMU HUKUM

LUBIS
178400022 NADHILAH PUTRI PEREMPUAN SIANTAR ILMU HUKUM

178400017 TITIN ASTIKA PEREMPUAN MEDAN ILMU HUKUM
178400006 FARAH DILLA PEREMPUAN ACEH ILMU HUKUM
178400015 YUSNITA SEMBIRING PEREMPUAN LHOKSEMAWE ILMU HUKUM
178400024 ANNISA PEREMPUAN KISARAN ILMU HUKUM
178210002 BAGINDA ROMADHAN LAKI2 SIBOLGA AGROTEKNOLOGI

SIREGAR
188220003 ADE AULIA LESTARI PEREMPUAN KABANJAHE AGRIBISNIS
178220001 KHOIRUL FIKRI LAKI2 KABANJAHE AGRIBISNIS
198220002 ERISA SRIJEKI PEREMPUAN KABANJAHE AGRIBISNIS

MANURUNG
198220010 TRI WULANDARI PEREMPUAN BERASTAGI AGRIBISNIS
198220004 IBNU FAHMI LAKI2 NIAS AGRIBISNIS
198220006 SYAFARUDDIN LAKI2 BERASTAGI AGRIBISNIS

RITONGA
198220012 UMMY ZULFADLAH PEREMPUAN TANJUNG BALAI AGRIBISNIS
198220013 HERLINA SIREGAR PEREMPUAN MEDAN AGRIBISNIS
178210021 ISRA HAYATI PEREMPUAN LANGSA AGROTEKNOLOGI
178210003 NOVIKA PURNAMA SARI PEREMPUAN BINJAI AGROTEKNOLOGI
178210008 NOVITA SARI PEREMPUAN TEBING TINGGI AGROTEKNOLOGI
178210006 IMELDA BR TARIGAN PEREMPUAN TANJUNG BALAI AGROTEKNOLOGI
178210011 RIZKI KHAIRANI PEREMPUAN BINJAI AGROTEKNOLOGI
178210013 ANNISA PUTRI PEREMPUAN MEDAN AGROTEKNOLOGI

BATUBARA
178210004 SIHOL SIHOMBING LAKI2 SIBOLGA AGROTEKNOLOGI
178210012 RESKA ELISIANA PEREMPUAN MEDAN AGROTEKNOLOGI

RITONGA
178210016 SULASNI PEREMPUAN MEDAN AGROTEKNOLOGI
178210010 ANNISA RITONGA PEREMPUAN BERASTAGI AGROTEKNOLOGI
168520002 M.FAHRUL RIDHO LAKI2 RANTAU PRAPAT ADM.PUBLIK
168520003 M.DEDE ERIANDI LAKI2 SIANTAR ADM.PUBLIK
168520008 YOGI SAPUTRA LAKI2 TEBING TINGGI ADM.PUBLIK
168520011 AHMAD ADJI LAKI2 MEDAN ADM.PUBLIK

ALAMSYAH
168520015 SANDI PRIMA NAIBAHO LAKI2 SIANTAR ADM.PUBLIK
168520017 JHON HORASMAN LAKI2 KISARAN ADM.PUBLIK

TURNIP
168520020 SUSI INDAH ROSLIA PEREMPUAN MEDAN ADM.PUBLIK
168520021 ARDI WANDIRA LAKI2 RANTAU PRAPAT ADM.PUBLIK
168520022 NANDA HERIAMBANG LAKI2 SIBOLGA ADM.PUBLIK
188530004 LAMEKI GOHAE LAKI2 SIBOLGA ILMU KOMUNIKASI
188530011 KURNIAWAN LAKI2 MEDAN ILMU KOMUNIKASI
188530013 RICARDO SEBAYANG LAKI2 MEDAN ILMU KOMUNIKASI
188530021 AYU SYAFIRA PEREMPUAN MEDAN ILMU KOMUNIKASI
188530024 RAMONTUA SINAGA LAKI2 MEDAN ILMU KOMUNIKASI
188530027 AHMAD SYUKUR LAKI2 ACEH ILMU KOMUNIKASI
188530005 KHAIRIL HUDA LAKI2 ACEH ILMU KOMUNIKASI
188530012 TEUKU MUNTASHIR LAKI2 SINGKIL ILMU KOMUNIKASI
188530020 FAKHRY HAMBALI LAKI2 BERASTAGI ILMU KOMUNIKASI
188530021 RIKARDO ZALUKHU LAKI2 MEDAN ILMU KOMUNIKASI
(Sumber : Universitas Medan Area)

3.2 Penerapan Metode K-Means Clustering
Uji coba dan analisa adalah untuk melihat bagaimana suatu proses pada
software pemrograman, tujuan dari proses dan output yang diharapkan. Ujicoba
ini bertujuan untuk melakukan perhitungan algoritma untuk mencari nilai terbaik
yang akan menjadi pembagi terhadap atribut yang lainnya, dengan menggunakan
perhitungan (rumus) K-Means Clustering. K-Means Clustering akan dilatihkan
terhadap pola data input dan target sebenarnya.
3.2.1 Transformasi Data
Agar data pada tabel 3.1 di atas dapat diolah dengan menggunakan metode k-
means clustering, maka data yang berjenis data bukan nominal seperti Jenis Kelamin dan
Kota Asal harus diinisialisasikan terlebih dahulu dalam bentuk angka. Untuk melakukan
inisialisasi attribut dilakukan dengan langkah-langkah sebagai berikut:
1. Melakukan proses inisialisasi terhadap data Jenis Kelamin guna
kepentingan proses clustering. Dengan cara Jenis Kelamin yang
memiliki frekuensi terbesar diberi inisial dengan angka 1 dan
Jenis Kelamin yang memiliki frekuensi terbesar kedua diberi
inisial dengan angka 2, begitu seterusnya hingga Jenis Kelamin
dengan frekuensi paling sedikit. Hasil dari inisialisasi Jenis
Kelamin dapat dilihat pada tabel 3.2.
Tabel 3.2 Inisialisasi Data Jenis Kelamin Mahasiswa

Jenis Kelamin Frekuensi Inisialisasi
Perempuan 28 1
Laki-Laki 22 2
Selain Jenis Kelamin, Kota Asal juga termasuk ke dalam jenis data non-nominal
sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada Jenis Kelamin, pada
Kota Asal juga diberikan inisialisasi berdasarkan frekuensi pada Kota Asal tersebut. Hasil
dari inisialisasi Kota Asal tersebut dapat dilihat pada tabel 3.3.
Tabel 3.3 Inisialisasi Data Kota Asal
Kategori Wilayah Frekuensi Inisialisasi
Medan
Medan 17 1
Binjai
Berastagi
Kabanjahe
Luar Kota 1 Kisaran 15 2
Siantar
Tebing Tinggi
Sibolga
Nias
Luar Kota 2 Tanjung Balai 10 3
Kota Pinang
Rantau prapat
Aceh
Langsa
Aceh 8 4
Lhoksemawe
Singkil
Selain Jenis Kelamin dan Kota Asal, Prodi juga termasuk ke dalam jenis data non-
nominal sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada Jenis
Kelamin, pada Kota Asal juga diberikan inisialisasi berdasarkan frekuensi Mahasiswa
pada Kota Asal tersebut. Hasil dari inisialisasi Prodi dapat dilihat pada tabel 3.4.
Tabel 3.4 Inisialisasi Data Prodi
Kategori Prodi Frekuensi Inisialisasi
Ilmu Hukum 12 1
Agroteknologi 11 2
Ilmu Komunikasi 10 3
Adm. Publik 9 4
Agribisnis 8 5
Tabel 3.5 Hasil Inisialisasi Seluruh Data Mahasiswa
DATA
NAMA JKEL KOTAASAL PRODI
KE
01 TASYA NURUL HUDA 1 2 1
02 PUTRIE RIZKY ANANDA 1 3 1
03 CUT MUTIA SARI 1 4 1
04 AINUR RIZA 1 4 1
05 RAVITA RAMBE 1 1 1
06 SRI HARTINI 1 1 1
07 PUTRY AMALIA BR LUBIS 1 1 1
08 NADHILAH PUTRI 1 2 1
09 TITIN ASTIKA 1 1 1
10 FARAH DILLA 1 4 1
11 YUSNITA SEMBIRING 1 4 1
12 ANNISA 1 2 1
13 BAGINDA ROMADHAN SIREGAR 2 3 2
14 ADE AULIA LESTARI 1 2 5

DATA
KE
15 KHOIRUL FIKRI 2 2 5
16 ERISA SRIJEKI MANURUNG 1 2 5
17 TRI WULANDARI 1 2 5
18 IBNU FAHMI 2 3 5
19 SYAFARUDDIN RITONGA 2 2 5
20 UMMY ZULFADLAH 1 3 5
21 HERLINA SIREGAR 1 1 5
22 ISRA HAYATI 1 4 2
23 NOVIKA PURNAMA SARI 1 1 2
24 NOVITA SARI 1 2 2
25 IMELDA BR TARIGAN 1 3 2
26 RIZKI KHAIRANI 1 1 2
27 ANNISA PUTRI BATUBARA 1 1 2
28 SIHOL SIHOMBING 2 3 2
29 RESKA ELISIANA RITONGA 1 1 2
30 SULASNI 1 1 2
31 ANNISA RITONGA 1 2 2
32 M.FAHRUL RIDHO 2 3 4
33 M.DEDE ERIANDI 2 2 4
34 YOGI SAPUTRA 2 2 4
35 AHMAD ADJI ALAMSYAH 2 1 4
36 SANDI PRIMA NAIBAHO 2 2 4
37 JHON HORASMAN TURNIP 2 2 4

DATA
KE
38 SUSI INDAH ROSLIA 1 1 4
39 ARDI WANDIRA 2 3 4
40 NANDA HERIAMBANG 2 3 4
41 LAMEKI GOHAE 2 3 3
42 KURNIAWAN 2 1 3
43 RICARDO SEBAYANG 2 1 3
44 AYU SYAFIRA 1 1 3
45 RAMONTUA SINAGA 2 1 3
46 AHMAD SYUKUR 2 4 3
47 KHAIRIL HUDA 2 4 3
48 TEUKU MUNTASHIR 2 4 3
49 FAKHRY HAMBALI 2 2 3
50 RIKARDO ZALUKHU 2 1 3
3.2.2 Pengolahan Data Dengan K-Means Clustering
Setelah semua data riset Mahasiswa yang lulus ditransformasi ke

dalam bentuk angka, maka data-data tersebut telah dapat dikelompokan
dengan menggunakan algoritma K-Means Clustering. Untuk dapat
melakukan pengelompokan data-data tersebut menjadi beberapa cluster
perlu dilakukan beberapa langkah, yaitu:
1. Tentukan jumlah cluster yang diinginkan. Dalam penelitian ini
data-data yang ada akan dikelompokan menjadi tiga cluster.
2. Tentukan titik pusat awal dari setiap cluster. Dalam penelitian ini
titik pusat awal ditentukan secara random dan didapat titik pusat
dari setiap cluster dapat dilihat pada tabel 3.6.
Tabel 3.6. Titik Pusat Awal Setiap Cluster
Data Jenis
Nama Mahasiswa Kota Asal Prodi
Ke- Kelamin
06 SRI HARTINI Perempuan Medan Ilmu Hukum
25 IMELDA BR TARIGAN Perempuan Luar Kota 2 Agroteknologi
46 M.ARIEF RINALDI Laki-Laki Aceh Ilmu Komunikasi
Tabel 3.7. Inisialisasi Titik Pusat Awal Setiap Cluster
Data Jenis
Nama Mahasiswa Kota Asal Prodi
Ke- Kelamin
06 SRI HARTINI 1 1 1
46 M.ARIEF RINALDI 2 4 3
3. Tempatkan setiap data pada cluster. Dalam penelitian ini
digunakan metode k-means untuk mengalokasikan setiap data

ke dalam suatu cluster, sehingga data akan dimasukan dalam
suatu cluster yang memiliki jarak paling dekat dengan titik pusat
dari setiap cluster. Untuk mengetahui cluster mana yang paling
dekat dengan data, maka perlu dihitung jarak setiap data dengan
titik pusat setiap cluster.
Perhitungan Iterasi Ke-1
Sebagai contoh, dihitung jarak dari Mahasiswa pertama ke pusat cluster

pertama:
D(1,1 ) = √¿ ¿
= 1,0
Jarak data Mahasiswa pertama ke pusat cluster kedua:
D(1,2 ) = √¿ ¿
= 1,41
Jarak data Mahasiswa pertama ke pusat cluster ketiga:
D(1,3 ) = √¿ ¿
= 3,00
Kemudian Hitung Jarak dari data Mahasiswa Kedua ke pusat cluster

pertama:
D(2,1 ) = √¿ ¿
= 2,0
Jarak data Mahasiswa kedua ke pusat cluster kedua:

D(2,2 ) = √¿ ¿
= 1,0
Jarak data Mahasiswa kedua ke pusat cluster ketiga:
D(2,3 ) = √¿ ¿
= 2,45
Berdasarkan hasil ketiga perhitungan di atas dapat disimpulkan bahwa jarak

data Mahasiswa Pertama yang paling dekat adalah dengan cluster 1, sehingga data
Mahasiswa pertama dimasukkan ke dalam cluster 1. Untuk jarak data Mahasiswa Kedua
yang paling dekat adalah dengan cluster 2, sehingga data Mahasiswa Kedua dimasukkan
ke dalam cluster 2.
Hasil perhitungan selengkapnya untuk seluruh data Mahasiswa dapat di lihat

pada tabel di bawah ini.
Tabel 3.8 Hasil Perhitungan Setiap Data Ke Pusat Cluster
Data KOTA PROD Cluster

NAMA JKEL C1 C2 C3
Ke- ASAL I Terdekat
TASYA NURUL
1 2 1
01 HUDA 1,00 1,41 3,00 1
PUTRIE RIZKY
1 3 1
02 ANANDA 2,00 1,00 2,45 2
03 CUT MUTIA SARI 1 4 1 3,00 1,41 2,24 2
04 AINUR RIZA 1 4 1 3,00 1,41 2,24 2
05 RAVITA RAMBE 1 1 1 0,00 2,24 3,74 1
06 SRI HARTINI 1 1 1 0,00 2,24 3,74 1
PUTRY AMALIA
1 1 1
07 BR LUBIS 0,00 2,24 3,74 1
08 NADHILAH PUTRI 1 2 1 1,00 1,41 3,00 1
09 TITIN ASTIKA 1 1 1 0,00 2,24 3,74 1
10 FARAH DILLA 1 4 1 3,00 1,41 2,24 2
YUSNITA
1 4 1
11 SEMBIRING 3,00 1,41 2,24 2
12 ANNISA 1 2 1 1,00 1,41 3,00 1

BAGINDA
ROMADHAN 2 3 2
13 SIREGAR 2,45 1,00 1,41 2
ADE AULIA
1 2 5
14 LESTARI 4,12 3,16 3,00 3
15 KHOIRUL FIKRI 2 2 5 4,24 3,32 2,83 3
ERISA SRIJEKI
1 2 5
16 MANURUNG 4,12 3,16 3,00 3
17 TRI WULANDARI 1 2 5 4,12 3,16 3,00 3
18 IBNU FAHMI 2 3 5 4,58 3,16 2,24 3
SYAFARUDDIN
2 2 5
19 RITONGA 4,24 3,32 2,83 3
UMMY
1 3 5
20 ZULFADLAH 4,47 3,00 2,45 3
21 HERLINASIREGAR 1 1 5 4,00 3,61 3,74 2

NAMA JKEL C1 C2 C3
Ke- ASAL I Terdekat
22 ISRA HAYATI 1 4 2 3,16 1,00 1,41 2
NOVIKA
1 1 2
23 PURNAMA SARI 1,00 2,00 3,32 1
24 NOVITA SARI 1 2 2 1,41 1,00 2,45 2
IMELDA BR
1 3 2
25 TARIGAN 2,24 0,00 1,73 2
26 RIZKI KHAIRANI 1 1 2 1,00 2,00 3,32 1
ANNISA PUTRI
1 1 2
27 BATUBARA 1,00 2,00 3,32 1
SIHOL
2 3 2
28 SIHOMBING 2,45 1,00 1,41 2
RESKA ELISIANA
1 1 2
29 RITONGA 1,00 2,00 3,32 1
30 SULASNI 1 1 2 1,00 2,00 3,32 1
31 ANISA RITONGA 1 2 2 1,41 1,00 2,45 2

M.FAHRUL
2 3 4
32 RIDHO 3,74 2,24 1,41 3
33 M.DEDE ERIANDI 2 2 4 3,32 2,45 2,24 3
34 YOGI SAPUTRA 2 2 4 3,32 2,45 2,24 3
AHMAD ADJI
2 1 4
35 ALAMSYAH 3,16 3,00 3,16 2
SANDI PRIMA
2 2 4
36 NAIBAHO 3,32 2,45 2,24 3
JHON
HORASMAN 2 2 4
37 TURNIP 3,32 2,45 2,24 3
SUSI INDAH
1 1 4
38 ROSLIA 3,00 2,83 3,32 2
39 ARDI WANDIRA 2 3 4 3,74 2,24 1,41 3
NANDA
2 3 4
40 HERIAMBANG 3,74 2,24 1,41 3
41 LAMEKI GOHAE 2 3 3 3,00 1,41 1,00 3
42 KURNIAWAN 2 1 3 2,24 2,45 3,00 1
RICARDO
2 1 3
43 SEBAYANG 2,24 2,45 3,00 1
44 AYU SYAFIRA 1 1 3 2,00 2,24 3,16 1
RAMONTUA
2 1 3
45 SINAGA 2,24 2,45 3,00 1
46 AHMAD SYUKUR 2 4 3 3,74 1,73 0,00 3
47 KHAIRIL HUDA 2 4 3 3,74 1,73 0,00 3
TEUKU
2 4 3
48 MUNTASHIR 3,74 1,73 0,00 3

NAMA JKEL C1 C2 C3
Ke- ASAL I Terdekat
FAKHRY
2 2 3
49 HAMBALI 2,45 1,73 2,00 2
RIKARDO
2 1 3
50 ZALUKHU 2,24 2,45 3,00 1
Setelah proses perhitungan selesai, maka akan terbentuk tabel cluster baru
dengan tiap-tiap anggota cluster seperti tabel di bawah ini:
Tabel 3.9 Anggota Cluster 1
Data Ke- NAMA JKEL KOTAASAL PRODI
1 TASYA NURUL HUDA 1 2 1
5 RAVITA RAMBE 1 1 1
6 SRI HARTINI 1 1 1
7 PUTRY AMALIA BR LUBIS 1 1 1
8 NADHILAH PUTRI 1 2 1
9 TITIN ASTIKA 1 1 1
12 ANNISA 1 2 1
23 NOVIKA PURNAMA SARI 1 1 2
26 RIZKI KHAIRANI 1 1 2
27 ANNISA PUTRI BATUBARA 1 1 2
29 RESKA ELISIANA RITONGA 1 1 2
30 SULASNI 1 1 2
42 KURNIAWAN 2 1 3
43 RICARDO SEBAYANG 2 1 3
44 AYU SYAFIRA 1 1 3
45 RAMONTUA SINAGA 2 1 3
50 RIKARDO ZALUKHU 2 1 3
Average (Rata-Rata) 1,24 1,18 1,88
Nilai pada baris Average merupakan hasil perhitungan rata-rata dari tiap-tiap
kolom titik cluster. Nilai average ini nantinya akan menjadi titik pusat untuk cluster 1
yang baru.
Data Ke- NAMA JKEL KOTAASAL PRODI
2 PUTRIE RIZKY ANANDA 1 3 1

3 CUT MUTIA SARI 1 4 1
4 AINUR RIZA 1 4 1
10 FARAH DILLA 1 4 1
11 YUSNITA SEMBIRING 1 4 1
BAGINDA ROMADHAN
13 SIREGAR 2 3 2
21 HERLINA SIREGAR 1 1 5
22 ISRA HAYATI 1 4 2
24 NOVITA SARI 1 2 2
28 SIHOL SIHOMBING 2 3 2
31 ANNISA RITONGA 1 2 2
35 AHMAD ADJI ALAMSYAH 2 1 4
38 SUSI INDAH ROSLIA 1 1 4
49 FAKHRY HAMBALI 2 2 3
yang baru.
DATA
KE- NAMA JKEL KOTAASAL PRODI
14 ADE AULIA LESTARI 1 2 5

15 KHOIRUL FIKRI 2 2 5
16 ERISA SRIJEKI MANURUNG 1 2 5
17 TRI WULANDARI 1 2 5
18 IBNU FAHMI 2 3 5
19 SYAFARUDDIN RITONGA 2 2 5
20 UMMY ZULFADLAH 1 3 5
32 M.FAHRUL RIDHO 2 3 4
33 M.DEDE ERIANDI 2 2 4
34 YOGI SAPUTRA 2 2 4
36 SANDI PRIMA NAIBAHO 2 2 4
37 JHON HORASMAN TURNIP 2 2 4
39 ARDI WANDIRA 2 3 4
40 NANDA HERIAMBANG 2 3 4
41 LAMEKI GOHAE 2 3 3
46 AHMAD SYUKUR 2 4 3
47 KHAIRIL HUDA 2 4 3
48 TEUKU MUNTASHIR 2 4 3
yang baru. Sehingga titik pusat cluster pada iterasi kedua yaitu:
Tabel 3.12 Titik Pusat Cluster Pada Iterasi 2
Jenis Kelamin Kota Asal Prodi
Cluster 1 1,24 1,18 1,88
Cluster 2 1,27 2,73 2,20
Cluster 3 1,78 2,67 4,17

Perhitungan Iterasi Ke-2
Setelah didapatkan titik pusat yang baru dari setiap cluster, lakukan kembali dari
langkah ketiga hingga titik pusat dari setiap cluster tidak berubah lagi dan tidak ada lagi
data yang berpindah dari satu cluster ke cluster yang lain. Sebagai contoh, dihitung
jarak dari mahasiswa pertama ke pusat cluster pertama:
D(1,1 ) = √¿ ¿
= 1,23
Jarak data Mahasiswa pertama ke pusat cluster kedua:
D(1,2 ) = √¿ ¿
= 1,43
Jarak data Mahasiswa pertama ke pusat cluster ketiga:
D(1,3 ) = √¿ ¿
= 3,33
Kemudian Hitung Jarak dari data Mahasiswa Kedua ke pusat cluster

pertama:
D(2,1 ) = √¿ ¿
= 2,04
Jarak data Mahasiswa kedua ke pusat cluster kedua:
D(2,2 ) = √¿ ¿
= 1,26
Jarak data Mahasiswa kedua ke pusat cluster ketiga:
D(2,3 ) = √¿ ¿
= 3,28
Berdasarkan hasil ketiga perhitungan di atas dapat disimpulkan bahwa jarak
data Mahasiswa Pertama yang paling dekat adalah dengan cluster 1, sehingga data
Mahasiswa pertama dimasukkan ke dalam cluster 1. Untuk jarak data Mahasiswa Kedua
yang paling dekat adalah dengan cluster 2, sehingga data Mahasiswa Kedua dimasukkan
ke dalam cluster 2.
Hasil perhitungan selengkapnya untuk seluruh data Mahasiswa dapat di lihat

pada tabel di bawah ini.
Tabel 3.13 Hasil Perhitungan Setiap Data Ke Pusat Cluster Pada Iterasi 2
Jkel Kota Prodi

No Nama C1 C2 C3 Cluster
Asal
01 TASYA NURUL HUDA 1 2 1 1,23 1,43 3,33 1
02 PUTRIE RIZKY ANANDA 1 3 1 2,04 1,26 3,28 2
03 CUT MUTIA SARI 1 4 1 2,97 1,77 3,52 2
04 AINUR RIZA 1 4 1 2,97 1,77 3,52 2
05 RAVITA RAMBE 1 1 1 0,93 2,12 3,66 1
06 SRI HARTINI 1 1 1 0,93 2,12 3,66 1
07 PUTRY AMALIA BR LUBIS 1 1 1 0,93 2,12 3,66 1
08 NADHILAH PUTRI 1 2 1 1,23 1,43 3,33 1
09 TITIN ASTIKA 1 1 1 0,93 2,12 3,66 1
10 FARAH DILLA 1 4 1 2,97 1,77 3,52 2
11 YUSNITA SEMBIRING 1 4 1 2,97 1,77 3,52 2
12 ANNISA 1 2 1 1,23 1,43 3,33 1
13 BAGINDA ROMADHAN SIREGAR 2 3 2 1,98 0,81 2,2 2
14 ADE AULIA LESTARI 1 2 5 3,23 2,91 1,32 3
15 KHOIRUL FIKRI 2 2 5 3,31 2,99 1,09 3
16 ERISA SRIJEKI MANURUNG 1 2 5 3,23 2,91 1,32 3

Jkel Kota Prodi
Asal
17 TRI WULANDARI 1 2 5 3,23 2,91 1,32 3
18 IBNU FAHMI 2 3 5 3,69 2,91 0,92 3
19 SYAFARUDDIN RITONGA 2 2 5 3,31 2,99 1,09 3
20 UMMY ZULFADLAH 1 3 5 3,62 2,83 1,19 3
21 HERLINA SIREGAR 1 1 5 3,13 3,3 2,02 3
22 ISRA HAYATI 1 4 2 2,84 1,31 2,66 2
23 NOVIKA PURNAMA SARI 1 1 2 0,32 1,77 2,84 1
24 NOVITA SARI 1 2 2 0,86 0,81 2,4 2
25 IMELDA BR TARIGAN 1 3 2 1,84 0,43 2,33 2
26 RIZKI KHAIRANI 1 1 2 0,32 1,77 2,84 1
27 ANNISA PUTRI BATUBARA 1 1 2 0,32 1,77 2,84 1
28 SIHOL SIHOMBING 2 3 2 1,98 0,81 2,2 2
29 RESKA ELISIANA RITONGA 1 1 2 0,32 1,77 2,84 1
30 SULASNI 1 1 2 0,32 1,77 2,84 1
31 ANNISA RITONGA 1 2 2 0,86 0,81 2,4 2
32 M.FAHRUL RIDHO 2 3 4 2,9 1,96 0,43 3
33 M.DEDE ERIANDI 2 2 4 2,4 2,08 0,72 3
34 YOGI SAPUTRA 2 2 4 2,4 2,08 0,72 3
35 AHMAD ADJI ALAMSYAH 2 1 4 2,26 2,6 1,69 3
36 SANDI PRIMA NAIBAHO 2 2 4 2,4 2,08 0,72 3

Jkel Kota Prodi
Asal
37 JHON HORASMAN TURNIP 2 2 4 2,4 2,08 0,72 3
38 SUSI INDAH ROSLIA 1 1 4 2,14 2,51 1,85 3
39 ARDI WANDIRA 2 3 4 2,9 1,96 0,43 3
40 NANDA HERIAMBANG 2 3 4 2,9 1,96 0,43 3
41 LAMEKI GOHAE 2 3 3 2,27 1,12 1,23 2
42 KURNIAWAN 2 1 3 1,37 2,05 2,05 1
43 RICARDO SEBAYANG 2 1 3 1,37 2,05 2,05 1
44 AYU SYAFIRA 1 1 3 1,16 1,93 2,18 1
45 RAMONTUA SINAGA 2 1 3 1,37 2,05 2,05 1
46 AHMAD SYUKUR 2 4 3 3,13 1,67 1,79 2
47 KHAIRIL HUDA 2 4 3 3,13 1,67 1,79 2
48 TEUKU MUNTASHIR 2 4 3 3,13 1,67 1,79 2
49 FAKHRY HAMBALI 2 2 3 1,58 1,31 1,36 2
50 RIKARDO ZALUKHU 2 1 3 1,37 2,05 2,05 1
Dalam penelitian ini, iterasi clustering data Mahasiswa terjadi sebanyak 2 kali
iterasi. Pada iterasi ke-2 ini, titik pusat dari setiap cluster sudah tidak berubah dan tidak
ada lagi data yang berpindah dari satu cluster ke cluster yang lain.
Berdasarkan hasil pengelompokan data menggunakan metode k-means

clustering, di dapatkan hasil clustering hingga iterasi ke-2, dimana titik pusat tidak lagi
berubah dan tidak ada data yang berpindah antar cluster. Hasil dari clustering tersebut
seperti pada tabel di bawah ini.
Tabel 3.14 Anggota Cluster 1 Hasil Iterasi 2

Nama Jkel Kota Asal Prodi
TASYA NURUL HUDA 1 2 1
RAVITA RAMBE 1 1 1
SRI HARTINI 1 1 1
PUTRY AMALIA BR LUBIS 1 1 1
NADHILAH PUTRI 1 2 1
TITIN ASTIKA 1 1 1
ANNISA 1 2 1
NOVIKA PURNAMA SARI 1 1 2
RIZKI KHAIRANI 1 1 2
ANNISA PUTRI BATUBARA 1 1 2
RESKA ELISIANA RITONGA 1 1 2
SULASNI 1 1 2
KURNIAWAN 2 1 3
RICARDO SEBAYANG 2 1 3
AYU SYAFIRA 1 1 3
RAMONTUA SINAGA 2 1 3
RIKARDO ZALUKHU 2 1 3
PUTRIE RIZKY ANANDA 1 3 1
CUT MUTIA SARI 1 4 1
AINUR RIZA 1 4 1
FARAH DILLA 1 4 1
YUSNITA SEMBIRING 1 4 1
BAGINDA ROMADHAN SIREGAR 2 3 2
HERLINA SIREGAR 1 4 2
ISRA HAYATI 1 2 2
NOVITA SARI 1 3 2
IMELDA BR TARIGAN 2 3 2
SIHOL SIHOMBING 1 2 2
ANNISA RITONGA 2 2 3
AHMAD ADJI ALAMSYAH 2 3 3
SUSI INDAH ROSLIA 2 4 3
FAKHRY HAMBALI 2 4 3
ADE AULIA LESTARI 1 1 5
KHOIRUL FIKRI 2 1 4
ERISA SRIJEKI MANURUNG 1 1 4
TRI WULANDARI 1 2 5
IBNU FAHMI 2 2 5
SYAFARUDDIN RITONGA 1 2 5
UMMY ZULFADLAH 1 2 5
M.FAHRUL RIDHO 2 3 5
M.DEDE ERIANDI 2 2 5
YOGI SAPUTRA 1 3 5
SANDI PRIMA NAIBAHO 2 3 4
JHON HORASMAN TURNIP 2 2 4
ARDI WANDIRA 2 2 4
NANDA HERIAMBANG 2 2 4
LAMEKI GOHAE 2 2 4
AHMAD SYUKUR 2 3 4
KHAIRIL HUDA 2 3 4
Dari hasil clustering diatas dapat diambil kesimpulan bahwa:
1. Karakteristik Data Mahasiswa pada cluster 1 mayoritas Kota Asal
yaitu Medan dan Binjai, dengan jumlah data 17 data mahasiswa.
Dengan mayoritas mahasiswa memilih Prodi Ilmu Hukum dan
Agroteknologi. Berarti untuk wilayah Medan lebih diprioritaskan
untuk mempromosikan mengenai Ilmu Hukum dan Agroteknologi.
yaitu Aceh, dengan jumlah data 16 data mahasiswa. Dengan
mayoritas mahasiswa memilih Prodi Agroteknologi. Berarti untuk

wilayah Aceh lebih diprioritaskan untuk mempromosikan
mengenai Prodi Agroteknologi.
yaitu Luar Kota 1 yaitu wilayah Berastagi, Kabanjahe, Kisaran,
Siantar dan tebing Tinggi, dengan jumlah data 17 data
mahasiswa. Dengan mayoritas mahasiswa memilih Prodi
Agribisnis dan Administrasi Publik. Berarti untuk wilayah ini lebih
diprioritaskan untuk mempromosikan mengenai Prodi Agribisnis
dan Administrasi Publik.
3.3 Flowchart K-means Clustering
Flowchart merupakan penggambaran secara fisik dari langkah-langkah dan
urutan prosedur dari suatu program. Berikut rancangan flowchart untuk untuk
mendukung strategi promosi pada Universitas Medan Area dengan metode K-
Means Clustering.
Mulai
Inisialisasi Data
Input Data
Survei Mahasiswa
Tentukan Pusat Cluster
Proses Hitung
K-Means Clustering
Hasil Pengelompokkan
Selesai
Gambar 3.1 Flowchart Metode K-Means Clustering
Flowchart metode k-means clustering diatas menjelaskan bahwa tahapan

clustering simbol terminator Mulai, kemudian tahapan inisialisasi data. Setelah itu input
data mahasiswa ke dalam sistem. Selanjutnya yaitu menentukan titik pusat cluster,
dalam kasus ini digunakan 3 titik pusat cluster. Kemudian proses hitung K-Means
Clustering sehingga dihasilkan pengelompokkan data pada tiap-tiap cluster. Kemudian
selesai.
3.4 Pemodelan/Perancangan Sistem
3.4.1 Unified Modeling Language (UML)
Unfied Modeling Language adalah keluarga notasi grafis yang didukung oleh meta-
model tunggal, yang membantu pendeskripsian dan desain sistem perangkat lunak.
Prosedur sistem yang akan digunakan dengan menggunakan UML. Pemodelan UML
menggunakan use case diagram yang selanjutnya setiap proses yang akan terjadi akan
diperjelas dengan diagram activity.
3.4.1.1 Use Case Diagram
Use case diagram yang digunakan untuk sistem aplikasi Mahasiswa dengan
Metode K-Means Clustering merupakan gambaran bagaimana pengguna berinteraksi
dengan sistem. Dengan adanya use case ini dapat diketahui proses yang terjadi didalam
sistem. Adapun use case diagram metode K-Means Clustering dapat dillihat di bawah ini.
Login
Input Data Mahasiswa
Tentukan Titik Cluster

Admin
Proses K-Means Clustering
Tampil Hasil Clustering
Gambar 3.2 Use Case Diagram
Untuk memahami lebih jelas, apa saja yang akan dilakukan oleh user dalam use
case diagram diatas, maka akan dijelaskan pada skenario use case sebagai berikut :
1. Skenario Login
Nama use case : Login
Deskripsi : Memungkinkan pengguna untuk mengisi data username
dan password pada program aplikasi untuk masuk ke Menu

Utama program aplikasi.
Proses : Pengguna terlebih dahulu mengisi data user dan password.
Kondisi Akhir : Perangkat lunak akan memproses data user dan password
tersebut.
2. Skenario Data Mahasiswa
Nama use case :Masukkan data
Deskripsi :Memungkinkan pengguna untuk menginput data Mahasiswa,

dimana Mahasiswa ini akan dinilai nantinya.
Proses : Pengguna terlebih dahulu mengisi data dengan lengkap pada
form aplikasi yang tersedia.
Kondisi Akhir : Perangkat lunak akan menyimpan data.
3. Skenario Tentukan Titik Cluster
Nama use case :Tentukan Titik Cluster
Deskripsi :Memungkinkan pengguna untuk menentukan titik cluster dimana

data titik cluster ini merupakan acuan dalam melakukan
perhitungan nantinya.
Proses : Pengguna terlebih dahulu menentukan titik cluster.
Kondisi Akhir : Perangkat lunak akan menyimpan data titik cluster.
4. Skenario Proses Metode K-Means Clustering
Nama use case : Proses Metode K-Means Clustering
Deskripsi : Memungkinkan pengguna untuk mendapatkan hasil

perhitungan dengan metode K-Means Clustering.
Prekondisi : Pengguna sudah menjalankan perangkat lunak.
Proses : Pengguna terlebih dahulu menentukan data yang akan dinilai lalu
sistem akan menghitung data tersebut dengan menggunakan
metode K-Means Clustering.
Kondisi Akhir : Perangkat lunak akan menghitung dan Menunjukkan hasil dari
perhitungan K-Means Clustering.
5. Skenario Cetak Hasil
Nama use case : Cetak Laporan Hasil
Deskripsi : Memungkinkan pengguna untuk menarik kesimpulan dan

mengambil informasi atas penilaian yang telah dilakukan dengan
metode K-Means Clustering.
Prekondisi : Pengguna sudah mencatat penilaian dari setiap titik cluster.
Proses : Pengguna mencatat semua penilaian yang telah dilakukan
lalu mengambil kesimpulan/informasi baru.
Kondisi Akhir : Pengguna mendapatkan nilai clustering
berdasarkan perhitungan K-Means Clustering.

3.4.1.2 Activity Diagram
Activity diagram untuk use case ini merupakan alur kerja admin untuk masuk
kedalam sistem dari sistem aplikasi. Diagram ini merupakan alur proses dalam
menjalankan sistem data mining Untuk mendukung strategi promosi Universitas Medan
Area menggunakan metode K-Means Clustering.
Admin Sistem
Start
Login
Input Username
dan Password
Tidak Valid
Ya
Menu Utama
Input Data
Mahasiswa
Proses Data
Tentukan Titik
cluster Titik cluster
Proses Perhitungan
K-Means Clustering
Tampilkan Hasil
Pengelompokkan
Finish
Gambar 3.3 Activity Diagram Program K-Means Clustering
Activity diagram diatas terdiri dari dua bagian yaitu Admin sebagai pengguna dan
Sistem. Activity diagram ini dimulai dari Admin menginput username dan password.
Kemudian Sistem memproses login dari Admin. Jika valid (username dan password
benar) maka sistem akan menampilkan menu utama. Jika salah maka Admin harus
mengulangi input username dan password.
Kemudian setelah tampil menu utama, Admin melakukan Input Data Mahasiswa,
lalu menentukan titik pusat cluster (3 titik pusat cluster). Selanjutnya sistem memproses
data titik cluster tersebut. Kemudian sistem melakukan proses perhitungan dengan
metode K-Means Clustering. Sehingga menghasilkan output berupa hasil
pengelompokkan data mahasiswa. Lalu proses selesai.
3.4.1.3 Class Diagram
Class Diagram memperlihatkan hubungan antar kelas dan

penjelasan detail tiap-tiap kelas di dalam model desain (dalam logical
view) dari suatu sistem. Bentuk Class Diagram dari sistem aplikasi data mining yang
dibangun dapat dilihat pada gambar di bawah ini :
3.4.2 Desain Database
Mahasiswa
1
+ NIM* Varchar
Proses Clustering
- Nama Varchar Hasil 1..** m
- Jkel Varchar + NIM Varchar
- Kotaasal Varchar + NIM * Varchar - C1 Number
- Prodi Varchar - Nama
m Varchar - C2 Number
- C1 Number 1
- C3 Number
1..**
- C2 Number - Cluster Number
- C3 Number
+ TambahData ( ) - ClusterTerpilih Varchar + TambahData ( )
+ EditData ( ) + EditData ( )
+ HapusData ( ) + HapusData ( )
+ProsesPenilaian ( )
+CetakLaporan ( )
Login
+ Username * Text
+ Password Text
+ Login ( )
+ Exit ( )
Gambar 3.4 Class Diagram

Database merupakan sekumpulan data oprasional yang saling berhubungan
dengan redudansi minimal, yang digunakan secara bersama oleh beberapa aplikasi.
Database diterapkan untuk mengatasi masalah pengolahan data dengan cara
konvensional, yaitu jika struktur data diubah, program harus disesuaikan dan jika ada
duplikasi file, sulit untuk memlihara integrasi data.
3.4.2.1 Desain Tabel
Dalam perancangan database perencanaan data record tersimpan dalam

beberapa file dengan arsitektur data sebagai berikut :
1. Tabel Login
Tabel login berisi atribut-atribut mengenai username password yang harus di
input agar dapat masuk sebagai admin. Berikut tampilan tabel login di bawah ini:
Tabel 3.17 Login

No Field Name Type Field Field Size
1 Username Varchar 10
2 Password Varchar 10
2. Tabel Data Mahasiswa
Berikut rancangan struktur data yang dapat dilihat di bawah ini:
Tabel 3.18 Data Mahasiswa
No Field Name Type Field Field Size Keterangan
1 NIM Varchar 10 Primary Key
2 Nama Varchar 50 Nama Mahasiswa
3 Jkel Varchar 20 Jenis Kelamin
4 Kotaasal Varchar 20 Kota Asal
5 Prodi Varchar 20 Program Studi
3. Tabel Proses Clustering
Tabel proses clustering digunakan untuk menampung record data nilai
clustering yang kemudian akan disimpan sebagai database. Berikut tampilan
rancangan struktur yang berisi atribut-atribut data di bawah ini:
Tabel 3.19 Tabel Proses Clustering

2 C1 Number Long integer Jarak ke Cluster 1
5 Cluster Number Long integer Cluster
4. Tabel Hasil
Tabel hasil digunakan untuk menampung record data hasil clustering keseluruhan
yang kemudian akan disimpan sebagai Database. Berikut tampilan rancangan struktur
tabel yang berisi atribut-atribut data di bawah ini:
Tabel 3.20 Tabel Hasil

2 Nama Varchar 50 Nama Mahasiswa
3 ClusterTerpilih Varchar 10 Cluster yang terpilih
3.4.3 Perancangan Antar Muka
Dalam pembuatan program, dirancang beberapa form. Pembagian kedalam

beberapa form dimaksudkan untuk mempermudah pengguna dalam penggunaannya,
sehingga pengguna tidak mengalami kesulitan dalam pengoperasiannya.
Rancangan form sistem aplikasi Clustering untuk mendukung strategi promosi

dengan metode K-Means Clustering adalah sebagai berikut:
1. Rancangan Form Login

Tampilan form login merupakan form untuk menerima masukan username
dan password administrator yang kemudian akan dicek username dan password
tersebut telah valid jika ya, maka pengguna dapat menggunakan aplikasi ini,
sedangkan jika tidak, maka aplikasi ini akan menolak username dan password
tersebut dan aplikasi ini tidak dapat digunakan.
LOGIN SISTEM
Masukkan Username dan Password
LOGIN RESET
Gambar 3.6 Rancangan Login
2. Rancangan Menu Utama

Jendela tampilan Menu Utama yang terdiri dari beberapa sub menu dari
Menu File yang terdiri dari data Mahasiswa, data penilaian, data kriteria
sedangkan sub menu laporan terdiri dari laporan hasil. Tampilan rancangan Menu
Utama seperti pada gambar 3.6 berikut ini.
Logo Logout
Home UNIVERSITAS MEDAN AREA
Data Mahasiswa
Titik Cluster GAMBAR

Proses K-Means
Laporan
Gambar 3.6 Rancangan Menu Utama

3. Rancangan Form Data Mahasiswa
Jendela tampilan merancangan form data Mahasiswa merupakan form untuk
memasukkan data keterangan Mahasiswa beserta biodatanya yaitu NIM, nama
mahasiswa, jenis kelamin, kota asal dan prodi. Seperti pada gambar 3.7 berikut ini
Logout

Data Mahasiswa
Titik Cluster Tambah Data
Proses K-Means
Laporan Data Mahasiswa
Nama Jenis Kota

NIM Mahasiswa Prodi Aksi
Kelamin Asal
xxx xxx xxx 999 xxx x v
xxx xxx xxx 999 xxx x v
Gambar 3.7 Rancangan Halaman Mahasiswa
4. Rancangan Form Titik Cluster

Form titik cluster berfungsi untuk menentukan dan memproses data titik
cluster. Tombol simpan berfungsi untuk menyimpan data titik cluster yang telah
dipilih. Tombol keluar berfungsi untuk keluar dari tampilan form. Tampilan form
titik cluster dapat dilihat pada gambar 3.8 di bawah ini:
Logout

Data Mahasiswa
Proses K-Means
Laporan Data Titik Cluster
NIM Nama C1 C2 C3 Aksi
xxx 999 999 999 999 x v
xxx 999 999 999 999 x v
Gambar 3.8 Rancangan Halaman Titik Cluster
5. Rancangan Form Proses K-Means Clustering

Form proses perhitungan berfungsi untuk memproses data titik cluster
berdasarkan rumus dan persamaan yang telah ditentukan. Disini akan diproses
perhitungan titik cluster dengan metode K-Means Clustering dan menghasilkan
hasil clustering. Tombol proses berfungsi untuk melanjutkan ke proses
selanjutnya. Tombol keluar berfungsi untuk keluar dari tampilan form. Tampilan
form proses perhitungan dapat dilihat pada gambar 3.9 di bawah ini:
Logout

Data Mahasiswa
Proses K-Means
Laporan Data Titik Cluster
NIM Nama C1 C2 C3 Aksi
xxx 999 999 999 999 x v
xxx 999 999 999 999 x v
Gambar 3.9 Rancangan Halaman Clustering
6. Rancangan Laporan Hasil Pengelompokkan
Pada rancangan laporan hasil pengelompokkan merupakan laporan untuk

menampilkan data hasil perhitungan dari metode K-Means Clustering. Tampilan laporan
hasil pengelompokkan dengan menggunakan metode K-Means Clustering dapat
dilihatpada gambar 3.10 di bawah ini:
UNIVERSITAS MEDAN AREA
(UMA)
Jl. Setia Budi No 79 B Kec. Medan Sunggal Kota Medan

Laporan Hasil Analisa Clustering
NIM Nama Jarak C1 Jarak C2 Jarak C3 Cluster
Mahasiswa
xx Xxx 999 999 999 999
xx xxx 999 999 999 999
xx xxx 999 999 999 999

Gambar 3.13 Laporan Mahasiswa
Dari proses clustering dapat diambil kesimpulan bahwa :
Gambar 3.13 Laporan Mahasiswa
Xxxxx xxxxxx xxxxxx xxxxxx xxxxx xxxx xxxxxxxxxxxx xxxxxx
Xxxxx xxxxxx xxxxxx xxxxxx xxxxx xxxx xxxxxxxxxxxx xxxxxx
Xxxxx xxxxxx xxxxxx xxxxxx xxxxx xxxx xxxxxxxxxxxx.
Diketahui Oleh :
BAB IV
HASIL DAN PEMBAHASAN
4.1 Kebutuhan Sistem
Penerapan dan penggunaan aplikasi data mining untuk mendukung strategi
promosi pada Universitas Medan Area (UMA) menggunakan algoritma K-Means
Clustering membutuhkan beberapa alat perangkat pendukung, yaitu perangkat lunak
dan perangkat keras, minimal harus dipenuhi sehingga aplikasi ini dapat berjalan dengan
baik. Berikut adalah daftar spesifikasi minimal perangkat lunak dan perangkat keras.
1. Perangkat Keras (Hardware)
a. Memori minimal 2 GB.
b. Keyboard dan Mouse
c. Central processing unit (CPU), minimal Intel Dual Core.
d. Harddisk minimal 320 GB
2. Perangkat Lunak (Software)
a. Microsoft Windows 8 sebagai sistem operasi
b. XAMPP
c. Sublime Text
d. Browser Mozilla Firefox
4.2 Implementasi Sistem

Implementasi sistem merupakan bagian yang menerangkan tentang penerapan
dan hasil dari aplikasi data mining yang dijelaskan secara satu persatu. Dimulai dari form
login kemudian diteruskan ke menu utama, menu data dan terakhir menu laporan.
4.2.1 Login
Pada awal aplikasi dijalankan akan menampilkan form login, dimana user
diwajibkan untuk mengisi username dan password yang sudah terdaftar sebelumnya.
Dan akan menampilkan pesan atau peringatan (warning) jika nama user atau password
salah. Seperti pada gambar di bawah ini :
Gambar 4.1 Form Login
4.2.2 Menu Utama
Tampilan selanjutnya adalah menu utama Aplikasi data mining setelah
melakukan login terlebih dahulu. Menu utama terdiri dari beberapa menu yaitu Data
Mahasiswa, Proses, Laporan dan Keluar. Setiap menu memiliki sub menunya masing-
masing, kecuali menu Keluar yang tidak memiliki sub menu. Karena Keluar hanya
berfungsi untuk mengakhiri program. Gambar halaman utama aplikasi data mining ini
dapat dilihat di bawah ini:
Gambar 4.2 Tampilan Form Menu Utama
4.2.3 Form Mahasiswa
Tampilan ini berisikan tentang data Mahasiswa yang berfungsi sebagai media
dalam memasukan data mahasiswa baru dan juga mengedit serta menghapus data
Mahasiswa. Tampilan form dirancang agar mudah untuk digunakan oleh user. Adapun
tampilan form sebagai berikut:

Gambar 4.3 Tampilan Form Input Data Mahasiswa
Adapun fungsi-fungsi dari tombol yang terdapat dalam form mahasiswa yaitu :
Tambah : Menambah data mahasiswa
Edit : Merubah data-data yang dianggap salah
Hapus : Menghapus data-data yang dianggap tidak perlu
4.2.4 Form Titik Cluster
Tampilan Form Titik Cluster ini berfungsi untuk menampilkan hasil inisialisasi dan
memilih 3 data sebagai titik pusat Cluster. Adapun cara penggunaannya dengan terlebih
dahulu memilih (cheklist) pada list yang tersedia pada halaman titik cluster. Tampilan
form titik cluster dapat dilihat pada gambar berikut ini.

Gambar 4.4 Tampilan Form Titik Cluster
Gambar 4.5 Tampilan Form Proses Titik Cluster (lanjutan)

Adapun fungsi-fungsi dari tombol yang terdapat dalam form titik cluster yaitu
Simpan : Menyimpan data Titik Cluster baru
4.3 Pengujian Sistem
Setelah melalui tahap implementasi maka langkah selanjutnya adalah
melakukan pengujian sistem. Berikut dibawah ini tahap pengujian sistem.
4.3.1 Form Proses Clustering
Tampilan Form Proses Clustering ini berfungsi untuk melakukan proses
perhitungan jarak data ke titik Cluster menggunakan metode k-means clustering dan
menampilkan hasil perhitungan. Adapun hasil perhitungannya tampil dalam bentuk
listview. Klik tombol Proses untuk memulai perhitungan dengan metode K-Means
Clustering. Tampilan form sebagai berikut :
Gambar 4.6 Tampilan Form Clustering (Cluster 1)

Gambar 4.7 Tampilan Form Clustering (Cluster 2)
Gambar
4.8 Tampilan Form Clustering (Cluster 3)
4.3.2 Laporan Hasil Clustering
Form Laporan ini berfungsi untuk melihat hasil perhitungan Cluster dengan
metode K-Means Clustering beserta informasi lain mengenai Proses Titik Cluster
tersebut. Adapun hasil Cluster akan tampil pada kolom Cluster. Tampilan preview dapat
dilihat dibawah ini:

Gambar 4.9 Tampilan Preview Laporan Hasil Clustering
Laporan hasil clustering ini merupakan hasil perhitungan dari setiap data
mahasiswa ke jarak tiap pusat cluster pada iterasi 2. Seperti yang telah dijelaskan pada
Bab III halaman 50 (Tabel 3.14).

Gambar 4.10 Tampilan Preview Laporan Hasil Clustering (Bagian 2)
Dari hasil yang diatas, dapat dilihat bahwa dengan adanya aplikasi data mining
mendukung strategi promosi pada Universitas Medan Area (UMA) menggunakan
algoritma K-Means Clustering ini, yang dibuat dengan menggunakan perangkat-
perangkat lunak (software) dapat menganalisa data mahasiswa sehingga menghasilkan
laporan pengelompokkan data mahasiswa pada tiap-tiap cluster yang dapat digunakan
untuk kepentingan strategi promosi.
4.4 Kelemahan dan Kelebihan Sistem
Kelebihan dari aplikasi data mining mendukung strategi promosi pada
Universitas Medan Area (UMA) dengan metode k-means clustering yaitu:

a. Program ini dapat dijalankan di semua jenis komputer dan program ini tidak
membutuhkan spesifikasi komputer canggih untuk menjalankannya. Karena
program ini sangat ringan dan tidak memerlukan memori terlalu besar.
b. Dengan program ini mungkin dapat memotivasi kepada instansi lain untuk
melakukan kegiatan yang ter-update, mengikuti perkembangan jaman dan
teknologi.
Kelemahan dari sistem ini yaitu :
Keterbatasan sumber data, terbatas hanya dalam ruang lingkup aplikasi data mining
untuk mendukung strategi promosi saja.
a. Program ini tidak dapat melakukan backup data otomatis. Harus
dilakukan langsung dari komputer server apabila data akan di-backup.
b. Program ini tidak dapat melakukan backup data otomatis. Harus
dilakukan langsung dari computer server apabila data akan dibackup

BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
Setelah melakukan berbagai macam tahapan-tahapan maka diperoleh
beberapa kesimpulan sebagai berikut:
1. Hasil dari aplikasi data mining yang dibangun dapat mengadopsi
metode K-Means Clustering yang digunakan untuk mendukung
strategi promosi di Universitas Medan Area (UMA) secara tepat
dan akurat.
2. Setelah dilakukan pengujian dengan sampel data sebanyak 50
data mahasiswa, diperoleh hasil 3 (tiga) cluster. Dimana masing-
masing cluster memiliki karakteristik yang berbeda-beda.
5.2 Saran
Untuk meningkatkan kemampuan dan fungsi dari program data mining ini
ada beberapa saran yang dapat diberikan untuk pengembangan yang bisa
dilakukan, antara lain:
1. Program yang dibuat ini masih dapat dikembangkan lebih lanjut supaya
menjadi sistem yang lebih lengkap. Sehingga tidak hanya digunakan untuk
mendukung strategi promosi saja.

77
2. Program aplikasi data mining ini belum bisa di backup data secara otomatis.
Sehingga diharapkan kedepannya dapat dikembangkan lagi.
3. Program data mining untuk mendukung strategi promosi dengan metode K-
Means Clustering ini belum dibandingkan dengan metode lainnya, seperti
metode fuzzy atau yang lainnya.

DAFTAR PUSTAKA
Agustina, Silvia, dkk, “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan
Metode K-Means ,” J. Informatika dan Teknologi, vol. 2, no. 2, 2016.
Estri, Beta, dkk, “Analisis Segmentasi Pelanggan Menggunakan Kombinasi RFM

Model dan Teknik Clustering,” J. JUTEI, vol. 2, no.1, 2018.
Heriyanto, Yunahar, “Perancangan Sistem Informasi Rental Mobil Berbasis Web

Pada PT.APM Rent Car,” J. Intra-Tech, vol. 2, no. 2, pp. 64–77, 2018.
Iswandy, Eka, “Analisa Dan Perancangan Sistem Informasi Penagihan Purchasing

Order Customer Studi Kasus Pada Cv. Vertical Cipta Relasi Padang Dengan
Metode Centralized Data Processing,” J. TEKNOIF, vol. 4, no. Oktober, p.
14, 2016.
Mega, Windha, “Clustering Menggunakan Metode K-Means Untuk Menentukan

Status Gizi Balita,” Jurnal Informatika., vol. 15, no. 2, 2015.
Santoso dan R. Nurmalina, “Perencanaan dan Pengembangan Aplikasi Absensi

Mahasiswa Menggunakan Smart Card Guna Pengembangan Kampus Cerdas
(Studi Kasus Politeknik Negeri Tanah Laut),” J. Integr., vol. 9, no. 1, pp.
84–91, 2017.
Suendri, “Implementasi Diagram UML (Unified Modelling Language) Pada

Perancangan Sistem Informasi Remunerasi Dosen Dengan Database Oracle
(Studi Kasus: UIN Sumatera Utara Medan),” J. Ilmu Komput. dan Inform.,
vol. 3, no. 1, pp. 1–9, 2018.
Sulistyowati, dkk, “Analisa Segmentasi Konsumen Menggunakan Algoritma K-

Means Clustering, Institut Teknologi Adhi Tama Surabaya”, 2018.
Tofik Isa dan G. P. Hartawan, “Perancangan Aplikasi Koperasi Simpan Pinjam

Berbasis Web (Studi Kasus Koperasi Mitra Setia),” J. Ilm. Ilmu Ekon., vol.
5, no. 10, pp. 139–151, 2017.
Wijaya, Hadi, “Perancangan dan Implementasi Metode Oreste Pada Sistem

Pendukung Keputusan Seleksi Penerima Beasiswa,” Semin. Nas. Teknol.,
pp. 387–396, 2015.
Warman, Indra, “Analisis Perbandingan Kinerja Query Database Management

System (Dbms) Antara Mysql 5.7.16 Dan Mariadb 10.1,” Jurnal Teknoif,
pp. 32–42, 2018.
Yahya dan Mahfuz, “Penggunaan Algoritma K-Means Untuk
Menganalisis Pelanggan Potensial Pada Dealer SPS Motor
Honda Lombok Timur Nusa Tenggara Barat,” J. Informatika dan
Teknologi, vol. 2, no. 2, 2019.
Yanto, Robi dan R. Khoiriah, “Implementasi Data Mining dengan Metode

Algoritma Apriori dalam Menentukan Pola Pembelian Obat,” Creat. Inf.
Technol. J., vol. 2, no. 2, p. 102, 2017

Skripsi Yang Tergabung CX

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Skripsi Yang Tergabung CX

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS DATA MAHASISWA UNTUK MENDUKUNG

STRATEGI PROMOSI PADA UNIVERSITAS MEDAN AREA

PROGRAM STUDI TEKNIK INFORMATIKA

menyelesaikan Skripsi ini dengan judul “ANALISIS DATA MAHASISWA

UNTUK MENDUKUNGNG STRATEGI PROMOSI PADA UNIVERSITAS

MEDAN AREA MENGGUNAKAN K-MEANS CLUSTERING”.Tidak lupa

benderang seperti sekarang ini.

Sarjana di Jurusan Teknik Informatika Fakultas Teknik Universitas Islam

pembimbing tugas akhir. Dalam penyelesaian penulisan skripsi ini, penulis

spiritual, dan informasi secara langsung maupun tidak langsung.

Pada kesempatan ini penulis mengucapkan terima kasih yang sebesar

1. Bapak Abdul Haris Nasution, selaku Dekan Fakultas Teknik Universitas

Islam Sumatera Utara.

S1 Teknik Informatika UISU.

3. Bapak Mhd. Zulfansyuri Siambaton, ST.,M.Kom, selaku Dosen Penasehat

Akademik 2016 Jurusan Teknik Informatika UISU.

4. Bapak Khairuddin Nasution, ST,M.Kom selaku Dosen Pembimbing 1(satu)

Saya,yang telah Membantu Menyelesaikan Skripsi ini.

5. Ibu Tasliyah Haramaini,S.Si.,M.Kom Selaku Dosen Pembimbing 2(dua)

yang telah Membantu Menyelesaikan skripsi ini

6. Seluruh staf pengajar di Jurusan Teknik Informatika UISU.

dalam menyelesaikan skripsi ini.

8. Seluruh teman-teman di Jurusan Teknik Informatika UISU yang senantiasa

mensupport dan memberikan masukan dalam penyelesaian tugas akhir ini.

9. Semua pihak yang tidak dapat disebutkan satu persatu.

Penulis menyadari sepenuhnya, bahwa skripsi ini masih terdapat banyak

pihak yang sifatnya membangun demi kesempurnaan skripsi ini.

pada-Nyalah segala kesempurnaan berada. Akhir kata penulis berharap semoga

Muhammad Rishakim Marajari

BAB II TINJAUAN PUSTAKA

BAB III METODE PENELITIAN

BAB IV HASIL DAN PEMBAHASAN

4.1 Kebutuhan Sistem..........................................................................67

BAB V KESIMPULAN DAN SARAN

Gambar 2.1 Tampilan XAMPP .........................................................26

Tabel 2.1 Simbol-Simbol Use Case Diagram.....................................18

1.1 Latar Belakang

Kemajuan teknologi informasi sudah semakin berkembang

pesat disegala bidang kehidupan. Banyak sekali data yang

dihasilkan oleh teknologi informasi yang canggih, mulai dari bidang

industri, ekonomi, ilmu dan teknologi serta berbagai bidang

kehidupan lainnya. Penerapan teknologi informasi dalam dunia

pendidikan juga dapat menghasilkan data yang berlimpah mengenai

siswa dan proses pembelajaran yang dihasilkan.

Pada institusi pendidikan perguruan tinggi, data dapat

diperoleh berdasarkan data historis, sehingga data akan bertambah

secara terus menerus, misalnya data mahasiswa. Proses

penerimaan mahasiswa baru dalam sebuah perguruan tinggi

menghasilkan data yang berlimpah berupa profil dari mahasiswa

kegiatan belajar mengajar, sehingga dapat diketahui data prestasi

pada sebuah perguruan tinggi. Penumpukan data mahasiswa

secara menerus akan memperlambat pencarian informasi terhadap

Berdasarkan berlimpahnya data mahasiswa, informasi yang

tersembunyi dapat diketahui dengan cara melakukan pengolahan

terhadap data tersebut sehingga berguna bagi pihak universitas.

Pengolahan data mahasiswa perlu dilakukan untuk mengetahui

informasi penting berupa pengetahuan baru (knowledge discovery),

misalnya informasi mengenai pengelompokan data mahasiswa

berpotensi berdasarkan kota asal mahasiswa. Pengetahuan baru

tersebut dapat membantu pihak universitas dalam menentukan

strategi promosi terhadap calon mahasiswa baru dengan tepat

jumlah mahasiswa baru adalah dengan memanfaatkan data

mahasiswa diintegrasikan dengan teknik data mining sehingga