Anda di halaman 1dari 96

ANALISIS DATA MAHASISWA UNTUK MENDUKUNG

STRATEGI PROMOSI PADA UNIVERSITAS MEDAN AREA


MENGGUNAKAN K-MEANS CLUSTERING

TUGAS AKHIR

Oleh
Muhammad Rishakim Marajari
71160915020

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS ISLAM SUMATERA UTARA
2020

7
KATA PENGANTAR

Assalammualaikum Wr. Wb

Alhamdulillah, segala puji dan syukur saya panjatkan kepada Allah SWT,

yang telah memberikan Rahmat dan Hidayah-Nya kepada saya sehingga dapat

menyelesaikan Skripsi ini dengan judul “ANALISIS DATA MAHASISWA

UNTUK MENDUKUNGNG STRATEGI PROMOSI PADA UNIVERSITAS

MEDAN AREA MENGGUNAKAN K-MEANS CLUSTERING”.Tidak lupa

shalawat beriring salam saya hadiahkan kepada Nabi Besar Muhammad SAW

yang telah membawa kita dari alam kegelapan menuju alam yang terang

benderang seperti sekarang ini.

Skripsi ini ditujukan untuk memenuhi salah satu syarat kelulusan Program

Sarjana di Jurusan Teknik Informatika Fakultas Teknik Universitas Islam

Sumatera Utara. Hal tersebut tentunya tidak terlepas dari bantuan dosen

pembimbing tugas akhir. Dalam penyelesaian penulisan skripsi ini, penulis

banyak mendapatkan bimbingan dan bantuan dari pihak lain berupa materil,

spiritual, dan informasi secara langsung maupun tidak langsung.

Pada kesempatan ini penulis mengucapkan terima kasih yang sebesar

besarnya kepada :

1. Bapak Abdul Haris Nasution, selaku Dekan Fakultas Teknik Universitas

Islam Sumatera Utara.

8
2. Bapak Mhd. Zulfansyuri Siambaton, ST.,M.Kom, selaku Plt. Ketua Jurusan

S1 Teknik Informatika UISU.

3. Bapak Mhd. Zulfansyuri Siambaton, ST.,M.Kom, selaku Dosen Penasehat

Akademik 2016 Jurusan Teknik Informatika UISU.

4. Bapak Khairuddin Nasution, ST,M.Kom selaku Dosen Pembimbing 1(satu)

Saya,yang telah Membantu Menyelesaikan Skripsi ini.

5. Ibu Tasliyah Haramaini,S.Si.,M.Kom Selaku Dosen Pembimbing 2(dua)

yang telah Membantu Menyelesaikan skripsi ini

6. Seluruh staf pengajar di Jurusan Teknik Informatika UISU.

7. Kedua orang tua tercinta: Alm IR.Ibrahim dan Tuti Indrawati , serta seluruh

keluarga yang telah memberikan do’a restu dan dorongan kepada penulis

dalam menyelesaikan skripsi ini.

8. Seluruh teman-teman di Jurusan Teknik Informatika UISU yang senantiasa

mensupport dan memberikan masukan dalam penyelesaian tugas akhir ini.

9. Semua pihak yang tidak dapat disebutkan satu persatu.

Penulis menyadari sepenuhnya, bahwa skripsi ini masih terdapat banyak

kekurangan yang perlu diperbaiki, baik dari segi penyajian, bentuk maupun isi.

Dengan kerendahan hati penulis sangat mengharapkan kritik dan saran dari semua

pihak yang sifatnya membangun demi kesempurnaan skripsi ini.

9
Akhirul kalam kepada Allah SWT penulis berserah diri, karena hanya

pada-Nyalah segala kesempurnaan berada. Akhir kata penulis berharap semoga

Skripsi ini dapat berguna bagi semua pihak yang membacanya, amin.

Penulis

Muhammad Rishakim Marajari

10
DAFTAR ISI

Halaman
KATA PENGANTAR ............................................................... I
DAFTAR ISI ........................................................................... IV
DAFTAR GAMBAR ................................................................. VII
DAFTAR TABEL .................................................................... VIII
DAFTAR PUSTAKA.................................................................. IX
DAFTAR LAMPIRAN ..............................................................
ABSTRAK...................................................................................

BAB I PENDAHULUAN
1.1 Latar Belakang...............................................................................1
1.2 Rumusan Masalah........................................................................3
1.3 Manfaat Masalah..........................................................................3
1.4 Tujuan Penelitian ..........................................................................4
1.5 Batasan Masalah............................................................................5
1.6 Metode Penelitian ........................................................................5
1.7 Sistematika Penulisan ...................................................................6

BAB II TINJAUAN PUSTAKA


2.1 Data Mining................................................................................... 9
2.1.1 Teknik-Teknik Data Mining.................................................11
2.1.2 Tahapan Proses Data Mining................................................14
2.2 K-Means Clustering ......................................................................14
2.3 Unified Modeling Language(UML) .............................................17
2.3.1 Use Case...............................................................................18
2.3.2 Activity Diagram..................................................................20
2.3.3 Class Diagram......................................................................21
2.4 Flowchart........................................................................................23

11
2.5 XAMPP..........................................................................................25
2.6 PHP.................................................................................................26
2.7 MySQL……………………………………………………………28
2.7.1 Sejarah Universitas Medan Area……………………………30
2.7.2 Struktur Organisasi Universitas Medan Area……………….32

BAB III METODE PENELITIAN


3.1 Analisis Permasalah....................................................................... 32
3.2 Penerapan Metode K-Means Clustering........................................ 36
3.2.1 Transfromasi Data................................................................ 36
3.2.2 Pengolahan Data Dengan K-Means Clustering……………36
3.3 Rancangan Flowchart..................................................................... 53
3.4 Pemodelan/Perancangan Sistem…………………………………..54
3.4.1 Unifield Modeling Languange(UML)......................................... 54
3.4.1.1 Use Case Diagram........................................................... 54
3.4.1.2 Activity Diagram ............................................................ 57
3.4.1.3 Class Diagram................................................................. 57
3.4.2 Desain Database.......................................................................... 60
3.4.2.1 Desain Tabel……………………………………………..60
3.4.3 Perancangan Antar Muka………………………………….62

BAB IV HASIL DAN PEMBAHASAN

4.1 Kebutuhan Sistem..........................................................................67


4.2 Implementasi Sistem ..............................................................67
4.2.1 Login .....................................................................................68
4.2.2 Menu Utama..........................................................................68
4.2.3 Form Mahasiswa...................................................................69
4.2.4 Form Titik Cluster................................................................70
4.3 Pengujian Sistem ..........................................................................71

12
4.3.1 Form Proses Clustering……………………………………….71
4.3.2 Laporan Hasil Clustering……………………………………...73
4.4 Kelemahan dan Kelebihan Sistem..................................................74

BAB V KESIMPULAN DAN SARAN


5.1 Kesimpulan ...................................................................................76
5.2 Saran..............................................................................................76
DAFTAR PUSTAKA
LAMPIR

13
DAFTAR GAMBAR
HALAMAN

Gambar 2.1 Tampilan XAMPP .........................................................26


Gambar 2.2 Struktur Organisasi Medan Area....................................32
Gambar 3.1 FlowChart Metode K-Means Clustering........................53
Gambar 3.2 Use Case Diagram .........................................................55
Gambar 3.3 Activity Diagram Program K-Means Clustering...........58
Gambar 3.4 Class Diagram ...............................................................59
Gambar 3.5 Rancangan Form Login..................................................53
Gambar 3.6 Rancangan Menu Utama................................................54
Gambar 3.7 Rancangan Halaman Mahasiswa...................................63
Gambar 3.8 Rancangan Halaman Titik Cluster.................................64
Gambar 3.9 Rancangan Halaman Clustering.....................................65
Gambar 3.10 Rancangan Laporan Hasil Clustering...........................66
Gambar 4.1 Form Login....................................................................68
Gambar 4.2 Tampilan Form Menu Utama.........................................69
Gambar 4.3 Tampilan Form Input Data Mahasiswa..........................69
Gambar 4.4 Tampilan Form Titik Cluster ........................................70
Gambar 4.5 Tampilan Form Proses Titik Cluster...............................71
Gambar 4.6 Tampilan Form Clustering (Cluster 1)...........................72
Gambar 4.7 Tampilan Form Clustering (Cluster 2)............................72
Gambar 4.8 Tampilan Form Clustering (Cluster 3)...........................72
Gambar 4.9 Tampilan Preview Laporan Hasil Clustering.................73
Gambar 4.10 Tampilan Preview Laporan Hasil Clustering (2).........74
DAFTAR TABEL
HALAMAN

Tabel 2.1 Simbol-Simbol Use Case Diagram.....................................18


Tabel 2.2 Simbol Activity Diagram....................................................20
Tabel 2.3 Simbol Class Diagram........................................................22
Tabel 2.4 Simbol-Simbol Flowchart...................................................27
Tabel 3.1 Data Riset Mahasiswa.........................................................34
Tabel 3.2 Inisialisasi Data Jenis Kelamin Mahasiswa........................36
Tabel 3.3 Inisialisasi Data Kota Asal..................................................37
Tabel 3.4 Inisialisasi Data Prodi.........................................................38
Tabel 3.5 Hasil Inisialisasi Seluruh Data Mahasiswa.........................38
Tabel 3.6 Titik Pusat Awal Setiap Cluster..........................................40
Tabel 3.7 Inisialisasi Titik Pusat Awal Setiap Cluster.........................40
Tabel 3.8 Hasil Perhitungan Setiap Data Ke Pusat Cluster................42
Tabel 3.9 Anggota Cluster 1...............................................................44
Tabel 3.10 Anggota Cluster 2 .............................................................45
Tabel 3.11 Anggota Cluster 3..............................................................46
Tabel 3.12 Titik Pusat Cluster Pada Iterasi 2.......................................46
Tabel 3.13 Hasil Perhitungan Setiap Data Pusat Pada Iterasi 2...........48
Tabel 3.14 Anggota Cluster 1 Hasil Iterasi 2.......................................50
Tabel 3.15 Anggota Cluster 2 Hasil Iterasi 2.......................................50
Tabel 3.16 Anggota Cluster 3 Hasil Iterasi 2.......................................51
Tabel 3.17 Login..................................................................................60
Tabel 3.18 Data Mahasiswa.................................................................60
Tabel 3.19 Tabel Proses Clustering.....................................................61
BAB I

PENDAHULUAN

1.1 Latar Belakang

Kemajuan teknologi informasi sudah semakin berkembang

pesat disegala bidang kehidupan. Banyak sekali data yang

dihasilkan oleh teknologi informasi yang canggih, mulai dari bidang

industri, ekonomi, ilmu dan teknologi serta berbagai bidang

kehidupan lainnya. Penerapan teknologi informasi dalam dunia

pendidikan juga dapat menghasilkan data yang berlimpah mengenai

siswa dan proses pembelajaran yang dihasilkan.

Pada institusi pendidikan perguruan tinggi, data dapat

diperoleh berdasarkan data historis, sehingga data akan bertambah

secara terus menerus, misalnya data mahasiswa. Proses

penerimaan mahasiswa baru dalam sebuah perguruan tinggi

menghasilkan data yang berlimpah berupa profil dari mahasiswa


baru tersebut. Tahap selanjutnya mahasiswa akan melakukan

kegiatan belajar mengajar, sehingga dapat diketahui data prestasi

mereka setiap akhir semester. Hal ini akan terjadi secara berulang

pada sebuah perguruan tinggi. Penumpukan data mahasiswa

secara menerus akan memperlambat pencarian informasi terhadap

data tersebut.

Berdasarkan berlimpahnya data mahasiswa, informasi yang

tersembunyi dapat diketahui dengan cara melakukan pengolahan

terhadap data tersebut sehingga berguna bagi pihak universitas.

Pengolahan data mahasiswa perlu dilakukan untuk mengetahui

informasi penting berupa pengetahuan baru (knowledge discovery),

misalnya informasi mengenai pengelompokan data mahasiswa

berpotensi berdasarkan kota asal mahasiswa. Pengetahuan baru

tersebut dapat membantu pihak universitas dalam menentukan

strategi promosi terhadap calon mahasiswa baru dengan tepat

sasaran.
Salah satu langkah yang dapat dilakukan untuk meningkatkan

jumlah mahasiswa baru adalah dengan memanfaatkan data

mahasiswa diintegrasikan dengan teknik data mining sehingga

menghasilkan kesimpulan. Kesimpulan tersebut dapat digunakan

untuk pengambilan keputusan dalam menentukan wilayah promosi

yang tepat sasaran. Pengolahan data mahasiswa seharusnya

dilakukan agar dapat menentukan wilayah promosi yang tepat

sasaran sehingga dapat meningkatkan jumlah mahasiswa pada

tahun berikutnya.

Penelitian ini akan melakukan pengelompokan menggunakan

teknik Data Mining, berdasarkan pada data mahasiswa Universitas

Medan Area. Data mining didefinisikan sebagai proses menemukan pola dalam

data. Proses ini harus otomatis atau biasanya secara semi-otomatis. Pola yang

dihasilkan harus berarti bahwa pola tersebut memberikan beberapa keuntungan.

Pola tersebut diidentifikasi, divalidasi, dan digunakan untuk membuat sebuah

prediksi.

Data mining memiliki berbagai macam teknik analisa,

diantaranya adalah teknik Clustering. Clustering merupakan data


mentah yang sangat besar sulit untuk dianalisis dan dipahami, oleh

karena itu perlu adanya pengelompokan/clustering. Dalam hal ini

pengelompokan bertujuan untuk meningkatkan pemahaman terhadap

data, untuk menilai kualitas dari data tersebut (Yahya, 2019).

K-Means adalah salah satu algoritma dalam data mining yang bisa

digunakan untuk melakukan pengelompokan/clustering suatu data. Ada banyak

pendekatan untuk membuat cluster, diantaranya adalah membuat aturan yang

mendikte keanggotaan dalam group yang sama berdasarkan tingkat persamaan

diantara anggota-anggotanya (Windha Mega, 2015).

Algoritma K-Means merupakan metode non-hierarchial yang pada awalnya

mengambil sebagian dari banyaknya komponen dari populasi untuk dijadikan

pusat cluster awal. Pada step ini pusat cluster dipilih secara acak dari sekumpulan

populasi data. Berikutnya K-Means menguji masing-masing komponen di dalam

populasi data dan menandai komponen tersebut ke salah satu pusat cluster yang

telah didefinisikan tergantung dari jarak minimum antar komponen dengan tiap-

tiap pusat cluster (Silvi Agustina, 2016).

Adapun atribut/variabel yang akan digunakan dalam penentuan

pengelompokan wilayah untuk menentukan strategi promosi pada

Universitas Medan Area adalah program studi mahasiswa, kota asal

mahasiswa dan jenis kelamin.


Hal-hal tersebut yang mendorong untuk melakukan penelitian ini dengan

judul “Analisis Data Mahasiswa Untuk Mendukung Strategi Promosi Pada

Universitas Medan Area Menggunakan K-Means Clustering”, diharapkan

dengan dibuatnya skripsi ini dapat berguna untuk meningkatkan ketepatan

promosi terhadap calon mahasiswa baru.

1.2 Rumusan Masalah

Dengan mengacu pada uraian latar belakang masalah diatas, maka

permasalahan yang dibahas dan diteliti yaitu :

1. Bagaimana penerapan algoritma K-Means menganalisis data mahasiswa dalam

proses Data Mining untuk menentukan strategi promosi pada Universitas

Medan Area?

2. Bagaimana mengimplementasikan data mining dengan menggunakan bahasa

pemrograman berbasis website untuk mendukung strategi promosi pada

Universitas Medan Area?

1.3 Manfaat Penelitian

Adapun manfaat yang bisa didapat dari penulisan penelitian ini adalah:

1. Mempermudah pengelompokan data mahasiswa dengan menggunakan

algoritma K-Means.

2. Memberikan data dan informasi secara cepat mengenai pengelompokan data

mahasiswa baru.

3. Mempermudah pihak universitas dalam menentukan strategi promosi untuk

meningkatkan jumlah mahasiswa baru


1.4 Tujuan Penelitian

Adapun beberapa tujuan dari penelitian ini adalah :

1. Untuk menerapkan algoritma K-Means menganalisis data mahasiswa dalam

proses Data Mining untuk menentukan strategi promosi pada Universitas

Medan Area.

2. Untuk mengimplementasikan data mining dengan menggunakan bahasa

pemrograman berbasis website untuk mendukung strategi promosi pada

Universitas Medan Area.

1.5 Batasan Masalah

Untuk menghindari pembahasan yang meluas, maka ada beberapa batasan

permasalahan yaitu :

1. Proses clustering dengan algoritma K-Means akan diterapkan pada data

mahasiswa Universitas Medan Area.

2. Data mahasiswa yang dianalisis adalah data mahasiswa yang masuk pada

periode tahun 2019.

3. Sampel data yang digunakan sebanyak 50 data mahasiswa dari berbagai

jurusan.

4. Aplikasi yang dibangun berbasis website dengan PHP dan database MySQL.

1.6 Metode Penelitian.

Pada penelitian ini peneliti menggunakan pendekatan R&D (Research and

Developement), maka berikut ini adalah metode penelitiannya yaitu sebagai

berikut:
1. Teknik Pengumpulan Data (Data Collecting)

Adapun beberapa teknik yang digunakan dalam pengumpulan data dari

penelitian yaitu:

a. Observasi

Observasi merupakan teknik pengumpulan data dengan melakukan

tinjauan langsung ke tempat studi kasus dimana akan dilakukan

penelitian. Dalam hal ini peneliti melakukan observasi ke Universitas

Medan Area.

b. Wawancara

Teknik wawancara ini dilakukan untuk mendapatkan informasi tambahan

dari Universitas Medan Area yang memiliki wewenang dan berinteraksi

langsung dengan sistem yang akan dirancang sebagai sumber data.

2. Studi Kepustakaan (Library Research)

Studi Kepustakaan merupakan salah satu elemen yang mendukung sebagai

landasan teoritis peneliti untuk mengkaji masalah yang dibahas. Dalam hal

ini, peneliti menggunakan beberapa sumber kepustakaan diantaranya: buku,

jurnal nasional, jurnal internasional dan sumber-sumber lainnya.

3. Teknik Perancangan Sistem (Design System)

Sesuai dengan rumusan masalah yang menggunakan pendekatan Classic or

Waterfall Algorithm maka berikut ini adalah teknik perancangan sistem yang

digunakan:

a. Analisis Masalah dan Kebutuhan

b. Perancangan Sistem dan Pemodelan


c. Pengkodean

d. Pengujian

e. Implementasi Sistem

1.7 Sistematika Penulisan

Agar penelitian ini tersusun dengan mudah dan dapat dimengerti dengan

baik maka penyusunan penelitian ini ada 5 (lima) bab, dengan sistematika

penulisan sebagai berikut :

BAB I PENDAHULUAN

Pada bab pendahuluan menguraikan tentang latar belakang masalah,

rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode

penelitian, dan sistematika penulisan.

BAB II TINJAUAN PUSTAKA

Bab ini membahas dasar teori tentang, data mining, teknik-teknik data

mining, algoritma K-Means Clustering, pemodelan sistem, flowchart, aplikasi-

aplikasi yang digunakan dan teori-teori yang mendukung pengembangan sistem

serta analisa perancangan sistem yang digunakan.

BAB III METODE PENELITIAN

Bab ini berisi tentang menganalisan dan mendefinisikan masalah dan

solusinya untuk pembentukan sistem terkomputerisasi.


BAB IV HASIL DAN PEMBAHASAN

Bab ini membahas implementasi dari sistem yaitu hasil rancangan aplikasi

Data Mining disertai cara kerja dan penggunaanya. Adapun pengujian-pengujian

aplikasi dilakukan untuk mengetahui kekurangan yang terdapat pada perangkat

lunak. Analisa dilakukan untuk memperbaiki aplikasi apabila terdapat kesalahan

atau kekurangan pada program yang diperoleh.

BAB V KESIMPULAN DAN SARAN

Bab ini berisi kesimpulan yaitu merupakan jawaban dari permasalahan

penelitian ini sedangkan untuk saran adalah pengembangan dan perbaikan serta

penyempurnaan terhadap program aplikasi yang telah dibuat untuk meningkatkan

kualitas algoritma K-Means Clustering


BAB II

TINJAUAN PUSTAKA

2.1 Data Mining

Data adalah kumpulan informasi yang digunakan dalam proses pengambilan

kesimpulan maupun pengambilan keputusan. Data merupakan bentuk jamak dari

bentuk tunggal datum atau data-item. Data adalah kenyataan yang menggambarkan

suatu kejadian dan kesatuan nyata (Eka Iswandy, 2016).

Data Mining merupakan suatu proses untuk mendapatkan informasi baru dari

kumpulan data dengan menggunakan algoritma dan teknik yang melibatkan bidang ilmu

statistik, mesin pembelajaran dan sistem manajemen database. Data Mining digunakan

untuk ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Dengan

adanya Data Mining maka akan didapatkan suatu permata berupa pengetahuan di

dalam kumpulan data yang banyak jumlahnya.

Banyak istilah yang digunakan untuk menunjukkan proses Data Mining. Untuk

dapat memberikan pemahaman tentang Data Mining, berikut ini adalah beberapa fakta

yang terjadi seperti banyaknya organisasi, baik dari dunia bisnis maupun pemerintah

berurusan dengan sejumlah informasi dan juga pengelolaan basis data informasi

tersebut dan bukan tidak mungkin termasuk didalamnya kebutuhan akan pembangunan

Data Warehouse dalam skala besar. Seringkali data yang tersimpan tidak dapat secara

langsung dianalisa dengan metode statistik standar, hal ini disebabkan karena adanya
beberapa record yang hilang ataupun karena datanya dalam dimensi ukuran kualitatif

bukan kuantitatif.

Data mining merupakan sebuah proses ekstraksi data menjadi informasi atau

pengetahuan yang baru. Data yang diolah sebelumnya merupakan data yang bersifat

implisit dan biasanya dianggap tidak berguna serta data dalam jumlah besar (Robi Yanto,

2017).

Terdapat empat tugas utama data mining yaitu sebagai berikut :

1. Predictive Modelling

Predictive modelling digunakan untuk membangun sebuah model untuk target

variable sebagai fungsi dari explanatory variable. Explanatory variable dalam hal ini

merupakan semua atribut yang digunakan untuk melakukan prediksi, sedangkan

variabel target merupakan atribut yang akan diprediksi nilainya. Predictive modelling

dibagi menjadi dua tipe yaitu : Classification digunakan untuk memprediksi nilai dari

target variable yang discrete (diskrit) dan regression digunakan untuk memprediksi

nilai dari target variable yang continue (berkelanjutan).

2. Association Analysis

Association analysis digunakan untuk menemukan aturan asosiasi yang

memperlihatkan kondisi-kondisi nilai atribut yang sering muncul secara bersamaan

dalam sebuah himpunan data.

3. Cluster Analysis

Tidak seperti klasifikasi yang menganalisa kelas data obyek yang mengandung label.

Clustering menganalisa objek data tanpa memeriksa kelas label yang diketahui. Label-
label kelas dilibatkan di dalam data training. Karena belum diketahui sebelumnya.

Clustering merupakan proses pengelompokkan sekumpulan objek yang sangat mirip.

4. Anomaly Detection

Anomaly detection merupakan metode pendeteksian suatu data dimana tujuannya

adalah menemukan objek yang berbeda dari sebagian besar objek lain. Anomaly

dapat dideteksi dengan menggunakan uji statistik yang menerapkan model distribusi

atau probabilitas untuk data.

2.1.1 Teknik-Teknik Data Mining

Data Mining merupakan ilmu baru yang berakar dari berbagai bidang ilmu

seperti kecerdasan buatan (Artificial Intelligence), mesin learning, statistik dan database.

Oleh karena itu dalam menggali informasi, Data Mining menggunakan beberapa teknik,

antara lain :

1.Association Discovery

Association Discovery adalah teknik mempelajari sekumpulan data dan untuk

menunjukkan hubungan antara kemunculan atribut-atribut dalam data. Teknik ini

mencoba untuk menyiapkan nilai-nilai yang muncul pada saat bersamaan dalam

setiap barisnya dan menampilkan hasil keluaran yang disimpulkan dalam sebuah rule.

2.Clustering

Clustering adalah proses pengumpulan data yang serumpun dari sebuah dataset yang

lebih besar. Teknik ini menyingkapkan sejumlah kelompok-kelompok yang digunakan

sebagai masukan datanya. Dengan Clustering kelompok minoritas yang tersebar

dikelompokkan dalam sebuah kelompok besar yang memiliki kemiripan entitas.


Clustering dapat juga digunakan untuk mendeteksi secara otomatis cluster dari

record-record yang berdekatan dengan pengertian tertentu di dalam keseluruhan

variabel-variabel.

3.Sequential Discovery

Sequential Discovery adalah teknik mencari pola-pola diantara peristiwa-peristiwa

yang muncul dalam periode waktu. Metode ini dapat digunakan untuk mencari pola

komoditas yang terjadi berulang kali. Teknik ini terkonsentrasi pada kebiasaan yang

sama yang sering muncul dikemudian hari. Menurut laporan tersebut diungkapkan

bahwa algoritma yang dipakai memiliki kriteria sebagai berikut :

a. One Scan : algoritma ini membutuhkan paling sedikit satu kali penelusuran basis

data untuk membuat cluster yang diinginkan.

b. Anytime Algorithm : algoritma ini selalu dapat menyediakan jawaban yang terbaik

setiap saat selama komputasi dijalankan.

c. Interruptable and Incremental : algoritma ini dapat ditunda, dapat dihentikan dan

dijalankan lagi, dan hasil sementara yang muncul dapat disimpan untuk

kelanjutan komputasi data baru lebih lanjut.

d. Limitted RAM Requirement : algoritma ini mampu bekerja dalam kondisi memori

yang terbatas.

e. Forward-only Cursor : algoritma ini mampu untuk beroperasi pada basis data

dengan kursor (proses) bergerak maju hingga akhir data.

4.Classification

Classification adalah proses pengumpulan data bersama-sama yang didasarkan atas

sekumpulan kesamaan yang awalnya telah ditentukan oleh seorang analis sebelum
analisa dimulai. Teknik ini memeriksa data yang telah diklasifikasikan dan

dikumpulkan dalam grup bersama-sama sesuai dengan aturan keanggotaannya.

Aturan keanggotaan bisa mempunyai komponen waktu, komponen geografis,

komponen kuantitatif. Proses klasifikasi ini dapat dibagi menjadi tiga fase :

a. Learning : algoritma yang mencari sejumlah record dari training set dan

menciptakan sebuah deskripsi tentang model klasifikasi. Model ini dibuat kecil

dan persis pada saat yang sama.

b. Model yang sudah dibuat harus diuji dengan serangkaian uji coba dalam sebuah

basis data. Sebagai training set, record-record uji coba harus merupakan

kumpulan yang sudah lebih dahulu diklasifikasikan. Record untuk uji coba harus

berbeda dengan training set. Model classification akan selalu bekerja dengan

sempurna dalam training set yang digunakan.

c. Classification, model iterasi yang digunakan untuk membuat klasifikasi pada sisa

record-record dalam basis data yang ada.

5.Neural Network

Neural Network merupakan sebuah metode khusus untuk pengendalian

identifikasi pola yang digunakan pada trend perkiraan berdasarkan kebiasaan yang

telah diketahui sebelumnya. Suatu trend atau kecenderungan dapat diidentifikasikan

sebagai pergerakan yang ditujukan berdasarkan pada kebiasaan yang lama. Inti dari

pemrosesan didasarkan pada pengolahan data yang meniru dari fungsi sistem saraf

tubuh manusia. Pengetahuan dapat dipelajari dari suatu kumpulan data yang

terpisah dan kompleks. Ada tiga lapisan (layers) pada network, lapisan kiri yang

menerima masukan (input), lapisan tersembunyi (hidden layer neurons) yang

menjalankan fungsi kerja pemrosesan datanya, dan lapisan kanan yang menampilkan

analisa hasil keluaran. Ketika network dilatih (trained) dengan informasi yang
dimasukkan melalui masukan (input) akan diproses oleh lapisan tengah (neurons)

yang menjadikannya cerdas dalam sejumlah elemen data yang ada dan

mengeluarkan hasil pada lapisan keluarnya.

2.1.2 Tahapan Proses Data Mining

Data mining serangkaian proses seperti yang dijelaskan sebagai berikut:

1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise).

2. Integrasi data (penggabungan data dari beberapa sumber)

3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk ditambang)

4. Aplikasi teknik data mining, proses ekstraksi pola dari data yang ada

5. Evaluasi pola yang ditemukan (proses interpretasi pola menjadi pengetahuan yang

dapat digunakan untuk mendukung pengambilan keputusan).

6. Presentasi pengetahuan (dengan teknik visualisasi).

2.2 K-Means Clustering

K-Means adalah salah satu algoritma dalam clustering yang berulang-ulang.

Algoritma K-Means dimulai dengan memilih secara acak K, K di sini merupakan

banyaknya cluster yang ingin dibentuk. Kemudian menetapkan nilai K secara random,

untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan

centroid, mean atau “means”.

Clustering adalah studi formal untuk partisi atau mengelompokkan data dengan

tidak menggunakan pelabelan kategori. Clustering bersifat unsupervised learning atau

tidak mempunyai tahap pelatihan data, berbeda dengan klasifikasi. Clustering digunakan
untuk mengelompokkan data secara alamiah berdasarkan kemiripan pada objek data

dan sebaliknya meminimalkan kemiripan terhadap cluster lain (Beta Estri, 2018).

Menggunakan pendekatan partitional clustering. Tiap cluster dihubungkan dengan

sebuah centroid (titik pusat). Tiap titik ditempatkan ke dalam cluster dengan centroid

terdekat. Jumlah cluster, K, harus ditentukan. Berikut adalah langkah-langkah algoritma

K-Means (Sulistyowati, 2018) :

1. Pilih jumlah cluster k

2. Inisialisasi k pusat cluster bisa dilakukan dengan berbagai cara. Cara yang sering

dilakukan adalah dengan cara acak. Pusat-pusat cluster diberi nilai awal dengan

angka-angka random

3. Alokasikan semua data/objek ke cluster terdekat. Kedekatan dua objek ditentukan

berdasarkan jarak kedua objek tersebut. Demikian juga kedekatan suatu data ke

cluster tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini

perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak antara satu data dengan

satu cluster tertentu akan menentukan suatu data masuk dalam cluster mana. Untuk

menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori

jarak Euclidean.

4. Hitung kembali pusat cluster dengan keanggotaan cluster yang sekarang. Pusat

cluster adalah rata-rata dari semua data/objek dalam cluster tertentu. Jika

dikehendaki bisa juga menggunakan median (nilai tengah) dari cluster tersebut. Jadi

rata-rata (mean) bukan satu-satunya ukuran yang bisa dipakai.

5. Tugaskan lagi setiap objek memakai pusat cluster yang baru. Jika pusat cluster tidak

berubah lagi maka proses clustering selesai. Jika pusat cluster berubah maka kembali

ke langkah nomor 3 lagi.


Pada langkah 3 lokasi centroid (titik pusat) setiap kelompok yang diambil dari rata-

rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M

menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke-i dalam sebuah

kelompok, dan p menyatakan dimensi data, untuk menghitung sentroid fitur ke-i

digunakan formula :

M
1
Ci = ∑x
M j =1 j
……………………………………………. (2.1)

Formula tersebut dilakukan sebanyak p dimensi sehingga i mulai dari 1 sampai p.

Ada beberapa cara yang dapat digunakan untuk mengukur jarak data ke pusat

kelompok, diantaranya Euclidean, Manhattan/City Block serta Minkowsky. Masing-

masing cara mempunyai kelebihan dan kekurangan.

Pengukuran jarak pada ruang jarak (distance space) Euclidean menggunakan

formula

p
D(x2,x1) = ||x2 – x1||2 = √∑j=1
¿ x 2 j−x 1 j∨¿ ¿ 2 ………………... (2.2)

D adalah jarak antara data x2 dan x1, dan | . | adalah nilai mutlak. Pengukuran jarak

pada ruang jarak Manhattan menggunakan formula

p
D(x2,x1) = ||x2 – x1||1 = ∑ ¿ x 2 j −x1 j∨¿ ¿ ……………….......… (2.3)
j=1

Pengukuran jarak pada ruang jarak Minkowsky menggunakan formula

p
D(x2,x1) = ||x2 – x1||λ = √∑
λ

j=1
¿ x 2 j−x 1 j∨¿ ¿ λ ……………..… (2.4)
λ adalah parameter Minkowsky. Secara umum, λ merupakan parameter penentu

dalam karakteristik jarak. Jika λ=1, ruang jarak pada Minkowsky sama dengan

Manhattan. Jika λ=2, ruang jaraknya akan sama dengan Euclidean; jika λ=∞, ruang

jaraknya akan sama dengan ruang jarak Chebyshev. Namun demikian, cara yang paling

banyak digunakan adalah Euclidean dan Manhattan. Euclidean menjadi pilihan jika kita

ingin memberikan jarak terpendek antara dua titik (jarak lurus), sedangkan Manhattan

memberikan jarak terjauh pada dua data. Manhattan juga sering digunakan karena

kemampuannya dalam mendeteksi keadaan khusus, seperti keberadaan outlier, dengan

lebih baik.

2.3 Unified Modeling Language (UML)

Untuk memberikan pemahaman secara jelas terhadap sistem yang akan

dirancang, maka dapat digunakan Unified Modeling Language (UML). Dalam Unified

Modeling Language (UML) ini akan terlihat dengan jelas aktifitas yang terjadi pada

proses pembentukan aplikasinya dari awal hingga akhir.

Unified Modeling Language (UML) adalah keluarga notasi grafis yang didukung

oleh meta-model tunggal, yang membantu pendekskripsian dan desain sistem perangkat

lunak, khususnya sistem yang dibangun menggunakan pemrograman berorientasi objek

(Tofik Isa, 2017).

Unified Modeling Language (UML) merupakan bahasa standar yang digunakan

untuk mendokumentasikan, menspesifikasikan dan membanngun perangkat lunak. UML

merupakan metodologi dalam mengembangkan sistem berorientasi objek dan

merupakan alat untuk mendukung pengembangan sistem.


2.3.1 Use Case Diagram

Use case diagram merupakan pemodelan untuk kelakuan (behavior) sistem

informasi yang akan dibuat. Use case mendeskripsikan sebuah interaksi antara satu atau

lebih aktor dengan sistem informasi yang akan dibuat. Secara kasar, use case digunakan

untuk mengetahui fungsi apa saja yang ada di dalam sebuah sistem dan siapa saja yang

berhak menggunakan fungsi-fungsi tersebut (Yunahar Heriyanto, 2018).

Use case diagram menunjukkan 3 aspek dari sistem yaitu: actor, use case dan

system/sub system boundary. Actor mewakili peran orang, sistem yang lain

atau alat ketika berkomunikasi dengan use case.

Tabel 2.1 Simbol-Simbol Use Case Diagram

No Nama Simbol Deskripsi

Menerangkan “apa” yang

dikerjakan sistem, bukan


1 Use case
“bagaimana” sistem

mengerjakannya.
Menggambarkan orang,

sistem atau external entitas

2 Actor atau stakeholder yang

menyediakan atau menerima


Actor1

informasi dari sistem.


Sistem Menggambarkan jangkauan
3
Boundary sistem

Menggambarkan bagaimana
4 Association
actor terlibat dalam use case

Dibuat ketika ada sebuah

5 Generalization keadaan yang lain/perlakuan

khusus.
<< Extend >> Perluasan dari use case lain

6 Extend jika kondisi atau syarat

terpenuhi
<< Include >> Menjelaskan bahwa use case

7 Include termasuk didalam use case

lain

Use case diagram menggambarkan fungsionalitas yang diharapkan dari sebuah

sistem. Yang ditekankan adalah “apa” yang diperbuat sistem, dan bukan “bagaimana”.

Sebuah use case merepresentasikan sebuah interaksi antara aktor dengan sistem.

Menggambarkan sejumlah external actors dan hubungannya ke use case yang diberikan

oleh sistem. Use case adalah deskripsi fungsi yang disediakan oleh sistem dalam bentuk

teks sebagai dokumentasi dari use case symbol namun dapat juga dilakukan dalam

activity diagrams.

2.3.2 Activity Diagram


Activity diagram menggambarkan berbagai alir aktivitas dalam sistem yang

sedang dirancang, bagaimana masing-masing alir berawal, decision yang mungkin

terjadi, dan bagaimana mereka berakhir. Activity diagram juga dapat menggambarkan

proses paralel yang terjadi pada beberapa eksekusi (Hadi Wijaya, 2015).

Activity diagram atau diagram aktivitas menggambarkan workflow (aliran kerja)

atau aktivitas dari sebuah sistem atau menu yang ada pada sebuah perangkat lunak.

Tabel 2.2 Simbol Activity Diagram

No Nama Simbol Deskripsi

1. Start Titik Awal

2. Final Titik Akhir

3. Activity Aktifitas

Pilihan untuk pengambilan


4. Decission
keputusan

Untuk menunjukkan kegiatan


5. Fork /Join
yang dilakukan secara paralel

Menunjukkan adanya
6. Rake
dekomposisi

7. Tanda waktu Tanda waktu


8. Tanda penerimaan Tanda penerimaan

2.3.3 Class Diagram

Class diagram menggambarkan struktur sistem dari segi pendefinisian kelas-

kelas yang akan dibuat untuk membangun sistem. Kelas memiliki apa yang disebut

atribut dan metode atau operasi. Atribut merupakan variabel-variabel yang dimiliki oleh

suatu kelas, sedangkan operasi atau metode adalah fungsi-fungsi yang dimiliki oleh

suatu kelas.

Kelas sebagai suatu set objek yang memiliki atribut dan perilaku yang sama,

kelas kadang disebut kelas objek. Class memiliki tiga area pokok yaitu (Suendri, 2018):

1. Nama, kelas harus mempunyai sebuah nama.

2. Atribut, adalah kelengkapan yang melekat pada kelas. Nilai dari suatu kelas hanya

bisa diproses sebatas atribut yang dimiliki.

3. Operasi, adalah proses yang dapat dilakukan oleh sebuah kelas, baik pada kelas itu

sendiri ataupun kepada kelas lainnya

Class dalam UML digambarkan dengan kotak. Nama class menggunakan huruf

besar di awal kalimatnya dan diletakkan diatas kotak. Bila class mempunyai nama yang

terdiri dari 2 suku kata atau lebih maka semua suku kata digabungkan tanpa spasi

dengan huruf awal tiap suku kata menggunakan huruf besar.

Attribute adalah property dari sebuah class, attribute ini melukiskan batas nilai

yang mungkin ada pada obyek dari class. Sebuah class mungkin mempunyai nol atau

lebih attribute. Secara konvensi jika nama attribute terdiri atas satu suku kata maka
ditulis dengan huruf kecil. Akan tetapi jika nama attribute menggandung lebih dari satu

suku kata maka semua suku kata digabungkan dengan suku kata pertama menggunakan

huruf kecil dan awal suku kata berikutnya menggunakan huruf besar.

Tabel 2.3 Simbol Class Diagram

No Nama Simbol Deskripsi

Nama_Kelas
1 Kelas Kelas pada struktur sistem
+atribut

+operasi()

Sama dengan konsep interface

2 Antarmuka dalam pemrograman berorientasi

objek

No Nama Simbol Deskripsi

Relasi antar kelas dengan makna

3 Asosiasi umum, biasanya juga disertai

dengan multiplicity

Relasi antar kelas dengan makna

4 Asosiasi Berarah kelas yang satu digunakan oleh

kelas yang lain

Relasi antar kelas dengan makna

5 Generalisasi generalisasi-spesialisasi

(umumkhusus)
Relasi antar kelas dengan makna
6 Kebergantungan
kebergantungan antar kelas

Relasi antar kelas dengan makna


7 Agregasi
semua-bagian (whole-part)

2.4 Flowchart

Flowchart adalah representasi secara simbolik dari suatu algoritma atau prosedur

untuk menyelesaikan suatu masalah, dengan menggunakan flowchart akan

memudahkan pengguna melakukan pengecekan bagian-bagian yang terlupakan dalam

analisis masalah disamping itu flowchart juga berguna sebagai fasilitas untuk

berkomunikasi antara pemrogram yang bekerja dalam tim suatu proyek (Santoso, 2017).

Tabel 2.4 Simbol-Simbol Flowchart

No Nama Simbol Deskripsi

Simbol titik terminan

digunakan untuk menunjukkan


1. Terminator
awal dan akhir dari suatu

proses.

Simbol arah data/arus


2. Data Flow
data/aliran data.

3. Proses Proses yang dilakukan

komputer dalam pengolahan


data-data.

Simbol input/output

digunakan untuk mewakili


4. Input/Output
data input dan output.

Simbol Keputusan yang

digunakan untuk suatu


5. Keputusan
penyelesaian kondisi di dalam

program.

Simbol konektor menunjukkan

hubungan flowchart ke
6. Connector Off Page
halaman lain

Simbol yang menunjukkan

hubungan bagian-bagian
7. Connector On Page
flowchart yang berada dalam

satu halaman.

Simbol untuk menunjukkan

bahwa langkah yang dimaksud

terdapat flowchart lain yang


8. Predefined Process
menggambarkan langkah

tersebut lebih rinci.


2.5 XAMPP

XAMPP merupakan alat bantu yang menyediakan paket perangkat lunak ke

dalam satu buah paket. Dengan menginstall XAMPP maka tidak perlu lagi melakukan

instalasi dan konfigurasi web server Apache, PHP dan MySQL secara manual. XAMPP

akan menginstalasi dan mengkonfigurasikannya secara otomatis atau auto

configuration. XAMPP merupakan paket PHP yang berbasis open source yang

dikembangkan oleh sebuah komunitas Open Source (Santoso, 2017).

Dengan menggunakan XAMPP tidak dibingungkan dengan penginstalan

program-program lain, karena semua kebutuhan telah tersedia oleh XAMPP. Beberapa

aplikasi yang terdapat pada XAMPP diantaranya : Apache, MySQL, PHP, FileZilla FTP

Server, PHPmyAdmin dll.

Gambar 2.1 Tampilan XAMPP

Beberapa bagian XAMPP yang biasa digunakan pada umumnya:


1. htdocs adalah folder tempat meletakkan berkas-berkas yang akan dijalankan, seperti

berkas PHP, HTML dan skrip lain.

2. phpMyAdmin merupakan bagian untuk mengelola basis data MySQL yang ada di

komputer. Untuk membukanya, buka browser lalu ketikkan alamat

http://localhost/phpMyAdmin, maka akan muncul halaman phpMyAdmin.

3. Control Panel yang berfungsi untuk mengelola layanan (service) XAMPP. Seperti

menghentikan (stop) layanan, ataupun memulai (start).

2.6 PHP

PHP (Hypertext Preprocessor) adalah bahasa pemrograman web server-side yang

bersifat open source. PHP merupakan script yang terintegrasi dengan HTML dan berada

pada server (server side HTML embedded scripting). PHP adalah sricpt yang digunakan

untuk membuat halaman yang akan ditampilkan, dibuat saat halaman itu diminta oleh

client.

Database menyimpan data yang diolah oleh bahasa pemrograman PHP yang ada

di Web Server kemudian data tersebut ditampilkan dengan Web Server dengan cara

menuliskan alamat atau URL sesuai nama file yang terdapat pada Web Server.

Mekanisme ini menyebabkan informasi yang diterima client selalu yang terbaru

atau up to date. Semua script PHP dieksekusi pada server dimana script tersebut

dijalankan. Sebenernya saat kita menjalankan internet menggunakan browser seperti

Mozilla, Internet Explorer, Opera, dan Safari. Web server adalah aplikasi yang berfungsi

untuk melayani permintaan pemanggilan alamat dari pengguna melalui web server,

dimana web server mengirimkan kembali informasi yang diminta tersebut melalui HTTP
(Hyper Text Transfer Protocol) untuk ditampilkan ke layar monitor komputer. Isi dari

website yang kita buat dapat diubah dengan menggunkan program PHP, script-script

PHP tersebut yang berfungsi membuat halaman website menjadi dinamis. Dinamis

artinya pengunjung web dapat memberikan komentar saran masukan pada website

client.

Beberapa kelebihan PHP yaitu :

1. PHP memiliki tingkat akses yang lebih cepat.

2. PHP memiliki tingkat lifecycle yang cepat sehingga selalu mengikuti perkembangan

teknologi internet.

3. PHP memiliki tingkat keamanan tinggi.

4. PHP mampu berjalan di beberapa server yang ada, misalnya Apache, Microsoft IIS,

PWS, AOL Server, phttpd dan Xitami.

5. PHP mampu berjalan di linux sebagai platform sistem operasi utama bagi

6. PHP, namun juga dapat berjalan di FreeBSD,Unix, Solaris, Windows dan yang lain.

7. PHP juga mendukung akses ke beberapa database yang sudah ada, baik yang bersifat

free ataupun komersial. Database itu antara lain MySQL, PostgreSQL, mSQL, Informix,

dan Microsoft SQL server.

8. PHP bersifat free atau gratis.

2.7 MySQL

MySQL merupakan software database open source yang paling populer di dunia.

MySQL menjadi pilihan utama bagi banyak pengembang software dan aplikasi hal ini

dikarenakan kelebihan MySQL diantaranya sintaksnya yang mudah dipahami, didukung


program-program umum seperti C, C++, Java, PHP, Pyton. Pengguna MySQL tidak hanya

sebatas pengguna perseorangan maupun perusahaan kecil, namun perusahaan seperti

Yahoo, Google, Nokia, Youtube, Wordpress juga menggunakan DBMS MySQL (Indra

Warman, 2018).

MySQL merupakan database server yang memiliki konsep

database modern, Mysql mempunyai beberapa kelebihan, antara lain :

1. Portability

MySQL dapat berjalan stabil pada berbagi sistem operasi di antaranya

adalah

Windows, Linux, FreBSSD, Mac OS X Server, Solaris, Amiga, HP-UX ,

dan lain-lain.

2. Open Source

MySQL didistribusikan secara gratis ( open source), dibawah lisensi

GPL sehingga dapat digunakan tanpa dipungut biaya.

3. Multiuser

MySQL memiliki beberapa security seperti level subnet mask, nama

host, dan izin akses user dengan sistem yang mendetail serta

password yang menggunakan sistem enkripsi.


4. Connectivity

MySQL dapat melakukan koneksi dengan client melalui penggunaan

protocol

TCP/IP, Unix soket (Unixx), atau Name Pipes (NT).

5. Interface

MySQL memiliki interface terhadap berbagai aplikasi dan bahasa

pemograman dengan menggunakan fungsi Aplication Programming.

2.7 Universitas Medan Area

Universitas Medan Area merupakan salah satu universitas swasta yang cukup

terkenal di Kota Medan. Universitas Medan Area yang telah memiliki lima Fakultas yaitu 

Fakultas Teknik, Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, serta Fakultas

Ilmu Sosial dan Ilmu Politik. Berikut mengenai sejarah dan struktus organisasi

Universitas Medan Area.

2.7.1 Sejarah Universitas Medan Area

Latar belakang mendirikan Universitas Medan Area, adalah sebagai salah

satu wujud penjabaran UUD 1945 yaitu turut serta mencerdaskan kehidupan

bangsa serta merupakan wadah penampungan aspirasi dan hasrat masyarakat yang
terus berkembang untuk menikmati pendidikan tinggi. Nama Universitas Medan

Area diambil sebagai penghargaan atas perjuangan mempertahankan kemerdekaan

oleh pejuang-pejuang 1945 di sekitar kota Medan yang lebih dikenal dengan

nama  “Pejuang-Pejuang Medan Area”.

Pada tahun 1983-1984 adalah sebagai tahun akademik pertama dimulainya

Universitas Medan Area yang telah memiliki lima Fakultas yaitu  Fakultas

Teknik, Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, serta

Fakultas Ilmu Sosial dan Ilmu Politik. Masing-masing Fakultas semuanya

berstatus izin operasional, menyelenggarakan program pendidikan strata satu (S1).

Dalam waktu yang relatif singkat sekitar pertengahan 1984 semua Fakultas telah

memperoleh status terdaftar. Pengakuan dan kepercayaan pemerintah ini tertuang

dalam surat Keputusan Menteri Pendidikan dan  Kebudayaan Republik Indonesia

No. 054/0/1984 tanggal 6 Maret 1984.

Pada tahun akademik 1985/1986, Universitas Medan Area membuka

Fakultas baru yaitu Fakultas Psikologi. Fakultas ini merupakan satu-satunya

Fakultas Psikologi di luar pulau Jawa. Pada tahun akademik pertamanya Fakultas

ini menampung 204 orang mahasiswa. Pada tahun akademik 1988/1989

Universitas Medan  Area kembali membuka satu Fakultas baru, yaitu Fakultas

Biologi. Fakultas ini juga merupakan satu-satunya Fakultas Biologi di luar pulau

Jawa.

Pada tahun 2018 Universitas Medan Area resmi mendapat Akreditasi secara

Institusi dengan nilai B dengan nomor SK : 414/SK/BAN-PT/Akred/PT/XII/2018,

Tanggal SK: 19 Desember 2018 dan berlaku sampai dengan 19 Desember

2023. Sampai saat ini Universitas Medan Area telah memiliki tujuh Fakultas
dengan 16 program studi untuk Strata 1 (S1), 4 program studi untuk Strata 2 (S2)

dan 1 program Doktor (S3). Ketujuh Fakultas tersebut yaitu Fakultas Teknik,

Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, Fakultas Ilmu Sosial dan

Ilmu Politik, Fakultas Psikologi serta Fakultas Sains dan Teknologi telah memiliki

status TERAKREDITASI untuk semua program studi yang  diselenggarakannya

dengan grade “A“ dan grade "B".

Pada tahun 2000, Universitas Medan Area membuka Program Pascasarjana

dengan Program Studi Magister Administrasi Publik (MAP) dan saat ini telah

terakreditasi “B“ dengan SK BAN PT Depdiknas No. 024/BAN-PT/Ak-

V/S2/XII/2007 tanggal 14 Desember 2007. Tahun 2003, Program Pascasarjana

UMA membuka 2 Program Studi lagi yaitu Magister Agribisnis (MA) dengan

akreditasi “B“ dan Magister Ilmu Hukum (MH) juga telah terakreditasi oleh

BAN-PT, dan pada tahun 2008 dibuka pula Program Studi Magister Psikologi

(MPsi).

2.7.2 Struktur Organisasi Universitas Medan Area

Struktur organisasi yang baik memiliki gambaran yang jelas mengenai

pembagian tugas, wewenang, dan tanggung jawab kepada individu maupun bagian–

bagian dari suatu organisasi yang meningkatkan tercapainya komunikasi, koordinasi dan

pengintegrasian segenap kegiatan organisasi sehingga memperlancar proses menuju

sarana yang tersedia semaksimal mungkin, baik dalam jangka panjang maupun pendek.
Untuk lebih jelasnya, struktur organisasi Universitas Medan Area dapat dilihat

pada gambar di bawah ini :

Gambar

2.2 Struktur Organisasi Universitas Medan Area


32

BAB III

METODE PENELITIAN

3.1 Analisis Permasalahan

Kehadiran data mining dilatarbelakangi dengan masalah data explosion yang


dialami akhir-akhir ini dimana banyak perusahaan/bank/organisasi telah mengumpulkan
data sekian tahun lamanya (data pembelian, data penjualan, data nasabah, data
transaksi, dan lain-lain). Seperti yang terjadi pada sebuah perusahaan asuransi, data
yang tersimpan selama ini hanya sebagai dokumentasi dan hanya dipakai untuk
kebutuhan transaksi saja. Pertanyaannya sekarang, apakah data tersebut akan dibiarkan
menggunung, tidak berguna lalu dibuang, ataukah kita dapat menambangnya untuk
mencari ‘emas’ dan ‘berlian’ yaitu informasi yang berguna untuk organisasi kita.

Sama halnya dengan Universitas Medan Area yang telah beroperasi sejak lama,
sehingga banyak sekali data-data yang sebenarnya dapat digali untuk keperluan
informasi dunia pendidikan. Maka permasalahasan data ini dimanfaatkan untuk Untuk
mendukung strategi promosi terhadap Universitas Medan Area, dengan menimbang
atribut-atribut yang telah ada pada database yang ada pada Universitas Medan Area.

Untuk itu penerapan metode clustering merupakan metode yang paling


cocok untuk mencapai tujuan tersebut. K-Means Clustering merupakan metode
data mining yang telah populer di dunia pendidikan yang berguna untuk membuat
pengelompokkan atau klasifikasi di masa yang akan datang.
Ada beberapa tahapan dalam membuat penyelesaian masalah
dengan metode K-Means Clustering yaitu sebagai berikut:

1. Pilih jumlah cluster k.

2. Inisialisasi k pusat cluster ini bisa dilakukan dengan berbagai

cara. Namun yang paling sering dilakukan adalah dengan cara

random. Pusat-pusat cluster diberi nilai awal dengan angka-angka

random.
3. Alokasikan semua data/objek ke cluster terdekat. Kedekatan dua

objek ditentukan berdasarkan jarak kedua objek tersebut.

Demikian juga kedekatan suatu data ke cluster tertentu

ditentukan jarak antara data dengan pusat cluster. Dalam tahap

ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak

paling antara satu data dengan satu cluster tertentu akan

menentukan suatu data masuk dalam cluster mana. Untuk

menghiutng jarak semua data ke setiap tiitk pusat cluster dapat

menggunakan teori jarak Euclidean yang dirumuskan sebagai

berikut:

D(i , j ) = √ ¿ ¿ …………..(3.1)

dimana:

D (i,j) = Jarak data ke i ke pusat cluster j

X ki = Data ke i pada atribut data ke k

X kj= Titik pusat ke j pada atribut ke k


4. Hitung kembali pusat cluster dengan keanggotaan cluster yang

sekarang. Pusat cluster adalah rata-rata dari semua data/objek

dalam cluster tertentu. Jika dikehendaki bisa juga menggunakan


median dari cluster tersebut. Jadi rata-rata (mean) bukan satu-

satunya ukuran yang bisa dipakai.

5. Tugaskan lagi setiap objek memakai pusat cluster yang baru.

Jika pusat cluster tidak berubah lagi maka proses clustering

selesai. Atau, kembali ke langkah nomor 3 sampai pusat cluster

tidak berubah lagi

Dalam kasus ini akan diambil dari Database hasil survei yang
ada pada Universitas Medan Area dalam periode tahun 2020. Data
tersebut akan digunakan dalam perhitungan metode K-Means
Clustering untuk menganalisa mengenai mahasiswa. Data survei
tersebut selanjutnya akan dilakukan pra-proses untuk menghasilkan
data khusus yang siap untuk dibentuk menjadi sebuah informasi
baru.
Tabel 3.1 Data Riset Mahasiswa

NIM NAMA JKEL KOTAASAL PRODI

178400008 TASYA NURUL HUDA PEREMPUAN SIANTAR ILMU HUKUM

178400003 PUTRIE RIZKY ANANDA PEREMPUAN KOTA PINANG ILMU HUKUM

178400011 CUT MUTIA SARI PEREMPUAN ACEH ILMU HUKUM

178400009 AINUR RIZA PEREMPUAN LANGSA ILMU HUKUM

178400026 RAVITA RAMBE PEREMPUAN MEDAN ILMU HUKUM

178400012 SRI HARTINI PEREMPUAN MEDAN ILMU HUKUM

178400011 PUTRY AMALIA BR PEREMPUAN MEDAN ILMU HUKUM


LUBIS

178400022 NADHILAH PUTRI PEREMPUAN SIANTAR ILMU HUKUM


NIM NAMA JKEL KOTAASAL PRODI

178400017 TITIN ASTIKA PEREMPUAN MEDAN ILMU HUKUM

178400006 FARAH DILLA PEREMPUAN ACEH ILMU HUKUM

178400015 YUSNITA SEMBIRING PEREMPUAN LHOKSEMAWE ILMU HUKUM

178400024 ANNISA PEREMPUAN KISARAN ILMU HUKUM

178210002 BAGINDA ROMADHAN LAKI2 SIBOLGA AGROTEKNOLOGI


SIREGAR

188220003 ADE AULIA LESTARI PEREMPUAN KABANJAHE AGRIBISNIS

178220001 KHOIRUL FIKRI LAKI2 KABANJAHE AGRIBISNIS

198220002 ERISA SRIJEKI PEREMPUAN KABANJAHE AGRIBISNIS


MANURUNG

198220010 TRI WULANDARI PEREMPUAN BERASTAGI AGRIBISNIS

198220004 IBNU FAHMI LAKI2 NIAS AGRIBISNIS

198220006 SYAFARUDDIN LAKI2 BERASTAGI AGRIBISNIS


RITONGA

198220012 UMMY ZULFADLAH PEREMPUAN TANJUNG BALAI AGRIBISNIS

198220013 HERLINA SIREGAR PEREMPUAN MEDAN AGRIBISNIS

178210021 ISRA HAYATI PEREMPUAN LANGSA AGROTEKNOLOGI

178210003 NOVIKA PURNAMA SARI PEREMPUAN BINJAI AGROTEKNOLOGI

178210008 NOVITA SARI PEREMPUAN TEBING TINGGI AGROTEKNOLOGI

178210006 IMELDA BR TARIGAN PEREMPUAN TANJUNG BALAI AGROTEKNOLOGI

178210011 RIZKI KHAIRANI PEREMPUAN BINJAI AGROTEKNOLOGI

178210013 ANNISA PUTRI PEREMPUAN MEDAN AGROTEKNOLOGI


BATUBARA

178210004 SIHOL SIHOMBING LAKI2 SIBOLGA AGROTEKNOLOGI

178210012 RESKA ELISIANA PEREMPUAN MEDAN AGROTEKNOLOGI


NIM NAMA JKEL KOTAASAL PRODI

RITONGA

178210016 SULASNI PEREMPUAN MEDAN AGROTEKNOLOGI

178210010 ANNISA RITONGA PEREMPUAN BERASTAGI AGROTEKNOLOGI

168520002 M.FAHRUL RIDHO LAKI2 RANTAU PRAPAT ADM.PUBLIK

168520003 M.DEDE ERIANDI LAKI2 SIANTAR ADM.PUBLIK

168520008 YOGI SAPUTRA LAKI2 TEBING TINGGI ADM.PUBLIK

168520011 AHMAD ADJI LAKI2 MEDAN ADM.PUBLIK


ALAMSYAH

168520015 SANDI PRIMA NAIBAHO LAKI2 SIANTAR ADM.PUBLIK

168520017 JHON HORASMAN LAKI2 KISARAN ADM.PUBLIK


TURNIP

168520020 SUSI INDAH ROSLIA PEREMPUAN MEDAN ADM.PUBLIK

168520021 ARDI WANDIRA LAKI2 RANTAU PRAPAT ADM.PUBLIK

168520022 NANDA HERIAMBANG LAKI2 SIBOLGA ADM.PUBLIK

188530004 LAMEKI GOHAE LAKI2 SIBOLGA ILMU KOMUNIKASI

188530011 KURNIAWAN LAKI2 MEDAN ILMU KOMUNIKASI

188530013 RICARDO SEBAYANG LAKI2 MEDAN ILMU KOMUNIKASI

188530021 AYU SYAFIRA PEREMPUAN MEDAN ILMU KOMUNIKASI

188530024 RAMONTUA SINAGA LAKI2 MEDAN ILMU KOMUNIKASI

188530027 AHMAD SYUKUR LAKI2 ACEH ILMU KOMUNIKASI

188530005 KHAIRIL HUDA LAKI2 ACEH ILMU KOMUNIKASI

188530012 TEUKU MUNTASHIR LAKI2 SINGKIL ILMU KOMUNIKASI

188530020 FAKHRY HAMBALI LAKI2 BERASTAGI ILMU KOMUNIKASI

188530021 RIKARDO ZALUKHU LAKI2 MEDAN ILMU KOMUNIKASI

(Sumber : Universitas Medan Area)


3.2 Penerapan Metode K-Means Clustering

Uji coba dan analisa adalah untuk melihat bagaimana suatu proses pada
software pemrograman, tujuan dari proses dan output yang diharapkan. Ujicoba
ini bertujuan untuk melakukan perhitungan algoritma untuk mencari nilai terbaik
yang akan menjadi pembagi terhadap atribut yang lainnya, dengan menggunakan
perhitungan (rumus) K-Means Clustering. K-Means Clustering akan dilatihkan
terhadap pola data input dan target sebenarnya.
3.2.1 Transformasi Data

Agar data pada tabel 3.1 di atas dapat diolah dengan menggunakan metode k-
means clustering, maka data yang berjenis data bukan nominal seperti Jenis Kelamin dan
Kota Asal harus diinisialisasikan terlebih dahulu dalam bentuk angka. Untuk melakukan
inisialisasi attribut dilakukan dengan langkah-langkah sebagai berikut:

1. Melakukan proses inisialisasi terhadap data Jenis Kelamin guna

kepentingan proses clustering. Dengan cara Jenis Kelamin yang

memiliki frekuensi terbesar diberi inisial dengan angka 1 dan

Jenis Kelamin yang memiliki frekuensi terbesar kedua diberi

inisial dengan angka 2, begitu seterusnya hingga Jenis Kelamin

dengan frekuensi paling sedikit. Hasil dari inisialisasi Jenis

Kelamin dapat dilihat pada tabel 3.2.

Tabel 3.2 Inisialisasi Data Jenis Kelamin Mahasiswa


Jenis Kelamin Frekuensi Inisialisasi
Perempuan 28 1
Laki-Laki 22 2

Selain Jenis Kelamin, Kota Asal juga termasuk ke dalam jenis data non-nominal
sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada Jenis Kelamin, pada
Kota Asal juga diberikan inisialisasi berdasarkan frekuensi pada Kota Asal tersebut. Hasil
dari inisialisasi Kota Asal tersebut dapat dilihat pada tabel 3.3.

Tabel 3.3 Inisialisasi Data Kota Asal

Kategori Wilayah Frekuensi Inisialisasi

Medan
Medan 17 1
Binjai

Berastagi

Kabanjahe

Luar Kota 1 Kisaran 15 2

Siantar

Tebing Tinggi

Sibolga

Nias

Luar Kota 2 Tanjung Balai 10 3

Kota Pinang

Rantau prapat

Aceh

Langsa
Aceh 8 4
Lhoksemawe

Singkil

Selain Jenis Kelamin dan Kota Asal, Prodi juga termasuk ke dalam jenis data non-
nominal sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada Jenis
Kelamin, pada Kota Asal juga diberikan inisialisasi berdasarkan frekuensi Mahasiswa
pada Kota Asal tersebut. Hasil dari inisialisasi Prodi dapat dilihat pada tabel 3.4.
Tabel 3.4 Inisialisasi Data Prodi

Kategori Prodi Frekuensi Inisialisasi

Ilmu Hukum 12 1

Agroteknologi 11 2

Ilmu Komunikasi 10 3

Adm. Publik 9 4

Agribisnis 8 5

Tabel 3.5 Hasil Inisialisasi Seluruh Data Mahasiswa

DATA
NAMA JKEL KOTAASAL PRODI
KE

01 TASYA NURUL HUDA 1 2 1

02 PUTRIE RIZKY ANANDA 1 3 1

03 CUT MUTIA SARI 1 4 1

04 AINUR RIZA 1 4 1

05 RAVITA RAMBE 1 1 1

06 SRI HARTINI 1 1 1

07 PUTRY AMALIA BR LUBIS 1 1 1

08 NADHILAH PUTRI 1 2 1

09 TITIN ASTIKA 1 1 1

10 FARAH DILLA 1 4 1

11 YUSNITA SEMBIRING 1 4 1

12 ANNISA 1 2 1

13 BAGINDA ROMADHAN SIREGAR 2 3 2

14 ADE AULIA LESTARI 1 2 5


DATA
NAMA JKEL KOTAASAL PRODI
KE

15 KHOIRUL FIKRI 2 2 5

16 ERISA SRIJEKI MANURUNG 1 2 5

17 TRI WULANDARI 1 2 5

18 IBNU FAHMI 2 3 5

19 SYAFARUDDIN RITONGA 2 2 5

20 UMMY ZULFADLAH 1 3 5

21 HERLINA SIREGAR 1 1 5

22 ISRA HAYATI 1 4 2

23 NOVIKA PURNAMA SARI 1 1 2

24 NOVITA SARI 1 2 2

25 IMELDA BR TARIGAN 1 3 2

26 RIZKI KHAIRANI 1 1 2

27 ANNISA PUTRI BATUBARA 1 1 2

28 SIHOL SIHOMBING 2 3 2

29 RESKA ELISIANA RITONGA 1 1 2

30 SULASNI 1 1 2

31 ANNISA RITONGA 1 2 2

32 M.FAHRUL RIDHO 2 3 4

33 M.DEDE ERIANDI 2 2 4

34 YOGI SAPUTRA 2 2 4

35 AHMAD ADJI ALAMSYAH 2 1 4

36 SANDI PRIMA NAIBAHO 2 2 4

37 JHON HORASMAN TURNIP 2 2 4


DATA
NAMA JKEL KOTAASAL PRODI
KE

38 SUSI INDAH ROSLIA 1 1 4

39 ARDI WANDIRA 2 3 4

40 NANDA HERIAMBANG 2 3 4

41 LAMEKI GOHAE 2 3 3

42 KURNIAWAN 2 1 3

43 RICARDO SEBAYANG 2 1 3

44 AYU SYAFIRA 1 1 3

45 RAMONTUA SINAGA 2 1 3

46 AHMAD SYUKUR 2 4 3

47 KHAIRIL HUDA 2 4 3

48 TEUKU MUNTASHIR 2 4 3

49 FAKHRY HAMBALI 2 2 3

50 RIKARDO ZALUKHU 2 1 3

3.2.2 Pengolahan Data Dengan K-Means Clustering

Setelah semua data riset Mahasiswa yang lulus ditransformasi ke


dalam bentuk angka, maka data-data tersebut telah dapat dikelompokan
dengan menggunakan algoritma K-Means Clustering. Untuk dapat
melakukan pengelompokan data-data tersebut menjadi beberapa cluster
perlu dilakukan beberapa langkah, yaitu:
1. Tentukan jumlah cluster yang diinginkan. Dalam penelitian ini

data-data yang ada akan dikelompokan menjadi tiga cluster.

2. Tentukan titik pusat awal dari setiap cluster. Dalam penelitian ini

titik pusat awal ditentukan secara random dan didapat titik pusat

dari setiap cluster dapat dilihat pada tabel 3.6.

Tabel 3.6. Titik Pusat Awal Setiap Cluster

Data Jenis
Nama Mahasiswa Kota Asal Prodi
Ke- Kelamin

06 SRI HARTINI Perempuan Medan Ilmu Hukum

25 IMELDA BR TARIGAN Perempuan Luar Kota 2 Agroteknologi

46 M.ARIEF RINALDI Laki-Laki Aceh Ilmu Komunikasi

Tabel 3.7. Inisialisasi Titik Pusat Awal Setiap Cluster

Data Jenis
Nama Mahasiswa Kota Asal Prodi
Ke- Kelamin

06 SRI HARTINI 1 1 1

25 IMELDA BR TARIGAN 1 3 2

46 M.ARIEF RINALDI 2 4 3

3. Tempatkan setiap data pada cluster. Dalam penelitian ini

digunakan metode k-means untuk mengalokasikan setiap data


ke dalam suatu cluster, sehingga data akan dimasukan dalam

suatu cluster yang memiliki jarak paling dekat dengan titik pusat

dari setiap cluster. Untuk mengetahui cluster mana yang paling

dekat dengan data, maka perlu dihitung jarak setiap data dengan

titik pusat setiap cluster.

Perhitungan Iterasi Ke-1

Sebagai contoh, dihitung jarak dari Mahasiswa pertama ke pusat cluster


pertama:

D(1,1 ) = √¿ ¿

= 1,0

Jarak data Mahasiswa pertama ke pusat cluster kedua:

D(1,2 ) = √¿ ¿

= 1,41

Jarak data Mahasiswa pertama ke pusat cluster ketiga:

D(1,3 ) = √¿ ¿

= 3,00

Kemudian Hitung Jarak dari data Mahasiswa Kedua ke pusat cluster


pertama:

D(2,1 ) = √¿ ¿

= 2,0

Jarak data Mahasiswa kedua ke pusat cluster kedua:


D(2,2 ) = √¿ ¿

= 1,0

Jarak data Mahasiswa kedua ke pusat cluster ketiga:

D(2,3 ) = √¿ ¿

= 2,45

Berdasarkan hasil ketiga perhitungan di atas dapat disimpulkan bahwa jarak


data Mahasiswa Pertama yang paling dekat adalah dengan cluster 1, sehingga data
Mahasiswa pertama dimasukkan ke dalam cluster 1. Untuk jarak data Mahasiswa Kedua
yang paling dekat adalah dengan cluster 2, sehingga data Mahasiswa Kedua dimasukkan
ke dalam cluster 2.

Hasil perhitungan selengkapnya untuk seluruh data Mahasiswa dapat di lihat


pada tabel di bawah ini.

Tabel 3.8 Hasil Perhitungan Setiap Data Ke Pusat Cluster

Data KOTA PROD Cluster


NAMA JKEL C1 C2 C3
Ke- ASAL I Terdekat

TASYA NURUL
1 2 1
01 HUDA 1,00 1,41 3,00 1

PUTRIE RIZKY
1 3 1
02 ANANDA 2,00 1,00 2,45 2

03 CUT MUTIA SARI 1 4 1 3,00 1,41 2,24 2

04 AINUR RIZA 1 4 1 3,00 1,41 2,24 2

05 RAVITA RAMBE 1 1 1 0,00 2,24 3,74 1

06 SRI HARTINI 1 1 1 0,00 2,24 3,74 1

PUTRY AMALIA
1 1 1
07 BR LUBIS 0,00 2,24 3,74 1

08 NADHILAH PUTRI 1 2 1 1,00 1,41 3,00 1

09 TITIN ASTIKA 1 1 1 0,00 2,24 3,74 1

10 FARAH DILLA 1 4 1 3,00 1,41 2,24 2

YUSNITA
1 4 1
11 SEMBIRING 3,00 1,41 2,24 2

12 ANNISA 1 2 1 1,00 1,41 3,00 1


BAGINDA
ROMADHAN 2 3 2
13 SIREGAR 2,45 1,00 1,41 2

ADE AULIA
1 2 5
14 LESTARI 4,12 3,16 3,00 3

15 KHOIRUL FIKRI 2 2 5 4,24 3,32 2,83 3

ERISA SRIJEKI
1 2 5
16 MANURUNG 4,12 3,16 3,00 3

17 TRI WULANDARI 1 2 5 4,12 3,16 3,00 3

18 IBNU FAHMI 2 3 5 4,58 3,16 2,24 3

SYAFARUDDIN
2 2 5
19 RITONGA 4,24 3,32 2,83 3

UMMY
1 3 5
20 ZULFADLAH 4,47 3,00 2,45 3

21 HERLINASIREGAR 1 1 5 4,00 3,61 3,74 2

Data KOTA PROD Cluster


NAMA JKEL C1 C2 C3
Ke- ASAL I Terdekat

22 ISRA HAYATI 1 4 2 3,16 1,00 1,41 2

NOVIKA
1 1 2
23 PURNAMA SARI 1,00 2,00 3,32 1

24 NOVITA SARI 1 2 2 1,41 1,00 2,45 2

IMELDA BR
1 3 2
25 TARIGAN 2,24 0,00 1,73 2

26 RIZKI KHAIRANI 1 1 2 1,00 2,00 3,32 1

ANNISA PUTRI
1 1 2
27 BATUBARA 1,00 2,00 3,32 1

SIHOL
2 3 2
28 SIHOMBING 2,45 1,00 1,41 2

RESKA ELISIANA
1 1 2
29 RITONGA 1,00 2,00 3,32 1

30 SULASNI 1 1 2 1,00 2,00 3,32 1

31 ANISA RITONGA 1 2 2 1,41 1,00 2,45 2


M.FAHRUL
2 3 4
32 RIDHO 3,74 2,24 1,41 3

33 M.DEDE ERIANDI 2 2 4 3,32 2,45 2,24 3

34 YOGI SAPUTRA 2 2 4 3,32 2,45 2,24 3

AHMAD ADJI
2 1 4
35 ALAMSYAH 3,16 3,00 3,16 2

SANDI PRIMA
2 2 4
36 NAIBAHO 3,32 2,45 2,24 3

JHON
HORASMAN 2 2 4
37 TURNIP 3,32 2,45 2,24 3

SUSI INDAH
1 1 4
38 ROSLIA 3,00 2,83 3,32 2

39 ARDI WANDIRA 2 3 4 3,74 2,24 1,41 3

NANDA
2 3 4
40 HERIAMBANG 3,74 2,24 1,41 3

41 LAMEKI GOHAE 2 3 3 3,00 1,41 1,00 3

42 KURNIAWAN 2 1 3 2,24 2,45 3,00 1

RICARDO
2 1 3
43 SEBAYANG 2,24 2,45 3,00 1

44 AYU SYAFIRA 1 1 3 2,00 2,24 3,16 1

RAMONTUA
2 1 3
45 SINAGA 2,24 2,45 3,00 1

46 AHMAD SYUKUR 2 4 3 3,74 1,73 0,00 3

47 KHAIRIL HUDA 2 4 3 3,74 1,73 0,00 3

TEUKU
2 4 3
48 MUNTASHIR 3,74 1,73 0,00 3

Data KOTA PROD Cluster


NAMA JKEL C1 C2 C3
Ke- ASAL I Terdekat

FAKHRY
2 2 3
49 HAMBALI 2,45 1,73 2,00 2

RIKARDO
2 1 3
50 ZALUKHU 2,24 2,45 3,00 1
Setelah proses perhitungan selesai, maka akan terbentuk tabel cluster baru
dengan tiap-tiap anggota cluster seperti tabel di bawah ini:

Tabel 3.9 Anggota Cluster 1

Data Ke- NAMA JKEL KOTAASAL PRODI

1 TASYA NURUL HUDA 1 2 1

5 RAVITA RAMBE 1 1 1

6 SRI HARTINI 1 1 1

7 PUTRY AMALIA BR LUBIS 1 1 1

8 NADHILAH PUTRI 1 2 1

9 TITIN ASTIKA 1 1 1

12 ANNISA 1 2 1

23 NOVIKA PURNAMA SARI 1 1 2

26 RIZKI KHAIRANI 1 1 2

27 ANNISA PUTRI BATUBARA 1 1 2

29 RESKA ELISIANA RITONGA 1 1 2

30 SULASNI 1 1 2

42 KURNIAWAN 2 1 3

43 RICARDO SEBAYANG 2 1 3

44 AYU SYAFIRA 1 1 3

45 RAMONTUA SINAGA 2 1 3

50 RIKARDO ZALUKHU 2 1 3

Average (Rata-Rata) 1,24 1,18 1,88

Nilai pada baris Average merupakan hasil perhitungan rata-rata dari tiap-tiap
kolom titik cluster. Nilai average ini nantinya akan menjadi titik pusat untuk cluster 1
yang baru.

Tabel 3.10 Anggota Cluster 2

Data Ke- NAMA JKEL KOTAASAL PRODI

2 PUTRIE RIZKY ANANDA 1 3 1


3 CUT MUTIA SARI 1 4 1

4 AINUR RIZA 1 4 1

10 FARAH DILLA 1 4 1

11 YUSNITA SEMBIRING 1 4 1

BAGINDA ROMADHAN
13 SIREGAR 2 3 2

21 HERLINA SIREGAR 1 1 5

22 ISRA HAYATI 1 4 2

24 NOVITA SARI 1 2 2

25 IMELDA BR TARIGAN 1 3 2

28 SIHOL SIHOMBING 2 3 2

31 ANNISA RITONGA 1 2 2

35 AHMAD ADJI ALAMSYAH 2 1 4

38 SUSI INDAH ROSLIA 1 1 4

49 FAKHRY HAMBALI 2 2 3

Average (Rata-Rata) 1,27 2,73 2,20

Nilai pada baris Average merupakan hasil perhitungan rata-rata dari tiap-tiap
kolom titik cluster. Nilai average ini nantinya akan menjadi titik pusat untuk cluster 2
yang baru.

Tabel 3.11 Anggota Cluster 3

DATA
KE- NAMA JKEL KOTAASAL PRODI

14 ADE AULIA LESTARI 1 2 5


15 KHOIRUL FIKRI 2 2 5

16 ERISA SRIJEKI MANURUNG 1 2 5

17 TRI WULANDARI 1 2 5

18 IBNU FAHMI 2 3 5

19 SYAFARUDDIN RITONGA 2 2 5

20 UMMY ZULFADLAH 1 3 5

32 M.FAHRUL RIDHO 2 3 4

33 M.DEDE ERIANDI 2 2 4

34 YOGI SAPUTRA 2 2 4

36 SANDI PRIMA NAIBAHO 2 2 4

37 JHON HORASMAN TURNIP 2 2 4

39 ARDI WANDIRA 2 3 4

40 NANDA HERIAMBANG 2 3 4

41 LAMEKI GOHAE 2 3 3

46 AHMAD SYUKUR 2 4 3

47 KHAIRIL HUDA 2 4 3

48 TEUKU MUNTASHIR 2 4 3

Average (Rata-Rata) 1,78 2,67 4,17

Nilai pada baris Average merupakan hasil perhitungan rata-rata dari tiap-tiap
kolom titik cluster. Nilai average ini nantinya akan menjadi titik pusat untuk cluster 3
yang baru. Sehingga titik pusat cluster pada iterasi kedua yaitu:

Tabel 3.12 Titik Pusat Cluster Pada Iterasi 2

Jenis Kelamin Kota Asal Prodi

Cluster 1 1,24 1,18 1,88

Cluster 2 1,27 2,73 2,20

Cluster 3 1,78 2,67 4,17


Perhitungan Iterasi Ke-2

Setelah didapatkan titik pusat yang baru dari setiap cluster, lakukan kembali dari
langkah ketiga hingga titik pusat dari setiap cluster tidak berubah lagi dan tidak ada lagi
data yang berpindah dari satu cluster ke cluster yang lain. Sebagai contoh, dihitung
jarak dari mahasiswa pertama ke pusat cluster pertama:

D(1,1 ) = √¿ ¿

= 1,23

Jarak data Mahasiswa pertama ke pusat cluster kedua:

D(1,2 ) = √¿ ¿

= 1,43

Jarak data Mahasiswa pertama ke pusat cluster ketiga:

D(1,3 ) = √¿ ¿

= 3,33

Kemudian Hitung Jarak dari data Mahasiswa Kedua ke pusat cluster


pertama:

D(2,1 ) = √¿ ¿

= 2,04

Jarak data Mahasiswa kedua ke pusat cluster kedua:

D(2,2 ) = √¿ ¿

= 1,26

Jarak data Mahasiswa kedua ke pusat cluster ketiga:

D(2,3 ) = √¿ ¿

= 3,28
Berdasarkan hasil ketiga perhitungan di atas dapat disimpulkan bahwa jarak
data Mahasiswa Pertama yang paling dekat adalah dengan cluster 1, sehingga data
Mahasiswa pertama dimasukkan ke dalam cluster 1. Untuk jarak data Mahasiswa Kedua
yang paling dekat adalah dengan cluster 2, sehingga data Mahasiswa Kedua dimasukkan
ke dalam cluster 2.

Hasil perhitungan selengkapnya untuk seluruh data Mahasiswa dapat di lihat


pada tabel di bawah ini.

Tabel 3.13 Hasil Perhitungan Setiap Data Ke Pusat Cluster Pada Iterasi 2

Jkel Kota Prodi


No Nama C1 C2 C3 Cluster
Asal

01 TASYA NURUL HUDA 1 2 1 1,23 1,43 3,33 1

02 PUTRIE RIZKY ANANDA 1 3 1 2,04 1,26 3,28 2

03 CUT MUTIA SARI 1 4 1 2,97 1,77 3,52 2

04 AINUR RIZA 1 4 1 2,97 1,77 3,52 2

05 RAVITA RAMBE 1 1 1 0,93 2,12 3,66 1

06 SRI HARTINI 1 1 1 0,93 2,12 3,66 1

07 PUTRY AMALIA BR LUBIS 1 1 1 0,93 2,12 3,66 1

08 NADHILAH PUTRI 1 2 1 1,23 1,43 3,33 1

09 TITIN ASTIKA 1 1 1 0,93 2,12 3,66 1

10 FARAH DILLA 1 4 1 2,97 1,77 3,52 2

11 YUSNITA SEMBIRING 1 4 1 2,97 1,77 3,52 2

12 ANNISA 1 2 1 1,23 1,43 3,33 1

13 BAGINDA ROMADHAN SIREGAR 2 3 2 1,98 0,81 2,2 2

14 ADE AULIA LESTARI 1 2 5 3,23 2,91 1,32 3

15 KHOIRUL FIKRI 2 2 5 3,31 2,99 1,09 3

16 ERISA SRIJEKI MANURUNG 1 2 5 3,23 2,91 1,32 3


Jkel Kota Prodi
No Nama C1 C2 C3 Cluster
Asal

17 TRI WULANDARI 1 2 5 3,23 2,91 1,32 3

18 IBNU FAHMI 2 3 5 3,69 2,91 0,92 3

19 SYAFARUDDIN RITONGA 2 2 5 3,31 2,99 1,09 3

20 UMMY ZULFADLAH 1 3 5 3,62 2,83 1,19 3

21 HERLINA SIREGAR 1 1 5 3,13 3,3 2,02 3

22 ISRA HAYATI 1 4 2 2,84 1,31 2,66 2

23 NOVIKA PURNAMA SARI 1 1 2 0,32 1,77 2,84 1

24 NOVITA SARI 1 2 2 0,86 0,81 2,4 2

25 IMELDA BR TARIGAN 1 3 2 1,84 0,43 2,33 2

26 RIZKI KHAIRANI 1 1 2 0,32 1,77 2,84 1

27 ANNISA PUTRI BATUBARA 1 1 2 0,32 1,77 2,84 1

28 SIHOL SIHOMBING 2 3 2 1,98 0,81 2,2 2

29 RESKA ELISIANA RITONGA 1 1 2 0,32 1,77 2,84 1

30 SULASNI 1 1 2 0,32 1,77 2,84 1

31 ANNISA RITONGA 1 2 2 0,86 0,81 2,4 2

32 M.FAHRUL RIDHO 2 3 4 2,9 1,96 0,43 3

33 M.DEDE ERIANDI 2 2 4 2,4 2,08 0,72 3

34 YOGI SAPUTRA 2 2 4 2,4 2,08 0,72 3

35 AHMAD ADJI ALAMSYAH 2 1 4 2,26 2,6 1,69 3

36 SANDI PRIMA NAIBAHO 2 2 4 2,4 2,08 0,72 3


Jkel Kota Prodi
No Nama C1 C2 C3 Cluster
Asal

37 JHON HORASMAN TURNIP 2 2 4 2,4 2,08 0,72 3

38 SUSI INDAH ROSLIA 1 1 4 2,14 2,51 1,85 3

39 ARDI WANDIRA 2 3 4 2,9 1,96 0,43 3

40 NANDA HERIAMBANG 2 3 4 2,9 1,96 0,43 3

41 LAMEKI GOHAE 2 3 3 2,27 1,12 1,23 2

42 KURNIAWAN 2 1 3 1,37 2,05 2,05 1

43 RICARDO SEBAYANG 2 1 3 1,37 2,05 2,05 1

44 AYU SYAFIRA 1 1 3 1,16 1,93 2,18 1

45 RAMONTUA SINAGA 2 1 3 1,37 2,05 2,05 1

46 AHMAD SYUKUR 2 4 3 3,13 1,67 1,79 2

47 KHAIRIL HUDA 2 4 3 3,13 1,67 1,79 2

48 TEUKU MUNTASHIR 2 4 3 3,13 1,67 1,79 2

49 FAKHRY HAMBALI 2 2 3 1,58 1,31 1,36 2

50 RIKARDO ZALUKHU 2 1 3 1,37 2,05 2,05 1

Dalam penelitian ini, iterasi clustering data Mahasiswa terjadi sebanyak 2 kali
iterasi. Pada iterasi ke-2 ini, titik pusat dari setiap cluster sudah tidak berubah dan tidak
ada lagi data yang berpindah dari satu cluster ke cluster yang lain.

Berdasarkan hasil pengelompokan data menggunakan metode k-means


clustering, di dapatkan hasil clustering hingga iterasi ke-2, dimana titik pusat tidak lagi
berubah dan tidak ada data yang berpindah antar cluster. Hasil dari clustering tersebut
seperti pada tabel di bawah ini.

Tabel 3.14 Anggota Cluster 1 Hasil Iterasi 2


Nama Jkel Kota Asal Prodi

TASYA NURUL HUDA 1 2 1

RAVITA RAMBE 1 1 1

SRI HARTINI 1 1 1

PUTRY AMALIA BR LUBIS 1 1 1

NADHILAH PUTRI 1 2 1

TITIN ASTIKA 1 1 1

ANNISA 1 2 1

NOVIKA PURNAMA SARI 1 1 2

RIZKI KHAIRANI 1 1 2

ANNISA PUTRI BATUBARA 1 1 2

RESKA ELISIANA RITONGA 1 1 2

SULASNI 1 1 2

KURNIAWAN 2 1 3

RICARDO SEBAYANG 2 1 3

AYU SYAFIRA 1 1 3

RAMONTUA SINAGA 2 1 3

RIKARDO ZALUKHU 2 1 3

Tabel 3.15 Anggota Cluster 2 Hasil Iterasi 2

Nama Jkel Kota Asal Prodi

PUTRIE RIZKY ANANDA 1 3 1

CUT MUTIA SARI 1 4 1

AINUR RIZA 1 4 1

FARAH DILLA 1 4 1
Nama Jkel Kota Asal Prodi

YUSNITA SEMBIRING 1 4 1

BAGINDA ROMADHAN SIREGAR 2 3 2

HERLINA SIREGAR 1 4 2

ISRA HAYATI 1 2 2

NOVITA SARI 1 3 2

IMELDA BR TARIGAN 2 3 2

SIHOL SIHOMBING 1 2 2

ANNISA RITONGA 2 2 3

AHMAD ADJI ALAMSYAH 2 3 3

SUSI INDAH ROSLIA 2 4 3

FAKHRY HAMBALI 2 4 3

Tabel 3.16 Anggota Cluster 3 Hasil Iterasi 2

Nama Jkel Kota Asal Prodi

ADE AULIA LESTARI 1 1 5

KHOIRUL FIKRI 2 1 4

ERISA SRIJEKI MANURUNG 1 1 4

TRI WULANDARI 1 2 5

IBNU FAHMI 2 2 5

SYAFARUDDIN RITONGA 1 2 5

UMMY ZULFADLAH 1 2 5

M.FAHRUL RIDHO 2 3 5

M.DEDE ERIANDI 2 2 5
Nama Jkel Kota Asal Prodi

YOGI SAPUTRA 1 3 5

SANDI PRIMA NAIBAHO 2 3 4

JHON HORASMAN TURNIP 2 2 4

ARDI WANDIRA 2 2 4

NANDA HERIAMBANG 2 2 4

LAMEKI GOHAE 2 2 4

AHMAD SYUKUR 2 3 4

KHAIRIL HUDA 2 3 4

Dari hasil clustering diatas dapat diambil kesimpulan bahwa:

1. Karakteristik Data Mahasiswa pada cluster 1 mayoritas Kota Asal

yaitu Medan dan Binjai, dengan jumlah data 17 data mahasiswa.

Dengan mayoritas mahasiswa memilih Prodi Ilmu Hukum dan

Agroteknologi. Berarti untuk wilayah Medan lebih diprioritaskan

untuk mempromosikan mengenai Ilmu Hukum dan Agroteknologi.

2. Karakteristik Data Mahasiswa pada cluster 2 mayoritas Kota Asal

yaitu Aceh, dengan jumlah data 16 data mahasiswa. Dengan

mayoritas mahasiswa memilih Prodi Agroteknologi. Berarti untuk


wilayah Aceh lebih diprioritaskan untuk mempromosikan

mengenai Prodi Agroteknologi.

3. Karakteristik Data Mahasiswa pada cluster 3 mayoritas Kota Asal

yaitu Luar Kota 1 yaitu wilayah Berastagi, Kabanjahe, Kisaran,

Siantar dan tebing Tinggi, dengan jumlah data 17 data

mahasiswa. Dengan mayoritas mahasiswa memilih Prodi

Agribisnis dan Administrasi Publik. Berarti untuk wilayah ini lebih

diprioritaskan untuk mempromosikan mengenai Prodi Agribisnis

dan Administrasi Publik.

3.3 Flowchart K-means Clustering

Flowchart merupakan penggambaran secara fisik dari langkah-langkah dan

urutan prosedur dari suatu program. Berikut rancangan flowchart untuk untuk

mendukung strategi promosi pada Universitas Medan Area dengan metode K-

Means Clustering.

Mulai
Inisialisasi Data

Input Data

Survei Mahasiswa

Tentukan Pusat Cluster

Proses Hitung

K-Means Clustering

Hasil Pengelompokkan

Selesai
Gambar 3.1 Flowchart Metode K-Means Clustering

Flowchart metode k-means clustering diatas menjelaskan bahwa tahapan


clustering simbol terminator Mulai, kemudian tahapan inisialisasi data. Setelah itu input
data mahasiswa ke dalam sistem. Selanjutnya yaitu menentukan titik pusat cluster,
dalam kasus ini digunakan 3 titik pusat cluster. Kemudian proses hitung K-Means
Clustering sehingga dihasilkan pengelompokkan data pada tiap-tiap cluster. Kemudian
selesai.

3.4 Pemodelan/Perancangan Sistem

3.4.1 Unified Modeling Language (UML)

Unfied Modeling Language adalah keluarga notasi grafis yang didukung oleh meta-
model tunggal, yang membantu pendeskripsian dan desain sistem perangkat lunak.
Prosedur sistem yang akan digunakan dengan menggunakan UML. Pemodelan UML
menggunakan use case diagram yang selanjutnya setiap proses yang akan terjadi akan
diperjelas dengan diagram activity.

3.4.1.1 Use Case Diagram

Use case diagram yang digunakan untuk sistem aplikasi Mahasiswa dengan
Metode K-Means Clustering merupakan gambaran bagaimana pengguna berinteraksi
dengan sistem. Dengan adanya use case ini dapat diketahui proses yang terjadi didalam
sistem. Adapun use case diagram metode K-Means Clustering dapat dillihat di bawah ini.

Login

Input Data Mahasiswa

Tentukan Titik Cluster


Admin
Proses K-Means Clustering

Tampil Hasil Clustering

Gambar 3.2 Use Case Diagram

Untuk memahami lebih jelas, apa saja yang akan dilakukan oleh user dalam use
case diagram diatas, maka akan dijelaskan pada skenario use case sebagai berikut :

1. Skenario Login

Nama use case : Login

Deskripsi : Memungkinkan pengguna untuk mengisi data username

dan password pada program aplikasi untuk masuk ke Menu


Utama program aplikasi.

Proses : Pengguna terlebih dahulu mengisi data user dan password.

Kondisi Akhir : Perangkat lunak akan memproses data user dan password

tersebut.

2. Skenario Data Mahasiswa

Nama use case :Masukkan data

Deskripsi :Memungkinkan pengguna untuk menginput data Mahasiswa,


dimana Mahasiswa ini akan dinilai nantinya.
Proses : Pengguna terlebih dahulu mengisi data dengan lengkap pada
form aplikasi yang tersedia.

Kondisi Akhir : Perangkat lunak akan menyimpan data.

3. Skenario Tentukan Titik Cluster

Nama use case :Tentukan Titik Cluster

Deskripsi :Memungkinkan pengguna untuk menentukan titik cluster dimana


data titik cluster ini merupakan acuan dalam melakukan
perhitungan nantinya.

Proses : Pengguna terlebih dahulu menentukan titik cluster.

Kondisi Akhir : Perangkat lunak akan menyimpan data titik cluster.

4. Skenario Proses Metode K-Means Clustering

Nama use case : Proses Metode K-Means Clustering

Deskripsi : Memungkinkan pengguna untuk mendapatkan hasil


perhitungan dengan metode K-Means Clustering.

Prekondisi : Pengguna sudah menjalankan perangkat lunak.

Proses : Pengguna terlebih dahulu menentukan data yang akan dinilai lalu
sistem akan menghitung data tersebut dengan menggunakan
metode K-Means Clustering.

Kondisi Akhir : Perangkat lunak akan menghitung dan Menunjukkan hasil dari
perhitungan K-Means Clustering.

5. Skenario Cetak Hasil

Nama use case : Cetak Laporan Hasil

Deskripsi : Memungkinkan pengguna untuk menarik kesimpulan dan


mengambil informasi atas penilaian yang telah dilakukan dengan
metode K-Means Clustering.

Prekondisi : Pengguna sudah mencatat penilaian dari setiap titik cluster.

Proses : Pengguna mencatat semua penilaian yang telah dilakukan

lalu mengambil kesimpulan/informasi baru.

Kondisi Akhir : Pengguna mendapatkan nilai clustering

berdasarkan perhitungan K-Means Clustering.


3.4.1.2 Activity Diagram

Activity diagram untuk use case ini merupakan alur kerja admin untuk masuk
kedalam sistem dari sistem aplikasi. Diagram ini merupakan alur proses dalam
menjalankan sistem data mining Untuk mendukung strategi promosi Universitas Medan
Area menggunakan metode K-Means Clustering.

Admin Sistem
Start

Login
Input Username
dan Password

Tidak Valid

Ya

Menu Utama
Input Data
Mahasiswa

Proses Data
Tentukan Titik
cluster Titik cluster

Proses Perhitungan

K-Means Clustering

Tampilkan Hasil
Pengelompokkan

Finish

Gambar 3.3 Activity Diagram Program K-Means Clustering

Activity diagram diatas terdiri dari dua bagian yaitu Admin sebagai pengguna dan
Sistem. Activity diagram ini dimulai dari Admin menginput username dan password.
Kemudian Sistem memproses login dari Admin. Jika valid (username dan password
benar) maka sistem akan menampilkan menu utama. Jika salah maka Admin harus
mengulangi input username dan password.
Kemudian setelah tampil menu utama, Admin melakukan Input Data Mahasiswa,
lalu menentukan titik pusat cluster (3 titik pusat cluster). Selanjutnya sistem memproses
data titik cluster tersebut. Kemudian sistem melakukan proses perhitungan dengan
metode K-Means Clustering. Sehingga menghasilkan output berupa hasil
pengelompokkan data mahasiswa. Lalu proses selesai.

3.4.1.3 Class Diagram

Class Diagram memperlihatkan hubungan antar kelas dan


penjelasan detail tiap-tiap kelas di dalam model desain (dalam logical
view) dari suatu sistem. Bentuk Class Diagram dari sistem aplikasi data mining yang
dibangun dapat dilihat pada gambar di bawah ini :

3.4.2 Desain Database

Mahasiswa

1
+ NIM* Varchar
Proses Clustering
- Nama Varchar Hasil 1..** m
- Jkel Varchar + NIM Varchar
- Kotaasal Varchar + NIM * Varchar - C1 Number
- Prodi Varchar - Nama
m Varchar - C2 Number
- C1 Number 1
- C3 Number
1..**
- C2 Number - Cluster Number
- C3 Number
+ TambahData ( ) - ClusterTerpilih Varchar + TambahData ( )
+ EditData ( ) + EditData ( )
+ HapusData ( ) + HapusData ( )
+ProsesPenilaian ( )
+CetakLaporan ( )

Login

+ Username * Text
+ Password Text

+ Login ( )
+ Exit ( )

Gambar 3.4 Class Diagram


Database merupakan sekumpulan data oprasional yang saling berhubungan
dengan redudansi minimal, yang digunakan secara bersama oleh beberapa aplikasi.
Database diterapkan untuk mengatasi masalah pengolahan data dengan cara
konvensional, yaitu jika struktur data diubah, program harus disesuaikan dan jika ada
duplikasi file, sulit untuk memlihara integrasi data.
3.4.2.1 Desain Tabel

Dalam perancangan database perencanaan data record tersimpan dalam


beberapa file dengan arsitektur data sebagai berikut :

1. Tabel Login

Tabel login berisi atribut-atribut mengenai username password yang harus di

input agar dapat masuk sebagai admin. Berikut tampilan tabel login di bawah ini:

Tabel 3.17 Login


No Field Name Type Field Field Size

1 Username Varchar 10

2 Password Varchar 10

2. Tabel Data Mahasiswa

Berikut rancangan struktur data yang dapat dilihat di bawah ini:

Tabel 3.18 Data Mahasiswa

No Field Name Type Field Field Size Keterangan

1 NIM Varchar 10 Primary Key

2 Nama Varchar 50 Nama Mahasiswa

3 Jkel Varchar 20 Jenis Kelamin

4 Kotaasal Varchar 20 Kota Asal

5 Prodi Varchar 20 Program Studi

3. Tabel Proses Clustering

Tabel proses clustering digunakan untuk menampung record data nilai

clustering yang kemudian akan disimpan sebagai database. Berikut tampilan

rancangan struktur yang berisi atribut-atribut data di bawah ini:

Tabel 3.19 Tabel Proses Clustering


No Field Name Type Field Field Size Keterangan

1 NIM Varchar 10 Primary Key

2 C1 Number Long integer Jarak ke Cluster 1

3 C2 Number Long integer Jarak ke Cluster 2

4 C3 Number Long integer Jarak ke Cluster 3

5 Cluster Number Long integer Cluster

4. Tabel Hasil

Tabel hasil digunakan untuk menampung record data hasil clustering keseluruhan
yang kemudian akan disimpan sebagai Database. Berikut tampilan rancangan struktur
tabel yang berisi atribut-atribut data di bawah ini:

Tabel 3.20 Tabel Hasil


No Field Name Type Field Field Size Keterangan
1 NIM Varchar 10 Primary Key

2 Nama Varchar 50 Nama Mahasiswa

2 C1 Number Long integer Jarak ke Cluster 1

3 C2 Number Long integer Jarak ke Cluster 2

4 C3 Number Long integer Jarak ke Cluster 3

3 ClusterTerpilih Varchar 10 Cluster yang terpilih

3.4.3 Perancangan Antar Muka

Dalam pembuatan program, dirancang beberapa form. Pembagian kedalam


beberapa form dimaksudkan untuk mempermudah pengguna dalam penggunaannya,
sehingga pengguna tidak mengalami kesulitan dalam pengoperasiannya.

Rancangan form sistem aplikasi Clustering untuk mendukung strategi promosi


dengan metode K-Means Clustering adalah sebagai berikut:

1. Rancangan Form Login


Tampilan form login merupakan form untuk menerima masukan username

dan password administrator yang kemudian akan dicek username dan password

tersebut telah valid jika ya, maka pengguna dapat menggunakan aplikasi ini,

sedangkan jika tidak, maka aplikasi ini akan menolak username dan password

tersebut dan aplikasi ini tidak dapat digunakan.

LOGIN SISTEM
Masukkan Username dan Password

LOGIN RESET

Gambar 3.6 Rancangan Login

2. Rancangan Menu Utama


Jendela tampilan Menu Utama yang terdiri dari beberapa sub menu dari

Menu File yang terdiri dari data Mahasiswa, data penilaian, data kriteria

sedangkan sub menu laporan terdiri dari laporan hasil. Tampilan rancangan Menu

Utama seperti pada gambar 3.6 berikut ini.

Logo Logout

Home UNIVERSITAS MEDAN AREA

Data Mahasiswa

Titik Cluster GAMBAR


Proses K-Means

Laporan

Gambar 3.6 Rancangan Menu Utama


3. Rancangan Form Data Mahasiswa
Jendela tampilan merancangan form data Mahasiswa merupakan form untuk
memasukkan data keterangan Mahasiswa beserta biodatanya yaitu NIM, nama
mahasiswa, jenis kelamin, kota asal dan prodi. Seperti pada gambar 3.7 berikut ini

Logout

Home UNIVERSITAS MEDAN AREA


Data Mahasiswa
Titik Cluster Tambah Data
Proses K-Means
Laporan Data Mahasiswa

Nama Jenis Kota


NIM Mahasiswa Prodi Aksi
Kelamin Asal

xxx xxx xxx 999 xxx x v

xxx xxx xxx 999 xxx x v

Gambar 3.7 Rancangan Halaman Mahasiswa

4. Rancangan Form Titik Cluster


Form titik cluster berfungsi untuk menentukan dan memproses data titik
cluster. Tombol simpan berfungsi untuk menyimpan data titik cluster yang telah
dipilih. Tombol keluar berfungsi untuk keluar dari tampilan form. Tampilan form
titik cluster dapat dilihat pada gambar 3.8 di bawah ini:
Logout

Home UNIVERSITAS MEDAN AREA


Data Mahasiswa
Titik Cluster Tambah Data
Proses K-Means
Laporan Data Titik Cluster

NIM Nama C1 C2 C3 Aksi

xxx 999 999 999 999 x v

xxx 999 999 999 999 x v

Gambar 3.8 Rancangan Halaman Titik Cluster

5. Rancangan Form Proses K-Means Clustering


Form proses perhitungan berfungsi untuk memproses data titik cluster
berdasarkan rumus dan persamaan yang telah ditentukan. Disini akan diproses
perhitungan titik cluster dengan metode K-Means Clustering dan menghasilkan
hasil clustering. Tombol proses berfungsi untuk melanjutkan ke proses
selanjutnya. Tombol keluar berfungsi untuk keluar dari tampilan form. Tampilan
form proses perhitungan dapat dilihat pada gambar 3.9 di bawah ini:
Logout

Home UNIVERSITAS MEDAN AREA


Data Mahasiswa
Titik Cluster Tambah Data
Proses K-Means
Laporan Data Titik Cluster

NIM Nama C1 C2 C3 Aksi

xxx 999 999 999 999 x v

xxx 999 999 999 999 x v

Gambar 3.9 Rancangan Halaman Clustering

6. Rancangan Laporan Hasil Pengelompokkan

Pada rancangan laporan hasil pengelompokkan merupakan laporan untuk


menampilkan data hasil perhitungan dari metode K-Means Clustering. Tampilan laporan
hasil pengelompokkan dengan menggunakan metode K-Means Clustering dapat
dilihatpada gambar 3.10 di bawah ini:
UNIVERSITAS MEDAN AREA

(UMA)

Jl. Setia Budi No 79 B Kec. Medan Sunggal Kota Medan


Laporan Hasil Analisa Clustering
NIM Nama Jarak C1 Jarak C2 Jarak C3 Cluster
Mahasiswa

xx Xxx 999 999 999 999

xx xxx 999 999 999 999

xx xxx 999 999 999 999


Gambar 3.13 Laporan Mahasiswa

Dari proses clustering dapat diambil kesimpulan bahwa :

Gambar 3.13 Laporan Mahasiswa

Xxxxx xxxxxx xxxxxx xxxxxx xxxxx xxxx xxxxxxxxxxxx xxxxxx

Xxxxx xxxxxx xxxxxx xxxxxx xxxxx xxxx xxxxxxxxxxxx xxxxxx

Xxxxx xxxxxx xxxxxx xxxxxx xxxxx xxxx xxxxxxxxxxxx.

Diketahui Oleh :
BAB IV

HASIL DAN PEMBAHASAN

4.1 Kebutuhan Sistem

Penerapan dan penggunaan aplikasi data mining untuk mendukung strategi

promosi pada Universitas Medan Area (UMA) menggunakan algoritma K-Means

Clustering membutuhkan beberapa alat perangkat pendukung, yaitu perangkat lunak

dan perangkat keras, minimal harus dipenuhi sehingga aplikasi ini dapat berjalan dengan

baik. Berikut adalah daftar spesifikasi minimal perangkat lunak dan perangkat keras.

1. Perangkat Keras (Hardware)

a. Memori minimal 2 GB.

b. Keyboard dan Mouse

c. Central processing unit (CPU), minimal Intel Dual Core.

d. Harddisk minimal 320 GB

2. Perangkat Lunak (Software)

a. Microsoft Windows 8 sebagai sistem operasi

b. XAMPP

c. Sublime Text

d. Browser Mozilla Firefox

4.2 Implementasi Sistem


Implementasi sistem merupakan bagian yang menerangkan tentang penerapan

dan hasil dari aplikasi data mining yang dijelaskan secara satu persatu. Dimulai dari form

login kemudian diteruskan ke menu utama, menu data dan terakhir menu laporan.

4.2.1 Login

Pada awal aplikasi dijalankan akan menampilkan form login, dimana user

diwajibkan untuk mengisi username dan password yang sudah terdaftar sebelumnya.

Dan akan menampilkan pesan atau peringatan (warning) jika nama user atau password

salah. Seperti pada gambar di bawah ini :

Gambar 4.1 Form Login

4.2.2 Menu Utama

Tampilan selanjutnya adalah menu utama Aplikasi data mining setelah

melakukan login terlebih dahulu. Menu utama terdiri dari beberapa menu yaitu Data

Mahasiswa, Proses, Laporan dan Keluar. Setiap menu memiliki sub menunya masing-

masing, kecuali menu Keluar yang tidak memiliki sub menu. Karena Keluar hanya
berfungsi untuk mengakhiri program. Gambar halaman utama aplikasi data mining ini

dapat dilihat di bawah ini:

Gambar 4.2 Tampilan Form Menu Utama

4.2.3 Form Mahasiswa

Tampilan ini berisikan tentang data Mahasiswa yang berfungsi sebagai media

dalam memasukan data mahasiswa baru dan juga mengedit serta menghapus data

Mahasiswa. Tampilan form dirancang agar mudah untuk digunakan oleh user. Adapun

tampilan form sebagai berikut:


Gambar 4.3 Tampilan Form Input Data Mahasiswa

Adapun fungsi-fungsi dari tombol yang terdapat dalam form mahasiswa yaitu :

Tambah : Menambah data mahasiswa

Edit : Merubah data-data yang dianggap salah

Hapus : Menghapus data-data yang dianggap tidak perlu

4.2.4 Form Titik Cluster

Tampilan Form Titik Cluster ini berfungsi untuk menampilkan hasil inisialisasi dan

memilih 3 data sebagai titik pusat Cluster. Adapun cara penggunaannya dengan terlebih

dahulu memilih (cheklist) pada list yang tersedia pada halaman titik cluster. Tampilan

form titik cluster dapat dilihat pada gambar berikut ini.


Gambar 4.4 Tampilan Form Titik Cluster

Gambar 4.5 Tampilan Form Proses Titik Cluster (lanjutan)


Adapun fungsi-fungsi dari tombol yang terdapat dalam form titik cluster yaitu

Simpan : Menyimpan data Titik Cluster baru

4.3 Pengujian Sistem

Setelah melalui tahap implementasi maka langkah selanjutnya adalah

melakukan pengujian sistem. Berikut dibawah ini tahap pengujian sistem.

4.3.1 Form Proses Clustering

Tampilan Form Proses Clustering ini berfungsi untuk melakukan proses

perhitungan jarak data ke titik Cluster menggunakan metode k-means clustering dan

menampilkan hasil perhitungan. Adapun hasil perhitungannya tampil dalam bentuk

listview. Klik tombol Proses untuk memulai perhitungan dengan metode K-Means

Clustering. Tampilan form sebagai berikut :

Gambar 4.6 Tampilan Form Clustering (Cluster 1)


Gambar 4.7 Tampilan Form Clustering (Cluster 2)

Gambar

4.8 Tampilan Form Clustering (Cluster 3)

4.3.2 Laporan Hasil Clustering

Form Laporan ini berfungsi untuk melihat hasil perhitungan Cluster dengan

metode K-Means Clustering beserta informasi lain mengenai Proses Titik Cluster

tersebut. Adapun hasil Cluster akan tampil pada kolom Cluster. Tampilan preview dapat

dilihat dibawah ini:


Gambar 4.9 Tampilan Preview Laporan Hasil Clustering

Laporan hasil clustering ini merupakan hasil perhitungan dari setiap data

mahasiswa ke jarak tiap pusat cluster pada iterasi 2. Seperti yang telah dijelaskan pada

Bab III halaman 50 (Tabel 3.14).


Gambar 4.10 Tampilan Preview Laporan Hasil Clustering (Bagian 2)

Dari hasil yang diatas, dapat dilihat bahwa dengan adanya aplikasi data mining

mendukung strategi promosi pada Universitas Medan Area (UMA) menggunakan

algoritma K-Means Clustering ini, yang dibuat dengan menggunakan perangkat-

perangkat lunak (software) dapat menganalisa data mahasiswa sehingga menghasilkan

laporan pengelompokkan data mahasiswa pada tiap-tiap cluster yang dapat digunakan

untuk kepentingan strategi promosi.

4.4 Kelemahan dan Kelebihan Sistem

Kelebihan dari aplikasi data mining mendukung strategi promosi pada

Universitas Medan Area (UMA) dengan metode k-means clustering yaitu:


a. Program ini dapat dijalankan di semua jenis komputer dan program ini tidak

membutuhkan spesifikasi komputer canggih untuk menjalankannya. Karena

program ini sangat ringan dan tidak memerlukan memori terlalu besar.

b. Dengan program ini mungkin dapat memotivasi kepada instansi lain untuk

melakukan kegiatan yang ter-update, mengikuti perkembangan jaman dan

teknologi.

Kelemahan dari sistem ini yaitu :

Keterbatasan sumber data, terbatas hanya dalam ruang lingkup aplikasi data mining

untuk mendukung strategi promosi saja.

a. Program ini tidak dapat melakukan backup data otomatis. Harus

dilakukan langsung dari komputer server apabila data akan di-backup.

b. Program ini tidak dapat melakukan backup data otomatis. Harus

dilakukan langsung dari computer server apabila data akan dibackup


BAB V

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Setelah melakukan berbagai macam tahapan-tahapan maka diperoleh

beberapa kesimpulan sebagai berikut:

1. Hasil dari aplikasi data mining yang dibangun dapat mengadopsi

metode K-Means Clustering yang digunakan untuk mendukung

strategi promosi di Universitas Medan Area (UMA) secara tepat

dan akurat.

2. Setelah dilakukan pengujian dengan sampel data sebanyak 50

data mahasiswa, diperoleh hasil 3 (tiga) cluster. Dimana masing-

masing cluster memiliki karakteristik yang berbeda-beda.

5.2 Saran

Untuk meningkatkan kemampuan dan fungsi dari program data mining ini

ada beberapa saran yang dapat diberikan untuk pengembangan yang bisa

dilakukan, antara lain:

1. Program yang dibuat ini masih dapat dikembangkan lebih lanjut supaya

menjadi sistem yang lebih lengkap. Sehingga tidak hanya digunakan untuk

mendukung strategi promosi saja.


77

2. Program aplikasi data mining ini belum bisa di backup data secara otomatis.

Sehingga diharapkan kedepannya dapat dikembangkan lagi.

3. Program data mining untuk mendukung strategi promosi dengan metode K-

Means Clustering ini belum dibandingkan dengan metode lainnya, seperti

metode fuzzy atau yang lainnya.


DAFTAR PUSTAKA

Agustina, Silvia, dkk, “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan
Metode K-Means ,” J. Informatika dan Teknologi, vol. 2, no. 2, 2016.

Estri, Beta, dkk, “Analisis Segmentasi Pelanggan Menggunakan Kombinasi RFM


Model dan Teknik Clustering,” J. JUTEI, vol. 2, no.1, 2018.

Heriyanto, Yunahar, “Perancangan Sistem Informasi Rental Mobil Berbasis Web


Pada PT.APM Rent Car,” J. Intra-Tech, vol. 2, no. 2, pp. 64–77, 2018.

Iswandy, Eka, “Analisa Dan Perancangan Sistem Informasi Penagihan Purchasing


Order Customer Studi Kasus Pada Cv. Vertical Cipta Relasi Padang Dengan
Metode Centralized Data Processing,” J. TEKNOIF, vol. 4, no. Oktober, p.
14, 2016.

Mega, Windha, “Clustering Menggunakan Metode K-Means Untuk Menentukan


Status Gizi Balita,” Jurnal Informatika., vol. 15, no. 2, 2015.

Santoso dan R. Nurmalina, “Perencanaan dan Pengembangan Aplikasi Absensi


Mahasiswa Menggunakan Smart Card Guna Pengembangan Kampus Cerdas
(Studi Kasus Politeknik Negeri Tanah Laut),” J. Integr., vol. 9, no. 1, pp.
84–91, 2017.

Suendri, “Implementasi Diagram UML (Unified Modelling Language) Pada


Perancangan Sistem Informasi Remunerasi Dosen Dengan Database Oracle
(Studi Kasus: UIN Sumatera Utara Medan),” J. Ilmu Komput. dan Inform.,
vol. 3, no. 1, pp. 1–9, 2018.

Sulistyowati, dkk, “Analisa Segmentasi Konsumen Menggunakan Algoritma K-


Means Clustering, Institut Teknologi Adhi Tama Surabaya”, 2018.

Tofik Isa dan G. P. Hartawan, “Perancangan Aplikasi Koperasi Simpan Pinjam


Berbasis Web (Studi Kasus Koperasi Mitra Setia),” J. Ilm. Ilmu Ekon., vol.
5, no. 10, pp. 139–151, 2017.

Wijaya, Hadi, “Perancangan dan Implementasi Metode Oreste Pada Sistem


Pendukung Keputusan Seleksi Penerima Beasiswa,” Semin. Nas. Teknol.,
pp. 387–396, 2015.

Warman, Indra, “Analisis Perbandingan Kinerja Query Database Management


System (Dbms) Antara Mysql 5.7.16 Dan Mariadb 10.1,” Jurnal Teknoif,
pp. 32–42, 2018.
Yahya dan Mahfuz, “Penggunaan Algoritma K-Means Untuk
Menganalisis Pelanggan Potensial Pada Dealer SPS Motor
Honda Lombok Timur Nusa Tenggara Barat,” J. Informatika dan
Teknologi, vol. 2, no. 2, 2019.

Yanto, Robi dan R. Khoiriah, “Implementasi Data Mining dengan Metode


Algoritma Apriori dalam Menentukan Pola Pembelian Obat,” Creat. Inf.
Technol. J., vol. 2, no. 2, p. 102, 2017

Anda mungkin juga menyukai