TUGAS AKHIR
Oleh
Muhammad Rishakim Marajari
71160915020
7
KATA PENGANTAR
Assalammualaikum Wr. Wb
Alhamdulillah, segala puji dan syukur saya panjatkan kepada Allah SWT,
yang telah memberikan Rahmat dan Hidayah-Nya kepada saya sehingga dapat
shalawat beriring salam saya hadiahkan kepada Nabi Besar Muhammad SAW
yang telah membawa kita dari alam kegelapan menuju alam yang terang
Skripsi ini ditujukan untuk memenuhi salah satu syarat kelulusan Program
Sumatera Utara. Hal tersebut tentunya tidak terlepas dari bantuan dosen
banyak mendapatkan bimbingan dan bantuan dari pihak lain berupa materil,
besarnya kepada :
8
2. Bapak Mhd. Zulfansyuri Siambaton, ST.,M.Kom, selaku Plt. Ketua Jurusan
7. Kedua orang tua tercinta: Alm IR.Ibrahim dan Tuti Indrawati , serta seluruh
keluarga yang telah memberikan do’a restu dan dorongan kepada penulis
kekurangan yang perlu diperbaiki, baik dari segi penyajian, bentuk maupun isi.
Dengan kerendahan hati penulis sangat mengharapkan kritik dan saran dari semua
9
Akhirul kalam kepada Allah SWT penulis berserah diri, karena hanya
Skripsi ini dapat berguna bagi semua pihak yang membacanya, amin.
Penulis
10
DAFTAR ISI
Halaman
KATA PENGANTAR ............................................................... I
DAFTAR ISI ........................................................................... IV
DAFTAR GAMBAR ................................................................. VII
DAFTAR TABEL .................................................................... VIII
DAFTAR PUSTAKA.................................................................. IX
DAFTAR LAMPIRAN ..............................................................
ABSTRAK...................................................................................
BAB I PENDAHULUAN
1.1 Latar Belakang...............................................................................1
1.2 Rumusan Masalah........................................................................3
1.3 Manfaat Masalah..........................................................................3
1.4 Tujuan Penelitian ..........................................................................4
1.5 Batasan Masalah............................................................................5
1.6 Metode Penelitian ........................................................................5
1.7 Sistematika Penulisan ...................................................................6
11
2.5 XAMPP..........................................................................................25
2.6 PHP.................................................................................................26
2.7 MySQL……………………………………………………………28
2.7.1 Sejarah Universitas Medan Area……………………………30
2.7.2 Struktur Organisasi Universitas Medan Area……………….32
12
4.3.1 Form Proses Clustering……………………………………….71
4.3.2 Laporan Hasil Clustering……………………………………...73
4.4 Kelemahan dan Kelebihan Sistem..................................................74
13
DAFTAR GAMBAR
HALAMAN
PENDAHULUAN
mereka setiap akhir semester. Hal ini akan terjadi secara berulang
data tersebut.
sasaran.
Salah satu langkah yang dapat dilakukan untuk meningkatkan
tahun berikutnya.
Medan Area. Data mining didefinisikan sebagai proses menemukan pola dalam
data. Proses ini harus otomatis atau biasanya secara semi-otomatis. Pola yang
prediksi.
K-Means adalah salah satu algoritma dalam data mining yang bisa
pusat cluster awal. Pada step ini pusat cluster dipilih secara acak dari sekumpulan
populasi data dan menandai komponen tersebut ke salah satu pusat cluster yang
telah didefinisikan tergantung dari jarak minimum antar komponen dengan tiap-
Medan Area?
Adapun manfaat yang bisa didapat dari penulisan penelitian ini adalah:
algoritma K-Means.
mahasiswa baru.
Medan Area.
permasalahan yaitu :
2. Data mahasiswa yang dianalisis adalah data mahasiswa yang masuk pada
jurusan.
4. Aplikasi yang dibangun berbasis website dengan PHP dan database MySQL.
berikut:
1. Teknik Pengumpulan Data (Data Collecting)
penelitian yaitu:
a. Observasi
Medan Area.
b. Wawancara
landasan teoritis peneliti untuk mengkaji masalah yang dibahas. Dalam hal
Waterfall Algorithm maka berikut ini adalah teknik perancangan sistem yang
digunakan:
d. Pengujian
e. Implementasi Sistem
Agar penelitian ini tersusun dengan mudah dan dapat dimengerti dengan
baik maka penyusunan penelitian ini ada 5 (lima) bab, dengan sistematika
BAB I PENDAHULUAN
Bab ini membahas dasar teori tentang, data mining, teknik-teknik data
Bab ini membahas implementasi dari sistem yaitu hasil rancangan aplikasi
penelitian ini sedangkan untuk saran adalah pengembangan dan perbaikan serta
TINJAUAN PUSTAKA
bentuk tunggal datum atau data-item. Data adalah kenyataan yang menggambarkan
Data Mining merupakan suatu proses untuk mendapatkan informasi baru dari
kumpulan data dengan menggunakan algoritma dan teknik yang melibatkan bidang ilmu
statistik, mesin pembelajaran dan sistem manajemen database. Data Mining digunakan
untuk ekstraksi informasi penting yang tersembunyi dari dataset yang besar. Dengan
adanya Data Mining maka akan didapatkan suatu permata berupa pengetahuan di
Banyak istilah yang digunakan untuk menunjukkan proses Data Mining. Untuk
dapat memberikan pemahaman tentang Data Mining, berikut ini adalah beberapa fakta
yang terjadi seperti banyaknya organisasi, baik dari dunia bisnis maupun pemerintah
berurusan dengan sejumlah informasi dan juga pengelolaan basis data informasi
tersebut dan bukan tidak mungkin termasuk didalamnya kebutuhan akan pembangunan
Data Warehouse dalam skala besar. Seringkali data yang tersimpan tidak dapat secara
langsung dianalisa dengan metode statistik standar, hal ini disebabkan karena adanya
beberapa record yang hilang ataupun karena datanya dalam dimensi ukuran kualitatif
bukan kuantitatif.
Data mining merupakan sebuah proses ekstraksi data menjadi informasi atau
pengetahuan yang baru. Data yang diolah sebelumnya merupakan data yang bersifat
implisit dan biasanya dianggap tidak berguna serta data dalam jumlah besar (Robi Yanto,
2017).
1. Predictive Modelling
variable sebagai fungsi dari explanatory variable. Explanatory variable dalam hal ini
variabel target merupakan atribut yang akan diprediksi nilainya. Predictive modelling
dibagi menjadi dua tipe yaitu : Classification digunakan untuk memprediksi nilai dari
target variable yang discrete (diskrit) dan regression digunakan untuk memprediksi
2. Association Analysis
3. Cluster Analysis
Tidak seperti klasifikasi yang menganalisa kelas data obyek yang mengandung label.
Clustering menganalisa objek data tanpa memeriksa kelas label yang diketahui. Label-
label kelas dilibatkan di dalam data training. Karena belum diketahui sebelumnya.
4. Anomaly Detection
adalah menemukan objek yang berbeda dari sebagian besar objek lain. Anomaly
dapat dideteksi dengan menggunakan uji statistik yang menerapkan model distribusi
Data Mining merupakan ilmu baru yang berakar dari berbagai bidang ilmu
seperti kecerdasan buatan (Artificial Intelligence), mesin learning, statistik dan database.
Oleh karena itu dalam menggali informasi, Data Mining menggunakan beberapa teknik,
antara lain :
1.Association Discovery
mencoba untuk menyiapkan nilai-nilai yang muncul pada saat bersamaan dalam
setiap barisnya dan menampilkan hasil keluaran yang disimpulkan dalam sebuah rule.
2.Clustering
Clustering adalah proses pengumpulan data yang serumpun dari sebuah dataset yang
variabel-variabel.
3.Sequential Discovery
yang muncul dalam periode waktu. Metode ini dapat digunakan untuk mencari pola
komoditas yang terjadi berulang kali. Teknik ini terkonsentrasi pada kebiasaan yang
sama yang sering muncul dikemudian hari. Menurut laporan tersebut diungkapkan
a. One Scan : algoritma ini membutuhkan paling sedikit satu kali penelusuran basis
b. Anytime Algorithm : algoritma ini selalu dapat menyediakan jawaban yang terbaik
c. Interruptable and Incremental : algoritma ini dapat ditunda, dapat dihentikan dan
dijalankan lagi, dan hasil sementara yang muncul dapat disimpan untuk
d. Limitted RAM Requirement : algoritma ini mampu bekerja dalam kondisi memori
yang terbatas.
e. Forward-only Cursor : algoritma ini mampu untuk beroperasi pada basis data
4.Classification
sekumpulan kesamaan yang awalnya telah ditentukan oleh seorang analis sebelum
analisa dimulai. Teknik ini memeriksa data yang telah diklasifikasikan dan
komponen kuantitatif. Proses klasifikasi ini dapat dibagi menjadi tiga fase :
a. Learning : algoritma yang mencari sejumlah record dari training set dan
menciptakan sebuah deskripsi tentang model klasifikasi. Model ini dibuat kecil
b. Model yang sudah dibuat harus diuji dengan serangkaian uji coba dalam sebuah
basis data. Sebagai training set, record-record uji coba harus merupakan
kumpulan yang sudah lebih dahulu diklasifikasikan. Record untuk uji coba harus
berbeda dengan training set. Model classification akan selalu bekerja dengan
c. Classification, model iterasi yang digunakan untuk membuat klasifikasi pada sisa
5.Neural Network
identifikasi pola yang digunakan pada trend perkiraan berdasarkan kebiasaan yang
sebagai pergerakan yang ditujukan berdasarkan pada kebiasaan yang lama. Inti dari
pemrosesan didasarkan pada pengolahan data yang meniru dari fungsi sistem saraf
tubuh manusia. Pengetahuan dapat dipelajari dari suatu kumpulan data yang
terpisah dan kompleks. Ada tiga lapisan (layers) pada network, lapisan kiri yang
menjalankan fungsi kerja pemrosesan datanya, dan lapisan kanan yang menampilkan
analisa hasil keluaran. Ketika network dilatih (trained) dengan informasi yang
dimasukkan melalui masukan (input) akan diproses oleh lapisan tengah (neurons)
yang menjadikannya cerdas dalam sejumlah elemen data yang ada dan
1. Pembersihan data (untuk membuang data yang tidak konsisten dan noise).
3. Transformasi data (data diubah menjadi bentuk yang sesuai untuk ditambang)
4. Aplikasi teknik data mining, proses ekstraksi pola dari data yang ada
5. Evaluasi pola yang ditemukan (proses interpretasi pola menjadi pengetahuan yang
banyaknya cluster yang ingin dibentuk. Kemudian menetapkan nilai K secara random,
untuk sementara nilai tersebut menjadi pusat dari cluster atau biasa disebut dengan
Clustering adalah studi formal untuk partisi atau mengelompokkan data dengan
tidak mempunyai tahap pelatihan data, berbeda dengan klasifikasi. Clustering digunakan
untuk mengelompokkan data secara alamiah berdasarkan kemiripan pada objek data
dan sebaliknya meminimalkan kemiripan terhadap cluster lain (Beta Estri, 2018).
sebuah centroid (titik pusat). Tiap titik ditempatkan ke dalam cluster dengan centroid
2. Inisialisasi k pusat cluster bisa dilakukan dengan berbagai cara. Cara yang sering
dilakukan adalah dengan cara acak. Pusat-pusat cluster diberi nilai awal dengan
angka-angka random
berdasarkan jarak kedua objek tersebut. Demikian juga kedekatan suatu data ke
cluster tertentu ditentukan jarak antara data dengan pusat cluster. Dalam tahap ini
perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak antara satu data dengan
satu cluster tertentu akan menentukan suatu data masuk dalam cluster mana. Untuk
menghitung jarak semua data ke setiap titik pusat cluster dapat menggunakan teori
jarak Euclidean.
4. Hitung kembali pusat cluster dengan keanggotaan cluster yang sekarang. Pusat
cluster adalah rata-rata dari semua data/objek dalam cluster tertentu. Jika
dikehendaki bisa juga menggunakan median (nilai tengah) dari cluster tersebut. Jadi
5. Tugaskan lagi setiap objek memakai pusat cluster yang baru. Jika pusat cluster tidak
berubah lagi maka proses clustering selesai. Jika pusat cluster berubah maka kembali
rata (mean) semua nilai data pada setiap fiturnya harus dihitung kembali. Jika M
menyatakan jumlah data dalam sebuah kelompok, i menyatakan fitur ke-i dalam sebuah
kelompok, dan p menyatakan dimensi data, untuk menghitung sentroid fitur ke-i
digunakan formula :
M
1
Ci = ∑x
M j =1 j
……………………………………………. (2.1)
Ada beberapa cara yang dapat digunakan untuk mengukur jarak data ke pusat
formula
p
D(x2,x1) = ||x2 – x1||2 = √∑j=1
¿ x 2 j−x 1 j∨¿ ¿ 2 ………………... (2.2)
D adalah jarak antara data x2 dan x1, dan | . | adalah nilai mutlak. Pengukuran jarak
p
D(x2,x1) = ||x2 – x1||1 = ∑ ¿ x 2 j −x1 j∨¿ ¿ ……………….......… (2.3)
j=1
p
D(x2,x1) = ||x2 – x1||λ = √∑
λ
j=1
¿ x 2 j−x 1 j∨¿ ¿ λ ……………..… (2.4)
λ adalah parameter Minkowsky. Secara umum, λ merupakan parameter penentu
dalam karakteristik jarak. Jika λ=1, ruang jarak pada Minkowsky sama dengan
Manhattan. Jika λ=2, ruang jaraknya akan sama dengan Euclidean; jika λ=∞, ruang
jaraknya akan sama dengan ruang jarak Chebyshev. Namun demikian, cara yang paling
banyak digunakan adalah Euclidean dan Manhattan. Euclidean menjadi pilihan jika kita
ingin memberikan jarak terpendek antara dua titik (jarak lurus), sedangkan Manhattan
memberikan jarak terjauh pada dua data. Manhattan juga sering digunakan karena
lebih baik.
dirancang, maka dapat digunakan Unified Modeling Language (UML). Dalam Unified
Modeling Language (UML) ini akan terlihat dengan jelas aktifitas yang terjadi pada
Unified Modeling Language (UML) adalah keluarga notasi grafis yang didukung
oleh meta-model tunggal, yang membantu pendekskripsian dan desain sistem perangkat
informasi yang akan dibuat. Use case mendeskripsikan sebuah interaksi antara satu atau
lebih aktor dengan sistem informasi yang akan dibuat. Secara kasar, use case digunakan
untuk mengetahui fungsi apa saja yang ada di dalam sebuah sistem dan siapa saja yang
Use case diagram menunjukkan 3 aspek dari sistem yaitu: actor, use case dan
system/sub system boundary. Actor mewakili peran orang, sistem yang lain
mengerjakannya.
Menggambarkan orang,
Menggambarkan bagaimana
4 Association
actor terlibat dalam use case
khusus.
<< Extend >> Perluasan dari use case lain
terpenuhi
<< Include >> Menjelaskan bahwa use case
lain
sistem. Yang ditekankan adalah “apa” yang diperbuat sistem, dan bukan “bagaimana”.
Sebuah use case merepresentasikan sebuah interaksi antara aktor dengan sistem.
Menggambarkan sejumlah external actors dan hubungannya ke use case yang diberikan
oleh sistem. Use case adalah deskripsi fungsi yang disediakan oleh sistem dalam bentuk
teks sebagai dokumentasi dari use case symbol namun dapat juga dilakukan dalam
activity diagrams.
terjadi, dan bagaimana mereka berakhir. Activity diagram juga dapat menggambarkan
proses paralel yang terjadi pada beberapa eksekusi (Hadi Wijaya, 2015).
atau aktivitas dari sebuah sistem atau menu yang ada pada sebuah perangkat lunak.
3. Activity Aktifitas
Menunjukkan adanya
6. Rake
dekomposisi
kelas yang akan dibuat untuk membangun sistem. Kelas memiliki apa yang disebut
atribut dan metode atau operasi. Atribut merupakan variabel-variabel yang dimiliki oleh
suatu kelas, sedangkan operasi atau metode adalah fungsi-fungsi yang dimiliki oleh
suatu kelas.
Kelas sebagai suatu set objek yang memiliki atribut dan perilaku yang sama,
kelas kadang disebut kelas objek. Class memiliki tiga area pokok yaitu (Suendri, 2018):
2. Atribut, adalah kelengkapan yang melekat pada kelas. Nilai dari suatu kelas hanya
3. Operasi, adalah proses yang dapat dilakukan oleh sebuah kelas, baik pada kelas itu
Class dalam UML digambarkan dengan kotak. Nama class menggunakan huruf
besar di awal kalimatnya dan diletakkan diatas kotak. Bila class mempunyai nama yang
terdiri dari 2 suku kata atau lebih maka semua suku kata digabungkan tanpa spasi
Attribute adalah property dari sebuah class, attribute ini melukiskan batas nilai
yang mungkin ada pada obyek dari class. Sebuah class mungkin mempunyai nol atau
lebih attribute. Secara konvensi jika nama attribute terdiri atas satu suku kata maka
ditulis dengan huruf kecil. Akan tetapi jika nama attribute menggandung lebih dari satu
suku kata maka semua suku kata digabungkan dengan suku kata pertama menggunakan
huruf kecil dan awal suku kata berikutnya menggunakan huruf besar.
Nama_Kelas
1 Kelas Kelas pada struktur sistem
+atribut
+operasi()
objek
dengan multiplicity
5 Generalisasi generalisasi-spesialisasi
(umumkhusus)
Relasi antar kelas dengan makna
6 Kebergantungan
kebergantungan antar kelas
2.4 Flowchart
Flowchart adalah representasi secara simbolik dari suatu algoritma atau prosedur
analisis masalah disamping itu flowchart juga berguna sebagai fasilitas untuk
berkomunikasi antara pemrogram yang bekerja dalam tim suatu proyek (Santoso, 2017).
proses.
Simbol input/output
program.
hubungan flowchart ke
6. Connector Off Page
halaman lain
hubungan bagian-bagian
7. Connector On Page
flowchart yang berada dalam
satu halaman.
dalam satu buah paket. Dengan menginstall XAMPP maka tidak perlu lagi melakukan
instalasi dan konfigurasi web server Apache, PHP dan MySQL secara manual. XAMPP
configuration. XAMPP merupakan paket PHP yang berbasis open source yang
program-program lain, karena semua kebutuhan telah tersedia oleh XAMPP. Beberapa
aplikasi yang terdapat pada XAMPP diantaranya : Apache, MySQL, PHP, FileZilla FTP
2. phpMyAdmin merupakan bagian untuk mengelola basis data MySQL yang ada di
3. Control Panel yang berfungsi untuk mengelola layanan (service) XAMPP. Seperti
2.6 PHP
bersifat open source. PHP merupakan script yang terintegrasi dengan HTML dan berada
pada server (server side HTML embedded scripting). PHP adalah sricpt yang digunakan
untuk membuat halaman yang akan ditampilkan, dibuat saat halaman itu diminta oleh
client.
Database menyimpan data yang diolah oleh bahasa pemrograman PHP yang ada
di Web Server kemudian data tersebut ditampilkan dengan Web Server dengan cara
menuliskan alamat atau URL sesuai nama file yang terdapat pada Web Server.
Mekanisme ini menyebabkan informasi yang diterima client selalu yang terbaru
atau up to date. Semua script PHP dieksekusi pada server dimana script tersebut
Mozilla, Internet Explorer, Opera, dan Safari. Web server adalah aplikasi yang berfungsi
untuk melayani permintaan pemanggilan alamat dari pengguna melalui web server,
dimana web server mengirimkan kembali informasi yang diminta tersebut melalui HTTP
(Hyper Text Transfer Protocol) untuk ditampilkan ke layar monitor komputer. Isi dari
website yang kita buat dapat diubah dengan menggunkan program PHP, script-script
PHP tersebut yang berfungsi membuat halaman website menjadi dinamis. Dinamis
artinya pengunjung web dapat memberikan komentar saran masukan pada website
client.
2. PHP memiliki tingkat lifecycle yang cepat sehingga selalu mengikuti perkembangan
teknologi internet.
4. PHP mampu berjalan di beberapa server yang ada, misalnya Apache, Microsoft IIS,
5. PHP mampu berjalan di linux sebagai platform sistem operasi utama bagi
6. PHP, namun juga dapat berjalan di FreeBSD,Unix, Solaris, Windows dan yang lain.
7. PHP juga mendukung akses ke beberapa database yang sudah ada, baik yang bersifat
free ataupun komersial. Database itu antara lain MySQL, PostgreSQL, mSQL, Informix,
2.7 MySQL
MySQL merupakan software database open source yang paling populer di dunia.
MySQL menjadi pilihan utama bagi banyak pengembang software dan aplikasi hal ini
Yahoo, Google, Nokia, Youtube, Wordpress juga menggunakan DBMS MySQL (Indra
Warman, 2018).
1. Portability
adalah
dan lain-lain.
2. Open Source
3. Multiuser
host, dan izin akses user dengan sistem yang mendetail serta
protocol
5. Interface
Universitas Medan Area merupakan salah satu universitas swasta yang cukup
terkenal di Kota Medan. Universitas Medan Area yang telah memiliki lima Fakultas yaitu
Fakultas Teknik, Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, serta Fakultas
Ilmu Sosial dan Ilmu Politik. Berikut mengenai sejarah dan struktus organisasi
satu wujud penjabaran UUD 1945 yaitu turut serta mencerdaskan kehidupan
bangsa serta merupakan wadah penampungan aspirasi dan hasrat masyarakat yang
terus berkembang untuk menikmati pendidikan tinggi. Nama Universitas Medan
oleh pejuang-pejuang 1945 di sekitar kota Medan yang lebih dikenal dengan
Universitas Medan Area yang telah memiliki lima Fakultas yaitu Fakultas
Dalam waktu yang relatif singkat sekitar pertengahan 1984 semua Fakultas telah
Fakultas Psikologi di luar pulau Jawa. Pada tahun akademik pertamanya Fakultas
Universitas Medan Area kembali membuka satu Fakultas baru, yaitu Fakultas
Biologi. Fakultas ini juga merupakan satu-satunya Fakultas Biologi di luar pulau
Jawa.
2023. Sampai saat ini Universitas Medan Area telah memiliki tujuh Fakultas
dengan 16 program studi untuk Strata 1 (S1), 4 program studi untuk Strata 2 (S2)
dan 1 program Doktor (S3). Ketujuh Fakultas tersebut yaitu Fakultas Teknik,
Fakultas Pertanian, Fakultas Ekonomi, Fakultas Hukum, Fakultas Ilmu Sosial dan
Ilmu Politik, Fakultas Psikologi serta Fakultas Sains dan Teknologi telah memiliki
dengan Program Studi Magister Administrasi Publik (MAP) dan saat ini telah
UMA membuka 2 Program Studi lagi yaitu Magister Agribisnis (MA) dengan
akreditasi “B“ dan Magister Ilmu Hukum (MH) juga telah terakreditasi oleh
BAN-PT, dan pada tahun 2008 dibuka pula Program Studi Magister Psikologi
(MPsi).
pembagian tugas, wewenang, dan tanggung jawab kepada individu maupun bagian–
bagian dari suatu organisasi yang meningkatkan tercapainya komunikasi, koordinasi dan
sarana yang tersedia semaksimal mungkin, baik dalam jangka panjang maupun pendek.
Untuk lebih jelasnya, struktur organisasi Universitas Medan Area dapat dilihat
Gambar
BAB III
METODE PENELITIAN
Sama halnya dengan Universitas Medan Area yang telah beroperasi sejak lama,
sehingga banyak sekali data-data yang sebenarnya dapat digali untuk keperluan
informasi dunia pendidikan. Maka permasalahasan data ini dimanfaatkan untuk Untuk
mendukung strategi promosi terhadap Universitas Medan Area, dengan menimbang
atribut-atribut yang telah ada pada database yang ada pada Universitas Medan Area.
random.
3. Alokasikan semua data/objek ke cluster terdekat. Kedekatan dua
ini perlu dihitung jarak tiap data ke tiap pusat cluster. Jarak
berikut:
D(i , j ) = √ ¿ ¿ …………..(3.1)
dimana:
Dalam kasus ini akan diambil dari Database hasil survei yang
ada pada Universitas Medan Area dalam periode tahun 2020. Data
tersebut akan digunakan dalam perhitungan metode K-Means
Clustering untuk menganalisa mengenai mahasiswa. Data survei
tersebut selanjutnya akan dilakukan pra-proses untuk menghasilkan
data khusus yang siap untuk dibentuk menjadi sebuah informasi
baru.
Tabel 3.1 Data Riset Mahasiswa
RITONGA
Uji coba dan analisa adalah untuk melihat bagaimana suatu proses pada
software pemrograman, tujuan dari proses dan output yang diharapkan. Ujicoba
ini bertujuan untuk melakukan perhitungan algoritma untuk mencari nilai terbaik
yang akan menjadi pembagi terhadap atribut yang lainnya, dengan menggunakan
perhitungan (rumus) K-Means Clustering. K-Means Clustering akan dilatihkan
terhadap pola data input dan target sebenarnya.
3.2.1 Transformasi Data
Agar data pada tabel 3.1 di atas dapat diolah dengan menggunakan metode k-
means clustering, maka data yang berjenis data bukan nominal seperti Jenis Kelamin dan
Kota Asal harus diinisialisasikan terlebih dahulu dalam bentuk angka. Untuk melakukan
inisialisasi attribut dilakukan dengan langkah-langkah sebagai berikut:
Selain Jenis Kelamin, Kota Asal juga termasuk ke dalam jenis data non-nominal
sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada Jenis Kelamin, pada
Kota Asal juga diberikan inisialisasi berdasarkan frekuensi pada Kota Asal tersebut. Hasil
dari inisialisasi Kota Asal tersebut dapat dilihat pada tabel 3.3.
Medan
Medan 17 1
Binjai
Berastagi
Kabanjahe
Siantar
Tebing Tinggi
Sibolga
Nias
Kota Pinang
Rantau prapat
Aceh
Langsa
Aceh 8 4
Lhoksemawe
Singkil
Selain Jenis Kelamin dan Kota Asal, Prodi juga termasuk ke dalam jenis data non-
nominal sehingga perlu diinisialisasikan ke dalam bentuk angka. Seperti pada Jenis
Kelamin, pada Kota Asal juga diberikan inisialisasi berdasarkan frekuensi Mahasiswa
pada Kota Asal tersebut. Hasil dari inisialisasi Prodi dapat dilihat pada tabel 3.4.
Tabel 3.4 Inisialisasi Data Prodi
Ilmu Hukum 12 1
Agroteknologi 11 2
Ilmu Komunikasi 10 3
Adm. Publik 9 4
Agribisnis 8 5
DATA
NAMA JKEL KOTAASAL PRODI
KE
04 AINUR RIZA 1 4 1
05 RAVITA RAMBE 1 1 1
06 SRI HARTINI 1 1 1
08 NADHILAH PUTRI 1 2 1
09 TITIN ASTIKA 1 1 1
10 FARAH DILLA 1 4 1
11 YUSNITA SEMBIRING 1 4 1
12 ANNISA 1 2 1
15 KHOIRUL FIKRI 2 2 5
17 TRI WULANDARI 1 2 5
18 IBNU FAHMI 2 3 5
19 SYAFARUDDIN RITONGA 2 2 5
20 UMMY ZULFADLAH 1 3 5
21 HERLINA SIREGAR 1 1 5
22 ISRA HAYATI 1 4 2
24 NOVITA SARI 1 2 2
25 IMELDA BR TARIGAN 1 3 2
26 RIZKI KHAIRANI 1 1 2
28 SIHOL SIHOMBING 2 3 2
30 SULASNI 1 1 2
31 ANNISA RITONGA 1 2 2
32 M.FAHRUL RIDHO 2 3 4
33 M.DEDE ERIANDI 2 2 4
34 YOGI SAPUTRA 2 2 4
39 ARDI WANDIRA 2 3 4
40 NANDA HERIAMBANG 2 3 4
41 LAMEKI GOHAE 2 3 3
42 KURNIAWAN 2 1 3
43 RICARDO SEBAYANG 2 1 3
44 AYU SYAFIRA 1 1 3
45 RAMONTUA SINAGA 2 1 3
46 AHMAD SYUKUR 2 4 3
47 KHAIRIL HUDA 2 4 3
48 TEUKU MUNTASHIR 2 4 3
49 FAKHRY HAMBALI 2 2 3
50 RIKARDO ZALUKHU 2 1 3
2. Tentukan titik pusat awal dari setiap cluster. Dalam penelitian ini
titik pusat awal ditentukan secara random dan didapat titik pusat
Data Jenis
Nama Mahasiswa Kota Asal Prodi
Ke- Kelamin
Data Jenis
Nama Mahasiswa Kota Asal Prodi
Ke- Kelamin
06 SRI HARTINI 1 1 1
25 IMELDA BR TARIGAN 1 3 2
46 M.ARIEF RINALDI 2 4 3
suatu cluster yang memiliki jarak paling dekat dengan titik pusat
dekat dengan data, maka perlu dihitung jarak setiap data dengan
D(1,1 ) = √¿ ¿
= 1,0
D(1,2 ) = √¿ ¿
= 1,41
D(1,3 ) = √¿ ¿
= 3,00
D(2,1 ) = √¿ ¿
= 2,0
= 1,0
D(2,3 ) = √¿ ¿
= 2,45
TASYA NURUL
1 2 1
01 HUDA 1,00 1,41 3,00 1
PUTRIE RIZKY
1 3 1
02 ANANDA 2,00 1,00 2,45 2
PUTRY AMALIA
1 1 1
07 BR LUBIS 0,00 2,24 3,74 1
YUSNITA
1 4 1
11 SEMBIRING 3,00 1,41 2,24 2
ADE AULIA
1 2 5
14 LESTARI 4,12 3,16 3,00 3
ERISA SRIJEKI
1 2 5
16 MANURUNG 4,12 3,16 3,00 3
SYAFARUDDIN
2 2 5
19 RITONGA 4,24 3,32 2,83 3
UMMY
1 3 5
20 ZULFADLAH 4,47 3,00 2,45 3
NOVIKA
1 1 2
23 PURNAMA SARI 1,00 2,00 3,32 1
IMELDA BR
1 3 2
25 TARIGAN 2,24 0,00 1,73 2
ANNISA PUTRI
1 1 2
27 BATUBARA 1,00 2,00 3,32 1
SIHOL
2 3 2
28 SIHOMBING 2,45 1,00 1,41 2
RESKA ELISIANA
1 1 2
29 RITONGA 1,00 2,00 3,32 1
AHMAD ADJI
2 1 4
35 ALAMSYAH 3,16 3,00 3,16 2
SANDI PRIMA
2 2 4
36 NAIBAHO 3,32 2,45 2,24 3
JHON
HORASMAN 2 2 4
37 TURNIP 3,32 2,45 2,24 3
SUSI INDAH
1 1 4
38 ROSLIA 3,00 2,83 3,32 2
NANDA
2 3 4
40 HERIAMBANG 3,74 2,24 1,41 3
RICARDO
2 1 3
43 SEBAYANG 2,24 2,45 3,00 1
RAMONTUA
2 1 3
45 SINAGA 2,24 2,45 3,00 1
TEUKU
2 4 3
48 MUNTASHIR 3,74 1,73 0,00 3
FAKHRY
2 2 3
49 HAMBALI 2,45 1,73 2,00 2
RIKARDO
2 1 3
50 ZALUKHU 2,24 2,45 3,00 1
Setelah proses perhitungan selesai, maka akan terbentuk tabel cluster baru
dengan tiap-tiap anggota cluster seperti tabel di bawah ini:
5 RAVITA RAMBE 1 1 1
6 SRI HARTINI 1 1 1
8 NADHILAH PUTRI 1 2 1
9 TITIN ASTIKA 1 1 1
12 ANNISA 1 2 1
26 RIZKI KHAIRANI 1 1 2
30 SULASNI 1 1 2
42 KURNIAWAN 2 1 3
43 RICARDO SEBAYANG 2 1 3
44 AYU SYAFIRA 1 1 3
45 RAMONTUA SINAGA 2 1 3
50 RIKARDO ZALUKHU 2 1 3
Nilai pada baris Average merupakan hasil perhitungan rata-rata dari tiap-tiap
kolom titik cluster. Nilai average ini nantinya akan menjadi titik pusat untuk cluster 1
yang baru.
4 AINUR RIZA 1 4 1
10 FARAH DILLA 1 4 1
11 YUSNITA SEMBIRING 1 4 1
BAGINDA ROMADHAN
13 SIREGAR 2 3 2
21 HERLINA SIREGAR 1 1 5
22 ISRA HAYATI 1 4 2
24 NOVITA SARI 1 2 2
25 IMELDA BR TARIGAN 1 3 2
28 SIHOL SIHOMBING 2 3 2
31 ANNISA RITONGA 1 2 2
49 FAKHRY HAMBALI 2 2 3
Nilai pada baris Average merupakan hasil perhitungan rata-rata dari tiap-tiap
kolom titik cluster. Nilai average ini nantinya akan menjadi titik pusat untuk cluster 2
yang baru.
DATA
KE- NAMA JKEL KOTAASAL PRODI
17 TRI WULANDARI 1 2 5
18 IBNU FAHMI 2 3 5
19 SYAFARUDDIN RITONGA 2 2 5
20 UMMY ZULFADLAH 1 3 5
32 M.FAHRUL RIDHO 2 3 4
33 M.DEDE ERIANDI 2 2 4
34 YOGI SAPUTRA 2 2 4
39 ARDI WANDIRA 2 3 4
40 NANDA HERIAMBANG 2 3 4
41 LAMEKI GOHAE 2 3 3
46 AHMAD SYUKUR 2 4 3
47 KHAIRIL HUDA 2 4 3
48 TEUKU MUNTASHIR 2 4 3
Nilai pada baris Average merupakan hasil perhitungan rata-rata dari tiap-tiap
kolom titik cluster. Nilai average ini nantinya akan menjadi titik pusat untuk cluster 3
yang baru. Sehingga titik pusat cluster pada iterasi kedua yaitu:
Setelah didapatkan titik pusat yang baru dari setiap cluster, lakukan kembali dari
langkah ketiga hingga titik pusat dari setiap cluster tidak berubah lagi dan tidak ada lagi
data yang berpindah dari satu cluster ke cluster yang lain. Sebagai contoh, dihitung
jarak dari mahasiswa pertama ke pusat cluster pertama:
D(1,1 ) = √¿ ¿
= 1,23
D(1,2 ) = √¿ ¿
= 1,43
D(1,3 ) = √¿ ¿
= 3,33
D(2,1 ) = √¿ ¿
= 2,04
D(2,2 ) = √¿ ¿
= 1,26
D(2,3 ) = √¿ ¿
= 3,28
Berdasarkan hasil ketiga perhitungan di atas dapat disimpulkan bahwa jarak
data Mahasiswa Pertama yang paling dekat adalah dengan cluster 1, sehingga data
Mahasiswa pertama dimasukkan ke dalam cluster 1. Untuk jarak data Mahasiswa Kedua
yang paling dekat adalah dengan cluster 2, sehingga data Mahasiswa Kedua dimasukkan
ke dalam cluster 2.
Tabel 3.13 Hasil Perhitungan Setiap Data Ke Pusat Cluster Pada Iterasi 2
Dalam penelitian ini, iterasi clustering data Mahasiswa terjadi sebanyak 2 kali
iterasi. Pada iterasi ke-2 ini, titik pusat dari setiap cluster sudah tidak berubah dan tidak
ada lagi data yang berpindah dari satu cluster ke cluster yang lain.
RAVITA RAMBE 1 1 1
SRI HARTINI 1 1 1
NADHILAH PUTRI 1 2 1
TITIN ASTIKA 1 1 1
ANNISA 1 2 1
RIZKI KHAIRANI 1 1 2
SULASNI 1 1 2
KURNIAWAN 2 1 3
RICARDO SEBAYANG 2 1 3
AYU SYAFIRA 1 1 3
RAMONTUA SINAGA 2 1 3
RIKARDO ZALUKHU 2 1 3
AINUR RIZA 1 4 1
FARAH DILLA 1 4 1
Nama Jkel Kota Asal Prodi
YUSNITA SEMBIRING 1 4 1
HERLINA SIREGAR 1 4 2
ISRA HAYATI 1 2 2
NOVITA SARI 1 3 2
IMELDA BR TARIGAN 2 3 2
SIHOL SIHOMBING 1 2 2
ANNISA RITONGA 2 2 3
FAKHRY HAMBALI 2 4 3
KHOIRUL FIKRI 2 1 4
TRI WULANDARI 1 2 5
IBNU FAHMI 2 2 5
SYAFARUDDIN RITONGA 1 2 5
UMMY ZULFADLAH 1 2 5
M.FAHRUL RIDHO 2 3 5
M.DEDE ERIANDI 2 2 5
Nama Jkel Kota Asal Prodi
YOGI SAPUTRA 1 3 5
ARDI WANDIRA 2 2 4
NANDA HERIAMBANG 2 2 4
LAMEKI GOHAE 2 2 4
AHMAD SYUKUR 2 3 4
KHAIRIL HUDA 2 3 4
urutan prosedur dari suatu program. Berikut rancangan flowchart untuk untuk
Means Clustering.
Mulai
Inisialisasi Data
Input Data
Survei Mahasiswa
Proses Hitung
K-Means Clustering
Hasil Pengelompokkan
Selesai
Gambar 3.1 Flowchart Metode K-Means Clustering
Unfied Modeling Language adalah keluarga notasi grafis yang didukung oleh meta-
model tunggal, yang membantu pendeskripsian dan desain sistem perangkat lunak.
Prosedur sistem yang akan digunakan dengan menggunakan UML. Pemodelan UML
menggunakan use case diagram yang selanjutnya setiap proses yang akan terjadi akan
diperjelas dengan diagram activity.
Use case diagram yang digunakan untuk sistem aplikasi Mahasiswa dengan
Metode K-Means Clustering merupakan gambaran bagaimana pengguna berinteraksi
dengan sistem. Dengan adanya use case ini dapat diketahui proses yang terjadi didalam
sistem. Adapun use case diagram metode K-Means Clustering dapat dillihat di bawah ini.
Login
Untuk memahami lebih jelas, apa saja yang akan dilakukan oleh user dalam use
case diagram diatas, maka akan dijelaskan pada skenario use case sebagai berikut :
1. Skenario Login
Kondisi Akhir : Perangkat lunak akan memproses data user dan password
tersebut.
Proses : Pengguna terlebih dahulu menentukan data yang akan dinilai lalu
sistem akan menghitung data tersebut dengan menggunakan
metode K-Means Clustering.
Kondisi Akhir : Perangkat lunak akan menghitung dan Menunjukkan hasil dari
perhitungan K-Means Clustering.
Activity diagram untuk use case ini merupakan alur kerja admin untuk masuk
kedalam sistem dari sistem aplikasi. Diagram ini merupakan alur proses dalam
menjalankan sistem data mining Untuk mendukung strategi promosi Universitas Medan
Area menggunakan metode K-Means Clustering.
Admin Sistem
Start
Login
Input Username
dan Password
Tidak Valid
Ya
Menu Utama
Input Data
Mahasiswa
Proses Data
Tentukan Titik
cluster Titik cluster
Proses Perhitungan
K-Means Clustering
Tampilkan Hasil
Pengelompokkan
Finish
Activity diagram diatas terdiri dari dua bagian yaitu Admin sebagai pengguna dan
Sistem. Activity diagram ini dimulai dari Admin menginput username dan password.
Kemudian Sistem memproses login dari Admin. Jika valid (username dan password
benar) maka sistem akan menampilkan menu utama. Jika salah maka Admin harus
mengulangi input username dan password.
Kemudian setelah tampil menu utama, Admin melakukan Input Data Mahasiswa,
lalu menentukan titik pusat cluster (3 titik pusat cluster). Selanjutnya sistem memproses
data titik cluster tersebut. Kemudian sistem melakukan proses perhitungan dengan
metode K-Means Clustering. Sehingga menghasilkan output berupa hasil
pengelompokkan data mahasiswa. Lalu proses selesai.
Mahasiswa
1
+ NIM* Varchar
Proses Clustering
- Nama Varchar Hasil 1..** m
- Jkel Varchar + NIM Varchar
- Kotaasal Varchar + NIM * Varchar - C1 Number
- Prodi Varchar - Nama
m Varchar - C2 Number
- C1 Number 1
- C3 Number
1..**
- C2 Number - Cluster Number
- C3 Number
+ TambahData ( ) - ClusterTerpilih Varchar + TambahData ( )
+ EditData ( ) + EditData ( )
+ HapusData ( ) + HapusData ( )
+ProsesPenilaian ( )
+CetakLaporan ( )
Login
+ Username * Text
+ Password Text
+ Login ( )
+ Exit ( )
1. Tabel Login
input agar dapat masuk sebagai admin. Berikut tampilan tabel login di bawah ini:
1 Username Varchar 10
2 Password Varchar 10
4. Tabel Hasil
Tabel hasil digunakan untuk menampung record data hasil clustering keseluruhan
yang kemudian akan disimpan sebagai Database. Berikut tampilan rancangan struktur
tabel yang berisi atribut-atribut data di bawah ini:
dan password administrator yang kemudian akan dicek username dan password
tersebut telah valid jika ya, maka pengguna dapat menggunakan aplikasi ini,
sedangkan jika tidak, maka aplikasi ini akan menolak username dan password
LOGIN SISTEM
Masukkan Username dan Password
LOGIN RESET
Menu File yang terdiri dari data Mahasiswa, data penilaian, data kriteria
sedangkan sub menu laporan terdiri dari laporan hasil. Tampilan rancangan Menu
Logo Logout
Data Mahasiswa
Laporan
Logout
(UMA)
Diketahui Oleh :
BAB IV
dan perangkat keras, minimal harus dipenuhi sehingga aplikasi ini dapat berjalan dengan
baik. Berikut adalah daftar spesifikasi minimal perangkat lunak dan perangkat keras.
b. XAMPP
c. Sublime Text
dan hasil dari aplikasi data mining yang dijelaskan secara satu persatu. Dimulai dari form
login kemudian diteruskan ke menu utama, menu data dan terakhir menu laporan.
4.2.1 Login
Pada awal aplikasi dijalankan akan menampilkan form login, dimana user
diwajibkan untuk mengisi username dan password yang sudah terdaftar sebelumnya.
Dan akan menampilkan pesan atau peringatan (warning) jika nama user atau password
melakukan login terlebih dahulu. Menu utama terdiri dari beberapa menu yaitu Data
Mahasiswa, Proses, Laporan dan Keluar. Setiap menu memiliki sub menunya masing-
masing, kecuali menu Keluar yang tidak memiliki sub menu. Karena Keluar hanya
berfungsi untuk mengakhiri program. Gambar halaman utama aplikasi data mining ini
Tampilan ini berisikan tentang data Mahasiswa yang berfungsi sebagai media
dalam memasukan data mahasiswa baru dan juga mengedit serta menghapus data
Mahasiswa. Tampilan form dirancang agar mudah untuk digunakan oleh user. Adapun
Adapun fungsi-fungsi dari tombol yang terdapat dalam form mahasiswa yaitu :
Tampilan Form Titik Cluster ini berfungsi untuk menampilkan hasil inisialisasi dan
memilih 3 data sebagai titik pusat Cluster. Adapun cara penggunaannya dengan terlebih
dahulu memilih (cheklist) pada list yang tersedia pada halaman titik cluster. Tampilan
perhitungan jarak data ke titik Cluster menggunakan metode k-means clustering dan
listview. Klik tombol Proses untuk memulai perhitungan dengan metode K-Means
Gambar
Form Laporan ini berfungsi untuk melihat hasil perhitungan Cluster dengan
metode K-Means Clustering beserta informasi lain mengenai Proses Titik Cluster
tersebut. Adapun hasil Cluster akan tampil pada kolom Cluster. Tampilan preview dapat
Laporan hasil clustering ini merupakan hasil perhitungan dari setiap data
mahasiswa ke jarak tiap pusat cluster pada iterasi 2. Seperti yang telah dijelaskan pada
Dari hasil yang diatas, dapat dilihat bahwa dengan adanya aplikasi data mining
laporan pengelompokkan data mahasiswa pada tiap-tiap cluster yang dapat digunakan
program ini sangat ringan dan tidak memerlukan memori terlalu besar.
b. Dengan program ini mungkin dapat memotivasi kepada instansi lain untuk
teknologi.
Keterbatasan sumber data, terbatas hanya dalam ruang lingkup aplikasi data mining
5.1 Kesimpulan
dan akurat.
5.2 Saran
Untuk meningkatkan kemampuan dan fungsi dari program data mining ini
ada beberapa saran yang dapat diberikan untuk pengembangan yang bisa
1. Program yang dibuat ini masih dapat dikembangkan lebih lanjut supaya
menjadi sistem yang lebih lengkap. Sehingga tidak hanya digunakan untuk
2. Program aplikasi data mining ini belum bisa di backup data secara otomatis.
Agustina, Silvia, dkk, “Clustering Kualitas Beras Berdasarkan Ciri Fisik Menggunakan
Metode K-Means ,” J. Informatika dan Teknologi, vol. 2, no. 2, 2016.