Jelajahi eBook
Kategori
Jelajahi Buku audio
Kategori
Jelajahi Majalah
Kategori
Jelajahi Dokumen
Kategori
fahmir966@gmail.com
lola.yoriva30@gmail.com
3
abdurrahimradhin@gmail.com
2
I.
PENDAHULUAN
Dengan perkembangan teknologi pengumpulan data saat
ini, jumlah data yang dikumpulkan per unit waktu semakin
besar kecepatan yang berlipat. Dalam dunia bisnis maupun
teknologi, semakin banyak transaksi-transaksi yang
dilakukan secara otomatis baik yang online melalui internet
maupun lewat jaringan elektronik. Hal ini menambah volume
data yang tersimpan dan harus diolah semakin membesar.
Peningkatan volume data yang besar memerlukan metode
yang bisa bekerja cepat dan terotomatisasi untuk mengolah
dan mengambil kesimpulan data tersebut. Pada kenyataan
bahwa jumlah data yang tersimpan dalam basis data semakin
besar yang didasari munculnya data mining [1].
II.
TINJAUAN
PUSTAKA
1. Data Mining
Dalam Ong ( 2013 ), menurut Santoso ( 2007 ), data
mining adalah suatu metode pengolahan data untuk untuk
menemukan pola yang tersembunyi dari data tersebut. Hasil
dari pengolahan data dengan metode data mining ini dapat
digunakan untuk mengambil keputusan di masa depan. Data
mining ini juga dikenal dengan istilah pattern recognition [6].
Dalam Ong ( 2013 ), menurut Santosa ( 2013 ), Data
mining merupakan metode pengolahan data berskala besar
oleh karena itu data mining ini memiliki peranan penting
dalam bidang industry, keuangan, cuaca, ilmu dan teknologi.
Secara umum kajian data mining membahas metode-metode
seperti, clustering, klasifikasi, regresi, seleksi variable, dan
market basket analisis.[6]
2. Clustering
Dalam Asroni dan Adrian ( 2015 ), menurut Garcia
( 2002), clustering adalah mengelompokkan item data ke
dalam sejumlah kecil grup sedemikian sehingga masingmasing grup mempunyai sesuatu persamaan yang esensial.
Dalm Ong ( 2013 ), menurut Santosa ( 2007 ), pada
dasarnya clustering merupakan suatu metode untuk mencari
dan mengelompokkan data yang memiliki kemiripan
karakteristik (similarity) antara satu data dengan data yang
lain. Clustering merupakan salah satu metode data mining
yang bersifat tanpa arahan (unsupervised), maksudnya
metode ini diterapkan tanpa adanya latihan ( training ) dan
tanpa guru (teacher) serta tidak memerlukan target output.[6]
Dalam data mining ada dua jenis metode clustering
yang digunakan dalam pengelompokkan data, yaitu
hierarchical clustering dan non-hierarchical clustering.
3. Analytical Hierarchy Process (AHP)
Dalam Hartanti, dkk (2015), menurut Suprihatin
(2011), metode Analytical Hierarchy Process (AHP)
dikembangkan awal tahun 1970-an oleh Thomas L. Saaty,
seorang ahli matematika dari Universitas Pittsburg. Analisis
ini ditujukan untuk membuat suatu model permasalahan yang
tidak mempunyai struktur, biasanya ditetapkan untuk
masalah yang terukur (kuantitatif), masalah yang
memerlukan pendapat (judgement) maupun pada situasi yang
kompleks atau tidak terkerangka, pada situasi dimana data
statistic sangat minim atau tidak ada sama sekali dan hanya
bersifat kualitatif yang didasari oleh persepsi, pengalaman
atau intuisi.[5]
Tahapan dalam metode Analytic Hierarchy Process
(AHP) adalah sebagai berikut:
1. Mendefinisikan masalah dan menentukan
tujuan.
2. Menyusun masalah ke dalam bentuk hierarki
sehingga permasalahan yang kompleks dapat
dipahami dari sisi yang detail dan terukur.
3. Penyusunan prioritas untuk tiap elemen masalah
pada hierarki. Proses ini menghasilkan bobot
5.
METODOLOGI
15+
15-44
45+
Hasil
dari
pengolahan
data
ini
berupa
pengelompokan masyarakat buta huruf per provinsi di
Indonesia yang terdiri atas 3 kelompok dan dapat
menentukan provinsi mana yang diprioritaskan untuk
ditingkatkan pendidikannya guna mengurangi angka
persentase buta huruf tersebut.
IV.2.
III.
Nama Kriteria
K-Means Clustering
Gambar 1. Metodologi
IV.3.
Dari data hasil cluster menggunakan metode KMeans diatas, akan diproses kembali untuk menentukan
prioritas data dengan metode Analytical Hierarchy Process
( AHP ), dengan uraian langkah-langkah sebagai berikut:
Pertama, membentuk matrik Pairwise Comparison
dan kriteria. Terlebih dahulu melakukan penilaian
perbandingan dari kriteria.(Perbandingan ditentukan dengan
mengamati kebijakan yang dianut oleh penilai) adalah :
Semakin besar nilai F dan (sig < 0,05), maka
semakin besar perbedaan variabel pada cluster yang
terbentuk. Maka berdasarkan tabel yang didapat, yaitu
bahwa untuk instrumen Kriteria2 adalah variabel yang
paling menunjukkan adanya perbedaan diantara data pada
ketiga cluster yang terbentuk.
1.
2.
Cluster
1
Cluster
2
Cluster
3
Cluster
1
1
Cluster
2
7
Cluster
3
5
0.14285
0.2
Cluster
Cluster
1
1
Cluster
2
7
Cluster
3
5
1
Cluster
2
Cluster
3
Jumlah
0.14285
0.2
1.34
Clust
er 2
Clust
er 1
Cluster
1
Cluster
2
Cluster
3
Cluster
1
0.74468
5
0.10637
8
0.14893
7
Cluster
2
0.77777
8
0.11111
1
0.11111
1
Cluster
3
0.71428
6
0.14285
7
0.14285
7
Clust
er 3
Cluste
r3
0.7446
85
Cluste
r2
0.7777
78
Cluste
r1
0.7142
86
Ratarata
0.7455
83
[2]
[3]
[4]
0.1428
57
0.1428
57
0.1201
15
0.1343
02
0.1111
11
0.1111
11
REFERENCES
[1]
0.1063
78
0.1489
37
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
Clust
er1
Clust
er2
Clust
er3
7 5
0.142
85
0.2
1 1
1 1
0.7455
83
0.1201
15
0.1343
02
Hasil
Ranki
ng
2.2579
0.3609
24
0.4035
34