Anda di halaman 1dari 5

PENGELOMPOKKAN PROVINSI BERDASARKAN

PERSENTASE MASYARAKAT BUTA HURUF DENGAN


METODE K-MEANS DAN ANALYTICAL HIERARCHY
PROCESS
1

M.Reza Fahm , Lola Yoriva , Abdurrahman

Program Studi Sistem Informasi Fakultas


Sains dan Teknologi UIN SUSKA Riau
Jl. HR. Soebrantas KM. 18
Panam Pekanbaru-Riau
1

fahmir966@gmail.com
lola.yoriva30@gmail.com
3
abdurrahimradhin@gmail.com
2

Abstract Dalam perkembangan saat ini Masyarakat buta


huruf masih banyak di temukan di sebabkan adanya
pertambahan penduduk buta huruf baru yang belum di cacah,
sehingga sulit untuk meningkatkan pendidikan, hal ini berarti
pemerintah harus mengatasi buta huruf yang ada di provinsiprovinsi indonesia karna Secara global, Indonesia termasuk
dalam daftar 34 negara yang angka buta hurufnya tinggi. Oleh
karena itu diperlukan Pengelompokan dalam proses clustering
data buta huruf per provinsi. Penelitian ini bertujuan untuk
menganalisis kinerja antara algoritma K-means dan Analytical
Hierarchy Process (AHP) yang diimplementasikan pada data
Buta huruf Per Provinsi Di Indonesia. Beberapa tahapan yang
harus dilakukan sebelum dilakukan clustering, terebih dahulu
dilakukan prapengolahan data cleaning dan data transformation
untuk selanjutnya dilakukan clustering menggunakan kedua
algoritma tersebut. Dari data hasil cluster menggunakan metode
K-Means, akan diproses kembali untuk menentukan prioritas
data dengan metode Analytical Hierarchy Process ( AHP ) dari
hasil metode AHP maka di dapat hasil Cluster 1 memiliki nilai

paling tinggi sehingga layak untuk menjadi prioritas


untuk ditingkatkan pendidkannya, agar masyarakat
angka buta huruf pada wilayah yg termasuk kedalam
Cluster 1 berkurang.,
Keywords Buta huruf, AHP, K-means, pendidikan, Claster

I.
PENDAHULUAN
Dengan perkembangan teknologi pengumpulan data saat
ini, jumlah data yang dikumpulkan per unit waktu semakin
besar kecepatan yang berlipat. Dalam dunia bisnis maupun
teknologi, semakin banyak transaksi-transaksi yang
dilakukan secara otomatis baik yang online melalui internet
maupun lewat jaringan elektronik. Hal ini menambah volume
data yang tersimpan dan harus diolah semakin membesar.
Peningkatan volume data yang besar memerlukan metode
yang bisa bekerja cepat dan terotomatisasi untuk mengolah
dan mengambil kesimpulan data tersebut. Pada kenyataan
bahwa jumlah data yang tersimpan dalam basis data semakin
besar yang didasari munculnya data mining [1].

Data Mining adalah suatu istilah yang digunakan untuk


menguaikan penemuan pengetahuan di dalam database. Data
Mining adalah proses yang menggunakan teknik statistic,
matematika, kecerdasan buatan, dan mechine learning untuk
mengekstraksi dan megindentifikasi informasi yang
bermanfaat dan pengetahuan yang terkait dari berbagai
database [1].Adanya data data dalam skala besar
memungkinkan metode data mining dengan teknikclustering
yang dapat mengelompokkan data ke dalam beberapa
kelompok yang diinginkan. Teknik clustering digunakan
yaitu K-Means..
K-Means adalah suatu teknik pengelompokkan data yang
mana keberadaan tiap-tiap titik data dalam suatu cluster
ditentukan oleh derajat keanggotaan. Teknik ini pertama kali
diperkenalkan oleh Jim Bezdek pada tahun 1981[7]. Data
yang akan digunakan dalam teknik K-Means ini ialah sampel
data yang hanya diambil kolom judul buku. Yang kemudian
akan dikelompokkan berdasarkan kemiripan derajat
keanggotaan data tersebut di dalam set data.
Buta huruf merupakan jendela untuk melihat dunia.
Artinya, jika orang bisa membaca, dia melihat dunia baru dan
segala perkembangannya, termasuk ilmu pengetahuan dan
teknologi (iptek) serta teknologi informasi (TI). Itu berarti
bahwa pemerintah belum bisa mencapai tujuan tersebut[7].
Secara global, Indonesia termasuk dalam daftar 34 negara
yang angka buta hurufnya tinggi. Buta huruf yang ada di
Indonesia sebenarnya telah ada sejak zaman penjajahan. Dari
pihak Negara penjajah memang telah disengaja agar rakyat
Indonesia menjadi lebih terbelakang dan bodoh-bodoh agar
nantinya tidak merugikan mereka yang menjajah. Buta huruf
disinyalir menjadi salah satu penghambat suksesnya wajib
belajar 9 tahun. Kalau orangtua buta huruf, maka ada
kecenderungan anaknya tak sekolah, jikapun sekolah,
berpotensi untuk putus sekolah. Tinggi dan masih
bertambahnya jumlah buta huruf karena masih ditemukan
banyak siswa usia SD yang tidak sekolah atau putus
sekolah[7].

II.

TINJAUAN
PUSTAKA

1. Data Mining
Dalam Ong ( 2013 ), menurut Santoso ( 2007 ), data
mining adalah suatu metode pengolahan data untuk untuk
menemukan pola yang tersembunyi dari data tersebut. Hasil
dari pengolahan data dengan metode data mining ini dapat
digunakan untuk mengambil keputusan di masa depan. Data
mining ini juga dikenal dengan istilah pattern recognition [6].
Dalam Ong ( 2013 ), menurut Santosa ( 2013 ), Data
mining merupakan metode pengolahan data berskala besar
oleh karena itu data mining ini memiliki peranan penting
dalam bidang industry, keuangan, cuaca, ilmu dan teknologi.
Secara umum kajian data mining membahas metode-metode
seperti, clustering, klasifikasi, regresi, seleksi variable, dan
market basket analisis.[6]
2. Clustering
Dalam Asroni dan Adrian ( 2015 ), menurut Garcia
( 2002), clustering adalah mengelompokkan item data ke
dalam sejumlah kecil grup sedemikian sehingga masingmasing grup mempunyai sesuatu persamaan yang esensial.
Dalm Ong ( 2013 ), menurut Santosa ( 2007 ), pada
dasarnya clustering merupakan suatu metode untuk mencari
dan mengelompokkan data yang memiliki kemiripan
karakteristik (similarity) antara satu data dengan data yang
lain. Clustering merupakan salah satu metode data mining
yang bersifat tanpa arahan (unsupervised), maksudnya
metode ini diterapkan tanpa adanya latihan ( training ) dan
tanpa guru (teacher) serta tidak memerlukan target output.[6]
Dalam data mining ada dua jenis metode clustering
yang digunakan dalam pengelompokkan data, yaitu
hierarchical clustering dan non-hierarchical clustering.
3. Analytical Hierarchy Process (AHP)
Dalam Hartanti, dkk (2015), menurut Suprihatin
(2011), metode Analytical Hierarchy Process (AHP)
dikembangkan awal tahun 1970-an oleh Thomas L. Saaty,
seorang ahli matematika dari Universitas Pittsburg. Analisis
ini ditujukan untuk membuat suatu model permasalahan yang
tidak mempunyai struktur, biasanya ditetapkan untuk
masalah yang terukur (kuantitatif), masalah yang
memerlukan pendapat (judgement) maupun pada situasi yang
kompleks atau tidak terkerangka, pada situasi dimana data
statistic sangat minim atau tidak ada sama sekali dan hanya
bersifat kualitatif yang didasari oleh persepsi, pengalaman
atau intuisi.[5]
Tahapan dalam metode Analytic Hierarchy Process
(AHP) adalah sebagai berikut:
1. Mendefinisikan masalah dan menentukan
tujuan.
2. Menyusun masalah ke dalam bentuk hierarki
sehingga permasalahan yang kompleks dapat
dipahami dari sisi yang detail dan terukur.
3. Penyusunan prioritas untuk tiap elemen masalah
pada hierarki. Proses ini menghasilkan bobot

elemen terhadap pencapaian tujuan sehingga


elemen dengan bobot tertinggi memiliki
prioritas penanganan. Prioritas dihasilkan dari
suatu matriks perbandingan berpasangan antara
seluruh elemen pada tingkat hierarki yang sama
(Hartanti, dkk 2015) [5].
4. K-means Clustering
Algoritma
K-Means
merupakan
algoritma
klasterisasi yang mengelompokkan data berdasarkan titik
pusat klaster (centroid) terdekat dengan data. Tujuan dari
K-Means adalah pengelompokkan data dengan
memaksimalkan kemiripan data dalam satu klaster dan
meminimalkan kemiripan data antar klaster. Ukuran
kemiripan yang digunakan dalam klaster adalah fungsi
jarak. Sehingga pemaksimalan kemiripan data didapatkan
berdasarkan jarak terpendek antara data terhadap titik
centroid.[3]
Data clustering merupakan salah satu metode Data
Mining yang bersifat tanpa arahan (unsupervised). Ada dua
jenis data clustering yang sering dipergunakan dalam
proses pengelompokkan data yaitu hierarchical (hirarki)
data clustering dan non-hierarchical (non hirarki) data
clustering. K-means merupakan salah satu metode data
clustering non hirarki yang berusaha mempartisi data yang
ada kedalam bentuk satu atau lebih cluster / kelompok.
Metode
ini
mempartisi
data
ke
dalam
cluster/kelompok
sehingga
data
yang
memiliki
karakteristik yang sama dikelompokkan ke dalam satu
cluster yang sama dan data yang mempunyai karakteristik
yang berbeda dikelompokkan ke dalam kelompok yang
lain. Adapun tjuan dari clustering ini adalah untuk
meminimalisasikan objective function yang diset dalam
proses clustering, yang pada umumnya berusaha
meminimalisasikan variasi di dalam satu cluster dan
memaksimalkan variasi antar cluster (Mustakim 2012).[4]
Beberapa teknik klastering yang paling sederhana
dan umum adalah klastering K-means. Secara detail teknik
ini
menggunakan
ukuran
ketidakmiripan
untuk
mengelompokkan
obyek.
Ketidakmiripan
dapat
diterjemahkan dalam konsep jarak. Dua obyek dikatakan
mirip jika jarak dua objek tersebut dekat. Semakin tinggi
nilai jarak, semakin tinggi nilai ketidakmiripannya.
Algoritma klastering K-means dapat diringkas sebagai
berikut[2]:
1. Pilih jumlah klaster
2. Inisialisasi k pusat klaster (diberi nilai-nilai
random)
3. Tempatkan setiap data/obyek ke klaster terdekat.
Kedekatan dua obyek ditentukan berdasarkan
jarak kedua obyek tersebut. Jarak paling dekat
antara satu data dengan satu klaster tertentu akan
menentukan suatu data masuk dalam klaster
mana.
4. Hitung kembali pusat klaster dengan anggota
klaster yang sekarang. Pusat klaster adalah ratarata semua data/obyek dalam klaster.

5.

Tugaskan lagi setiap obyek memakai pusat


klaster yang baru. Jika pusat klaster sudah tidak
berubah lagi, maka proses pengklasteran selesai.
6. Kembali ke langkah 3 sampai pusat klaster tidak
berubah lagi.
Berikut rumus pengukuran jarak [2]:
(1)
Keterangan:
d=titik dokumen; x=data record; y=data centroid
5. Validitas Algoritma
6. Studi Kasus
7. Riset Terdahulu

Tabel 1. Data Kriteria


N
Kriteria
o
1
c1
2
c2
3
c3

METODOLOGI

Metodologi merupakan langkah-langkah yang ditempuh


dalam pelaksanaan penelitian dimulai dari studi pendahuluan
hingga akhir dari penelitian.

15+
15-44
45+

Hasil
dari
pengolahan
data
ini
berupa
pengelompokan masyarakat buta huruf per provinsi di
Indonesia yang terdiri atas 3 kelompok dan dapat
menentukan provinsi mana yang diprioritaskan untuk
ditingkatkan pendidikannya guna mengurangi angka
persentase buta huruf tersebut.
IV.2.

III.

Nama Kriteria

K-Means Clustering

Data Mining yang digunakan untuk menyelesaikan


kasus pengelompokkan masyarakat buta huruf perprovinsi di
indonesia pada penelitian ini adalah teknik K-Means
menggunakan tools SPSS, dengan uraian langkah-langkah
sebagai berikut :
Pertama masukkan data yang akan digunakan
kedalam tools SPSS. Dan kemudian pilih menu Analyze >
Classify > K-means cluster. Dan kemudian akan didapat
hasil sebagai berikut :

Tabel Initial Cluster Centers di atas merupakan


tampilan awal proses clustering sebelum dilakukan proses
iterasi.

Gambar 1. Metodologi

IV. HASIL DAN ANALISIS


IV.1.
Data
Pada penelitian ini data yang digunakan yaitu data
kriteria dan data persentase masyarakat buta huruf perprovinsi
di indonesia. persentase masyarakat buta huruf perprovinsi di
indonesia data akurat dari situs resmi data indonesia
http://data.go.id, sedangkan data kriteria adalah data yang
digunakan untuk pengelompokkan masyarakat buta huruf
perprovinsi di indonesia dapat dilihat pada tabel 1. berikut:

Dari data diatas dapat diketahui berapa kali


dilakukan proses iterasi pada objek sebanyak 34 sampel.
Dari tabel Iteration History di atas, dapat diketahui
bahwasanya proses iterasi dilakukan sebanyak 2 kali.
Proses ini dilakukan untuk mendapatkan cluster yang tepat.
Dapat diketahui bahwa jarak minimum antar pusat cluster
yang terjadi dari hasil iterasi adalah 18,341.

Berdasarkan tabel Output Final Cluster Centers,


dapat didefinisikan nilai pada Kriteria3 memiliki nilai yang
tinggi pada semua cluster.

IV.3.

Analytical Hierarchy Process ( AHP )

Dari data hasil cluster menggunakan metode KMeans diatas, akan diproses kembali untuk menentukan
prioritas data dengan metode Analytical Hierarchy Process
( AHP ), dengan uraian langkah-langkah sebagai berikut:
Pertama, membentuk matrik Pairwise Comparison
dan kriteria. Terlebih dahulu melakukan penilaian
perbandingan dari kriteria.(Perbandingan ditentukan dengan
mengamati kebijakan yang dianut oleh penilai) adalah :
Semakin besar nilai F dan (sig < 0,05), maka
semakin besar perbedaan variabel pada cluster yang
terbentuk. Maka berdasarkan tabel yang didapat, yaitu
bahwa untuk instrumen Kriteria2 adalah variabel yang
paling menunjukkan adanya perbedaan diantara data pada
ketiga cluster yang terbentuk.

Data tabel diatas menampilkan jumlah anggota


masing-masing cluster yang terbentuk.
Dan berikut akan ditampilkan data hasil akhir cluster
yang telah dilakukan:

1.
2.

Cluster 1 lebih penting dari Cluster 3, dan 3 kali


lebih penting dari Cluster 2
Cluster 3 lebih penting dari Cluster 2

Sehingga matrik Pairwise Comparison untuk kriteria


adalah sebagai berikut :

Cluster
1
Cluster
2
Cluster
3

Cluster
1
1

Cluster
2
7

Cluster
3
5

0.14285

0.2

Kemudian dilakukan penjumlahan pada matrik


tersebut :

Cluster

Cluster
1
1

Cluster
2
7

Cluster
3
5

1
Cluster
2
Cluster
3
Jumlah

0.14285

0.2

1.34

Clust
er 2
Clust
er 1

Selanjutnya dilakukan normalisasi data dari matrik


tersebut, dengan membagi elemen-elemen setiap kolom
dengan jumlah datanya, akan didapat hasil sebagai berikut :

Cluster
1
Cluster
2
Cluster
3

Cluster
1
0.74468
5
0.10637
8
0.14893
7

Cluster
2
0.77777
8
0.11111
1
0.11111
1

Cluster
3
0.71428
6
0.14285
7
0.14285
7

Kemudian dicari rata-rata ( vector bobot ) dari setiap


cluster, dengan hasil sebagai berikut :

Clust
er 3

Cluste
r3
0.7446
85

Cluste
r2
0.7777
78

Cluste
r1
0.7142
86

Ratarata
0.7455
83

[2]

[3]
[4]

0.1428
57
0.1428
57

0.1201
15
0.1343
02

Langkah terakhir menentukan ranking dari hasil perkalian


vector bobot dengan matrik berpasangan yang diawal tadi,
dan didapat hasilnya sebagai berikut:
Dari hasil di atas, Cluster 1 memiliki nilai paling tinggi
sehingga layak untuk menjadi prioritas untuk ditingkatkan
pendidkannya, agar masyarakat angka buta huruf pada
wilayah yg termasuk kedalam Cluster 1 berkurang.
V. KESIMPULAN
[5]

Prasetyo,Eko. 2012. Data Mining Konsep dan Aplikasi Menggunakan


Matlab. Yogyakarta. Graha Ilmu
Santoso, B. Data Mining: Teknik Pemanfaatan Data untuk Keperluan
Bisnis. Yogyakarta: Graha Ilmu. 2007.
Asroni, Ronald Adrian. Penerapan Metode K-Means untuk Clustering
Mahasiswa Berdasarkan Nilai Akademik dengan Weka Interface.
Semesta Teknika.2015: 76-82.
Mustakim. Pemetaan Digital dan Pengelompokan Lahan Hijau di
Wilayah Provinsi Riau Berdasarkan Knowladge Discovery in
Database (KDD) dengan Teknik K-Means Mining. Seminar Nasional
Teknologi Informasi, Komunikasi dan Industri (SNTIKI) 4.
Pekanbaru. 2012.

0.1111
11
0.1111
11

Selanjutnya menghitung rasio konsistensi untuk


mengetahui apakah penilaian perbandingan kriteria bersifat
konsisten, dengan menggunakan data sebagai berikut :
- Nilai
Eigen
Maksimum,
diperoleh
dari
menjumlahkan dari hasil perkalian kolom jumlah
matrik Pairwise Comparison dengan Rata-rata, dan
didapat hasilnya = 3.022357
- Kemudian dicari Indeks Konsistensi (CI), dan
didapat hasilnya = 0.011179
- Selanjutnya dicari Rasio Konsentrasi (RI), dan
didapat hasilnya = 0.019274. Karena hasilnya < 0,1
maka, preferensi pembobotannya bersifat Konsisten.

REFERENCES
[1]

0.1063
78
0.1489
37

[6]

NiNik Tri Hartanti, Kusrini, Armadyah Amborowati. Sistem


PendukungKeputusan Untuk Menentukan Program Keahlian di SMK
Syubbanul Wathon Magelang. Konferensi Nasional Sistem dan
Informatika. Bali. 2015; 419-424.
Johan Oscar Ong. Implementasi Algoritma K-Means Clustering
Untuk Menentukan Strategi Marketing President University.
Bekasi. 2013; 12(1): 10-20.

[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]

Clust
er1
Clust
er2
Clust
er3

7 5

0.142
85
0.2

1 1
1 1

0.7455
83
0.1201
15
0.1343
02

Hasil
Ranki
ng
2.2579
0.3609
24
0.4035
34