Artikel Clustering Tingkat Buta Huruf Menggunakan Metode K-Means

Clustering Tingkat Buta Huruf Menggunakan Metode K-means
Anwar Ludfianto1, Triyanna Widiyaningtyas2

# Electrical Department, State University of Malang, Jl. Semarang 5, Malang, 65145, Indonesia
E-mail: anwarnagato@gmail.com, triyannaw.ft@um.ac.id,
Abstract— Buta huruf merupakan keadaan dimana seseorang tidak mampu untuk membaca dan menulis baik itu untuk komunikasi
dan menyampaikan pendapat dalam kehidupan bermasyarakat. Buta huruf menjadi masalah yang hampir ada di seluruh negara , di
Indonesia juga masih terdapat daerah yang memiliki penduduk buta huruf tercatat oleh Badan Pusat Statistik Indonesia masih
terdapat 3.7 juta penduduk yang mengalami buta huruf pada tahun 2017. Salah satu cara mengatasi buta huruf adalah dengan
memetakan penduduk berdasarkan tingkat buta huruf sehingga dapat di prioritaskan daerah dengan tingkat buta huruf tinggi. Karena
data penduduk buta huruf masih belum memiliki kelas maka diperlukan pengelompokkan kelas terlebih dahulu sehingga dibutuhkan
metode clustering sehingga tiap daerah dapat dilabelkan berdasarkan kelas buta hurufnya. Pada penelitian ini bertujuan untuk
mencari jumlah kelas optimal pada proses clustering tingkat buta huruf , dimana digunakan algoritma k-means clustering untuk
pengelompokkan kelasnya dan diterapkan sebanyak 4 skenario berbeda dengan k=2,k=3,k=5 dan k=7. Sebelum dilakukan clustering
maka akan dilakukan preprocessing meliputi pengumpulan data, selection atribut, integrasi data, uji multikolinieritas, normalisasi
data, dan deteksi outlier. Setelah preprocessing maka data akan langsung diolah menggunakan algoritma k-means clustering dan
kemudian akan divalidasi menggunakan silhouette coefficient(sc) .Sehingga menghasilkan nilai sc pada tiap-tiap nilai k sebagai berikut
, k=2 menghasilkan sc 0.24, k=3 0.29, k=5 0.25 dan k=7 0.24 sehingga dapat disimpulkan jumlah kelas paling optimal adalah k=3.
Keywords— Buta huruf, Clustering, K means.
Untuk dapat melakukan pemetaan penduduk dapat

I. PENDAHULUAN diterapkan menggunakan metode klasifikasi. Metode
Pendidikan merupakan salah satu kebutuhan utama yang klasifikasi adalah suatu cara untuk mengelompokkan data
harus dipenuhi . Karena dengan pendidikan dapat membuat menjadi kelas-kelas dimana acuannya berdasarkan ciri-ciri,
individu menjadi lebih berkembang dan mampu memahami perbedaan,dan persamaan [5]. Pada metode klasifikasi ini
ilmu pengetahuan dengan baik. Akan tetapi tidak semua terdapat beberapa algoritma yang bisa digunakan seperti C4.5 ,
daerah mendapat pendidikan yang layak sehingga Random Forest , Cart , K- Nearest Neighbour(KNN), Naïve
menyebabkan putus sekolah usia dini. Menimbulkan efek Bayes, Decision Tree [6]. Namun sebelum melakukan
samping seperti buta huruf dan dapat mengakibatkan klasifikasi maka langkah pertama adalah melakukan
penurunan kualitas pendidikan didaerah tersebut [1] . clustering terlebih dahulu karena data yan digunakan pada
Dimana memang salah satu indikator pendidikan penelitian ini masih belum memiliki kelas maka digunakan
adalah angka buta huruf, angka buta huruf sendiri merupakan clustering untuk pngelompokan kelas dimana metode yang
gambaran penduduk usia dan daerah tertentu yang tidak dapat digunakan adalah dengan algoritma K-means clustering.
membaca dan menulis huruf latin. Buta huruf banyak terjadi di Metode ini dipilih karena karena kelebihannya yang mudah
negara ketiga atau negara berkembang, termasuk di diterapkan dan dimodifikasi untuk menentukan kelas
Indonesia ,apalagi Indonesia memang memiliki daerah yang sehingga dapat ditemukan jumlah kelas paling optimal [7].
luas dan penduduk yang tersebar diberbagai daerah sehingga Selain itu metode ini dipilih karena memiliki keunggulan
sulit mengontrol pendidikan yang ada. Badan Pusat Statistik dalam menangani komplektisitas waktu dan ruang
telah mencatatkan bahwa pada tahun 2009 terdapat sebanyak penyimpanan dimana metode ini mudah untuk di
8.7 juta jiwa mengalami buta huruf [2].Sementara pada 2017 implementasikan dengan merubah-rubah nilai seperti fungsi
terdapat sebanyak 3.4 juta jiwa yang mengalami buta huruf jarak dan batas iterasi maksimal yang ingin dicapai [8].
yang tersebar diberbagai daerah di Indonesia[3]
Meskipun angka buta huruf terus berkurang tiap tahunnya , II. LANDASAN TEORI
beberapa daerah masih memilki kuantitas buta huruf yang A. K means
tinggi seperti hingga saat ini masih terdapat 11 provinsi dengan
K-means merupakan salah satu metode clustering yang
angkat buta huruf di atas angka nasional, yaitu Papua (28,75
tergolong non hierarki untuk mengelompokkan data menjadi
persen), NTB (7,91 persen), NTT (5,15 persen), Sulawesi
satu atau lebih cluster [9]. Algortima ini bekerja dengan
Barat (4,58 persen), Kalimantan Barat (4,50 persen), Sulawesi
Selatan (4,49 persen), Bali (3,57 persen), Jawa Timur (3,47 mengelompokkan data yang memiliki karakteristik yang
persen), Kalimantan Utara (2,90 persen), Sulawesi Tenggara sama dalam satu kelas. K-Means merupakan algoritma untuk
clustering objek berdasarkan atribut menjadi k partisi, dimana
(2,74 persen), dan Jawa Tengah (2,20 persen)[4]. Hal ini
k < n. Algoritma ini memiliki kinerja yang bagus dalam
menjadi acuan perlunya dikaji untuk memetakan daerah
mengolah data yang beratribut numerik. Salah satu
kabupaten/kota yang memiliki persentase tinggi sehingga
kelebihannya, algoritma ini mampu mengcluster data yang
dapat diperhatikan oleh pemerintah.
besar dengan sangat cepat [10]. Meski begitu K-Means masih
memiliki beberapa kekurangan antara lain bila jumlah data pengumpulan data dapat dilakukan dengan mencari data pada
yang digunakan sangat berpengaruh terhadap kinerja website data.go.id
clustering lalu jumlah cluster yang ada adalah sebanyak K
2) Data Selection: Didalam setiap data yang didapat
maka harus dilakukan penentuan nilai K yang optimal [11].
mengandung banyak atribut, tetapi tidak semua atribut akan
Untuk lebih jelasnya berikut merupkan pseudocode K-means
digunakan sehingga perlu dilakukan pemilihan atribut.
Input: Dengan cara mencari atribut yang dianggap memiliki
Data set Buta Huruf 2010 pengaruh terhadap objek penelitian
Output:
Empat data set dengan jumlah kelas 3) Data Integration: Setelah memilih atribut yang
tingkat buta huruf yang berbeda dianggap memiliki pengaruh terhadap objek pnelitian maka
Step: untuk langakah selanjutnya menggabungkan keseluruhan data
1. Menentukan nilai k =2; yang didapat kedalam satu tabel
2. Menentukan nilai pusat cluster; 4) Uji Multikolinieritas : Uji multikolinieritas merupakan
3. Menghitung jarak antara titik tiap pengujian untuk variabel prediktor dengan variabel prediktor
objek dengan masing-masing pusat yang lain apakah memiliki hubungan atau korelasi yang kuat
cluster menggunakan persamaan atau tidak. .Uji ini dilakukan guna menghindari variabel
prediktor yang memiliki informasi yang redundan
euclidean distance;
4. Mengelompokkan objek ke dalam 5) Data Transformation: Transformasi data merupakan
cluster berdasarkan jarak minimum sebuah tehnik di dalam data mining dimana tehnik ini akan
merubah sebuah nilai dalam data set yang ada . Tehnik yang
objek;
akan digunakan pada penelitian ini adalah z-score
5. ulangi step 2 sampai dengan step 4 normalization.
hingga tidak terdapat anggota
cluster yang berpindah; 6) Deteksi Oultier : Pada tahapan ini juga menggunakan z-
score normalization , karena tehnik tersebut juga dapat
6. Ulangi step 1 sampai dengan step
digunakan untuk mendeteksi pencilan atau outlier . Dimnana
5 dengan nilai k=3, k=5; data ini bisa dilihat ketika hasil transformasi data hasilnya
7. Selesai. lebih kecil dari -3,00 atau lebih besar dari 3,00 maka
merupakan data outlier
Gambar. 1 Pseudocode of k meanes algorithm
C. Proses Clustering
III. METODE PENELITIAN
A. Data Penelitian
Start
Data yang digunakan sebagai inputan untuk clustering
adalah data penduduk buta huruf dan data pendukungnya
yang didapatkan yang berasal dari Badan Pusat Statistik Illiterate
Indonesia yang di himpun pada situs pemerintah yaitu Datasets
data.go.id dimana data yang digunakan adalah data penduduk
buta huruf tahun 2010 dan data pendukung lainnya . Data Determine the value of k
tersebut terdiri dari 7 atribut dan 497 instances . Pada
penelitian ini yang dijadikan objek penelitian adalah data dari Clustering
94 kabupaten yang ada di 34 provinsi di Indonesia yang process using k
berfokus di tahun 2010 , dimana nanti akan di cluster untuk means
mendapatkan kelas target berupa tingkat buta huruf. Dalam Save the clustering result
menentukan label setiap instances tersebut akan digunakan 8
atribut awal yang menjadi indikator yaitu
pengeluaran_perkapita,angka_harapan_hidup,jumlah_pendu
duk_miskin,tingkat_pendidikan,jumlah_perempuan(tidak make sure
that
lulus sd), jumlah_laki_laki(tidak lulus sd), lama_sekolah , clustering
angka_melek_huruf dan tidak_baca_tulis. has done
B. Pre-processing
Pre-processingi data pada penelitian ini meliputi
Finish
pengumpulan data, data selection, data integration, uji
multikolinieritas ,dan deteksi outlier. Gambar. 2 Sequences line of research
1) Pengumpulan data: Pengumpulan data dilakukan untuk Pada Gambar 2 dijelaskan tahapan-tahapan proses
menemukan data yang memiliki hubungan dengan faktor dan clustering menggunakan metode K-means dimana pada
pengaruh terhadap objek penelitian yaitu buta huruf . Untuk langkah pertama adalah menyiapkan dataset yang digunakan.
Kemudian menentukan nilai k yang akan dimasukkan dimana Persentase penduduk miskin sebagai F3 , Jumlah penduduk
menjadi acuan berapa jumlah kel;as yang dibuat. Setelah itu tidak lulus SD sebagai F4 , Angka melek huruf sebagai F5,
hasilnya akan disimpan untuk proses validasi , langkah Lama sekolah sebagai F6 , Penduduk tidak bisa baca tulis
tersebut diulangi sampai 3 kali sehingga menghasilkan cluster sebagai F7 . Hasil dari seleksi atribut dan integrasi data sertya
k=2 ,kemudian k=3 dan k=5 . uji multikolinieritas data dapat dilihat pada Tabel 2.
D. Validasi Hasil Evaluasi TABEL II
Ada beberapa langkah yang memerlukan validasi untuk 5 DARI 462 SAMPEL DATA BUTA HURUF
memastikan proses berjalan dengan baik ,Untuk proses yang Karakteristik Data
pertama adalah memvalidasi hasil clustering dengan Kab/kota
F1 F2 F3 F4 F5 F6 F7
menggunakan metode Silhouette Cosefisien. Metode Kab. 62 618 23 120 98.6 8.52 5195
Silhouette Coefisien adalah metode validasi internal didalam Simelue
proses clustering dimana akan dilihat kedekatan antar objek Kab. Nias 69 607 19 620 90.4 6.4 3676
dalam satu buah cluster [12]. Tahapan-tahapan untuk 71 644 6 630 98.5 9 1809
memperoleh nilai Silhouette Coefisien adalah sebagai berikut Kab. Siak
[13]. (1) Hitung rata-rata jarak menggunakan persamaan Kab. 70 589 33 409 97.4 9.2 3792
euclidean distance dari objek ke-i dengan seluruh objek yang Fakfak
berada pada cluster yang sama. Kemudian, nilai rata-rata jarak Kab. 62 597 14 629 97.9 9.3 1602
tersebut digunakan sebagai nilai ai.(2) Hitung rata-rata jarak Merauke
menggunakan persamaan euclidean distance dari objek ke-i
Tahapan transformasi data dilakukan pada Tabel 2
dengan seluruh objek yang berada pada cluster lainnya. dari
dikarenakan rentang nilai yang tidak sama sehingga akan
semua jarak rata-rata tersebut ambil nilai yang paling kecil.
menyulitkan jika dilakukan perhitungan jarak antar variabel.
Kemudian, nilai rata-rata jarak paling terkecil tersebut
Data yang akan ditransformasi adalah data pada kolom angka
digunakan sebagai nilai bi.(3) Hitung nilai Silhouette
harapan hidup,pengeluaran perkapita,persentase penduduk
Coefisien (SC) untuk objek ke-i menggunakan persamaan
miskin, jumlah penduduk tidak tamat SD, angka melek huruf,
sebagai berikut.
lama sekolah dan tidak baca tulis(jumlah penduduk tidak bisa
𝑏𝑖 − 𝑎𝑖 baca tulis), karena data tersebut yang akan menjadi data
𝑆𝐶𝑖 = (1) predictor untuk menentukan cluster pada tahap selanjutnya.
𝑀𝑎𝑥(𝑎𝑖 ,𝑏𝑖 )
Untuk dapat menilai sebuah cluster sudah baik atau belum Teknik transformation data yang digunakan adalah z-score
adalah dengan melihat kedekatan antar objek dalam sebuah normalization . Dengan metode z-score normalization maka
cluster dimana hasilnya jika mendekati satu maka cluster data yang ada akan di normalisasi berdasarkan nilai mean dan
tersebut bagus , untuk lebih lengkapnya tingkat kekuatan standar deviasi tiap atributnya [14]. Untuk melakukan
cluster seperti pada Tabel 1 . normaliasai dengan z-score menggunakan persamaan
berikut :
TABEL I
ACUAN NILAI SILHOUETTE COEFFICIENT 𝑣− 𝐴̅
𝑣′ = (2)
𝜎𝐴
Nilai Silhouette Coefisien Tingkat Kekuatan Cluster
(SC)
Berdasarkan Persamaan 2, nilai z-score normalization (𝑣`)
0,7 < SC ≤ 1 Sangat Kuat diperoleh dari nilai atribut A (𝑣) dikurangi dengan mean
0,5 < SC ≤ 0,7 Kuat atribut A (𝐴̅), kemudain dibagi dengan standar deviasi
atribut A (𝜎𝐴 ). Untuk hasil transformasi data menggunakan
0,25 < SC ≤ 0,5 Sedang z-score dapat dilihat pada Tabel 3
SC ≤ 0,25 Buruk TABEL III
3 DARI 462 SAMPEL TRANSFORMASI DATA
Kab/kot Karakteristik Data

E. Evaluasi a F1 F2 F3 F4 F5 F6 F7
Kab. 1.99 0.24 0.092 0.7 0.575 0.46 0.713
Setelah selsai melakukan proses testing atau validasi maka
Simelue
dapat dilihat hasil evaluasi berupa nilai Silhouette coefficient
dari tiap cluster dari berbagai nilai k yang berbeda sehingga Kab. 0.396 0.82 0.031 0.3 0.112 0.88 0.043
dapat diketahui nilai sc tertinggi dan terendah pada nilai k Nias
yang dimasukkan . Kab. 0.688 0.16 0.107 0.52 0.452 0.121 0.223
Siak
IV. HASIL DAN PEMBAHASAN
A. Hasil Pre-processing
Pada Tabel 3, jika terdapat nilai negatif maka
Pada tahap Pre-processing dilakukan pengumpulan dan
menunjukkan bahwa data di bawah rata-rata total, sedangkan
integrasi data dimana , data Angka harapan hidup di
nilai positif menunjukkan bahwa data berada di atas rata-rata
inisialisasikan sebagai F1 , Pengeluaran perkapita sebagai F2 ,
total. Hasil transformasi data yang ditunjukkan pada Tabel 3 algoritma K berarti dengan nilai k = 2 ditunjukkan pada Tabel
akan digunakan sebagai dataset proses clustering 6.
menggunakan algoritma K means untuk membentuk kelas
buta huruf. TABEL VI
10 OF 114 SAMPLES OF CLUSTERING RESULT
Tapi sebelum itu perlu dilakukan deteksi outlier terlebih Nama Nilai Euclidean
dahulu dengan memperhatikan nilai z-score dari tiap objek . Label
Daerah Distance
Outlier dapat ditandai dengan nilai yang memiliki distribusi Kab.
tidak normal dengan rentang nilai dibawah -3 atau diatas 3 Simeulue Cluster 1 2.063785
[15] . Sehingga melalui proses ini terdapat 35 objek yang Kab. Aceh
merupakan outlier maka dihapus dari dataset . Sehingga data Singkil Cluster 1 1.28987
yang digunakan memiliki 462 objek. Kab. Aceh
Selatan Cluster 1 1.214199
B. Clustering Menggunakan Metode K-means Kab. Aceh
Tenggara Cluster 2 1.996979
Proses clustering dilakukan tiga kali dengan nilai k = 2, k = 3,
Kab. Aceh
dan k = 5. Langkah awal penentuan cluster dengan nilai k = 2 Timur Cluster 1 2.08613
ditunjukkan pada Tabel 4. Kab. Aceh
TABEL IV Tengah Cluster 2 1.12503
TITIK PUSAT CLUSTER AWAL Kab. Aceh
Barat Cluster 1 1.82489
Clusters Kab. Aceh
Data
Cluster 1 Cluster 2 Besar Cluster 2 1.336122
F1 -2.6896804 -0.3949074 Kab. Pidie Cluster 2 1.210859
F2 0.7216268 -0.4789252 Kab. Bireuen Cluster 2 2.163445
F3 0.0297028 -0.0967458
F4 -0.4836585 1.3934143 Dari hasil yang ditunjukkan pada Tabel 6, 247 daerah
F5 -0.2990172 -0.4923361 dikelompokkan dalam kelompok 1 dan 215 daerah yang
dikelompokkan dalam kelompok 2. Kemudian, proses
F6 -0.6783040 0.3913993
pengelompokan akan diulang dengan cara yang sama untuk k
F7 -0.1172511 0.4710987 = 3 dan k = 5. Setelah semua proses pengelompokan memiliki
Setelah dilakukan, diperoleh jumlah anggota masing-masing
Berdasarkan Tabel 4.10, centroid awal yang dipilih untuk cluster seperti yang ditunjukkan pada Tabel 7
pusat cluster 1 merupakan objek ke-27 dan pusat cluster awal
TABLE VII
untuk cluster 2 merupakan objek ke-275. Pada proses ANGGOTA TIAP CLUSTER
clustering dengan nilai k=2, dilakukan 21 kali iterasi hingga
objek tidak berpindah cluster lagi . Untuk pusat cluster akhir Nilai k Jumlah
Label Persentase
dapat dilihat pada Tabel 5. Anggota
Cluster 1 247 54%
TABEL V k=2
Cluster 2 215 46%
PUSAT CLUSTER AKHIR
Cluster 1 204 44%
Clusters
Data k=3 Cluster 2 177 38%
Cluster 1 Cluster 2
F1 -0.5635997 0.7654722 Cluster 3 81 17%
F2 -0.3155703 0.5524862 Cluster 1 30 6%
F3 -0.0112379 -0.1187075 Cluster 2 59 12%
F4 0.02913571 -0.2352607 k=5 Cluster 3 155 33%
F5 -0.3788719 0.7062448 Cluster 4 100 21%
F6 0.0142193 0.3591641 Cluster 5 118 25%
F7 0.0184489 -0.2833912
Setelah dilakukan tiga kali proses clustering, kemudian

dilakukan validasi hasil clustering dengan menggunakan
Pada Tabel 5, dapat dilihat bahwa rata-rata cluster 1 adalah metode Silhouette Coefisien seperti yang telah di jelaskan
-0.17249 dan cluster 2 adalah 0.2494. Jadi, kesimpulannya
pada Persamaan 1. Dari proses validasi clustering diperoleh
adalah bahwa cluster 1 lebih rendah dari cluster 2 pada
hasil seperti yang ditunjukkan pada Tabel 8 dan mengacu
beberapa aspek kehidupan , yang berarti cluster 1 adalah kelas
pada Tabel 8 hasil clustering terbaik terjadi pada hasil
buta huruf tinggi dan cluster 2 adalah kelas buta huruf rendah. clustering k=3 dengan nilai Silhouette Coefisien sebesar 0.29
Hasil akhir dari proses pengelompokan menggunakan dengan kategori sedang. Sedangkan hasil clustering terburuk
terjadi pada hasil clustering k=2 dengan nilai Silhouette [5] O. Irvi and A. A. Supianto, “Perbandingan Teknik
Coefisien sebesar 0, 24 dengan kategori buruk. Klasifikasi Dalam Data Mining untuk Bank Direct
Marketing,” vol. 5, no. 5, pp. 567–576, 2018.
TABEL VIII [6] I. Ahmad, H. Mabuchi, M. Kano, S. Hasebe, Y. Inoue, and
HASIL VALIDASI SILHOUETTE COEFFICIENT
H. Uegaki, Data-based fault diagnosis of power cable
Tingkat system: Comparative study of k-NN, ANN, random forest,
Nilai Silhouette and CART, vol. 18, no. PART 1. IFAC, 2011.
Jumlah Kelas Kekuatan
Coefficient [7] N. Wakhidah, “Clustering Menggunakan K-Means
Cluster
0.24 Buruk Algorithm ( K-Means Algorithm Clustering ),” Fak.
2
Teknol. Inf., vol. 21, no. 1, pp. 70–80, 2014.
3 0.29 Sedang [8] F. E. M. Agustin, A. Fitria, and A. Hanifah, “Implementasi
5 0.25 Sedang Algoritma K-Means untuk Menentukan Kelompok
Pengayaan Materi Mata Pelajaran Ujian Nasional (Studi
Kasus: SMP Negeri 101 Jakarta),” J. Tek. Inform., vol. 8,
no. 1, pp. 73–78, 2015.
[9] M. Jain and C. Verma, “Adapting k-means for Clustering
V. KESIMPULAN in Big Data,” vol. 101, no. 1, pp. 19–24, 2014.
[10] B. M. Metisen and H. L. Sari, “Analisis Clustering
Berdasarkan hasil penelitian maka dapat disimpulkan: Menggunakan K-means Dalam Pengelompokkan
 K-means clustering dapat digunakan untuk proses Penjualan Produk Pada Swalayan Fadhila,” J. Media
cluster tingkat buta huruf. Infotama, vol. 11, no. 2, pp. 110–118, 2015.
 Jumlah kelas buta huruf yang dianggap paling optimal [11] K. Singh, D. Malik, and N. Sharma, “Evolving limitations
adalah tiga kelas yang terdiri dari buta huruf tinggi , in K-means algorithm in data mining and their removal,”
buta huruf sedang dan buta huruf rendah dimana IJCEM Int. J. Comput. Eng. Manag. ISSN, vol. 12, no.
jumlah anggota buta huruf tinggi sebanyak 204 dan April, pp. 2230–7893, 2011.
buta huruf rendah sebanyak 177 anggota sementara [12] M. Anggara, H. Sujiani, and H. Nasution, “Pemilihan
buta huruf sedang terdapat 81 anggota Distance Measure Pada K-Means Clustering Untuk
 Dari ketiga proses clustering yang telah dilakukan, Pengelompokkan Member Di Alvaro Fitness,” vol. 1, no.
1, pp. 1–6, 2016.
maka dilakukan Validasi hasil evaluasi menggunakan
[13] D. F. Azuri and R. S. Pontoh, “Pengelompokkan
Silhouette coefficient dan menunjukkan dengan k = 3 Kabupaten / Kota Di Pulau Jawa Berdasarkan
memperoleh hasil terbaik dengan nilai sc sebesar 0,29 Pembangunan Manusia Berbasis Gender Menggunakan
dan tingkat kekuatan cluster sedang. Peringkat kedua Bisecting K-Means,” pp. 27–28, 2016.
adalah clustering dengan lima kelas yang memperoleh [14] H. Junaedi, H. Budianto, and I. Maryati, “Data
dengan nilai sc sebesar 0,25 dan tingkat kekuatan transformation pada data mining,” vol. 7, pp. 93–99, 2011.
cluster sedang . Yang ketiga adalah clustering dengan [15] A. Rosiatun, T. Widihardih, and D. Safitri, “Analisis
dua kelas yang memperoleh nilai sc sebesar 0,24 dan Klaster untuk Segmentasi Pemirsa Program Berita Sore
tingkat kekuatan cluster buruk. Stasiun TV Swasta,” Media Stat., vol. 3, no. 2, pp. 93–
102, 2010.
Untuk mendapatkan hasil yang lebih baik untuk penelitian
kedepannya maka disarankan untuk:
 Menambahkan variabel data lain yang memiliki
pengaruh terhadap angak buta huruf
 Menggunakan metode clustering lainnya atau
meningkatkan kinerja metode K-means clustering
 Meningkatkan jumlah data observasi untuk
meningkatkan keakuratan data.
RUJUKAN
[1] R. D. Bekti, E. Irwansyah, and Andiyono, “Angka Buta

Huruf Melalui Geographically Weighted Regression :
Studi Kasus Provinsi Jawa Timur,” Comtech, vol. 4, no. 1,
pp. 443–449, 2013.
[2] Mariyono, “Strategi Pemberantasan Buta Aksara Melalui
Penggunaan Teknik Metastasis Berbasis Keluarga,”
Pancaran, vol. 5, no. 1, pp. 55–66, 2016.
[3] Antara, “Indonesia Peringkat Keempat Penduduk dengan
Buta Huruf Terbanyak,” Media Indonesia, 2017. [Online].
Available: https://mediaindonesia.com/read/detail/121475-
indonesia-peringkat-keempat-penduduk-dengan-buta-
huruf-terbanyak. [Accessed: 24-Jul-2019].
[4] B. O. Sepling Paling, Irsan Hengky Sulendorong,
“Pendampingan Masyarakat Melalui Program Keaksaraan
di Distrik Walelagama, Wamena Kabupaten Jayawijaya,
Papua,” vol. 3, no. 1, pp. 11–20, 2019.

Artikel Clustering Tingkat Buta Huruf Menggunakan Metode K-Means

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Artikel Clustering Tingkat Buta Huruf Menggunakan Metode K-Means

Diunggah oleh

Hak Cipta:

Format Tersedia

Clustering Tingkat Buta Huruf Menggunakan Metode K-means

Anwar Ludfianto1, Triyanna Widiyaningtyas2

Keywords— Buta huruf, Clustering, K means.

Untuk dapat melakukan pemetaan penduduk dapat

Kab/kot Karakteristik Data

Setelah dilakukan tiga kali proses clustering, kemudian

[1] R. D. Bekti, E. Irwansyah, and Andiyono, “Angka Buta

Anda mungkin juga menyukai