Anda di halaman 1dari 17

Jurnal Informatika dan Bisnis

KLASTERISASI INDEKS PEMBANGUNAN MANUSIA (IPM)


PER KABUPATEN DI INDONESIA
DENGAN MENGGUNAKAN ALGORITMA K-MEANS

Samuel1) dan Akhmad Budi2)


1)
Alumni Program Studi Sistem Informasi
2)
Staff Pengajar Program Studi Teknik Informatika
Institut Bisnis dan Informatika Kwik Kian Gie
Jl. Yos Sudarso Kav. 87 Sunter Jakarta Utara 14350
http://www.kwikkiangie.ac.id
akhmad.budi@kwikkiangie.ac.id

ABSTRACT
Development of technology and information systems use data mining as a method of data
processing is growing, due to the large amount of data available and growing every day, especially
economy, health, and education data. One of the benefits that can be obtained by applying information
technology, among others, is to conduct the analysis and clustering of large amounts of data. The human
development index (IPM) is a factor of public welfare measurement in Indonesia, but quite difficult to
analyze because there has not been a proper measurement clustering method for cluster the data (IPM) in
the future. This research aims to make it easier to read the data and classifying data by using K-Means.
With the aim of obtaining the results of the cluster so as to facilitate reading the index.
Key Words : Clustering, Human Development Index, Data Mining, K-Means, Rapidminer.

1. PENDAHULUAN Di dalam perkembangan teknologi


informasi, tentunya harus memberikan manfaat
Pada era globalisasi saat ini, perkembangan yang baik bagi penggunanya. Manfaat yang
teknologi dan informasi sudah menjadi bagian diberikan yaitu penggunaan informasi yang
dari kehidupan masyarakat luas. Maka tidak efektif, cepat, dan efisien, juga memudahkan
mengherankan apabila masyarakat zaman aktivitas sehari-hari, menyelesaikan berbagai
sekarang menggunakan alat-alat komunikasi macam masalah, dan sebagainya.
maupun teknologi dalam aktivitas sehari-hari,
salah satu alasan masyarakat bergantung pada Sehingga sistem pengolahan data terus
teknologi informasi yaitu memudahkan untuk dituntut untuk beradaptasi dengan situasi yang
memenuhi kebutuhan akan informasi. Kebutuh- terjadi dalam berbagai bidang kehidupan
an akan informasi menjadi sangat penting dalam masyarakat, memudahkan dan membuat solusi
melakukan perencanaan bisnis, pengambilan dan solusi alternatif dalam menghadapi berbagai
keputusan, penelitian, dan lain sebagainya. macam masalah yang terjadi secara efektif dan
Seiring dengan permintaan kebutuhan informasi efisien. Salah satu manfaat dari penggunaan dan
masyarakat yang begitu banyak, menyebabkan penerapan teknologi informasi yaitu dengan
jumlah data yang begitu besar, karena data penerapan data mining. Data mining merupakan
merupakan kumpulan fakta yang berasal dari pengolahan data dalam jumlah banyak dan dapat
kejadian-kejadian dari waktu ke waktu dalam menyajikan informasi secara spesifik dengan
kehidupan manusia sehari-hari. Kemudian data menggunakan metode-metode tertentu, salah
tersebut diolah menjadi informasi yang memiliki satu metode data mining adalah klasterisasi atau
pola atau bentuk, dan diolah dalam sebuah segmentasi (clustering). Pemanfaatan klasteri-
sistem yangr dapat menghasilkan informasi yang sasi data dalam jumlah besar sangat membantu
akurat serta dapat digunakan oleh manusia untuk dalam membaca data, data yang ada di
mendukung aktivitas secara efektif dan efisien. kelompokkan menjadi kategori-kategori tertentu.

13
Jurnal Informatika dan Bisnis

Beberapa contoh penggunaan clustering dalam Indeks Pembangunan Manusia (IPM)


kehidupan sehari-hari antara lain klasterisasi merupakan pengukuran perbandingan dari
jenis-jenis penyakit, klasterisasi pendapatan dan harapan hidup, melek huruf, pendidikan dan
pengeluaran per kapita penduduk, dan lain standar hidup untuk semua negara seluruh dunia.
sebagainya. Dalam kesempatan ini, penulis IPM digunakan untuk mengklasifikasikan
melakukan penelitian mengenai klasterisasi apakah sebuah negara adalah negara maju,
indeks pembangunan manusia (IPM) per negara berkembang atau negara terbelakang dan
kabupaten di Indonesia. juga untuk mengukur pengaruh dari
kebijaksanaan ekonomi terhadap kualitas hidup.
Menurut wikipedia, Indonesia tercatat Maka dalam penelitian ini, penulis berfokus
sebagai negara kepulauan terbesar di dunia pada Indeks Pembangunan Manusia (IPM) per
dengan luas wilayah sebesar 1,904,569 km2 dan kabupaten di Indonesia.
memliki jumlah penduduk sebanyak
255,461,700 jiwa. Karena hal tersebut maka Indonesia sebagai negara yang besar
tidak dapat dipungkiri bahwa data dan informasi tentunya memiliki wilayah, khususnya
yang dapat diperoleh dari negara Indonesia kabupaten yang tersebar di seluruh pelosok
sangatlah besar jumlahnya jika dihitung dari tanah air. Masing-masing wilayah tersebut tidak
berbagai faktor dan bidang yang saling terlepas dari indeks pembangunan manusia, di
berkembang di dalamnya. Salah satu faktor yang mana tiap individu dari penduduk suatu wilayah
berpengaruh yang memiliki data dalam jumlah dilakukan perhitungan untuk mengetahui tingkat
besar di Indonesia adalah pembangunan kesejahteraan dan kemajuan penduduk.
manusia. Kemudian dilakukan segmentasi (cluster)
terhadap kabupaten-kabupaten di Indonesia
Tingkat pembangunan manusia bertujuan berdasarkan besarnya nilai indeks pembangunan
untuk melihat apakah suatu negara termasuk manusia. Sehingga dapat diketahui berapa
golongan negara berkembang atau negara maju. banyak kabupaten yang memiiki nilai IPM yang
Hal ini dapat dilihat dari berbagai komponen- rendah, agar segera mendapat penanganan yang
komponen yang terdapat pada pembangunan tepat dan dilakukan pengadaan fasilitas seperti
manusia. Dalam hal ini dilakukan segala metode pendidikan, kesehatan, maupun pengadaan
perhitungan aspek-aspek yang mencakup di lapangan pekerjaan di tiap-tiap wilayah yang
dalamnya, dan dilakukan perhitungan tiap membutuhkan serta meningkatkan kualitas
tahunnya untuk memperoleh hasil berupa data hidup penduduk.
Indeks Pembangunan Manusia (IPM).
Indeks pembangunan manusia (IPM)
Data indeks pembangunan manusia (IPM) di merupakan salah satu indikator yang dapat
Indonesia dikumpulkan dan dihitung melalui digunakan untuk mengetahui tingkat ke-
Badan Pusat Statisik (BPS) yaitu lembaga sejahteraan manusia, dengan cara melakukan
pemerintah non kementerian yang bertanggung pengukuran perbandingan antara melek huruf,
jawab langsung kepada presiden untuk harapan hidup, standar hidup, dan pendidikan
mengumpulkan data tentang berbagai bidang di tiap-tiap individu yang mencerminkan tingkat
Indonesia untuk kebutuhan pemerintah dan kesejahteraan penduduk dari suatu wilayah atau
publik. Data yang dikumpulkan dari BPS suatu negara. Maka dari hal tersebut dapat
tersebut dapat diakses melalui situs resmi BPS diketahui apakah suatu negara dapat di
yaitu http://bps.go.id atau melalui portal data kategorikan sebagai negara maju, negara
publik indonesia yaitu http://data.go.id. Data berkembang, atau negara terbelakang. Hal ini
indeks pembangunan manusia (IPM) yang tentu saja bertujuan agar wiayah-wilayah yang
dikumpulkan oleh BPS memiliki keakuratan memiliki nilai IPM yang rendah memperoleh
yang tinggi karena dikumpulkan berdasarkan penanganan yamg tepat dan cepat serta
data tiap provinsi yang dilakukan dengan meningkatkan kualitas hidup penduduk.
melakukan observasi langsung ke lapangan dan
menggunakan tenaga ahli statistik dalam Dalam melakukan perhitungan dan
pengumpulan dan penghitungannya. pengukuran data Indeks Pembangunan Manusia,

14
Jurnal Informatika dan Bisnis

tentunya muncul berbagai kendala yang Menurut [12], sistem informasi memiliki
dihadapi, seperti kesulitan dalam membaca data empat komponen penting, antara lain
dan mengetahui kabupaten apa saja yang sebagai berikut:
memiliki nilai IPM yang tertinggi maupun
terendah karena data tidak praktis. Disamping 1. Manusia
itu, data dalam bentuk tabel memberikan Membuat rancangan, mengembangkan,
informasi yang kurang informatif, sehingga menjalankan, dan perawatan sistem
kesulitan dalam membaca data secara spesifik informasi apa pun yang melibatkan
karena jumlah data yang sangat banyak. Kendala berbagai kelompok atau tim kerja.
lain yang muncul yaitu belum ada metode 2. Teknologi
klasterisasi (clustering) dari BPS dalam mem- Terdiri dari hardware, software, dan
visualisasikan data IPM per kabupaten di telekomunikasi.
Indonesia ke dalam bentuk grafik maupun 3. Data
diagram. Merupakan keunggulan bagi setiap
sistem informasi, dan merupakan fakta
Oleh karena itu, dalam penelitian tugas akhir mentah yang dapat menggambarkan diri
ini penulis melakukan penelitian dengan cara mereka dalam berbagai macam rupa dan
segmentasi atau klasterisasi (clustering) bentuk.
terhadap Indeks Pembangunan Manusia (IPM) 4. Proses
per kabupaten di Indonesia dengan Sekumpulan aktivitas atau kegiatan
menggunakan algoritma K-Means untuk perancangan untuk menyelesaikan suatu
mengelompokkan tingkat IPM ke dalam bentuk pekerjaan.
data gambar berupa grafik maupun diagram
serta memberikan penjelasan secara informatif
serta mengetahui tingkat IPM dengan mudah. 2.2. Data
Data dapat diterjemahkan sebagai aliran
fakta mentah yang mewakili peristiwa yang
2. LANDASAN TEORI terjadi dalam organisasi atau lingkungan
2.1. Sistem Informasi fisik sebelum diatur dan disusun menjadi
bentuk yang dapat dipahami dan digunakan
Sistem informasi dapat didefinisikan [5].
kombinasi teratur apa pun dari orang-orang,
hardware, software, jaringan komunikasi, 2.3. Database
dan sumber daya data yang mengumpulkan, Database adalah kumpulan terintegrasi
mengubah, dan menyebarkan informasi dari elemen data yang secara logika saling
dalam sebuah organisasi [9]. Pendapat lain berhubungan [9]. Pendapat lain
mengatakan bahwa sistem informasi dapat mengemukakan database merupakan
didefinisikan secara teknis sebagai satu kumpulan informasi yang terintegrasi yang
kumpulan komponen yang mengumpulkan secara logika saling berhubungan dan
(atau mengambil), memproses, menyimpan, disimpan dengan cara seperti meminimalkan
dan mendistribusikan informasi untuk duplikasi dan memberi kemudahan
mendukung pengambilan keputusan dan pencarian keterangan yang cepat [12].
pengendalian dalam suatu organisasi [5].
Pendapat lain mengemukakan sistem 2.4. Data Mining
informasi merupakan suatu sistem yang
Data mining adalah penggunaan utama
membawa empat komponen penting
dari database dalam data warehouse. Dalam
bersama-sama untuk mengumpulkan,
data mining, data di suatu data warehouse
memproses, mengatur, menganalisa, dan
dianalisis untuk mengungkapkan pola dan
menyalurkan informasi [12].
tren tersembunyi dalam aktivitas bisnis yang
telah lewat [9]. Pendapat lain mengatakan

15
Jurnal Informatika dan Bisnis

data mining adalah istilah yang mengacu menemukan karakteristik pelanggan


pada penggunaan algoritma dan komputer yang cenderung untuk berhenti
untuk menemukan novel dan pola menarik menggunakan produk layanan
dalam data [11]. Pendapat lain perusahaan tersebut dan dapat
mengemukakan data mining merupakan menghasilkan sebuah model untuk
suatu jenis pengumpulan intelijensi yang membantu para manajer
digunakan untuk menjelajah rekam data memprediksi pelanggan sehingga
(record) di dalam data warehouse, mencari manajer dapat mengadakan
pola tersembunyi dan membentuk hubungan kampanye khusus untuk
dengan berbagai macam hal yang tidak mendapatkan pelanggan tersebut.
terdeteksi dalam laporan harian [12]. 3. Clustering / Klasterisasi: Berfungsi
persis seperti klasifikasi saat belum
2.5. Jenis-jenis Data Mining ada kelompok-kelompok yang
Menurut [5], jenis-jenis informasi yang ditentukan. Suatu alat data mining
diperoleh dari data mining antara lain: dapat menemukan pengelompokkan
yang berbeda di dalam data, seperti
1. Associations / Asosiasi: merupakan menemukan kelompok afinitas
kejadian yang berkaitan dengan suatu untuk kartu bank atau pembagian
kejadian tertentu. Sebagai contoh, sebuah database kedalam kelompok
sebuah studi mengenai pola pembelian pelanggan berdasarkan pada
di supermarket bisa saja menunjukan demografi dan jenis investasi
bahwa, pada saat keripik jagung dibeli, pribadi.
minuman bersoda dibeli sebanyak 65 4. Forecasting / Peramalan: Walaupun
persen, tetapi pada saat diadakan aplikasi ini melibatkan prediksi-
promosi, minuman bersoda dibeli prediksi, peramalan (forecasting)
sebanyak 85 persen. Informasi ini digunakan untuk prediksi dengan
membantu para manajer mengambil cara yang berbeda. Dengan
keputusan dengan lebih baik sebab menggunakan serangkaian nilai-
mereka telah mengetahui keuntungan nilai yang telah ada untuk
dari suatu promosi. meramalkan nilai-nilai lain apa yang
1. Sequences / Pengurutan: Dalam akan dihasilkan. Misalnya,
pengurutan, kejadian-kejadian peramalan bisa saja menemukan
saling berhubungan dari waktu ke pola-pola dalam data untuk
waktu. Kita mungkin menemukan, membantu para manajer
sebagai contoh, jika sebuah rumah memperkirakan nilai masa yang
dibeli, sebuah lemari es baru akan akan datang dari variabel yang
dibeli dalam dua minggu sebanyak berlanjut, seperti angka penjualan.
65 persen, dan sebuah oven akan
dibeli dalam satu bulan dari 2.6. Tahap-tahap Data Mining
pembelian rumah sebanyak 45
persen. Tahapan dalam data mining terbagi
2. Classification / Klasifikasi: dalam beberapa langkah yang disebut
Mengakui pola yang CRISP-DM (CRoss-Industry Standard
menggambarkan kelompok yang Process for Data Mining) [1] yaitu antara
dimiliki suatu item dengan lain adalah:
memeriksa item yang ada yang telah 1. Business Understanding / Organizatio-
diklasifikasikan dan menyimpulkan nal Understanding (pemahaman bisnis /
seperangkat aturan. Misalnya, bisnis organisasi): Tahap pemahaman sistem
kartu kredit atau perusahaan telepon yang berjalan dan kebutuhan apa yang
khawatir akan kehilangan pelanggan dibutuhkan dalam menyelesaikan
tetapnya. Klasifikasi membantu masalah yang timbul didalamnya.

16
Jurnal Informatika dan Bisnis

2. Data Understanding (pemahaman data): dari atribut dalam suatu kumpulan data, dan
Tahap pemahaman dan pengumpulan mengelompokkan mereka bersama-sama
data yang dibutuhkan untuk sebelum berdasarkan pada kesamaan atribut-atribut
dilakukan persiapan untuk analisa. Pada tersebut pada rata-rata kelompok. Karena
tahap ini data yang dikumpulkan harus atribut apa pun dapat diukur serta dapat
merupakan data yang tepat digunakan memiliki perhitungan mean, k-Means
untuk proses penelitian dan mewakili clustering memberikan cara yang efektif
masalah yang akan diselesaikan serta dalam mengelompokkan pengamatan
sesuai dengan kebutuhan dan bersama-sama berdasarkan pada jenis
kepentingan. kelompok tersebut. Juga dapat membantu
3. Data Preparation (persiapan data): kita memahami dimana suatu kelompok
Tahap persiapan dan seleksi data yang memulai dan yang lainnya berhenti dalam
telah dikumpulkan dan diubah menjadi proses yang terjadi di antara kelompok
bentuk yang dapat diolah dalam model dalam kumpulan data.
yang ditentukan selanjutnya.
4. Modeling (pemodelan): Proses analisa K-Means clustering sangat fleksibel
dan pemodelan data yang telah dalam kemampuannya mengelompokkan
disiapkan dimana dalam hal ini pengamatan bersama-sama. Juga
dilakukan penerapan atau penghitungan mengijinkan pengguna untuk mengatur
berdasarkan algoritma atau metode yang jumlah cluster yang mereka inginkan untuk
ditentukan untuk mendapatkan hasil menghasilkan, menentukan jumlah sampel
yang diinginkan sesuai dengan mean yang digunakan untuk menentukan
kebutuhan pengguna dan melakukan cluster, dan menggunakan sejumlah
representasi pemecahan masalah. algoritma yang berbeda-beda untuk
5. Evaluation (evaluasi): Melakukan mengevaluasi mean. Disamping pengaturan
analisa dan evaluasi dari hasil model dan definisinya yang sederhana, k-Means
yang telah dibuat apakah sudah sesuai clustering merupakan metode yang kuat
standar dan telah memecahkan masalah untuk menemukan kelompok alami dari
atau memenuhi kebutuhan dari pengamatan di dalam suatu kumpulan data.
pengguna.
6. Deployment (penerapan): Tahap
penerapan hasil dari model yang telah 3. METODOLOGI PENELITIAN
dievaluasi dan dianalisa untuk kemudian
dijadikan bentuk yang dapat diolah 3.1. Teknik Pengumpulan Data
kembali. Dalam penelitian ini, data yang
digunakan adalah data sekunder dari indeks
pembangunan manusia per kabupaten di
Indonesia yang diambil dari
http://data.go.id/ berdasarkan survei dan
pendataan yang dilakukan oleh Badan Pusat
Statistik (BPS).
Dalam pengumpulan data, penulis
menggunakan metode kuantitatif. Metode
Gambar 1. Tahapan Data Mining kuantitatif yaitu penelitian ilmiah yang
(CRISP-DM) sistematis terhadap bagian-bagian dan
fenomena serta hubungan-hubungannya.
2.7. K-Means Tujuan penelitian kuantitatif adalah
Menurut [1], k-means clustering adalah mengembangkan model-model matematis,
teori-teori dan/atau hipotesis yang berkaitan
model data mining yang mirip dengan
klasifikasi. Dengan mengetahui indikator dengan fenomena alam. Proses pengukuran

17
Jurnal Informatika dan Bisnis

adalah bagian yang sentral dalam penelitian c. Data Preparation: Tahap persiapan dan
kuantitatif karena hal ini memberikan seleksi data yang telah dikumpulkan dan
hubungan yang fundamental antara diubah menjadi bentuk yang dapat
pengamatan empiris dan ekspresi matematis diolah dalam model yang ditentukan
dari hubungan-hubungan kuantitatif. selanjutnya.
Menurut [7], metode kuantitatif d. Modeling: Proses analisa dan pemodelan
didefinisikan sebagai penelitian yang data yang telah disiapkan dimana dalam
mengacu pada pengukuran variabel-variabel ini dilakukan penerapan atau
dan pengujian hipotesis-hipotesis. Penelitian penghitungan berdasarkan algoritma
kuantitatif memiliki ciri-ciri sebagai berikut: atau metode yang ditentukan untuk
a. Peneliti menguji hipotesis-hipotesis mendapatkan hasil yang diinginkan
yang sudah ditetapkan diawal. sesuai dengan kebutuhan pengguna dan
b. Konsep berupa variabel yang jelas. melakukan representasi pemecahan
c. Pengukuran secara sistematis masalah.
diciptakan sebelum pengumpulan e. Evaluation: Melakukan analisa dan
data dan telah distandarisasikan. evaluasi dari hasil model yang telah
d. Data berupa angka dari hasil dibuat apakah sudah sesuai standar dan
pengukuran atau perhitungan akurat. telah memecahkan masalah atau
e. Teori merupakan sebab-akibat dan memenuhi kebutuhan dari pengguna.
bersifat menyimpulkan. f. Deployment: Tahap penerapan hasil dari
f. Prosedur penelitian standar, dan model yang telah dievaluasi dan
balasan sering muncul. dianalisa untuk kemudian dijadikan
g. Analisis dilanjutkan menggunakan bentuk yang dapat diolah kembali.
statistik, tabel, atau grafik dan
didiskusikan apakah penelitian
menunjukkan hasil sesuai dengan
hipotesis.

3.2. Teknik Analisa Data


Dalam penelitian ini penulis
menggunakan teknik analisis yang dilakukan
berdasarkan metode CRISP-DM (CRoss- Gambar 2. Tahapan Data Mining
Industry Standard Process for Data Mining) (CRISP-DM)
yaitu antara lain adalah:
a. Business Understanding / 3.3. Teknik Pengukuran
Organizational Understanding: Tahap
1. Langkah-langkah K-Means
pemahaman sistem yang berjalan dan
Clustering:
kebutuhan apa yang dibutuhkan dalam a. Tentukan berapa banyak cluster (k)
menyelesaikan masalah yang timbul dari dataset yang akan dibagi.
didalamnya.
b. Tetapkan secara acak data k menjadi
b. Data Understanding: Tahap pemahaman pusat (centroid) awal lokasi cluster.
dan pengumpulan data yang dibutuhkan c. Untuk masing-masing cluster (k),
untuk sebelum dilakukan persiapan temukan pusat cluster terdekat.
untuk analisa. Pada tahap ini data yang Sehingga masing-masing centroid
dikumpulkan harus merupakan data memiliki sebuah subset dari dataset.
yang tepat digunakan untuk proses d. Untuk masing-masing cluster (k),
penelitian dan mewakili masalah yang temukan centroid luasan cluster,
akan dipecahkan serta sesuai dengan dan perbaharui lokasi dari masing-
kebutuhan dan kepentingan. masing pusat cluster ke nilai baru
dari pusat luasan.

18
Jurnal Informatika dan Bisnis

e. Ulangi langkah ke-3 (c) dan ke-5 (e) pembaca dan pengguna aplikasi untuk
hingga data-data pada tiap cluster memudahkan proses pengujian klasterisasi
menjadi terpusat atau sesuai. Indeks Pembangunan Manusia (IPM)
menggunakan Data Mining dengan
2. Pengukuran Jarak Data Dengan menggunakan algoritma K-Means
Centroid Metode Clustering: Clustering. Perancangan GUI dilakukan
Pengukuran jarak data metode dengan menggunakan aplikasi Microsoft
clustering penulis menggunakan Access 2013.
rumus Euclidean Distance untuk
menghitung jarak data dengan 4.2. Rancangan Basis Data
centroid berdasarkan data yang Berdasarkan data kependudukan yang
digunakan: telah diunduh dari http://data.go.id/ yang
memiliki ekstensi .csv diambil data Angka
Harapan Hidup, Angka Melek Huruf, Lama
Sekolah, Pengeluaran Perkapita dan IPM
(Indeks Pembangunan Manusia) untuk
dilakukan proses klasterisasi dengan aplikasi
d = jarak Rapidminer. Setelah data hasil klasterisasi
j = banyaknya data diperoleh, maka data hasil klasterisasi akan
y = centroid di copy dan di paste ke dalam Microsoft
x = data Excel untuk mengetahui perkembangan IPM
per Kabupaten di Indonesia dari tahun 2004
hingga tahun 2012. Data yang diperoleh
3.4. Teknik Perancangan GUI
dalam tabel Excel akan diimpor ke dalam
tabel Microsoft Access untuk kemudian
Perancangan dan pengembangan GUI
dirancang ke dalam GUI.
akan dilakukan dengan terlebih dahulu
Sebelum implementasi GUI dilakukan,
melakukan pemilahan data sesuai urutan
akan dilakukan proses klasterisasi data
tahun 2004 hingga 2012 menjadi beberapa
untuk memperoleh data klasterisasi dengan
dataset untuk dilakukan proses clustering
menggunakan algoritma K-Means
dalam RapidMiner. Sehingga diperoleh data
Clustering. Penulis menggunakan aplikasi
IPM per tahun dengan menggunakan metode
Rapidminer 5.3 sebagai aplikasi pengolahan
clustering.
dan pengelompokkan data yang dibutuhkan.
Kemudian penulis akan
mengimplementasikan hasil klasterisasi dan
1. Pengujian Data Klasterisasi
analisa tersebut kedalam Microsoft Access
a. Import Dataset (Memasukkan
untuk kemudian melakukan perancangan
Dataset)
GUI sederhana yang didalamnya terdapat
b. Process Building (Membangun
proses penghitungan penyimpangan
Alur Proses)
keakuratan klasterisasi dan menghasilkan
data aktual secara sistematis dan siap 4.3. Implementasi Sistem GUI
diberikan pada pembaca untuk diteliti dan
dipelajari lebih lanjut sesuai dengan metode Setelah data dan pengukuran hasil
yang dilakukan oleh penulis. klasterisasi didapat, tahap selanjutnya adalah
menerapkan data dan hasil analisa tersebut
4. HASIL DAN PEMBAHASAN ke dalam GUI (Graphical User Interface)
untuk memudahkan pembaca melihat hasil
4.1. Rancangan Sistem penelitian yang telah dilakukan.
Perancangan GUI yang dilakukan
Penulis melakukan perancangan sistem
menggunakan aplikasi Microsoft Access
informasi berupa GUI (Graphic User
2013 untuk menghasilkan tampilan GUI
Interface). Rancangan ini dibuat untuk para

19
Jurnal Informatika dan Bisnis

yang sederhana dan mudah dilihat oleh 1. Input Data Klasterisasi


pembaca. Dalam penerapan sistem GUI 2. Proses Implementasi GUI
penulis melakukan beberapa langkah, yaitu: 3. Spesifikasi Sistem

Gambar 3. Form Main Menu

20
Jurnal Informatika dan Bisnis

Gambar 4. Form Sub Menu

Gambar 5. Form Sub Menu 2

21
Jurnal Informatika dan Bisnis

Gambar 6. Form Sub Menu 3

Gambar 7. Form Data IPM 2004

Gambar 8. Form Hasil Cluster Data IPM 2004

22
Jurnal Informatika dan Bisnis

Gambar 9. Report Data IPM 2004 anggota cluster 0

Gambar 10. Report Data IPM 2004 anggota cluster 1

Gambar 11. Report Data IPM 2004 anggota cluster 2

23
Jurnal Informatika dan Bisnis

Gambar 12. Report Data IPM 2004 anggota cluster 3

Gambar 13. Report Data IPM 2004 anggota cluster 4

Gambar 14. Report Data IPM 2004 anggota cluster 5

24
Jurnal Informatika dan Bisnis

Gambar 15. Report Data IPM 2004 anggota cluster 6

Adapun hasil analisis penelitian yang Tinggi : IPM lebih dari 80.0
dilakukan oleh penulis adalah sebagai Menengah Atas : IPM antara 66.0 -
berikut: 79.9
Kategori IPM: Menengah Bawah : IPM antara 50.0 -
Konsep Pembangunan Manusia yang 65.9
dikembangkan oleh Perserikatan Bangsa- Rendah : IPM kurang dari
Bangsa (PBB), menetapkan peringkat 50.0
kinerja pembangunan manusia pada skala
0.0 - 100.0 dengan kategori sebagai berikut:

Gambar 25. Plot View Data IPM 2004-2012

Hasil analisa data IPM 2004-2012 anggota cluster 1 termasuk golongan rendah,
menunjukkan bahwa hasil penyebaran karena nilai IPM yang dimiliki kurang dari
cluster mengindikasikan anggota cluster 0 50.0, yaitu sebesar 49.5. Untuk melihat
termasuk golongan menengah atas, karena anggota cluster data IPM 2004-2012, dapat
nilai IPM yang dimiliki diantara 66.0 hingga dilihat pada tampilan report anggota cluster
79.9, yaitu sebesar 74.036. Sedangkan IPM 2004-2012 berikut.

25
Jurnal Informatika dan Bisnis

Gambar 26. Anggota Cluster 0 Data IPM 2004-2012

Gambar 27. Anggota Cluster 1 Data IPM 2004-2012

Gambar 28. Anggota Cluster 2 Data IPM 2004-2012

26
Jurnal Informatika dan Bisnis

Gambar 29. Anggota Cluster 3 Data IPM 2004-2012

Gambar 30. Anggota Cluster 4 Data IPM 2004-2012

Gambar 31. Anggota Cluster 5 Data IPM 2004-2012

27
Jurnal Informatika dan Bisnis

Gambar 32. Anggota Cluster 6 Data IPM 2004-2012

4.4. Implikasi Penelitian kabupaten-kabupaten di seluruh


Indonesia, serta memudahkan dalam
Penelitian ini memberikan implikasi mengetahui anggota-anggota cluster
bagi institusi yaitu dalam penelitian ini tersebut sesuai dengan nilai-nilai indeks
adalah BPS (Badan Pusat Statistik), antara yang dimiliki.
lain:
1. Menyediakan hasil 3. Metode klasterisasi (clustering) dalam
penelitian analisa dan klasterisasi memvisualisasikan hasil klasterisasi data
IPM. dalam penelitian ini menggunakan
2. Menerapkan metode algoritma K-Means Clustering dalam
klasterisasi IPM menggunakan bentuk Plot View, di mana dapat dilihat
algoritma K-Means Clustering. penyebaran nilai-nilai indeks ditiap-tiap
3. Menyediakan hasil cluster dapat memberikan gambaran
laporan clustering dalam mengenai perkembangan IPM dari tahun
pengolahan data IPM di masa 2004 hingga tahun 2012.
depan.
6. REKOMENDASI
5. SIMPULAN Dalam pembuatan penelitian tugas akhir ini,
Berdasarkan penelitian klasterisasi IPM penulis memberikan beberapa saran untuk para
dengan menggunakan algoritma K-Means pembaca sebagai bahan pertimbangan, antara
Clustering, penulis menyimpulkan berbagai hal lain sebagai berikut:
sebagai berikut: 1. Hasil klasterisasi data yang diperoleh
1. Hasil penelitian memberikan kemudahan penulis dari penelitian ini dilakukan
dalam mengelompokkan data karena dengan menggunakan data IPM secara
proses klasterisasi dilakukan dengan keseluruhan, dari tahun 2004 hingga
menggunakan algoritma K-Means tahun 2012, maka disarankan
Clustering, sehingga dapat diperoleh penggunaan data dapat dikurangi
hasil cluster dalam waktu yang relatif menjadi kurang lebih 5 tahun saja agar
singkat. memperoleh hasil yang efektif.

2. Dalam penelitian yang dilakukan, hasil 2. Hasil metode Clustering dengan


dari klasterisasi data dalam bentuk Plot algoritma K-Means Clustering memiliki
View memudahkan dalam mengetahui kekurangan, sehingga hasil yang
tinggi rendahnya nilai indeks yang diperoleh terkadang kurang optimal,
dijadikan indikator kesejahteraan dalam maka disarankan dapat menggunakan
tiap-tiap anggota cluster, yaitu metode pendukung atau algoritma

28
Jurnal Informatika dan Bisnis

Clustering selain yang digunakan oleh [4] Lakshmi, K.R. dan S. Prem Kumar (2013),
penulis untuk memperoleh hasil cluster Utilization of Data Mining Techniques for
yang optimal. Prediction of Diabetes Disease
Survivability, International Journal of
3. Rancangan GUI yang dibuat oleh Scientific & Engineering Research, Vol. 4,
penulis sengaja dibuat secara sederhana, Issue 6.
agar mudah dipahami dan digunakan
oleh setiap user, dan juga memakan [5] Laudon, Kenneth C. dan Jane P. Laudon
waktu yang relatif singkat karena (2012), Management Information Systems:
implementasi algoritma dilakukan Managing the Digital Firm, Edisi ke-12,
dengan segera. Apabila merasa kurang New Jersey: Pearson Prentice Hall.
berkenan mengenai rancangan GUI yang
telah dibuat oleh penulis, maka dapat [6] Madhulatha, T. Soni (2012), An Overview
dikembangkan atau ditambahkan sesuai on Clustering Methods, IOSR Journal of
dengan kebutuhan dan keinginan Engineering, Vol. 2(4) pp: 719-725.
pengembang selanjutnya agar tampilan
GUI dapat lebih diperbaiki. [7] Neuman, W. Lawrence (2014), Social
Research Methods: Qualitative and
4. Data yang digunakan oleh penulis hanya Quantitative Approaches, Edisi ke-7,
terbatas data IPM hingga tahun 2012 Harlow: Pearson Education Limited.
saja, maka disarankan bagi peneliti
selanjutnya dapat menambahkan data [8] Nurul Afifah (2014), Skripsi: Clustering
IPM beberapa tahun kedepan agar Data Indeks Pembangunan Manusia (IPM)
informasi mengenai Indeks Pulau Jawa Menggunakan Algoritma ST-
Pembangunan Manusia (IPM) semakin DBSCAN dan Bahasa Pemrograman R,
diperbaharui serta dapat menggunakan Bogor Agricultural University, Bogor.
metode klasterisasi yang lebih efektif
agar hasil yang diperoleh semakin [9] O’Brien, James A. dan George M. Marakas
kompleks dan optimal. (2010), Introduction to Information
Systems, Edisi ke-15, New York: McGraw-
7. DAFTAR REFERENSI Hill/Irwin.
[1] A. North, Matthew (2012), Data Mining for [10] Sofi Defiyanti dan Mohamad Jajuli (2015),
the Masses, Edisi ke-1, Georgia: Global “Integrasi Metode Klasifikasi Dan
Text Project. Clustering dalam Data Mining”, Konferensi
Nasional Informatika (KNIF).
[2] Abd. Rozak (2012), “Analisis
Pengelompokan (Clustering Analysis) [11] Stanton, Jeffrey dan Robert W. De Graaf
Dengan Metode K-Means Cluster”, Media (2013), Version 3: An Introduction to Data
Kampus: Jurnal Pendidikan, Vol. 7, No. 1, Science, New York: Creative Commons.
STKIP PGRI Jombang, Jombang.
[12] Wallace, Patricia (2015), Introduction to
[3] J. Zaki, Mohammed dan Wagner Meira JR Information Systems, Edisi ke-2, New
(2014), Data Mining and Analysis Jersey: Pearson.
Fundamentals Concepts dan Algorithms,
New York: Cambridge University Press. [13] Ye, Nong (2014), Data Mining: Theories,
Algorithms, and Examples, New York:
CRC Press.

29

Anda mungkin juga menyukai