Anda di halaman 1dari 7

CLUSTERING K- MEANS ANALYSIS

(Studi Kasus : Koleksi Perpustakaan)

Warnia Nengsih
Department of Computer Politeknik Caltex Riau Indonesia
Email: warnia@pcr.ac.id

Abstrak

Koleksi perpustakaan merupakan salahsatu indikator untuk menentukan kualitas sebuah perpustakaan .Semakin
lengkap koleksi dan memenuhi kebutuhan pengunjungnya menjadi magentik tersendiri akan keberadaan
perpustakaan tersebut. Tentunya pengelola perpustakaan harus memperhatikan aspek pengadaaan koleksi ini.
Untuk mewujudkan pengadaan koleksi sehingga keefektifan dan konsep tepat guna bisa diperoleh maka perlu
adanya analysis pengadaan kebutuhan koleksi perpustakaan. Penelitian ini menggunakan teknik k-means
clustering untuk menentukan koleksi apa yang diminati oleh pengunjung sehingga membantu dalam penentuan
kebijakan pengadaan koleksi. diperoleh sembilan kriteria masuk ke dalam cluster 5 (koleksi audio visual), tujuh
kriteria masuk ke dalam cluster 4 (koleksi serial) dan terdapat delapan kriteria masuk ke dalam cluster 2 (koleksi
referensi ). Sehingga dari hasil kmeans clustering diperoleh analisis bahwa pengadaan koleksi lebih fokus pada
jenis koleksi audio visual, koleksi serial dan koleksi referensi serta koleksi umum. Koleksi fiksi dan koleksi digital
tidak perlu dilakukan penambahan karena minat pengunjung untuk jenis koleksi ini sangat kecil.

Keywords: K-means,clustering, pengadaaan koleksi, perpustakaan

A. Pendahuluan
Pengadaan koleksi yang tepat sasaran pada sebuah Dalam rangka mewujudkan hal tersebut perlu
perpustakaan menjadi sebuah keharusan. Sehingga adanya analisis lebih dalam dengan menggunakan k-
pengadaan koleksi tidak hanya sebagai upaya untuk means clustering. K-Means clustering merupakan
menambah kuantitas saja tetapi juga harus dlihat salahsatu teknik data mining yang memberikan
dari aspek kualitas dan aspek kemanfaatannya. deskripsi cluster sebuah item. Sehingga hasil
simulasi memberikan pengetahuan tentang
Aspek tepat gunanya harus disesuaikan dengan kebijakan pengadaan koleksi pada sebuah
kebutuhan pengunjung dan harus disesuaikan perpustakaan.
dengan kebutuhan budaya serta karakteristik dari
pengguna. Kesulitan dalam menentukan jenis B. Dasar Teori
koleksi apa yang seharusnya perlu menjadi prioritas 1. Koleksi perpustakaan
untuk diperbanyak atau tidak, harus menjadi Koleksi perpustakaan merupakan salahsatu
pengetahuan penting bagi para pengelola indikator kualitas sebuah perpustakaan.
perpustakaan. Pengelola perpustakaan harus Perpustakaan yang mempunyai koleksi dengan
memiliki pengetahuan berdasarkan data kuantitas dan jenis koleksi yang beragam menjadi
pengunjung, sehingga tidak terjadi kesalahan dalam sebuah keharusan, karena seyogyanya konsep
pengadaan. perpustakaan sebagai media untuk memperoleh
ilmu. Bagaimanapun bentuk dan formatnya jika
item-item tersebut dimanfaatkan dan mempunyai lengkap dan banyak jenis koleksi menjadi daya
nilai guna bagi pengunjung perpustakaan , maka magnet bagi pengunjung di samping hal-hal lain
definisi tersebut sudah mengarah pada koleksi tentunya seperti faktor kenyamanan dan faktor
perpustakaan. pelayanan. Namun koleksi merupakan faktor
internal yang harus menjadi perhatian manajemen
Kohar (2003) mengatakan, Koleksi perpustakaan perpustakaan sehingga tercapainya tujuan
adalah yang mencakup berbagai format bahan sesuai perpustakaan. Pemilihan koleksi dan jumlah harus
dengan perkembangan dan kebutuhan alternatif para berdasarkan kriteria data pengunjung perpustakaan
pemakai perpustakaan terhadap media rekam tersebut , sehingga pengadaan koleksi tidak sebatas
informasi. pengadaan biasa, namun pengadaan dilakukan
sesuai dengan kebutuhan. Maka seyogyanya
Beragam jenis koleksi perpustakaan adalah : pengadaan tersebut harus menyesuaikan dengan
a. Koleksi umum prilaku pengunjung yang sudah ada.
Koleksi umum bisa berbentuk cetak dan
tercetak tidak terbatas untuk semua bidang, Kegiatan ini disebut juga dengan pengembangan
namun bisa dipinjamkan dan tidak harus koleksi. Ada dua hal penting yang harus
diakses dilingkungan perpustakaan. diperhatikan dalam pengembangan koleksi yaitu
b. Koleksi Referensi kegiatan pemilihan dan pengadaan. Tentunya dua
Koleksi yang bisa berbentuk cetak dan tercetak kegiatan ini tetap mengacu pada konsep sesuai
tidak terbatas untuk semua bidang, dengan dengan kebutuhan pengunjung.
jumlah yang terbatas dan sifat yang terbatas
sehingga hanya bisa digunakan oleh Sejumlah kegiatan yang berkaitan dengan
pengunjung di area perpustakaan seperti kamus, penentuan dan koordinasi kebijakan seleksi, menilai
ensiklopedia, biografi. kebutuhan pemakai, pemakaian koleksi, evaluasi
c. Koleksi Fiksi /non fiksi koleksi, identifikasi kebutuhan koleksi, seleksi
Merupakan koleksi buku yang pada umumnya bahan pustaka, perencanaan kerjasama sumberdaya
termasuk ke dalam kategori koleksi umum koleksi, pemeliharaan koleksi, dan penyiangan
d. Koleksi serial koleksi perpustakaan itu merupakan definisi dari
Seperti jurnal, buletin, terbitan berkala , komik konsep pengembangan koleksi menurut Kohar
serial,majalah, surat kabar atau laporan berkala (2003).
dan sebagainya
e. Koleksi audio visual Menurut buku Perpustakaan Perguruan Tinggi
Seperti film, format CD ,gambar, mp3, (2004), Tujuan pengembangan koleksi
mp4,video , lukisan , piringan hitam dan perpustakaan perlu dirumuskan dan disesuaikan
sebagainya. dengan kebutuhan sivitas akademika di perguruan
f. Koleksi digital tinggi agar perpustakaan dapat secara terencana
Seperti e-book, e-journal dan sebagainya mengembangkan koleksinya. Hal itu berarti bahwa
pengadaan koleksi harus disesuaikan dengan
Koleksi yang lengkap biasanya identik dengan karakter, budaya dan kebutuhan penggunanya.
pengunjung pada perpustakaan tersebut. Semakin
Menurut Sutarno NS (2006), manfaat ditentukan dan dibatasi, hal ini berarti bahwa boleh
pengembangan koleksi antara lain : memilih sembarang objek untuk penentuan titik
1. Membantu menetapkan metode untuk menilai tengah cluster. Berikut merupakan langkah-langkah
bahan pustaka yang harus dibeli. pada k-means.
2. Membantu merencanakan bentuk-bentuk kerja
sama dengan perpustakaan lain, seperti pinjam Seperti yang terlihat pada gambar 1 maka algoritma
antar perpustakaan, kerjasama dalam k-means clustering sebagai berikut :
pengadaan, dan sebagainya. 1. Menentukan jumlah cluster.
3. Membantu identifikasi bahan pustaka yang 2. Menentukan pusat baru cluster
perlu dipindahkan ke gudang atau dikeluarkan 3. Menghitung jarak terdekat dengan
dari koleksi. menggunakan nilai euclidean.
4. Membantu dalam merencanakan anggaran 4. Menampilkan hasil berdasarkan jarak yang
jangka panjang dengan menetapkan prioritas- terendah yang dihasilkan.
prioritas dan garis besar sasaran 5. Jika belum ditemukan hasil yang sesuai , iterasi
pengembangan. akan dilanjutkan , namun jika sudah ditemukan,
5. Membantu memilih cara terbaik untuk hasil akan dilanjutkan.
pengadaan.
Adapun formula untuk mencari nilai euclidean
adalah :
Semua kegiatan untuk menambah atau mengadakan
koleksi dengan melakukan pemilihan dan penilaian
start
koleksi disebut dengan pengembangan koleksi.
Menurut buku Perpustakaan Perguruan Tinggi
Tentukan
(2004), kebijakan pengembangan koleksi didasari
jumlah cluster
atas beberapa asas yaitu :

1. Relevan dengan kebutuhan pengguna Pusat cluster


2. Berorientasi kepada kebutuhan pengguna
3. Kelengkapan
Hitung nilai euclidean
4. Kemutakhiran

2. Algoritma K-Means Kelompokkan obyek berdasar


K-Means adalah salah satu metode data clustering jarak minimum

non hirarki yang mempartisi data ke dalam bentuk


satu atau lebih cluster/kelompok, sehingga data
Nilai sudah Belum
yang memiliki karakteristik yang sama
diperoleh
dikelompokkan dalam satu cluster yang sama dan
data yang memiliki karakteristik berbeda
Sudah
dikelompokkan ke dalam kelompok lain menurut
Agusta ( 2007). Pada algoritma ini akan ditentukan end

terlebih dahulu jumlah cluster yang untuk kategori Gambar 1. Flowchart algoritma K-Means clustering
data dan pemilihan centroid point tidak harus
referensi),clsuter 3 (koleksi fiksi), cluster 4 (koleksi
serial),cluster 5(koleksi audio visual), cluster 6
(koleksi digital). Sehingga dari hasil simulasi
diperoleh analisa jenis koleksi yang menjadi fokus
dimana : untuk pengadaan serta jenis koleksi apa yang tak
dij = Jarak objek perlu ditambah.
P = Dimensi data
Berikut meruapakan flowchart sistem :
Xik = Koordinat dari obyek i
Xjk = Koordinat dari obyek j
Mulai

Sementara untuk mencari nilai pusat cluster baru


dapat menggunakan rumus Data Pengunjung
perpustakaan

K-means clustering

C. Implementasi dan Hasil

Hasil Pengolahan
Pengadaan kebutuhan koleksi perpustakaan, jenis
koleksi apa yang perlu ditambah dan yang tidak
perlu ditambah,sehingga pengadaan koleksi sesuai
dengan kebutuhan pengunjung pada perpustakaan . Selesai
Analisa menggunakan k-means clustering akan
membantu pengelola perpustakaan dalam
Gambar 2. Flowchart sistem
mendefinisikan kebutuhan untuk tercapainya nilai
Tabel 1 menunjukkan data pengunjung
tepat guna dan tepat sasaran.
perpustakaan yang akan diolah dengan
menggunakan k-means clustering, simulasi
Pada penelitian ini data yang diolah berdasarkan berdasarkan empat variabel yang berkaitan dengan
data pengunjung perpustakaan. Simulasi pengunjung perpustakaan
berdasarkan usia, gender, pekerjaan dan level
Tabel 1 data pengunjung perpustakaan
pendidikan pengunjung. Dari data pengunjung dan
empat variabel tersebut akan ditentukan bahwa
pengunjung dengan kriteria tertentu lebih dominan
untuk melakukan peminjaman jenis koleksi tertentu.
Terdapat enam cluster yang ditentukan diantaranya
cluster 1 (koleksi umum) ,Cluster 2 (Koleksi
Berdasarkan data pusat cluster baru, selanjutnya
menentukan jarak terdekat setiap cluster seperti
yang ditunjuk pada tabel 2

Tabel 3 Jarak setiap data pada pusat cluster

6,0827625 5,1962 4,582576 4,69041576 5,385165 5,744563


3,8729833 2,2361 1,732051 2,44948974 3,872983 4,795832
3 1,7321 1 2,44948974 4,123106 5,385165
3,1622777 2,4495 2,44949 3,60555128 5,09902 6
4,6904158 3,1623 2,44949 2,64575131 3,741657 4,690416
4,3588989 3 2,645751 3,16227766 4,358899 5,196152
5,4772256 4,2426 3,741657 3,87298335 4,690416 5,477226
2,4494897 1,4142 2,44949 3,87298335 5,477226 6,63325
5,6568542 4,4721 3,464102 3,31662479 4 4,242641
6,4807407 4,6904 3,162278 1,73205081 1,414214 2
4,472136 3,4641 2,828427 3,31662479 4,472136 5,09902
7,0710678 5,4772 4,242641 3,31662479 3,162278 3,464102
4,1231056 2,6458 1 1,41421356 3 4,358899
4,2426407 3,1623 2,44949 3 4,242641 5,477226
5,5677644 4,1231 3,316625 3,16227766 3,872983 4,358899
5,6568542 4,4721 3,464102 3,31662479 4 5,09902
6,7082039 5,1962 3,605551 2,44948974 2,236068 3
Dari data tersebut tentukan jumlah cluster kemudian 6,0827625 4,3589 3 2 2,236068 3,316625
tentukan pusat cluster acak. 4,6904158 3,1623 2,44949 2,64575131 3,741657 4,472136
4,472136 3,4641 2,828427 3,31662479 4,472136 5,09902
1 1,7321 3 4,69041576 6,403124 7,681146
Tabel 2 Pusat cluster acak 2,4494897 1,4142 1,414214 3 4,690416 6
3,3166248 2,2361 2,645751 3,74165739 5,196152 6,557439
3,8729833 2,2361 1,732051 2,44948974 3,872983 5,196152

Berikut merupakan hasil cluster sementara , pada


tabel 4 terlihat tujuh data pada cluster 1, delapan
data pada cluster 2, satu data pada cluster 3, enam
data pada cluster 4, dua data pada cluster 5.

Tabel 4 Hasil cluster sementara


Iterasi dilanjutkan sampai ditemukan hasil cluster yang sama.

Tabel 5 Hasil cluster akhir

Tabel 5 merupakan hasil cluster akhir setelah


melalui beberapa iterasi, diperoleh sembilan kriteria D. Kesimpulan
masuk ke dalam cluster 5 (koleksi audio visual), Pengunjung dengan kriteria tertentu lebih dominan
tujuh kriteria masuk ke dalam cluster 4 (koleksi untuk melakukan peminjaman jenis koleksi tertentu.
serial) dan terdapat delapan kriteria masuk ke dalam Terdapat sembilan kriteria yang masuk ke dalam c5
cluster 2 (koleksi referensi ). Sehingga dari hasil k (koleksi audio visual), tujuh kriteria yang masuk ke
means clustering diperoleh analisis bahwa dalam c4( koleksi serial) dan delapan kriteria yang
pengadaan koleksi lebih fokus pada jenis koleksi masuk ke dalam c2 ( koleksi referensi). Koleksi fiksi
audio visual, koleksi serial dan koleksi referensi dan koleksi digital tidak perlu dilakukan
serta koleksi umum. Koleksi fiksi dan koleksi digital penambahan karena minat pengunjung untuk jenis
tidak perlu dilakukan penambahan karena minat koleksi ini sangat kecil.
pengunjung untuk jenis koleksi ini sangat kecil.
DAFTAR PUSTAKA

[1] Darmono. 2001. Manajemen dan Tata Kerja


Perpustakaan Sekolah. Jakarta: Grasindo.

[2] Garcia-Molina, Hector; Ullman, JD., & Widom,


Jennifer. 2002. Database systems the complete
book, International edition. New Jersey, Prentice
Hall.
[3] Bafadal, Ibrahim. 2008. Pengelolaan
Perpustakaan Sekolah. Jakarta: Bumi Aksara.

[4] Pal, Shankar K & Mitra, Pabitra. 2004. Pattern


Recognition algorithms for data mining. CRC
Press.

[5] Yusuf, Pawit M dan Suhendar, Yaya. 2005.


Pedoman Penyelenggaraan Perpustakaan
Sekolah. Jakarta: Kencana.

[6] Wright, Peggy , Knowledge Discovery In


Databases: Tools and Techniques,
http://www.acm.org/crossroads/xrds5-
2/kdd.html#11
[7] Tan, Pang-Ning,; Steinbach,Michael; Kumar
,Vipin. Data Mining Cluster Analysis: Basic
Concepts and Algorithms. www-
users.cs.umn.edu/ ~kumar /dmbook/-16k.

[8] J. A. Hartigan (1975) Clustering Algorithms.


Wiley. J. A. Hartigan and M. A. Wong (1979).
A K-Means Clustering Algorithm. Applied
Statistics 28 (1): 100108.

[9] Teknomo, Kardi. Numerical Example of K-


Means Clustering,
http://people.revoledu.com/kardi/tutorial/kMe
an/NumericalExample.htmNu
[10] Berkhin, Pavel. Survey on clustering data
mining techniques,
http://www.ee.ucr.edu/~barth/EE242/clusterin
g_survey.pdf

[11] William, Graham, Data Mining Cluster,


http://datamining.anu.edu.au/student/math334
6_2005/ 050809-maths3346-clusters-2x2.pdf

[12] http://yudiagusta /k-means/

Anda mungkin juga menyukai