kelompok bukan pada individu. Cara seperti ini baik sekali untuk dilakukan apabila tidak
terdapat atau sulit menentukan / menemukan kerangka sampel meski dapat juga dilakukan
pada populasi yang kerangka sampel sudah ada.
Pengambilan sampel dengan cara Cluster umum dilakukan pada populasi yg bersifat
terbatas (Finit) sementara itu untuk populasi yg jumlah dan identitas anggota populasi tak
diketahui (Infinit) pengambilan sampel biasa dilakukan secara tak acak (Non random
Sampling). Adapun yg termasuk pada cara ini adalah :
Quota Sampling : yaitu penarikan sampel yang hanya menekankan pada jumlah
sampel yang harus dipenuhi.
Pada Jurnal ini menggunakan metode Cluster Sampling, karena Clustering merupakan
salah satu metode data mining yang bersifat tanpa arahan (unsupervised). Clustering data
adalah proses dari pengelompokkan data berdasarkan similaritas atau kesamaan antara data.
Similaritas clustering dapat diaplikasikan untuk beberapa bidang, misalnya di bidang
penelitian pasar, clustering digunakan untuk membagi populasi umum dari konsumen-
konsumen ke dalam segmen pasar, pembagian pasar dan menentukan sasaran pasarnya.
Pada umumnya data yang digunakan untuk penggalian kaidah asosiasi sangatlah besar
dan terdapat variasi data yang sangat tinggi. Hal ini dapat mengurangi kualitas dari kaidah
yang dihasilkan. Oleh karena itu, pada penelitian ini digunakan cluster-based sampling untuk
melakukan clustering data, agar data yang digunakan untuk penggalian kaidah asosiasi sudah
terklaster dengan baik. Kemudian dari data yang terklaster tersebut, dilakukan pengambilan
sampel yang digunakan untuk penggalian kaidah asosiasi. Dengan menggunakan teknik
sampling ini diharapkan dapat meningkatkan kualitas dari kaidah yang dihasilkan.
Permasalahan yang dirumuskan dalam penelitian ini adalah bagimana membandingkan
kualitas kaidah-kaidah yang dihasilkan pada proses penggalian kaidah asosiasi multi obyektif
antara data yang dicluster dengan data yang tidak di-cluster, serta bagaimana mengetahui
algoritma yang lebih baik antara algoritma K-Means dan Fuzzy C Means untuk penggalian
kaidah asosiasi multi obyektif. Adapun tujuan dari penelitian ini adalah penggunaan cluster-
based sampling untuk penggalian kaidah asosiasi multi obyektif untuk membandingkan
kualitas kaidah-kaidah yang dihasilkan pada proses penggalian kaidah asosiasi multi obyektif
antara data yang dicluster dengan data yang tidak di-cluster. Dalam hal ini kualitas dari
kaidah yang lebih baik adalah yang mempunyai rata-rata nilai confidence yang lebih tinggi.
Serta membandingkan algoritma K-Means dan Fuzzy C-Means untuk penggalian kaidah
asosiasi multi obyektif.
Manfaat penelitian yang diajukan adalah bahwa data yang di-cluster akan
menghasilkan kaidah-kaidah yang lebih berkualitas dibandingkan dengan data yang tidak
melalui proses clustering. Dan mengetahui algoritma clustering yang lebih baik antara K-
Means dan Fuzzy C-Means untuk penggalian kaidah asosiasi multi objektif.
Sampel adalah sebahagian daripada bilangan dan ciri-ciri yang dimiliki oleh penduduk,
Sugiyono, 2005). Teknik pensampelan yang digunakan ialah teknik kelompok (contoh
sampling). Sugiyono (2005) menerangkan bahawa, teknik pensampelan ini digunakan untuk
menentukan sampel jika objek yang dikaji atau sumber data sangat luas, misalnya penduduk
dari negara, wilayah atau daerah. Untuk menentukan populasi yang akan digunakan sebagai
sumber data, sampel itu adalah berdasarkan kepada populasi penduduk yang telah ditetapkan.
Teknik pensampelan ini sering digunakan melalui 2 (dua) tahap, iaitu peringkat pertama
menentukan sampel serantau atau Syarikat Kerugian Insurans (Umum), dan tahap berikutnya
menentukan mereka yang berada di kawasan atau Underwriters yang bekerja di setiap
Syarikat Insurans Kerugian (Umum) dengan mengambil sampel juga . Hermawan (2005)
menerangkan bahawa jika anda ingin memilih kumpulan secara langsung dan menggunakan
semua elemen dalam kumpulan ini, maka dalam hal ini ia dipanggil satu tahap cluster
sampling. Tambahan pula, jika anda telah memilih elemen sampel secara rawak dari dalam
kumpulan dipilih, maka ini dipanggil dua tahap pensampelan kluster.
Pensampelan Kluster
Kawasan pensampelan atau kawasan sampingan digunakan jika sumber atau populasi
data sangat luas, contohnya penduduk wilayah, daerah, atau pekerja sebuah perusahaan yang
tersebar di seluruh wilayah. Untuk menentukan sampel mana yang digunakan, maka kawasan
populasi ditentukan secara rawak, dan menentukan bilangan sampel yang digunakan di setiap
kawasan ini menggunakan teknik persampelan rawak proporsional yang mengira jumlah yang
boleh berbeza.
Contoh:
sumber data sangat luas iaitu penduduk dari negara, negeri, zon dan daerah. Kaedah cluster
sampling telah dipilih dapat mengkaji populasi berdasarkan sampel responden untuk Zon
Utara. Kajian dilaksanakan terhadap responden di peringkat Zon Utara iaitu negeri Perlis,
Kedah, Pulau Pinang dan Perak. Cluster Sampling merupakan kaedah memilih sampel dari
kelompok unit – unit yang kecil atau cluster. Subpopulasi dari total populasi merupakan
populasi dari cluster. Tiap cluster mempunyai anggota yang heterogen mempunyai populasi
menentukan sampel jika sumber data sangat luas, contohnya penduduk dari
sebuah negara, negeri, zon dan daerah. Malaysia mempunyai 14 buah negeri
Utara yang terdiri daripada negeri Perlis, Kedah, Pulau Pinang dan Perak.
populasi pelajar SMU di suatu kota. Untuk random tidak dilakukan langsung
pada semua pelajar-pelajar tetapi pada sekolah/kelas sebagai kelompok atau
cluster.
Teknik sampling daerah ini sering digunakan melalui dua tahap, yaitu tahap
orang-orang yang ada pada daerah itu secara sampling juga. Teknik ini dapat