Anda di halaman 1dari 7

Cluster Sampling adalah teknik pengambilan sampel dimana pemilihan mengacu pada

kelompok bukan pada individu. Cara seperti ini baik sekali untuk dilakukan apabila tidak
terdapat atau sulit menentukan / menemukan kerangka sampel meski dapat juga dilakukan
pada populasi yang kerangka sampel sudah ada.

Pengambilan sampel dengan cara Cluster umum dilakukan pada populasi yg bersifat
terbatas (Finit) sementara itu untuk populasi yg jumlah dan identitas anggota populasi tak
diketahui (Infinit) pengambilan sampel biasa dilakukan secara tak acak (Non random
Sampling). Adapun yg termasuk pada cara ini adalah :

 Quota Sampling : yaitu penarikan sampel yang hanya menekankan pada jumlah
sampel yang harus dipenuhi.

 Purposive Sampling : yaitu pengambilan sampel hanya pada individu yg didasarkan


pada pertimbangan dan karakteristik tertentu.

 Accidental Sampling : yaitu pengambilan sampel dengan jalan mengambil individu


siapa saja yang dapat dijangkau atau ditemui.

Pada Jurnal ini menggunakan metode Cluster Sampling, karena Clustering merupakan
salah satu metode data mining yang bersifat tanpa arahan (unsupervised). Clustering data
adalah proses dari pengelompokkan data berdasarkan similaritas atau kesamaan antara data.
Similaritas clustering dapat diaplikasikan untuk beberapa bidang, misalnya di bidang
penelitian pasar, clustering digunakan untuk membagi populasi umum dari konsumen-
konsumen ke dalam segmen pasar, pembagian pasar dan menentukan sasaran pasarnya.

Pada umumnya data yang digunakan untuk penggalian kaidah asosiasi sangatlah besar
dan terdapat variasi data yang sangat tinggi. Hal ini dapat mengurangi kualitas dari kaidah
yang dihasilkan. Oleh karena itu, pada penelitian ini digunakan cluster-based sampling untuk
melakukan clustering data, agar data yang digunakan untuk penggalian kaidah asosiasi sudah
terklaster dengan baik. Kemudian dari data yang terklaster tersebut, dilakukan pengambilan
sampel yang digunakan untuk penggalian kaidah asosiasi. Dengan menggunakan teknik
sampling ini diharapkan dapat meningkatkan kualitas dari kaidah yang dihasilkan.
Permasalahan yang dirumuskan dalam penelitian ini adalah bagimana membandingkan
kualitas kaidah-kaidah yang dihasilkan pada proses penggalian kaidah asosiasi multi obyektif
antara data yang dicluster dengan data yang tidak di-cluster, serta bagaimana mengetahui
algoritma yang lebih baik antara algoritma K-Means dan Fuzzy C Means untuk penggalian
kaidah asosiasi multi obyektif. Adapun tujuan dari penelitian ini adalah penggunaan cluster-
based sampling untuk penggalian kaidah asosiasi multi obyektif untuk membandingkan
kualitas kaidah-kaidah yang dihasilkan pada proses penggalian kaidah asosiasi multi obyektif
antara data yang dicluster dengan data yang tidak di-cluster. Dalam hal ini kualitas dari
kaidah yang lebih baik adalah yang mempunyai rata-rata nilai confidence yang lebih tinggi.
Serta membandingkan algoritma K-Means dan Fuzzy C-Means untuk penggalian kaidah
asosiasi multi obyektif.

Manfaat penelitian yang diajukan adalah bahwa data yang di-cluster akan
menghasilkan kaidah-kaidah yang lebih berkualitas dibandingkan dengan data yang tidak
melalui proses clustering. Dan mengetahui algoritma clustering yang lebih baik antara K-
Means dan Fuzzy C-Means untuk penggalian kaidah asosiasi multi objektif.
Sampel adalah sebahagian daripada bilangan dan ciri-ciri yang dimiliki oleh penduduk,
Sugiyono, 2005). Teknik pensampelan yang digunakan ialah teknik kelompok (contoh
sampling). Sugiyono (2005) menerangkan bahawa, teknik pensampelan ini digunakan untuk
menentukan sampel jika objek yang dikaji atau sumber data sangat luas, misalnya penduduk
dari negara, wilayah atau daerah. Untuk menentukan populasi yang akan digunakan sebagai
sumber data, sampel itu adalah berdasarkan kepada populasi penduduk yang telah ditetapkan.
Teknik pensampelan ini sering digunakan melalui 2 (dua) tahap, iaitu peringkat pertama
menentukan sampel serantau atau Syarikat Kerugian Insurans (Umum), dan tahap berikutnya
menentukan mereka yang berada di kawasan atau Underwriters yang bekerja di setiap
Syarikat Insurans Kerugian (Umum) dengan mengambil sampel juga . Hermawan (2005)
menerangkan bahawa jika anda ingin memilih kumpulan secara langsung dan menggunakan
semua elemen dalam kumpulan ini, maka dalam hal ini ia dipanggil satu tahap cluster
sampling. Tambahan pula, jika anda telah memilih elemen sampel secara rawak dari dalam
kumpulan dipilih, maka ini dipanggil dua tahap pensampelan kluster.

Penduduk kajian terdiri daripada 85 syarikat dalam Industri Asuransi Kerugian


(Umum) di Indonesia hari ini. Dengan kaedah persampelan kluster satu tahap, dengan
kesilapan 5%, jumlah sampel adalah 68. Menurut Hermawan (2005) bahawa dalam
persampelan kluster, kumpulan yang dibentuk mestilah heterogen. Manakala populasi
syarikat dalam Industri Insurans (Jeneral) di Indonesia kini terdiri daripada 2 kumpulan, iaitu
Syarikat Persendirian Nasional dan Syarikat Usaha Sama. Pada umumnya, penaja jamin
dalam Syarikat Insurans (Umum) di Indonesia pada amnya hanya dibahagikan kepada 2
Subdivisi, termasuk Penaja Jamin Penaja Penaja Marin dan Bukan Marin. Berdasarkan ini,
jumlah sampel penaja jamin Syarikat dalam Industri Insurans Kerugian (am) adalah 136
orang. Dengan menggunakan dua tahap persampelan kluster, sampel yang diperoleh adalah
100.

Pensampelan Kluster

Kawasan pensampelan atau kawasan sampingan digunakan jika sumber atau populasi
data sangat luas, contohnya penduduk wilayah, daerah, atau pekerja sebuah perusahaan yang
tersebar di seluruh wilayah. Untuk menentukan sampel mana yang digunakan, maka kawasan
populasi ditentukan secara rawak, dan menentukan bilangan sampel yang digunakan di setiap
kawasan ini menggunakan teknik persampelan rawak proporsional yang mengira jumlah yang
boleh berbeza.
Contoh:

Penyelidik ingin mengetahui tahap keberkesanan proses pengajaran dan pembelajaran


di peringkat sekolah menengah. Populasi kajian adalah pelajar sekolah menengah di seluruh
Indonesia. Kerana bilangannya sangat besar dan dibahagikan kepada pelbagai wilayah,
penentuan sampel dilakukan di peringkat berikut

Langkah pertama ialah menentukan kawasan sampel. Sebagai contoh, 10 wilayah


secara rawak ditugaskan untuk dijadikan sampel.

Peringkat kedua. Mengambil sampel SMU di peringkat wilayah secara rawak,


kemudian dirujuk sebagai sampel provinsi. Kerana provinsi ini terdiri dari kabupaten / kota,
SMU tingkat kabupaten secara rawak dibuat yang akan ditetapkan sebagai sampel (disebut
daerah sampel), dan seterusnya, ke tingkat kelurahan / desa yang akan dicontoh. Apabila
digabungkan, keseluruhan sekolah tinggi yang dicontohkan dijangka menerangkan
keseluruhan populasi secara keseluruhan.
Kaedah Cluster sampling merupakan teknik kelompok untuk menentukan sampel jika

sumber data sangat luas iaitu penduduk dari negara, negeri, zon dan daerah. Kaedah cluster

sampling telah dipilih dapat mengkaji populasi berdasarkan sampel responden untuk Zon

Utara. Kajian dilaksanakan terhadap responden di peringkat Zon Utara iaitu negeri Perlis,

Kedah, Pulau Pinang dan Perak. Cluster Sampling merupakan kaedah memilih sampel dari

kelompok unit – unit yang kecil atau cluster. Subpopulasi dari total populasi merupakan

populasi dari cluster. Tiap cluster mempunyai anggota yang heterogen mempunyai populasi

sendiri (Nazir, 1998:311)

Kaedah cluster sampling digunakan apabila populasi terdiri dari kelompok-

kelompok individu atau cluster. Kaedah cluter sampling digunakan untuk

menentukan sampel jika sumber data sangat luas, contohnya penduduk dari

sebuah negara, negeri, zon dan daerah. Malaysia mempunyai 14 buah negeri

tetapi dalam kajian yang dilaksanakan hanya memfokuskan terhadap Zon

Utara yang terdiri daripada negeri Perlis, Kedah, Pulau Pinang dan Perak.

Indonesia memiliki 34 propinsi dan akan menggunakan 10 propinsi.

Pengambilan 10 propinsi itu dilakukan secara random. Tetapi perlu diingat,

karena propinsi-propinsi di Indonesia itu berstrata maka pengambilan

sampelnya perlu menggunakan stratified random sampling. Contoh tersebut

dikemukakan oleh Sugiyono sedangkan contoh lainnya dikemukakan oleh

Margono (2004: 127). Ia mencotohkan bila penelitian dilakukan terhadap

populasi pelajar SMU di suatu kota. Untuk random tidak dilakukan langsung
pada semua pelajar-pelajar tetapi pada sekolah/kelas sebagai kelompok atau

cluster.

Teknik sampling daerah ini sering digunakan melalui dua tahap, yaitu tahap

pertama menentukan sampel daerah, dan tahap berikutnya menentukan

orang-orang yang ada pada daerah itu secara sampling juga. Teknik ini dapat

digambarkan di bawah ini.

Gambar 2. Teknik Cluster Random Sampling (Sugiyono, 2001: 59)

Anda mungkin juga menyukai