1
BIASES DAN
NON SAMPLING ERROR (1)
Bias dan Non Sampling Error
Bias merupakan systematic errors, kaitan dengan
variable errors
Bias dan non sampling error harus dipikirkan karena
mempunyai pengaruh yang besar terhadap total error
2
NON SAMPLING ERROR (1)
Non sampling error dipengaruhi oleh :
a. Kesalahan konsep -definisi
b. Daftar isian yang kurang baik dan pedoman yang tidak
jelas
c. Kualifikasi petugas
d. Pelatihan petugas lemah
e. Responden tidak cooperative
3
NON SAMPLING ERROR (2)
f. Pengawasan dan atau pemeriksaan serta monitoring
tidak dilakukan/ lemah
g. Editing & coding tidak dilakukan dengan baik
h. Kesalahan perekaman data
i. Lainnya
4
Hubungan Variable Sampling
Error dan Bias (1)
E y c Y tr u e 2
E y Y
E yc E yc
2
c tr u e
2
5
Hubungan Variable Sampling
Error dan Bias (2)
Teknik sampling
prosedur estimasi
tingkat presisi yang digambarkan dengan RSE
Accuracy & precission
precission : small variable error
accuracy : small total errors
6
Hubungan Variable Sampling Error
dan Bias (3)
Suatu desain dapat dikategorikan :
Accurate (akurasi), yg berkaitan dengan total error. Suatu
design dikatakan accurate bila mempunyai total error kecil
Precise (yang berkaitan dengan variable error),tapi
tidak accurate.Suatu design misalnya mempunyai sampling
error kecil akan tergolong dalam design yg mempunyai presisi
yang baik
Tidak keduanya
7
Dapat juga dikategorikan
8
Gb : Hubungan VE dan Bias
9
Gambar : Hubungan VE dan Bias (1)
Keterangan:
1 bias dari C
2 bias dari A:
y c : nilai rata-rata APS ke C
Sebaran yang paling bagus dari A,B,C dan D
adalah D, karena sebarannya tidak menyebar dan
melewati D termasuk accuracy tinggi
10
Hubungan VE dan Bias (2)
C: reliability-nya cukup baik (sampling error
kecil tapi bias cukup besar)
- Bisa terjadi seperti survey dengan sample besar
(dengan telpon) tetapi sample yang masuk belum tentu
mewakili populasi/ non respon besar
- Terjadi juga pada mailing system (dengan post) atau
framenya salah kategori.
11
Hubungan VE dan Bias (3)
12
Gambar 1: Bagan Jenis Kesalahan/Bias
Kesalahan/Bias
13
Sumber-sumber Bias/
kesalahan
1. Sampling Bias (Bias Sampling):
a. Frame biases
b. “Consistent” sampling biases
c. Constant statistical bias
2. Non Sampling Biases (Bias Di Luar Sampling):
a. Non Observation (Di luar Observasi)
- Non Coverage
- Non response
b. Observation (dalam Observasi)
- Field : data collection
- Office : data processing
14
Sampling Bias
(1) “Frame biases “
Bias terjadi karena penggunaan kerangka
sampel yang salah.
Contoh : digunakan kerangka sampel yang
bukan data mutahir, penggunaan data
pendukung yang salah (menggunakan PPS
sampling tetapi size tidak ada korelasi dengan
data yang kita amati) atau definisi frame tidak
sesuai dengan unit analisis
15
Sampling Bias (2)
Bias yang menyangkut penghitungan, seperti
dalam Consistent Sampling Biases dan Constant
Statistical Biases, dapat diatasi pada saat
estimasi, yaitu pada saat penetapan faktor pengali
dan penimbang. Sehingga hal ini dapat diamati
sepanjang data yang digunakan dari hasil survei
benar atau data yang digunakan sebagai
pendukung akurat, misal data untuk penimbang.
16
“Consistent” sampling biases
Estimasi yang konsisten :
Klaster
y
*
M y
i i
M i
Rasio estimate y
r
x
17
Constant statistical biases
y
r
i 1 x
Estimasi rasio
y r
18
Non Sampling Bias (Bias di
Luar Sampling)
19
Non Sampling Bias (Bias di
Luar Sampling)
Non sampling error akan makin besar bila
banyaknya sampel makin besar, karena secara
otomatis pengumpulan data akan berhadapan
dengan lebih banyak responden dan lebih banyak
petugas. Dengan demikian peluang untuk adanya
kesalahan makin besar, apalagi bila dilakukan suatu
sensus lengkap.
Oleh karena itu dalam Sensus Lengkap, variabel yang
dikumpulkan tidak boleh terlalu banyak. Pada
kenyataan sering tidak dapat dihindari karena
konsumen membutuhkan banyak jenis data untuk
berbagai keperluan.
20
Bias di Luar Sampling (2)
Sampling Error
21
Non Sampling Bias (Bias di
Luar Sampling)
Dari gambar di atas dapat dilihat pengaruh banyaknya
sampel (n) terhadap besarnya error:
Ditinyau dari segi sampling error, makin besar
sampel kesalahan makin kecil, dan akan
menjadi nol untuk suatu sensus (pencacahan
lengkap).
Ditinjau dari segi non sampling error, makin besar
sampel kesalahan makin besar dan tidak terkontrol
apabila pengumpulan data tidak dilakukan secara
baik ditinjau dari semua aspek tahapan pengumpulan
dan pengolahan data.
22
Non Sampling Bias (Bias di
Luar Sampling)
Besarnya sampling error jauh lebih mudah
dikontrol terutama bila tersedia kerangka sampel
dan data pendukung yang baik.
Besarnya non sampling error jauh lebih sulit
mengontrolnya dibanding sampling error karena
tergantung dari berbagai aspek baik dari
pengelola pengumpulan data, petugas maupun
respondennya sendiri
23
Non Sampling Bias (Bias di
Luar Sampling)
Dalam suatu pelaksanaan survei, kesalahan
digambarkan sebagai berikut:
Total kesalahan = Kesalahan sampling +
Kesalahan di luar sampling
Usahakan total kesalahan atau total error
sekecil mungkin.Ditinjau dari segi penggunaan
metode sampling, khusus dalam pelaksanaan
survei sampel kondisi pada kesalahan yang
digambar pada B akan mempunyai total error
paling kecil. Hal dapat diperkirakan pada saat
perencanaan.
24
Non Sampling Bias (Bias di
Luar Sampling)
Pada kondisi A kesalahan karena sampling cukup
besar, tetapi kesalahan karena non sampling error
kecil, karena banyaknya sampel tidak memenuhi
syarat.
Sebaliknya pada kondisi C kesalahan karena
sampling cukup kecil tetapi non sampling error
besar.
Pada desain sampel yang dicari kondisi B
dengan persyaratan survei dilaksanakan dengan
baik.
25
Sumber-sumber Kesalahan di Luar
Sampling (Non Sampling Error)
26
Kesalahan Pengumpulan Data
27
Kesalahan Pengumpulan Data
Penetapan petugas yang terus menerus untuk
suatu jenis survei juga sering mengakibatkan
sumber dari kesalahan antara lain disebabkan:
Petugas menganggap dirinya sudah
memahami materi survei, sehingga tidak serius
dalam pelatihan. Adanya penyempurnaan atau
perubahan konsep misalnya menjadi tidak
dihiraukan.
28
Kesalahan Pengumpulan Data
Petugas telah jenuh dengan pengumpulan data,
sehingga tidak serius dalam pengumpulan data.
Petugas telah hafal dengan pertanyaan pada
kuesioner dan jawaban yang umum dari
responden,sehingga ada kecenderungan untuk
mengarahkan jawaban dari responden. Kejadian
yang paling gawat, petugas memperkirakan
sendiri jawaban responden. Responden lainnya
diperkirakan jawaban dengan melihat kondisi
dari luar.
29
Contoh Kasus (1)
Pada suatu blok sensus terpilih terdapat
beberapa penjual gado-gado, maka petugas
hanya mencacah 2 atau 3 penjual dan lainnya
tidak dilakukan wawancara hanya diwawancari
nama saja. Langkah lanjut isian kuesioner
lainnya dimodifikasi.
Kasus ini terjadi pula pada misalnya usaha
sablon, usaha angkot, dan sebagainya.
Kasus lain bahkan lebih parah yaitu
konsumsi/pengeluaran rumahtangga
diperkirakan sendiri oleh petugas
30
Contoh Kasus (2)
Kejadian semacam itu apabila terus menerus
dilakukan akan menyebabkan data tidak akurat
lagi dan kepercayaan terhadap pengelola survei
akan hilang.
Oleh karena itu secara teori petugas pengumpul
data, sebaiknya maksimum 3 kali melakukan
survei yang sama.
31
Klasifikasi dari Sumber Error
32
Klasifikasi dari Sumber Error
Variable error
Termasuk didalamnya sampling & non sampling
error
Sampling error tergantung desain, misal dalam
sampling 3 tahap:
var y
S a2 S b2 S c2
a ab abc
33
Variable error
Sa2 = varians dari 2 stage sampling unit
a
(tahap I)
Sb2 = between blok dalam desa
ab
Sc2
= between blok diantara karakteristik
abc
rumah tangga
34
Biases & NSE
35
Effective Sample Sizes (1)
Contoh : Effective sample sizes (besarnya sample
yang efektif dengan menghitung bias).
- Nilai rumah rata-rata $ 9200
- Standar deviasi (Sy) $ 5700
- Bias $ 320 (3,5 %)
Apakah bias ini besar?
36
Effective Sample Sizes (2)
5, 7 2 5,7 2
Var SE
n n
n 100 1000 10.000 100.000
SE 0.57 0.18 0.057 0.018
37
Effective Sample Sizes (3)
Jadi SE berbanding terbalik dengan n
5, 7 2
Total error 0,32 2
n
38
Effective Sample Sizes (4)
Berapa n’ agar SE = total error ?
2
2 2 5,7
5,7 5, 7 n'
0 ,32 2
5,7 2
0,32 2
n' n n
n 100 1000 10000 100000
39
Effective Sample Sizes (5)
SE & n’ makin lama makin
konstan, yang paling bagus adalah
308 karena total error sudah
konstan. n’ = effektif sample size
40
Significance Non Response
1. Rate non response
Persentase dari non response. Dicatat yang non
response dan response pengganti/ penggantian
sample, termasuk sampling biases.
2. Keadaan non response dibanding response
Jika non response banyak (> 5%) harus
mempelajari karakteristik sample res-ponse dan
non response
3. Sumber dan cara mengatasi
4. Efek Non response
5. Biaya untuk mengurangi non response
41
Non Response
Tidak di tempat
Menolak
Tidak sanggup menjawab
Tidak dijumpai
Dokumen hilang
Terutama survei-survei didaerah yang sulit
kita memberikan tenggang waktu biaya
lebih besar
Misal Survei industri besar sedang revisit
42
Efek dari Non Response (1)
Y
Y
W1 Y 1 W 2 Y2
W1 W 2 1
N
RB Y
1
Y Y
1
Y 1 W1 Y 1 W 2 Y 2
Y
Y
W 2 (Y 1 Y 2 )
Y
N1 n1 N2 n2
W1 w1 W2 w2
N n N n
43
Efek dari Non Response (2)
Y1 karakteristik respon
44
Efek dari Non Response (3)
Ingin melihat rata-rata jumlah pohon
Uraian % Respons Jml.Pohon
(rata-rata)
Mailing 1 10 456
Mailing 2 17 382
Mailing 3 14 340
Non Respon (59) 290
Jumlah 100 329
45
Efek dari Non Response (4)
Y1
10 x 456 17 x 382 14 x 340 385
41
46
Cara Mengatasi Non Response (1)
Penyempurnaan prosedur
- Memberikan penjelasan pentingnya survei
tersebut dan efeknya pada responden
- Melengkapi fasilitas pengumpulan data
- Memotivasi responden agar kooperatif
- Membuat perjanjian sebelumnya
Call back (revisit)
- Mailing : mengirim surat kembali
- Interview : revisit (dikunjungi lagi)
47
Cara Mengatasi Non Response (2)
48