Anda di halaman 1dari 16

SAMPLING DAN

DISTRIBUSI SAMPLING
8.1. Pendahuluan
Pada Bab 2 sampai Bab 5 membahas metode statistik untuk menganalisis data
Sedangkan Bab 6 dan Bab 7 membahas masalah probabilitas dan distribusinya untuk
mengetahui apa yang akan terjadi di masa mendatang. Pada bab ini kita akan membahas
masalah sampling. Konsep tentang sampling telah kita perkenalkan pada pada Bab 1.
Sampling adalah metode bagaimana membuat kesimpulan tentang populasi dari sampel
yang kita ambil dari populasi tersebut. Kenapa ada metode sampling karena karakteristik dari
populasi yaitu parameter seringkali sulit diketahui. Di samping itu ada beberapa kesulitan jika
semua objek di dalam populasi diteliti. Pertama, jika populasi cukup besar sangat sulit
melakukan penelitian dengan menghubungi semua objek yang diteliti. Kedua, memerlukan
biaya cukup besar dan ketiga memerlukan waktu yang cukup lama.
Bab 8 ini akan diawali dengan membahas masalah sensus dan sampling. Kemudian
membahas metode pengambilan sampel atau disebut metode sampling dimana dapat
dikategorikan menjadi dua yaitu metode sampling secara acak dan metode sampling tidak
acak. Bagian terakhir bab ini akan membahas masalah distribusi sampling rata-rata dan
proporsi.

8.2. Sensus Versus Sampling


Sensus adalah informasi statistik yang paling besar yang dikumpulkan secara
periodik. Informasi yang dikumpulkan di dalam sensus ini meliputi seluruh individu atau objek
dari populasi yang ada. Individu ini bisa orang, rumah tangga, mahasiswa, perusahaan, dan
sebagainya. Karena meliputi seluruh populasi maka sensus ini sangat memerlukan biaya
besar dan tentu membutuhkan waktu yang lama untuk mengolah dan menyajikan informasi
yang ada. Di dalam pelaksanaannya sensus banyak menghadapi kendala seperti besarnya
populasi, adanya perubahan yang terus menerus individu di dalam populasi dan sebagainya.
Contoh dari sensus adalah sensus penduduk Indonesia lima tahunan.
Karena adanya persoalan di dalam sensus maka sebagian besar pekerjaan statistika
berdasarkan sampel. Proses pemilihan sampel dari populasi itu disebut dengan sampling. Di
dalam metode sampling ini sampel yang dipilih dari populasi digunakan untuk membuat
kesimpulan tentang karakteristik dari populasi. Misalnya, sebuah perusahaan sepeda motor

l
1-0 hfiykin Kniiim I'ttiigiijitfH | |||ui|nt3|n _ ________ ________ _________________ _____

Inpln ni<HU|otHli(il hngnliiKinn lospon konsuniun dongan produk sepe^ m?^?r c^aru Vang
dlkohiailum Mnkn poiutinhiinii lomobul mumlllh sampol dan kemudian da sampei jni
nioinbiinl koMliiipuhin lonlnnn rtnipon konsumon torhadap produk baru terseout. Hasil dari
fnxnptil ini dlkalogoilkan iiobagnl cabting stallsllku Inforonsl.

8.3. Kosalaban Sampling dan Non Sampling .


Koslmpulnn dari iiiimpol tanking populasi pasli tidak selalu benar karena sampei
hnnynlnh bnglan knell dml populasl. Kosalaban dari sampei ini disebut dengan kesalahan
sampling (sampling oimi). Oleh karonn llu klta perlu membuat ukuran tentang kesalahan ini
sohlngga klta inompunyal koporcayaan alau rolibilitas (reliability') estimasi berdasarkan
sampol looking karaktorlstlk populasl. Konmngklnan bahwa kesalahan sampling ini melebihi
dari ukuran toilontu biasanya dlnyalakan dalam benluknilai probabilitas, misalnya 5%.
Adanya margin kosalaban yang dltorlma Ini kemudian bisa digunakan untuk membuat derajat
koporcayaan (confindonco) oioh pongambll koputusan. Secara umum di dalam konteks
blsnls. para pongambll koputusan monglnglnkan derajat keyakinan 95% atau lebih tinggi
sohlnggn hasil sampol monunjukkan kobonaran tontang karakteristik populasi.
Solaln kosalaban sampling di dalam molode sampling juga bisa muncul kesalahan
non sampling. Kosalaban Ini muncul solama proses pelaksanaan sensus atau survei sampei.
Kosalaban Ini misalnya soporli kosalaban pemlllhan individu di dalam populasi, kesalahan
pongumpulan data karona ada kosalaban tentang pembuatan kuesioner dan sebagainya.

8.4. Paramotor Populasl dan Statistik Sampei


Karaktoristlk dari populasi disebut dengan paremater. Pada Bab 2 sampai dengan
Bab 5 sobolumnya klta tolah mombahas beberapa contoh parameter populasi misalnya rata-
rata, varian, standar dovlasl, median, mode, kemiringan, dan kemencengan. Parameter
populasi ini biasanya ditulis dongan menggunakan huruf Yunani (Greek Alphabet). Misalnya
rata-rata diberi slmbol //, varian dongan a2, dan deviasi standar dengan huruf a.
Apabila kitn monggunakan sampei untuk membuat kesimpulan atau inferensi
terhadap parameter populasi maka karakteristik sampei ini disebut dengan statistik sampei
atau seringkali hanya disebut sebagai statistik. Karakteristik sampei ini biasanya diberi simbol
dengan menggunakan huruf Roman untuk membedakan dengan parameter populasi yang
terkait. Misalnya huruf ,v menggambarkan rata-rata sampei, s2 menunjukkan varian sampei
dan 5 merupakan deviasi standar sampei.

8.5. Metode Sampling


Tujuan dari statistika Induktif (inferential statistics) adalah untuk menentukan
karakteristik populasi didasarkan pada data sampei. Populasi adalah keseluruhan data
sedangkan sampei adalah bagian dari populasi yang diselidiki (the part of the population of
interest). Pertanyaannya kenapa klta bisa menggunakan data sampei untuk mengetahui
tentang sifat dari populasi. Ada beberapa alasannya sebagai berikut- (1) Untuk menghubungi
populasi maka memerlukan waktu yang lama dan tentunya cukup menghabiskan waktu; (2)
Blaya mengumpu kan date populas. adalah sangat mahal; (3) Hasil sampei sudah mencukupi
untuk melihat sifat populasi. p

Setelah klta ketahui kenapa klta bisa menggunakan data sampei untuk menaksir sifat
populasl, pertanyaan yang muncul kemudian adalah bagaimana cara kite menqambll sampe'
sehlngga b.sa menjamln bahwa sampei yang kite dapatkan memang mewakili popular

Scanned with CamScanner

2
------------------------------------------------------------------------------------ ----------------- Bab 8: Sampling dan DistribusI Sampling 121

Dengan kata lain, sampel yang kita ambil harus benar-benar merupakan representasi dari
populasi atau merupakan sampel yang tidak bias {unbiased). Ada beberapa metode
pengambilan sampel {sampling methods) yang bisa menghasilkan sampel yang tidak bias dan
fair dari populasi. Secara umum pengambilan sampel dapat dibagi menjadi dua yaitu metode
acak {random sampling) dan metode tidak acak {non random sampling), lihat Gambar 8.1.

Gambar 8.1. Metode Pengambilan Sampel

8.5.1. Metode Sampling Acak


Metoda sampling acak merupakan metode pemilihan sampel dari populasi yang ada
dimana setiap sampel dipilih secara acak atau random. Pemilihan secara acak ini
dimaksudkan agar setiap sampel mempunyai kesempatan yang sama untuk dipilih sebagai
wakil dari populasi. Pemilihan secara random ini diharapkan akan mampu menghasilkan
sampel yang tidak bias dari populasi.

8.5.1.1. Sampling Acak Sederhana


Metode sampling acak sederhana {Simple Random Sampling) adalah metode
pemilihan sampel yang mana setiap bagian dari populasi mempunyai kesempatan yang sama
untuk dipilih sebaqai sampel. Metode ini merupakan metode yang banyak digunakan.
Misalnva kita mempunyai populasi sebanyak 2000 orang dan kita memilih sebanyak 50 orang
secara acak untuk dijadikan sampel. Agar terjamin bahwa setiap orang di dalam populasi ini
mempunyai kesempatan yang sama dipilih menjadi sampel maka pertama harus menulis
semua nama tersebut di dalam kertas dan digulung. Kemudian kertas tersebut dimasukkan

3
122 Bagian Kedua: Pengujian Hipotesis

ke dalam kotak. Setelah itu kotak dikocok maka kita ambi . tk samDei sebanx l
tersebut tanpa melihat. Proses ini terus dilakukan hingga kita men p yak
50 orang. , .... .
Selain cara di atas, ada metode yang mudah dilakukan untu mernii' S^Tke,r^e^ara
acak. Metode ini menggunakan nomer identitas setiap orang dan ta e , 001

numbers). Dari tabel ini kemudian kita bisa kita memilih sampel secara aca g u ah.

8.5.1.2. Sampling Acak Sistematis , , ,


Metode sampling acak sederhana mudah dilakukan tetapi sanga meng abiskan
waktu. Jika populasinya cukup besar maka kita perlu waktu yang lama untuk memberi nomer
kepada setiap sampel. Oleh karena itu kita bisa menggunakan metode lain yaitu sampling
acak sistematis (Systematic Random Sampling).
Pertama yang harus dilakukan di dalam sampling acak sistematis ini adalah membuat
susunan atau order dari populasi yang ada. Kemudian kita menentukan interval sampling (k).
Interval sampling ini dihitung dengan cara membagi jumlah populasi dengan jumlah sampel
yang akan dipilih atau k = N/n. Dimana N dan n masing-masing adalah jumlah populasi dan
sampel. Setelah itu kita memilih sampel yang pertama secara acak pada interval sampling
yang pertama dan kemudian sampel berikutnya diindentifikasi pada setiap interval kelas yang
ada. Misalnya jika kita mempunyai populasi sebanyak 2000 dan kita ingin mengambil sampel
sebanyak 50. maka jumlah k = 2000/ 50= 40. Pada sampel pertama misalnya terpilih nomer
20 di interval sampling yang pertama. Sampel berikutnya dengan demikian dimbil nomer
urutan 40 berikutnya yaitu nomer 60,100, 140 dan seterusnya.

8.5.1.3. Sampling Acak Terstratifikasi


Selain dua metode di atas, kita bisa menggunakan metode sampling acak yang
terstratifikasi jika populasi yang kita miliki bisa dikelompokkan dalam beberapa kelompok
dimana setiap kelompok mempunyai karakteristik yang hampir sama. Dalam metode ini
populasi dibagi dalam beberapa kelompok yang mempunyai sifat sama disebut strata dan
kemudian setiap strata diambil secara acak untuk mendapatkan sampel. Pembagian ini bisa
dilakukan dengan mengelompokkan strata sesuai dengan lokasi, umur, jenis industri, jenis
produk, jumlah penjualan.dan sebagainya.

8.5.1.4. Sampling Kluster


Seringkali kita juga mempunyai populasi yang tersebar di wilayah geografis yang
sangat luas. Jika lokasi populasi seperti hal ini maka untuk mengurangi biaya pengambilan
sampel kita bisa menggunakan metode sampling berdasarkan lokasi atau area populasi
untuk mendapatkan sampel. Metode ini seringkali disebut dengan samplina kluster (cluster
sampling). Ka

Dengan alat bantu peta, semua populasi dibagi ke dalam lokasi-lokasi atau kluster-
kluster yang lebih kecil. Kemudian kluster ini dipilih secara acak dan dari kluster vanq terpilih
diambil sampel secara acak. Metode sampling kluster ini berbeda denqan metode samfW
“populasi3 a"" 301 klU8,er r6latif lebih heterogen ^bandTngSn den%n

(cs) Scanned with CamScanner

4
Bab 8: Sampling dan Distribusi Sampling 123

8,5.1.5. Sampling Boborapa Tahap


Motodo sampling boborapa tahap ini digunakan ketika kita mempunyai populasi yang
snngnt bosai dan lorsobar luas dan melodo sampling acak tidak mungkin bisa dilakukan.
Dongnn melodo mi soluruh populasi dibagi menjadi beberapa unit disebut tahapan (stages)
dliiinna soliap tahapan lordiri darl boborapa tahapan. Sampel kemudian diambil pada setiap
tahapan. Ukuran sampel pada soliap lahapannya ditentukan berdasarkan relatif besarnya
populasi yang ada. Esonsi dari metode sampling beberapa tahap ini adalah setiap
subtahapan diambil dari grup atau strata secara berturut turut. Pemilihan sampel pada setiap
unit bisa dilakukan dengan atau tanpa stratifikasi.
Misalnya ketika sobuah lembaga yang berkecimpung di dalam jejak pendapat
(polling) di dalam pemilihan umum di Indonesia. Lembaga ini akan melakukan sebuah jejak
pendapat dalam pemilihan presiden. Karena besarnya populasi dan tersebar luas di berbagai
daerah make langkah pertama metode sampling beberapa tahap ini adalah mengambil
sampel dengan area geografi yang penting misalnya berdasarkan pulau penting seperti
Sumatera, Jawa, Kalimatan, Sulawesi, Bali dan Nusa Tenggara, Maluku, dan Papua. Ukuran
sampel dari setiap pulau ini ditentukan berdasarkan populasi relatif pada setiap daerah.
Tahapan berikutnya, sejumlah daerah disetiap pulau dipilih. Langkah ketiga adalah memilih
sampel dari sejumlah daerah yang dipilih tersebut pada langkah kedua.

8.5.2. Metode Sampling Tidak Acak


Berbeda dengan metode sampling acak, pada metode sampling tidak acak ini sampel
tidak diambil secara acak. Setiap unit di dalam populasi tidak mempunyai kesempatan yang
sama untuk dipilih. Dengan demikian, kelemahannya metode ini adalah tidak menjamin
adanya validitas karakteristik populasi yang diambil dari sampel yang ada.

8.5.2.1.Sampling Kuota
Sampling kuota berarti adanya pembatasan sampel yang diambil dari populasi. Di
dalam metode ini pemilihan sampel tergantung dari keinginan investigator meskipun di dalam
penentuan sampel ini investigator harus menjamin bahwa setiap sampel memenuhi kriteria
tertentu yang dibutuhkan di dalam studi. Kriteria yang digunakan investigator ini merupakan
variabel mengontrol untuk membatasi sampel yang dipilih.
Misalnya ketika seorang dosen akan meneliti jam belajar mahasiswa Fakultas
Ekonomi di sebuah perguruan tinggi. Dosen tersebut mengambil sampel secara terbatas
sejumlah 50 mahasiswa dari 1000 mahasiswa dengan kriteria 25 mahasiswa laki-laki dan 25
mahasiswa perempuan. Dari 25 mahasiswa baik laki-laki dan perempuan tersebut kemudian
dipilih mereka yang mulai semester pertama sampai semester 6.

8 5.2.2. Sampling Purposif


Di dalam metode ini peneliti mengambil sampel dengan pertimbangan bahwa sampel
yang dipilih paling bisa mewakili populasi yang sedang diteliti. Kembali ke kasus penelitian
tentang jam belajar mahasiswa di Fakultas Ekonomi sebelumnya. Sekarang dosen hanya
memilih dua orang mahasiswa terdiri dari 1 laki-laki dan 1 perempuan yang mampu mewakili
seluruh populasi sebanyak 1000 mahasiswa. Pengambilan 1 sampel mahasiswa laki-laki
diharapkan mewakili kelompok mahasiswa laki-laki dan begitu pula 1 mahasiswa perempuan
sebagai sampel diambil untuk bisa mewakili kelompok mahasiswa perempuan.

|cs| Scanned with CamScar

5
124 Bagian Kedua: Pengujian Hipotesis

8.5.2.3. Sampling Cara Mudah . . .


Sampling tidak acak yang terakhir adalah sampling mudah (con ven/ence) ya itu
pengembalian sampel dengan cara yang mudah dilakukan. Di dalam me o lv' u‘

individu yang dipilih menjadi sampel dipilih dengan pertimbangan paling memu a an agi
peneliti, bukan atas dasar kriteria tertentu sebelumnya. Kembali ke contoh pene i lan en ang
jam belajar mahasiswa sebelumnya. Sampling convenience ini bisa dilaku an engan
mengambil mahasiswa yang rumahnya dekat dengan peneliti. Dengan mengambil sampel di
dekat tempat peneliti maka peneliti akan mudah menghubungi responden sewaktu-waktu
dengan biaya yang murah.

8.6. Distribusi Sampling


Pada Bab 3 kita telah membahas beberapa metode statistik untuk menghitung
parameter populasi seperti rata-rata, standar deviasi,dan sebagainya. Nilai parameter ini
digunakan untuk menggambarkan karakteristik dari populasi. Jika populasi sangat besar dan
karakteristik populasi tidak bisa diidentifikasi dengan metode sensus maka apa yang kita bisa
lakukan hanyalah menggunakan metode statistika yaitu melalui statistika inferensi.^ Parameter
populasi diidentifikasi dengan cara mengambil dari karakteristik sampel atau statistik sampel.
Statistik sampel yang kita dapatkan akan berbeda-beda dari satu sampel ke sampel
yang lain. Oleh karena itu secara teoritis kita bisa membuat tabel frekuensi yang
menunjukkan nilai statistik dan besarnya frekuensi kejadian. Karena hasilnya merupakan
proses sampling ini maka distribusi dari nilai statistik ini disebut dengan distribusi sampling
(sampling distribution). Nilai statistik ini merupakan variabel random atau acak karena nilainya
didasarkan pada metode sampel acak.
Konsep distribusi sampling ini berhubungan dengan distribusi probabilitasyang sudah
kita bahas pada Bab 7 sebelumnya. Distribusi probabilitas adalah distribusi teoritis dari
variabel acak atau random yang digunakan untuk menggambarkan karakteristik populasi
dalam situasi atau kondisi tertentu. Distribusi probabilitas adalah alat bantu di dalam
menentukan probabilitas sebuah kejadian dari variabel random ketika populasi yang
menghasilkan kejadian tersebut memenuhi kondisi tertentu. Misalnya ketika kita mengatakan
bahwa sebuah populasi mempunyai distribusi normal, hal ini berarti fenomena yang
menggambarkan distribusi probabilitas normal tersebut memberi gambaran yang berguna
dari distribusi nilai populasi. Oleh karena itu ketika kita mengatakan bahwa nilai rata-rata
yang diperoleh dari sampel didistribusikan secara normal ini berarti bahwa distribusi ini
berguna untuk menggambarkan karakteristik atau sifat dari distribusi sampling.

8.6.1. Standard Error of Statistic


Distribusi Sampling menggambarkan nilai statistik tertentu. Oleh sebab itu deviasi standar
dari sampling ini yang merupakan standard error berbeda dengan deviasi standar dari populasi.
Deviasi standar populasi menggambarkan variasi diantara unit di dalam populasi sedangkan
deviasi standar distribusi sampling menggambarkan variasi diantara nilai statistik sampel
misalnya rata-rata karena adanya kesalahan sampling (sampling error) Pemahaman tentang
distribusi sampling menyebabkan kita akan mampu menentukan probabilitas kesalahan sampling.
Deviasi standar dari distribusi sampling ini dikenal dengan kesalahan standar statistik (standard
error of statistic) atau seringkali hanya disebut sebagaistandard error
Standard error ini berguna tidak hanya sekadar mengukur jumlah kemungkinan
kesalahan di dalam proses pengambilan sampel tetapi juga sangat berguna untuk mengukur

|CS| Scanned with CamScanner

6
Bab 8: Sampling dan Distribusi Sampling 125

kelepatan atau akurasi yang kita inginkan. Salah satu penggunaan penting tentang standard error
ini adalah pada saat kita membicarakan masalah estimasi karena nilai estimasi dari sampel
digunakan untuk mengestimasi nilai parameter populasi. Persoalan ini akan dibahas pada Bab 9.

8.6.2. Populasi, Distribusi Sampel, dan Distribusi Sampling


Metode sampling yang kita jelaskan sebelumnya menghasilkan apa yang disebut
dengan statistik. Dengan demikian dari distribusi populasi ini kita bisa mendapatkan statistik
distribusi sampling (sampling distribution of statistic of interest). Distribusi sampling ini
mempunyai rata-rata dan deviasi standar tertentu dimana distribusi sampling ini
menggambarkan frekuensi relatif kejadian sebuah nilai dari statistik sampel.

(a) distribusi populasi

— — r—
_

—I

i. ] if 1
X3 ^2 X3 X4
sampel 1 sampel 2 sampel 3 sampel 4
(b) Distribusi sampel

-J Xj xr px x3 x4
(c) distribusi sampling acak rata-rata sampel

Gambar 8.2. Distribusi Sampling Random Dari Rata-Rata Sampel

jcsj Scanned with CamScanner

7
-26 Bagian Kedua: Pengujian Hipotosis _____________________________________________ _____________________

Dari pembahasan tersebut maka kita bisa mengklasifikasikan distribusi menjadi tiga
yaitu distribusi populasi, distribusi sampel, dan distribusi sampling. Distribusi populasi adalah
distribusi nilai dari seluruh anggota. Nilai rata-rata diberi simbol nilai varian diberi simbol a2
dan nilai deviasi standar diberi simbol dengan a, lihat Gambar 8.2(a)
Distribusi sampel adalah distribusi nilai statistik di dalam sampel acak yang diambil dari
populasi. Setiap distribusi sampel merupakan distribusi diskrit karena nilai berubah-ubah dari
satu sampel ke sampel yang lain. Misalnya kila mempunyai 4 sampel, lihat Gambar 8.2(b). Di
dalam distribusi sampel ini rata-rata aritmatik menunjukkan rata-rata dari semua rata-rata
sampel yang mungkin atau diberi simbol dengan X. Deviasi standar yang mengukur variabilitas
diantara semua nilai yang ada dari nilai sampel merupakan estimasi dari deviasi standar
populasi a.
Sedangkan distribusi sampling merupakan distribusi probabilitas semua kemungkinan
nilai statistik dari semua kemungkinan sampel yang diambil dari populasi. Distribusi sampling
ini bisa dilihat di dalam Gambar 8.2(c). Distribusi sampling nilai rata-rata mempunyai nilai
rata-rata aritmatik tertentu diberi simbol dengan /z* dan deviasi standarnya diberi simbol
dengan Perhitungan statistik distribusi sampling ini berdasarkan sifat-sifat berikut ini:
1) Rata-rata aritmatik /z* distribusi sampling nilai rata-rata sama dengan rata-rata
populasi /ztanpa melihat bentuk distribusi probabilitas.
2) Distribusi sampling mempunyai deviasi standar atau disebut dengan standard error
yang nilainya merupakan deviasi standar populasi dibagi dengan akar dari jumlah
sampel sebagai berikut: /z* = tf/Vn.
3) Distribusi sampling nila rata-rata sampel dari distribusi populasi normal adalah
distribusi normal untuk semua sampel.

Jika jumlah sampel paling tidak sebesar 30 atau lebih (n > 30) pada umumnya
dianggap sebagai sampel besar (large sample) di dalam analisis statistik sedangkan jika
sampel kurang dari 30 (n <30) disebut sebagai sampel kecil (small sample). Deviasi standar
distribusi sampling px nilainya akan terus mengecil jika sampel terus membesar dan
sebaliknya nilainya akan membesar jika sampel terus mengecil. Ketika deviasi standar
populasi er tidak diketahui, deviasi standar sampel s yang nilainya sebagai wakil atau proksi
dari nilai deviasi standar populasi adigunakan untuk menghitung standard errorpx = s/jn.

8.7. Teori Central Limit


Distribusi rata-rata sampel cenderung mendekati distribusi normal ketika sampel terus
bertambah, lihat Gambar 8.3. Ini merupakan salah satu karakteristik penting di dalam
statistika Inferensi. Teori ini disebut dengan Teori Central Limit (the Central Limit Theorem).
Teori central limit ini menyatakan bahwa ketika sampling yang diambil dari populasi dengan
rata-rata p dan standar deviasi a maka distribusi sampling dari rata-rata sampel X akan
cenderung mengikuti distribusi normal dengan rata-rata p dan standar deviasi a/Vn bila
sampel terus ditambah.
Teori Central Limit sangat penting di dalam statistika karena itu menyatakan bahwa
distribusi rata-rata sampel akan cenderung seperti distribusi normal tanpa memandang
bentuk distribusi populasi yang mana sampel random atau acak diambil. Dengan teori ini kita
bisa membuat pernyataan probabilitas tentang kemungkinan nilai dari rata-rata sampel yang
mungkin terjadi.

[CSj Scanned with Car

8
Bab 8: Sampling dan Distribusi Sampling 127

Te°ri Central Limit ini mengatakan bahwa ketika n terus bertambah sampai tidak
terbatas (/n mity atau dinyatakan n ->co maka distribusi dari rata-rata sampel X menjadi
distribusi normal. Tingkat dimana distribusi mendekati distribusi normal tidak tergantung dari
distribusi populasinya. Jika distribusi populasi sudah bersifat normal, maka distribusi rata-rata
sampel x akan normal berapapun ukuran sampelnya. Sebaliknya jika distribusi populasi tidak
mengikuti distribusi normal maka dibutuhkan sampel cukup besar agar distribusi dari rata-rata
sampel xbisa mengikuti distribusi normal. Pertanyaannya, berapa minimal sampel n
dikatakan sampel besar. Pada pembahasan sebelumnya dinyatakan bahwa sebuah sampel
dikatakan sampel besar jika paling tidak 30 atau lebih (n > 30). Sedangkan bila sampel n lebih
kecil dari 30 (n < 30) maka dikatakan sampel kecil. Jadi jika sampel minimal adalah 30 maka
distribusi rata-rata sampel xakan mengikuti distribusi normal.

Gambar 8.3. Kurva Normal dan Distribusi Sampling Dari Rata-Rata Sampel pada Berbagai
Ukuran Sampel

8.8. Rata-Rata Distribusi Sampling


Distribusi sampling dari rata-rata sampel akan sangat tergantung dari bentuk distribusi
populasi dimana sampel yang dipilih secara random diambil. Bila distribusi populasi
mempunyai distribusi normal maka distribusi sampling dari rata-rata sampel akan mempunyai
distribusi normal tanpa memandang berapa jumlah sampel yang ada. Namun, jika distribusi
populasi tidak mempunyai distribusi normal maka distribusi sampling dari rata-rata sampel
akan mengikuti distribusi normal jika sampel terus bertambah dengan jumlah sampel minimal
sebanyak 30.

8.8.1. Rata-Rata Distribusi Sampling Dengan Populasi Berdistribusi Normal


Pada setiap ukuran sampel tertentu nyang diambil dari populasi dengan rata-rata n
dan standar deviasi o, distribusi sampling statistik sampel seperti rata-rata dan standar
deviasi besarnya masing-masing sebagai berikut.

Mx = E(X) = M ^81)

(8.2)

9
j28 Bagian Kedua: Pengujian Hipotesis

Bila semua kemungkinan sejumlah sampel ndiambil seca npa


pengembalian dari populasi yang mempunyai distribusi normal dengan r M an
standar deviasi a maka rata-rata distribusi sampling xdan standard errorax a juga
didistribusikan secara normal pula. Jika distribusi sampling xadalah normal, standard error
rata-rata dapat digunakan di untuk menentukan probabilitas dari berbagai m ai ra a-rata
sampel dalam hubungannya dengan distribusi normal. Untuk keperluan ini ma a rata-rata
sampel x pertama kali harus dirubah di dalam nilai Z di dalam distribusi normal untuk
mengetahui setiap nilai rata-rata yang berdeviasi dari rata-rata sampel x dengan
menggunakan rumus sebagai berikut:

Z= = (8.3)

Dimana:X= rata-rata sampel; p= rata-rata populasi; cr= standar deviasi populasi; n= jumlah
sampel.
Jika populasi adalah terbatas (finite) dan sampel ndiambil tanpa pengembalian maka
standard error distribusi sampling rata-rata harus disesuaikan dengan sebuah faktor koreksi
yaitu faktor koreksi populasi terbatas (finite population correction factor) sehingga standard
error-nya menjadi sebagai berikut:

a |n -n
= VS (8-4)

Dimana:N = jumlah populasi; n = jumlah sampel

I——-
n-n
= faktor koreksi
^N-l

Contoh 8.1. Rata-Rata Distribusi Sampling


Menurut data PT Telkom, rata-rata pengeluaran biaya telepon tetap (fixed liner) bagi rumah
tangga di Indonesia sebesar Rp175.000 per bulan dengan standar deviasi Rp20.000. Jika diambil
secara acak sebanyak 81 rumah tangga di seluruh Indonesia berapa besarnya probabilitas rumah
tangga yang membayartagihan telepon rata-rata antara Rp170.000 sampai Rp185.000?

Solusi 8.1.
Rata-rata pengeluaran biaya telepon rumah tangga di Indonesia (/z)sebesar Rp175.000 dengan
standar devias, (<z)sebesar Rp 20.000 Dengan sampel sebanyak n=81, maka nilai probabilitas

HaZam^S93 " 17°°00 ' RP 180 000 dapa* m/nggunakan

Nilai Z untuk X = Rp 170.000

z_X-/z_ 170.000- 175.000


a/y/n 20.000/V81 ~2

|CS| Scanned with CamScanner

10
Bab S: can Dtstnbusi Saving 129

Nilai Z untuk X = Rp 185.000

X-u 180.000 - 175.000


z =--------= ---------------------—— = n
ff/v'n 20.000/vSl

Besamya probabilitas pada saat nilai Z sama dengan 2 adalah 0.4772. Sehingga besamya
probabilitas rumah tangga membayar tagihan telepon rata-rata antara Rp170.000 -
Rp180.000 adalah sebesar 0.4772 + 6,4772 = 0.9544. lihat Gambar 8.4.

8.8.2. Rata-Rata Distribusi Sampling Dengan Populasi Tidak BerdistribusiNormal


Pada kasus populasi tidak didistribusikan secara normal, maka kita akan
menggunakan teori central limit untuk menggambarkan sifat random dan rata-rata sampel
untuk sampel besar tanpa mengetahui distribusi populasi. Sebagaimana penjelasan
sebelumnya, jika nilai sampel n paling tidak 30 (n > 30) maka distribusi sampling rata-rata
diasumsikan berdistribusi normal tanpa memandang bentuk distribusi populasi. Semakin
besar jumlah sampel maka semakin mendekati distribusi normal.
Pada perhitungan standard error dari distribusi sampling yang didistribusikan secara
normal, kita asumsikan bahwa standar deviasi populasi a diketahui. Namun apabila standar
deviasi populasi a tidak diketahui maka kita akan menggunakan standar deviasi sampel untuk
mengestimasi standar deviasi populasi. Standard error distribusi sampling rata-rata dihitung
dengan menggunakan formula sebagai berikut:

Sehingga nilai Z dihitung dengan menggunakan formula sebagai berikut:

z= X-Hx = X-P- (8.6)


tr* s/Vn
Dimana:Jr= rata-rata sampel; /z= rata-rata populasi; s = standar deviasi sampel; n= jumlah
sampel

Scanned with CamScanner

11
130 Bagian Kedua: Pengujian Hipotesis

Contoh 8.2. Distribusi SamplingRata-Rata k nplanaaan rumah


Menurut data PT. PLN, rata-rata pengeluaran biaya listrik kapasitas 450V Distribusi
tangga di Indonesia sebesar Rp75.000 per bulan dengan standar deviasi RpS.OOO _Uism8|
populasi tidak diketahui. Sampel sebanyak 50 rumah tangga dari seu Hpvjaci cphpsar
menunjukkan bahwa rata-rata sebesar Rp72.500 per bulan dengan stan rata.raf_
Rp5.000. Berapa besarnya probabilitas rumah tangga untuk membayar tagi
antara Rp74.000 sampai Rp76.250?

Solusi 8.2.
Kita tidak mengetahui distribusi populasi, tetapi dengan sampel sebanyak 50 ruma angga ma a
sampel ini termasuk sampel besar. Dengan menggunakan pendekatan teori Centra imi, kita
bisa menyelesaikan Contoh 8.2. dengan menggunakan distribusi Z. Karena standar deviasi
populasi tidak diketahui maka kita bisa menggunakan standar deviasi sampel untuk menghitung
nilai Z dengan menggunakan formula persamaan (8.6).

Nilai Z untuk X = Rp 74.000


X-n 74.000 - 75.000
Z =------ —1,41
s/Vn 5.000/V50
Nilai Z untuk X = Rp 76.250
X-n 76.250-75.000
Z =____ — =-----------------------
s/Vn 5.000/V50

Gambar 8.5. Besarnya Probabilitas antara nilai Z = -1,41 dan Z = 1 77

Besarnya probabilitas pada saat nilai Z sama dengan -1,41 adalah 0 4207 dan besarnya
probabilitas pada Z sebesar 1,77 sebesar 0,4616. Besarnya probabilitas rumah tanqqa membayar
tagihan listrik rata-rata antara Rp74.000 - Rp76.250 adalah sebesar 0 4207 + 0 461R - n 8823
Penjelasan detil lihat Gambar 8.5. ’ ’ 0 " ’

8.9. Distribusi Sampling Proporsi


Dalam banyak kasus, anggota setiap populasi bersifat mutually exclusive vaitu setiap
anggota dikelompokkan hanya ke dalam dua kategori misalnya antara sukses dan oaaal
Atau dengan kata lain distribusi sampling proporsi berdasarkan distribusi binomial Dengan

|cs| Scanned with CamScannei

12
Bab 8: Sampling dan Distribusi Sampling 131

demikian proporsi sampel p dapat digunakan untuk membuat kesimpulan secara statistik
(statistical in erence) tentang parameter proporsi populasi n. Proporsi sampel dapat
didefimsikan sebagai berikut:
X
P= n (8.7)

Dimana, p- proporsi sampel; x= jumlah kejadian sukses; n= jumlah sampel

Seperti distribusi sampling rata-rata, distribusi sampling proporsi dengan rata-rata


sebesar ;zp dan standard error atau standar deviasi ap besarnya sebagai berikut:

=P (8.8)

c7p = (8-9)

Distribusi sampling proporsi akan mengikuti distribusi normal jika sampel besar (n > 30) dan
mempunyai syarat bila np > 5 dan n(1-p) > 5. Bila distribusi sampling proporsi mempunyai
distribusi normal maka proporsi sampel p yang standar akan mengikuti distribusi normal
standar Z yang dihitung dengan menggunakan formula sebagai berikut:
P ~ Px = P ~
(8.10)
av Vp(1_p)/n
Dalam kasus populasi terbatas (finite) dan sampel n diambil tanpa pengembalian maka
standard error distribusi sampling proporsi harus disesuaikan dengan sebuah faktor koreksi
yaitu faktor koreksi populasi terbatas (finite population correction factor) sehingga standard
error-nya menjadi sebagai berikut:

P(l-P) N-n
(8.11)
N -1

Dimana :N = jumlah populasi; n = jumlah sampel

N—n
= faktor koreksi
N-l

Contoh 8.3. Distribusi Sampling Proporsi


Manajer produksi sebuah prabrik ban sepeda motor skala nasional ingin mengetahui tentang
produk ban yang cacat dihasilkan pertahunnya. Berdasarkan informasi produksi sebelumnya,
sebesar 2 5% ban yang dihasilkan tidak sesuai dengan standar yang ditetapkan alias cacat. Untuk
keperluan' ini, perusahaan mengambil sampel sebanyak 100 ban yang diambil secara acak.
Berapa probabilitas bahwa proporsi ban cacat antara 2,20 /o sampai 2,75/o.

S°,USi 8 3‘ _n hoc
Ada beberapa informasi yang diketahui yaitu n- , > Pi = 0,022; p2 = 0,0275 dan n = 100.

[csj Scanned with CamScanner

13
132 Bagian Kedua: Pengujian Hipotosls

Besarnya nilai Z untuk pi = 0,022

7= p — tt = 0,022 - 0,025 = -0,003 = Q ] g

Vtt(1 - 7r)/n 70,025(0,975)/100 0,0156

Besarnya nilai Z untuk p2 = 0,0275


p-7T 0,0275- 0,025 0,0025
" 7tt(1 - 7T)/n ~ 70,025(0,975)/100 ” 0,0156

Probabilitas pada saat nilai Z sama dengan -0,19 adalah 0,0753 dan besarnya probabilitas pada
Z sebesar 0,16 sebesar 0,0636. Besarnya probabilitas proporsi ban cacat antara 2,20% dan
2,75% sebesar 0,0753 + 0,0636 = 0,1389. Penjelasan detil lihat Gambar 8.6.

Gambar 8.6. Besarnya Probabilitas antara nilai Z = -0,19 dan Z = 0,16

Scanned with CamScanner

14
TABEL 1.
TABEL DISTRIBUSI NORMAL

Contoh:
Pr (0 < Z < 1.55) = 0,4394
Pr( Z > 1,55) = 0,5 - 0,4394 = 0,0606

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.3 .1179 .1217 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0,4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224

0.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549
0.7 .2580 .2611 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133
0.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621

1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441

1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.7 .4454 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817

2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952

2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 | -4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990
SOAL- SOAL LATIHAN

1. Data PT Telkom menunjukkan rata-rata pengeluaran biaya telepon seluler per orang di
Indonesia sebesar Rp125.500 per bulan dengan standar deviasi Rp15.000. Jika diambil
secara acak sebanyak 100 orang di seluruh Indonesia berapa besarnya probabilitas
orang yang membayar tagihan telepon rata-rata antara Rp120.000 sampai Rp130.000?

2. Berdasarkan survei yang dilakukan lembaga konsumen Indonesia, rata-rata pemilik mobil
harus mengeluarkan sebanyak Rp170.000 untuk membeli bensin premium per
minggunya dengan standar deviasi Rp10.000. Sebanyak 121 sampel yang diambil dari
seluruh kota besar di Indonesia. Berapa probabilitas pengeluaran bensin premium per
minggunya lebih dari Rp171.500?

3. Manajer produksi sebuah pabrik ekspor sepatu ingin mengetahui tentang produk sepatu
yang cacat dihasilkan pertahunnya sehingga tidak bisa diekspor ke luar negeri.
Berdasarkan informasi produksi sebelumnya, sebesar 1,5% sepatu yang dihasilkan tidak
sesuai dengan standar yang ditetapkan oleh perusahaan. Perusahaan mengambil sampel
sebanyak 144 sepatu yang diambil secara acak. Berapa probabilitas bahwa proporsi
sepatu cacat lebih dari 1,75%?

4. Berdasarkan data lulusan sarjana dari berbagai program studi diperkirakan sebanyak
65% tidak ingin bekerja di daerah perdesaan. Sebanyak 225 lulusan sarjana diambil
sampelnya. Berapa probabilitas proporsi lulusan sarjana yang tidak mau bekerja di
daerah perdesaan antara 55 % dan 70%?

16

Anda mungkin juga menyukai