Anda di halaman 1dari 17

LECTURE NOTES

STAT6145 – Business Statistics

Week 3
Sampling and Interval Estimation

STAT6145 – Business Statistics|1


LEARNING OUTCOMES

LO1: Mahasiswa diharapkan memiliki kemampuan untuk mengidentifikasi konsep statistik

OUTLINE MATERI :

1. Memilih Sampel
2. Titik Pendugaan
3. Pengantar Distribusi Sampling
4. Distribusi Pengambilan Sampel 𝑥̅
5. Distribusi Pengambilan Sampel 𝑝̅
6. Metode Pengambilan Sampel Lainnya
7. Estimasi Interval Rata-rata Populasi:  diketahui
8. Estimasi Interval Rata-rata Populasi:  tidak diketahui
9. Menentukan ukuran sampel

STAT6145 – Business Statistics|2


ISI MATERI

1. Memilih Sample
Rata-rata sampel memberikan perkiraan dari rata-rata populasi, dan proporsi sampel
memberikan perkiraan dari proporsi populasi. Dengan perkiraan seperti ini, beberapa kesalahan
estimasi dapat diperkirakan. Pada topik ini memberikan dasar untuk menentukan seberapa
besar kesalahan itu.
Di bagian ini akan dijelaskan cara-cara memilih sampel. Pertama-tama akan dijelaskan
cara mengambil sampel dari populasi terbatas dan kemudian dijelaskan cara memilih sampel
dari populasi tak terbatas. Populasi terbatas adalah kumpulan objek penelitian yang menempati
area tertentu dan membedakan kelompok populasi tersebut dengan yang lain. Contoh populasi
terbatas adalah semua mahasiswa aktif Universitas Bina Nusantara. Sedangkan populasi tak
terbatas adalah kumpulan objek penelitian yang tidak dibatasi oleh area tertentu. Contoh
populasi tidak terbatas adalah populasi semua burung merpati.
1. Pengambilan Sample dari Populasi Terbatas
Ahli statistik merekomendasikan untuk memilih sampel probabilitas ketika
mengambil sampel dari populasi terbatas karena sampel probabilitas memungkinkan
mereka untuk membuat kesimpulan statistik yang valid tentang populasi. Jenis sampel
probabilitas yang paling sederhana adalah setiap sampel berukuran n memiliki probabilitas
yang sama untuk dipilih. Ini disebut sampel acak sederhana. Sampel acak sederhana (simple
random sampling) berukuran n dari populasi terbatas berukuran N didefinisikan sebagai
berikut.
Simple Random sampling (untuk populasi terbatas)
Sampel acak sederhana berukuran n dari populasi terbatas ukuran N adalah sampel
yang dipilih sedemikian rupa sehingga setiap sampel ukuran n yang mungkin memiliki
probabilitas yang sama untuk dipilih.
2. Pengambilan Sample dari Populasi Tak Terbatas
Kadang-kadang kita ingin memilih sampel dari suatu populasi, tetapi populasinya
sangat besar atau elemen-elemen populasi dihasilkan oleh proses yang berkelanjutan yang
tidak ada batasan jumlah elemen yang dapat dihasilkan. Dengan demikian, tidak mungkin
untuk mengembangkan daftar semua elemen dalam populasi. Ini dianggap sebagai kasus
populasi tak terbatas. Dengan populasi tak terbatas, kami tidak dapat memilih sampel acak

STAT6145 – Business Statistics|3


sederhana karena kami tidak dapat membuat bingkai yang terdiri dari semua elemen. Dalam
kasus populasi tak terbatas, ahli statistik merekomendasikan untuk memilih apa yang
disebut sampel acak.
Simple Random sample (untuk populasi tak terbatas)

Sampel acak berukuran n dari populasi yang tak terbatas adalah sampel yang dipilih
sehingga kondisi berikut dipenuhi.

1. Setiap elemen yang dipilih berasal dari populasi yang sama.

2. Setiap elemen dipilih secara independen.

2. Pendugaan Titik (Point Estimation),

Pendugaan titik merupakan suatu nilai dari sampel sebagai estimator parameter. Dalam
pendugaan titik, kita menggunakan data sampel untuk menghitung suatu nilai statistik sebagai

penduga parameter populasi. Rata-rata sampel, x , merupakan estimator dari rata-rata populasi
µ, rata-rata roporsi, p , merupakan estimator dari proporsi populasi p, Standar deviasi, s,
merupakan estimator dari , dan varians dari sampel, s2, merupakan estimator untuk varians
populasi 2.

Rumus rata-rata sample:

∑ 𝑥𝑖
𝑥̅ =
𝓃

Rumus rata-rata proporsi:


𝑥
𝑝̅ =
𝑛

Rumus standar deviasi:

∑(𝑥𝑖 −𝑥̅ )2
𝑠=√
𝓃−1

Contoh soal:
Sampel acak sederhana dari 30 manajer dan data terkait pada gaji tahunan dan
partisipasi program pelatihan manajemen adalah seperti yang ditunjukkan pada tabel 1. Notasi

STAT6145 – Business Statistics|4


𝑥1 , 𝑥2 , dan seterusnya digunakan untuk menunjukkan gaji tahunan manajer pertama dalam
sampel, gaji tahunan manajer kedua dalam sampel, dan sebagainya. Partisipasi dalam program
pelatihan manajemen ditunjukkan oleh jawaban yes di kolom program pelatihan manajemen.
Tabel 1. Status Program Gaji dan Pelatihan Tahunan untuk Sampel Acak Sederhana
30 Manajer EAI

Sumber: Anderson (2018)

𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + ... + 𝑥30 = 1,554,420


n = 30
Rata-rata sample:

Standar deviasi:

Rata-rata proporsi:

STAT6145 – Business Statistics|5


Sumber: Anderson (2018)

3. Pengantar Distribusi Sampling


Jika kita menganggap proses pemilihan sampel acak sederhana sebagai percobaan,

rata-rata sampel x adalah deskripsi numerik dari hasil percobaan. Dengan demikian, rata-rata

sampel x adalah variabel acak. Akibatnya, seperti variabel acak lainnya, x memiliki nilai
rata-rata atau yang diharapkan, standar deviasi, dan distribusi probabilitas. Karena berbagai

kemungkinan nilai x adalah hasil dari sampel acak sederhana yang berbeda, distribusi

probabilitas x disebut distribusi sampling x . Pengetahuan tentang distribusi pengambilan


sampel ini dan sifat-sifatnya akan memungkinkan kita untuk membuat pernyataan probabilitas

tentang seberapa dekat rata-rata sampel x dengan rata-rata populasi .

4. Distribusi sampling untuk x

Distribusi sampling untuk x adalah distribusi probabilita dari semua kemungkinan nilai

rata-rata sampel x .

Nilai yang diharapkan (expected value):

E( x ) =  ,

dimana  = rata-rata populasi.

Simpangan baku (standard deviation):

1. Populasi terbatas

𝑁−𝑛 𝜎
𝜎𝑥̅ = √ ( )
𝑁−1 √𝑛

2. Populasi tidak terbatas


𝜎
𝜎𝑥̅ =
√𝑛

STAT6145 – Business Statistics|6


*Faktor koreksi

√(𝑁 − 𝑛)/(𝑁 − 1)

*Populasi terbatas dan ukuran sampel kurang dari atau sama dengan 5% dari ukuran
populasi, maka n / N ≤ 0,05.

Contoh:

Standar deviasi gaji tahunan untuk populasi 2500 manajer EAI adalah  = 4000. Dalam
hal ini, populasi terbatas, dengan N = 2500. Namun, dengan ukuran sampel 30, kami memiliki
n / N = 30/2500 = 0,012. Karena ukuran sampel kurang dari 5% dari ukuran populasi, kita
dapat mengabaikan faktor koreksi populasi terbatas. Berapa simpangan baku dari gaji manajer
diatas?

𝜎 4000
𝜎𝑥̅ = = = 730.3
√𝑛 √30

5. Distribusi sampling untuk p

Proporsi sampel p adalah pendugaan titik proporsi populasi p. Rumus untuk


menghitung proporsi sampel adalah

𝑥
p =
𝑛
Nilai diharapkan (expected value):

E( p ) = p ,

dimana p = proposi populasi.

Simpangan baku (standard deviation):

1. Populasi terbatas

𝑁−𝑛 𝑝(1−𝑝)
𝜎𝑝̅ = √ √
𝑁−1 𝑛

2. Populasi tidak terbatas

STAT6145 – Business Statistics|7


𝑝(1−𝑝)
𝜎𝑝̅ = √
𝑛

*Faktor koreksi

√(𝑁 − 𝑛)/(𝑁 − 1)

*Populasi terbatas dan ukuran sampel kurang dari atau sama dengan 5% dari ukuran
populasi, maka n / N ≤ 0,05.

6. Metode Pengambilan Sampel Lainnya


1. Pengambilan Sampel Acak Stratified
Dalam stratified random sampling, elemen-elemen dalam populasi pertama-
tama dibagi menjadi kelompok-kelompok yang disebut strata, sehingga setiap elemen
dalam populasi milik satu dan hanya satu strata. Dasar untuk membentuk strata, seperti
departemen, lokasi, usia, jenis industri, dan sebagainya, berada pada kebijaksanaan
perancang sampel.
Hasil terbaik diperoleh ketika elemen-elemen dalam setiap strata sama
sebanyak mungkin (yaitu kelompok yang homogen).
Contoh: Dasar untuk membentuk kemungkinan strata departemen, lokasi, umur,
jenis industri, dan sebagainya.
Keuntungan: Jika strata homogen, metode ini memberikan hasil yang "tepat"
seperti pengambilan sampel acak sederhana tetapi dengan ukuran sampel total yang
lebih kecil.
2. Pengambilan Sampel Kluster
Populasi pertama-tama dibagi menjadi kelompok-kelompok unsur yang
terpisah yang disebut dengan kluster.
Idealnya, setiap kluster adalah versi populasi skala kecil yang representatif (mis.
Kelompok heterogen). Sampel acak sederhana dari cluster kemudian diambil. Semua
elemen dalam setiap cluster sampel (dipilih) membentuk sampel.
Contoh: Aplikasi utama adalah pengambilan sampel area, di mana cluster
adalah blok kota atau area lain yang terdefinisi dengan baik.

STAT6145 – Business Statistics|8


Keuntungan: Kedekatan elemen dapat menjadi efektif biaya (mis. Banyak
pengamatan sampel dapat diperoleh dalam waktu singkat).
Kerugian: Metode ini umumnya membutuhkan ukuran sampel total yang lebih
besar daripada pengambilan sampel acak sederhana atau bertingkat.
3. Pengambilan Sampel Sistematik
Jika ukuran sampel (n) yang diinginkan dari populasi yang mengandung elemen
(N), kita dapat mengambil sampel satu elemen untuk setiap elemen N/n dalam populasi.
Secara acak kita akan memilih salah satu elemen N/n pertama dari daftar populasi.
Selanjutnya kemudian kita memilih setiap N/n elemen yang mengikuti dalam daftar
populasi.
Metode ini memiliki sifat-sifat sampel acak sederhana, terutama jika daftar
elemen populasi adalah urutan acak.
Contoh: Memilih setiap daftar ke-100 dalam buku telepon setelah daftar
pertama yang dipilih secara acak.
Keuntungan: Sampel biasanya akan lebih mudah diidentifikasi daripada jika
sampling acak sederhana digunakan.
4. Pengambilan Sampel Kemudahan
Ini adalah teknik pengambilan sampel yang nonprobability. Item dimasukkan
dalam sampel tanpa diketahui kemungkinan terpilih. Sampel diidentifikasi terutama
oleh kenyamanan.
Contoh: Seorang profesor yang melakukan penelitian mungkin menggunakan
sukarelawan mahasiswa untuk menjadi sampel.
Keuntungan dan kerugian metode pengambilan sample kenyamanan ini adalah
pemilihan sampel dan pengumpulan data relatif mudah dan tidak mungkin menentukan
seberapa representatif populasi sampel.
5. Pengambilan Sampel Pertimbangan
Orang yang paling berpengetahuan tentang subjek penelitian memilih elemen-
elemen populasi yang menurutnya paling representatif dari populasi. Ini adalah teknik
pengambilan sampel yang nonprobability.
Contoh: Seorang reporter dapat mengambil sampel tiga atau empat senator,
menilai mereka mencerminkan pendapat umum senat.

STAT6145 – Business Statistics|9


Keuntungan dan kerugian metode pengambilan sample pertimbangan ini adalah
cara yang relatif mudah untuk memilih sampel dan kualitas hasil sampel tergantung
pada penilaian orang yang memilih sampel.

7. Estimasi Interval Rata-rata Populasi:  diketahui


Untuk mengembangkan estimasi interval rata-rata populasi, baik standar deviasi populasi
atau standar deviasi sampel harus digunakan untuk menghitung margin kesalahan (margin of
error). Dalam sebagian besar aplikasi, tidak diketahui, dan  digunakan untuk menghitung
margin kesalahan. Dalam beberapa aplikasi, sejumlah besar data historis yang relevan tersedia
dan dapat digunakan untuk memperkirakan simpangan baku populasi sebelum pengambilan
sampel. Juga, dalam aplikasi kontrol kualitas di mana suatu proses diasumsikan beroperasi
dengan benar, atau "dalam kendali," adalah tepat untuk memperlakukan standar deviasi
populasi seperti yang diketahui.

Contoh:

Setiap minggu Lloyd's Department Store memilih sampel acak sederhana sebanyak 100
pelanggan untuk mengetahui jumlah yang dihabiskan per perjalanan belanja. Dengan x
mewakili jumlah yang dihabiskan per perjalanan belanja, rata-rata sample 𝑥̅ memberikan
estimasi titik , jumlah rata-rata yang dihabiskan per perjalanan belanja untuk populasi semua
pelanggan Lloyd. Lloyd's telah menggunakan survei mingguan selama beberapa tahun.
Berdasarkan data historis, Lloyd sekarang mengasumsikan nilai = $ 20 yang diketahui untuk
standar deviasi populasi. Data historis juga menunjukkan bahwa populasi mengikuti distribusi
normal. Selama minggu terakhir, Lloyd mensurvei 100 pelanggan (n = 100) dan memperoleh
sampel rata-rata 𝑥̅ = $ 82. Jumlah rata-rata sampel yang dihabiskan memberikan estimasi titik
dari jumlah rata-rata populasi yang dihabiskan per perjalanan belanja,. Dalam diskusi
berikutnya, kami menunjukkan cara menghitung margin kesalahan untuk estimasi ini dan
mengembangkan estimasi interval rata-rata populasi.

Jawab:

 20
x  = =2
n 100

𝒛𝜶/𝟐 = 𝒛𝟎.𝟎𝟓/𝟐 = 𝒛𝟎.𝟎𝟐𝟓 = 1.96

STAT6145 – Business Statistics|10


Cari nilai tabel dibawah ini dengan cara 1 – 0.025 = 0.9750, kemudian dari dalam tabel nilai
0.9750 ditarik horisontal dan didapatkan nilai 1.9, selanjutnya tarik vertikal dan didapatkan
nilai 0.05. Terakhir 1.9 + 0.06 = 1.96

Sumber: Anderson (2018)

Margin of error

𝑧𝛼/2 .  x  1.96 (2) = 3.92

Estimasi Interval Rata-rata Populasi:  diketahui


𝝈 𝝈
̅ − 𝒛𝜶/𝟐
𝒙 ̅< 𝒙
<𝒙 ̅ + 𝒛𝜶/𝟐
√𝒏 √𝒏

$ 82 – 3.92 < $ 82 < $ 82 + 3.92


$ 78.08 < $ 82 < 85.92

n n
Rumus ini digunakan apabila  0,05 ; dan apabila  0,05 maka rumus di atas menjadi :
N N

STAT6145 – Business Statistics|11


 N n  N n
x  Z / 2     x  Z / 2 
n N 1 n N 1

8. Estimasi Interval Rata-rata Populasi:  tidak diketahui


Ketika mengembangkan estimasi interval dari suatu populasi berarti kita biasanya tidak
memiliki estimasi yang baik untuk standar deviasi populasi. Dalam kasus ini, kita harus
menggunakan sampel yang sama untuk memperkirakan  dan . Situasi ini merupakan kasus
yang tidak diketahui. Ketika s digunakan untuk memperkirakan , margin kesalahan dan
perkiraan interval untuk rata-rata populasi didasarkan pada distribusi probabilitas yang dikenal
sebagai distribusi t.

Contoh:

Sampel rumah tangga berdasarkan penggunaan saldo kartu kredit adalah n = 70 dan data
tersebut ditunjukkan pada Tabel 2.

Tabel 2. Saldo Kartu Kredit untuk Sampel 70 Rumah Tangga

Sumber: Anderson (2018)

Jawab:

𝑥̅ = $9430 + $7535 + $4078 + ⋯ + $10324/ 70 = $𝟗𝟑𝟏𝟐

($9430− $9312) 𝟐 +($7535−$9312) 𝟐 + ($4078−$9312)𝟐 + …+ ($10324−$9312)𝟐


S=√ = $𝟒𝟎𝟎𝟕
𝟕𝟎−𝟏

STAT6145 – Business Statistics|12


s 4007
=  478.96
n 70

df = n − 1 = 69 degrees of freedom

Dengan menggunakan tingkat keryakinan sebesar 95%, maka 𝒕𝜶/𝟐 = 𝒕𝟎.𝟎𝟓/𝟐 = 𝒕𝟎.𝟎𝟐𝟓 =
1.995

Cari nilai tabel dibawah ini dengan cara tentukan nilai df secara vertikal sebesar 69, kemudian
cari nilai 0.025 pada baris paling atas, selanjutnya tarik ke dalam tabel dan didapatkan nilai
1.995

Sumber: Anderson (2018)

Margin of Error
𝑆
𝑡𝛼/2 = 1.995 (478.96) = 995
√𝑛

STAT6145 – Business Statistics|13


Estimasi Interval Rata-rata Populasi:  tidak diketahui
𝑆 𝑆
𝑥̅ − 𝑡𝛼/2 < 𝑥̅ < 𝑥̅ + 𝑡𝛼/2
√𝑛 √𝑛

$9312 − $995 < $9312 < $9312 + $955


$8357 < $9312 < $10,267

9. Menentukan ukuran sampel

Ukuran sampel digunakan dalam memberikan perkiraan interval yang tepat ketika
populasi tidak terdistribusi secara normal. Di bagian ini, kami fokus pada aspek lain dari
masalah ukuran sampel. Kami menjelaskan cara memilih ukuran sampel yang cukup besar
untuk memberikan margin kesalahan yang diinginkan.

Jika margin kesalahan yang diinginkan dipilih sebelum pengambilan sampel, prosedur
dalam bagian ini dapat digunakan untuk menentukan ukuran sampel yang diperlukan untuk
memenuhi persyaratan margin kesalahan.

E adalah margin kesalahan yang diinginkan


𝜎
𝐸 = 𝑧𝛼/2
√𝑛
Ukuran Sampel yang Diperlukan
(𝑧𝛼/2 )2 𝜎 2
n=
𝐸2

Contoh:

Sebuah studi yang pernah dilakukan oleh peneliti sebelumnya yang menyelidiki biaya
sewa mobil di Amerika Serikat menemukan biaya rata-rata sekitar $ 55 per hari untuk menyewa
mobil menengah. Misalkan organisasi yang melakukan penelitian ini ingin melakukan studi
baru untuk memperkirakan sampel biaya sewa harian untuk mobil menengah di Amerika
Serikat. Dalam mendesain studi baru, direktur proyek akan menentukan berapa sampel biaya
sewa harian dengan margin of error adalah $ 2 dan tingkat kepercayaan 95%.

Jawab :

E = 2,
Tingkat kepercayaan adalah 95%, maka 𝑧0.025 = 1.96

STAT6145 – Business Statistics|14


Dengan demikian, ukuran sampel untuk studi baru harus setidaknya 89.43 sewa mobil
menengah untuk memenuhi persyaratan margin-of-error $ 2 yang telah ditentukan oleh
direktur proyek. Dalam kasus di mana n yang dihitung bukan bilangan bulat, kami
membulatkan ke nilai bilangan bulat berikutnya; karenanya, ukuran sampel yang disarankan
adalah 90 persewaan mobil menengah.

STAT6145 – Business Statistics|15


SIMPULAN

1. Rata-rata sampel memberikan perkiraan dari rata-rata populasi, dan proporsi sampel
memberikan perkiraan dari proporsi populasi. Dengan perkiraan seperti ini, beberapa
kesalahan estimasi dapat diperkirakan.Distribusi probabilitas dengan variabel acak
disebut distribusi sampling.

2. Secara khusus, kita menggambarkan distribusi sampling dari rata-rata sampel, x , dan
proporsi sampel, p .
3. Pendugaan titik merupakan suatu nilai dari sampel sebagai estimator parameter.

STAT6145 – Business Statistics|16


DAFTAR PUSTAKA

1. David R. Anderson. (2018). Statistics for business and economics. Cengage Learning.
Boston. ISBN: 9781337094160. Chapter 7, 8.

STAT6145 – Business Statistics|17

Anda mungkin juga menyukai