Anda di halaman 1dari 53

PROBABILITAS DAN STATISTIK

TEORI PENARIKAN SAMPEL


(SAMPLING)

By :
Suthami Ariessaputra, ST. M.Eng
Agung BM, ST., MT
Teori Penarikan Sampel (Sampling)

 Dalam survey statistik, hasil pengamatan dicatat dalam


numerik. Obyek yang diamati bisa manusia, hewan, atau
benda lainnya.
 Dalam setiap penelitian banyaknya pengamatan dinyatakan
sebagai ukuran populasi yang mungkin :
 kecil

 besar tapi masih berhingga

 tidak berhingga
Teori Penarikan Sampel (Sampling)

 Populasi (population) adalah adalah kumpulan dari seluruh


obyek yang diamati.
 Tiap pengamatan dalam populasi merupakan suatu nilai dari
suatu peubah Acak X dengan suatu distribusi peluang f(x).

 Sampel (Sample) adalah himpunan bagian dari populasi yang


karakteristiknya hendak diselidiki/diduga; dianggap bisa
mewakili populasi.
Teori Penarikan Sampel (Sampling)

Inferensia Statistik
 Tujuan dari inferensia statistik adalah untuk memperoleh
informasi tentang populasi berdasarkan informasi sampel untuk
menarik suatu kesimpulan.
Teori Penarikan Sampel (Sampling)

Alasan Pengambilan Sampel :


1. Hasil penelitian dengan hasil ketelitian yang
tidak mutlak, sehingga dapat menghemat
biaya dan waktu
2. Untuk sumberdaya yang terbatas dan obyek
bersifat seragam, pengambilan sampel dapat
memperluas cakupan studi
3. Bila proses riset bersifat destruktif, pengambilan sampel dapat
menghemat produk
4. Apabila akses ke seluruh populasi tidak dapat dilakukan, pengambilan
sampel adalah satu satunya pilihan
5. Mudah mengontrol tingkat kesalahan non sampling (non teknis) dalam
menentukan hipotesa untuk pengambilan keputusan
Teori Penarikan Sampel (Sampling)

Kesalahan
1. Kesalahan Sampling
2. Kesalahan Non Sampling (dapat terjadi pd sensus/sample
survey), disebabkan oleh :
a. populasi yang tidak jelas (sumber informasi populasi)
b. pertanyaan yang tdk tepat (kuisioner yg tdk jelas)
c. kesalahan lain : kalkulasi, salah ketik dll
Teori Penarikan Sampel (Sampling)

 Setiap Pensamplingan akan menghasilkan suatu kesimpulan


yang konsisten dalam menaksir/estimasi, sehingga perlu
diperiksa apakah nilai sampel tersebut memenuhi sifat-sifat
sebagai estimator yang baik, yaitu:
1. Tak bias (Unbiased), yaitu jika nilai harapan dari estimator
sama dengan nilai parameter populasi yang diestimasi.
2. Efisien (Efficient), yaitu jika estimator tersebut memiliki
standar error yang paling kecil dibandingkan estimator tak
bias yang lain.
3. Konsisten (Consistent), apabila estimator tersebut
cenderung mendekati nilai parameter populasi jika ukuran
sampel ditingkatkan (semakin besar).
Teori Penarikan Sampel (Sampling)

 Tujuan memilih sampel acak yaitu untuk mendapatkan


keterangan mengenai parameter populasi yang belum
diketahui.

Bias = nilai statistik (sample) – nilai parameter (populasi)

 Nilai statistik adalah setiap fungsi dari peubah acak yang


membentuk suatu sampel acak.
Teori Penarikan Sampel (Sampling)
Teori Penarikan Sampel (Sampling)
Karakteristik Populasi dan Sampel
Nilai Statistik dari sampel

 Nilai Statistik dari sampel :


DISTRIBUSI SAMPEL
1. Distribusi Sampel Dari Rerata (X)
2. Distribusi Sampel dari Selisih Dua Rataan
3. Distribusi Sampel Dari Varians s2
4. Distribusi t-student
Distribusi Sampel

Merupakan bidang statistik inferensi yaitu dengan melakukan pengamatan untuk memperoleh
prediksi (estimasi) dari populasi. Distribusi Sampel merupakan distribusi peluang dari suatu
nilai statistik.
 Dalam menentukan jumlah sampel, angka yang dicari adalah angka yang cukup besar
sehingga pengukurannya nanti cukup reliabel, cukup presisi dan sebagainya tapi tidak
terlalu besar sehingga terlalu mahal, kurang manageable, dan sebagainya.
 Jadi penentuan sampel tidak langsung menetapkan sekian persen dari populasi (10%,
25%, dsb.).
 Aturan umum untuk jumlah sampel adalah sekitar 30 ke atas walau sebenarnya jumlah itu
terlalu sedikit. Di bawah jumlah itu, rumus statistik yang digunakan adalah rumus2 statistik
nonparametrik yaitu untuk analisa statistik jumlah kecil.
 Angka 30 tersebut karena distribusi frekuensinya sudah mulai berbentuk kurve normal
yaitu bentuk kurve dari distribusi frekuensi populasi.
 Jika jumlah populasi target tidak banyak, disarankan sensus yang tidak ada sampling
error-nya (tapi coverage-nya harus tinggi misalnya 95% populasi ter-cover).
Distribusi Sampel

 Dalam estimasi titik kita menggunakan data sampel untuk


menghitung suatu nilai statistik sebagai estimasi parameter
populasi.
Contoh:
 Ẋ sebagai estimator titik dari rata-rata populasi, μ
 s sebagai estimator titik dari simpangan baku populasi, σ.
 p sebagai estimator titik dari proporsi populasi, p
 Sampling error merupakan perbedaan absolut antara
estimator tak bias (unbiased) dengan paramemter populasi.
Distribusi Sampel

 Contoh sampling error (Galat Baku) :


1 Distribusi Sampel Dari Rerata (X)
Distribusi Sampel Dari Rerata (X)

 Jika ada n pengamatan diambil dari populasi normal dengan rerata μ dan
varians σ2 Tiap pengamatan Xi (sampel) ; i = 1,2,3,…..,n dari sampel acak
akan berdistribusi normal juga yang sama dengan populasi yang diambil
sampelnya.

 Berdistribusi normal dengan rerata dan varians:


Distribusi Sampel Dari Rerata (X)

Contoh
1. Suatu sampel acak berukuran n = 10 diambil tanpa pengembalian dari
populasi tak berhingga yang berdistribusi normal dengan rataan 5.5 dan
simpangan baku 2.92, setiap sampel lalu dihitung rataannya. Tentukan
rataan dan simpangan baku dari sampel rataan tersebut.
Distribusi Sampel Dari Rerata (X)

Contoh
1. Suatu sampel acak berukuran n = 10 diambil tanpa pengembalian dari
populasi tak berhingga yang berdistribusi normal dengan rataan 5.5 dan
simpangan baku 2.92, setiap sampel lalu dihitung rataannya. Tentukan
rataan dan simpangan baku dari sampel rataan tersebut.

Solusi
 Sampel rataan tersebut mempunyai rataan:
μx = μ = 5.5
 simpangan baku:
Teorema limit tengah untuk rata-rata
(hampiran normal)
# Bila populasi yang disampel tidak diketahui
distribusinya
Teorema limit tengah untuk rata-rata
(hampiran normal)
 Apabila sampel berukuran n besar (>30) diambil dari populasi
yang mempunyai rata-rata μ dan deviasi standar σ, maka
ratarata sampel Ẋ akan terdistribusi normal dengan rata-rata μ
dan deviasi standar σ/√n
 Khusus: apabila populasinya terdistribusi normal, maka n pada
teorema di atas tidak harus besar.
 Hal ini dinyatakan oleh Teorema Limit Pusat sebagai berikut:
Teorema limit tengah untuk rata-rata
(hampiran normal)
Contoh
2. Suatu perusahaan memproduksi bola lampu yang umurnya berdistribusi
hampir normal dengan rataan 800 jam dan simpangan baku 40 jam.
Hitunglah peluangnya bahwa suatu sampel acak dengan 16 bola lampu
akan mempunyai umur rata-rata kurang dari 775 jam.
Teorema limit tengah untuk rata-rata
(hampiran normal)
2. Suatu perusahaan memproduksi bola lampu yang umurnya berdistribusi
hampir normal dengan rataan 800 jam dan simpangan baku 40 jam.
Hitunglah peluangnya bahwa suatu sampel acak dengan 16 bola lampu
akan mempunyai umur rata-rata kurang dari 775 jam.
Solusi
 Secara hampiran, distribusi sampel Ẋ akan berdistribusi normal dengan
μx = 800 dan σx = 40/ √16 = 10.
 Peluang yang dicari diberikan oleh luas daerah yang dihitami pada
gambar. Nilai z yang berpadanan dengan Ẋ = 775 adalah
Teorema limit tengah untuk rata-rata
(hampiran normal)
Contoh
3. Diketahui sebuah populasi berdistribusi seragam diskrit:

Hitunglah peluang bahwa sampel acak berukuran 36, yang dipilih dengan
pengembalian, akan menghasilkan rataan sampel lebih besar dari 1.4
tetapi lebih kecil dari 1.8 bila rataan diukur (dibulatkan) sampai
persepuluhan terdekat.
Teorema limit tengah untuk rata-rata
(hampiran normal)
Solusi
 Rataan dan variansi dihitung dengan rumus yang terdapat pada
materi distribusi seragam diskrit, dan diperoleh :
μ = (0 + 1 + 2 + 3)/4 = 3/2 = 1.5
Teorema limit tengah untuk rata-rata
(hampiran normal)
Solusi

2 Distribusi Sampel dari Selisih Dua Rataan
Distribusi Sampel dari Selisih Dua Rataan

 Bila sampel bebas dengan ukuran n1 dan n2 diambil secara


acak dari dua populasi diskrit maupun kontinu, masing-masing
dengan rerata μ1 dan μ2 dan varians σ12 dan σ22, maka
distribusi sampel dari selisih rerata, Ẋ1 - Ẋ2 berdistribusi
hampir normal dengan rerata dan varians :

 Sehingga
Distribusi Sampel dari Selisih Dua Rataan

 Jika n1 dan n2 keduanya lebih besar atau sama dengan 30,


hampiran normal untuk distribusi Ẋ1 - Ẋ2 sangat baik tidak
bergantung pada bentuk kedua populasi (normal atau bukan).
 Akan tetapi, bila n1 dan n2 keduanya kurang dari 30,
hampiran normal lumayan baik kecuali bila kedua populasi
jauh dari normal.
 Tentu saja jika kedua populasi normal, maka berdistribusi
normal terlepas dari ukuran n1 dan n2 .
Distribusi Sampel dari Selisih Dua Rataan

Contoh
4. sampel berukuran n1=5 diambil secara acak dari populasi
yang berdistribusi normal dengan rataan μ1 =50 dan variansi
σ12 = 9, dan rataan sampel Ẋ1 dihitung. Sampel acak kedua
berukuran n2= 4 diambil, bebas dari yang pertama, dari
populasi lain yang juga berdistribusi normal, dengan rataan
μ2 = 40 dan variansi σ22 = 4, dan rataan sampel Ẋ2 dihitung.
Carilah P(Ẋ1 - Ẋ2 < 8,2).
Distribusi Sampel dari Selisih Dua Rataan
Distribusi Sampel dari Selisih Dua Rataan

Contoh
5. Layar televisi yang dibuat pabrik A mempunyai rataan umur
6.5 tahun dengan simpangan baku 0.9 tahun, sedangkan hasil
dari pabrik B mempunyai rataan umur 6.0 tahun dengan
simpangan baku 0.8 tahun. Berapakah peluang bahwa suatu
sampel acak berukuran 36 buah Layar TV dari pabrik A akan
mempunyai rataan umur paling sedikit satu tahun lebih lama
dari rataan umur sampel 49 buah Layar TV dari pabrik B?
Distribusi Sampel dari Selisih Dua Rataan

Solusi
 Diketahui data berikut:
Populasi I Populasi II

μ1 = 6.5 μ2 = 6.0

σ1 = 0.9 σ2 = 0.8

n1 = 36 n2 = 49
Distribusi Sampel dari Selisih Dua Rataan

Solusi
 Distribusi sampel 1 - X2 akan berdistribusi hampiran normal dan mempunyai
rataan dan simpangan baku:

 Peluang bahwa rataan 36 buah layar TV dari pabrik A paling sedikit 1 tahun
lebih lama dari rataan 49 Layar TV dari pabrik B adalah P(Ẋ1 - Ẋ2 ≥ 1.0)
 Padanan nilai 1.0 adalah z = (1.0 – 0.5)/0.189 = 2.65
Sehingga
3 Distribusi Sampel Dari Varians s2
Distribusi Sampel Dari Varians s2

 Bila n sampel diambil dari populasi normal dengan rerata dan


varians μ dan σ2 dan varians sampel s2 dihitung (belum
diketahui), maka diperoleh suatu nilai statistik s2 akan
berdistribusi khi kuadrat dengan besaran :

 Derajat kebebasan (Degrees of Freedom) : dari suatu besaran


dengan distribusi hampiran normal (khi kuadrat dan t-student)
adalah banyaknya variable yang berpengaruh pada
perhitungan besaran tersebut.
Distribusi Sampel Dari Varians s2

 Nilai distribusi khi kuadarat χ2 (tidak simetris) dinyatakan


dalam tabel dirtribusi χ2 dengan luasan α (taraf
kepercayaan), nilai tersebut biasanya dinyatakan dengan
χ2. α.
Distribusi Sampel Dari Varians s2

Contoh :
6. Suatu pabrik baterai mobil menjamin dengan keyakinan 95
% bahwa baterainya akan tahan rata-rata 3 tahun dengan
simpangan baku 1 tahun. Bila lima baterai tahan 1,9; 2,4;
3,0; 3,5 dan 4,2 tahun, apakan pembuat baterai masih
yakin bahwa simpangan baku masih 1 tahun.
Distribusi Sampel Dari Varians s2

Contoh :
6. Suatu pabrik baterai mobil menjamin dengan keyakinan 95
% bahwa baterainya akan tahan rata-rata 3 tahun dengan
simpangan baku 1 tahun. Bila lima baterai tahan 1,9; 2,4;
3,0; 3,5 dan 4,2 tahun, apakan pembuat baterai masih
yakin bahwa simpangan baku masih 1 tahun.
Solusi :
Distribusi Sampel Dari Varians s2

Solusi:

 Merupakan suatu nilai distribusi khi-kuadrat dengan derajat kebebasan 4.


 Karena 95% nilai X2 dengan derajat kebebasan 4 terletak antara 0,484
dan 11,143, nilai perhitungan dengan menggunakan σ2 = 1 masih wajar,
sehingga tidak ada alasan bagi pembuatnya untuk mencurigai bahwa
simpangan baku baterainya bukan 1 tahun.
4 Distribusi t-student
Distribusi t-student
 Bila n sampel yang diambil dari populasi kecil (<30) dengan s2 yang
berubah cukup besar dari sampel satu ke sampel lain dan nilai σ2 tidak
deketahui distribusi peubah acak akan menyimpang jauh
dari distribusi normal baku.

 Maka kondisi tersebut distribusi peubah acak normal baku (Z) dapat
dinyatakan dengan distribusi T-student, dinyatakan sbb :
Ciri ciri Distribusi-t
Ciri - Ciri Distribusi T :
 Kurva dari distribusi t memiliki bentuk mirip dengan kurva normal, namun
lebih runcing dengan luasan α.
 Ciri khusus: distribusi t tergantung pada suatu parameter yang disebut
derajat bebas (degrees of freedom).
 Jika derajat bebas meningkat maka perbedaan distribusi t dengan distribusi
normal baku semakin kecil.
 Distribusi t dengan derajat bebas yang lebih besar memiliki varian yang
lebih kecil.
 Rata-rata dari distribusi t = 0 (nol).
 Membaca Tabel Student’s t
Misalkan α = 0,05 dan n = 10,
maka nilai tabel
Contoh Distribusi-t
Contoh
7. Nilai t dengan derajat kebebasan v = 14 sehingga luas
di sebelah kirinya 0.025 (jadi luas di sebelah kanannya
= 1 – 0.025 = 0.975) adalah?

Solusi :
t0.975 = – t0.025 = – 2.145
Contoh Distribusi-t
Contoh
7. Cari P(-t0,025< T < t0,05).

Solusi:
 Karena luas di sebelah kanan t0,05 adalah 0,05 dan luas di
sebelah kiri -t0,025 adalah 0,025, maka jumlah luas antara -
t0,025 dan t0,05 adalah
= 1 – 0,05 – 0,025
= 0,925
 jadi P(-t0,025< T < t0,05) = 0,925
Contoh Distribusi-t
Contoh
8. Untuk sampel berukuran n = 10 dan α = 0.05, tentukanlah
P(T < tα) dan P(- tα < T < tα ). Cari P(-t0,025< T < t0,05).

Solusi:
 Derajat kebebasan = n – 1 = 10 – 1 = 9.
t0.05 = 1.833
 Jadi, P(T < 1.833) = 1 – 0.05
= 0.95
dan P(-1.833 < T < 1.833) = 1 – 0.05 – 0.05
= 0.90
Latihan
Latihan

1. Populasi mahasiswa di jurusan Fakultas Teknik terdiri dari


populasi mahasiswa laki-laki dan populasi mahasiswa
perempuan. Diketahui rata-rata tinggi badan mahasiswa laki-
laki adalah 164 cm dengan simpangan baku 5.3 cm,
sedangkan rata-rata tinggi mahasiswa perempuan adalah
153 cm dengan simpangan baku 5.1 cm. Misalkan dari kedua
populasi tersebut diambil sampel secara acak yang saling
bebas masing-masing 150 orang, berapa peluang rata-rata
tinggi mahasiswa laki-laki paling sedikit 12 cm lebihnya
daripada rata-rata tinggi mahasiswa perempuan.
Latihan
2. Tentukan P(-t0,025<T<t0,05)

3. Cari nilai k yang memenuhi P(k<T<-1,761) = 0,045 untuk suatu


sampel acak berukuran 15 yang diambil dari populasi dengan
distribusi normal.

4. Suatu pabrik bola lampu yakin bahwa bola lampunya akan tahan
menyala rata-rata selama 500 jam. Untuk mempertahankan nilai
tersebut, tiap bulan diuji 25 bola lampu. Bila nilai t yang dihitung
terletak antara –t0,05 dan t0,05 maka pengusaha pabrik tadi akan
mempertahankan keyakinannya. Kesimpulan apakah yang
seharusnya diambil dari sampel dengan rerata X = 518 jam dan
simpangan baku s = 40 jam. Anggap bahwa distribusi waktu lama
lampu secara hampiran normal.
Referensi
 Rinaldi Munir. Bahan Kuliah II2092 Probabilitas dan Statistik . Sekolah Teknik
Elektro dan Informatika ITB
 Agung B.M. Diktat Probabilitas dan Statistik. Universitas Mataram
 Google.com

Anda mungkin juga menyukai