Anda di halaman 1dari 7

Distribusi Sampling: Penjelasan dan

Contoh Lengkap!

Distribusi sampling adalah distribusi pengukuran statistik seperti rata-rata,


standar deviasi, proporsi yang muncul sebagai akibat dari penggunaan sampel.

Bayangkan kita memiliki sekelompok populasi. Ketika kita mengambil sampel


data, kita akan mendapatkan hasil bahwa terdapat berbagai perbedaan
perhitungan dari satu sampel ke sampel lain.

Perbedaan hasil ini akan membuat perbedaan dalam pengukuran dan penentuan
distribusi sampling.

Jika kita dapat mengukur ketinggian semua orang di dunia (misalkan


melalui sensus) dan menyajikan hasilnya, maka kita telah mendapatkan
distribusi tinggi dari seluruh populasi dunia.
Namun, jika kita hanya mengambil sebagian kecil dari populasi, mungkin sekitar
100 orang per negara, lalu rata-rata dan menyajikan hasilnya, maka kita telah
memperoleh distribusi sampel tinggi dari populasi di seluruh dunia.

Perbedaan sampel dan populasi menyebabkan hadirnya ilmu statistik dalam


menyelesaikan berbagai estimasi dan prediksi.
Sebelum membahas distribusi sampling lebih lanjut, ingat poin-poin berikut ini:

1. Populasi: seluruh hal yang ingin kita periksa


2. Sampel: data atau informasi yang kita miliki tentang populasi
3. Statistik: metode atau teknik yang dapat digunakan untuk memperkirakan
populasi
4. Distribusi sampel: metode yang digunakan untuk menghasilkan nilai yang
mampu menggambarkan kondisi populasi melalui proses statistik.
Distribusi sampel akan tergantung pada kondisi distribusi populasi. Sebelum
memilih sampel, pelajari tentang populasi terlebih dahulu melalui referensi yang
tersedia. Sampel yang digunakan harus acak dan independen.

Sama seperti yang lain, distribusi sampling juga memiliki statistik


deskriptif seperti grafik, rata-rata, median, modus, skewness, dan varians
tersendiri.
Daftar isi [tutup]
 Mengapa distribusi sampling penting?
 Rata-rata distribusi sampling
 Hubungan standar deviasi, standar error, dan ukuran sampel
 Sekilas Teorema Limit Pusat
 Peluang untuk Sampel

Mengapa distribusi sampling penting?


Ada beberapa alasan mengapa mengetahui distribusi sampling merupakan hal
yang penting:

1. Distribusi sampling membantu kita untuk memilih sampel secara efektif dan
efisien dengan mempertimbangkan waktu, biaya, dan energi sehingga kita dapat
memperkirakan parameter dengan benar.

2. Teknologi informasi membantu kita menggunakan analisis dan pengukuran


yang tepat dalam menghasilkan parameter populasi.

Untuk memberikan gambaran, berikut saya berikan ilustrasi distribusi sampling.

Rata-rata distribusi sampling


Secara umum, rata-rata populasi dan semua sampel yang memungkinkan
adalah sama. Tetapi, kita harus menunjukkannya secara berbeda.
Untuk memahami rata-rata, saya sarankan anda membaca artikel mean, median,
dan modus ini!

Hubungan standar deviasi, standar error,


dan ukuran sampel
Dalam pendugaan parameter melalui statistik, tentu saja terdapat kemungkinan
terjadinya kesalahan.

Silakan lihat formula berikut:

Sekarang, berdasarkan formula di atas, kita melihat bahwa semakin banyak


jumlah sampel, nilai standar error semakin kecil.

Ini berarti memiliki lebih banyak data membuat varians dan kesalahan standar
semakin kecil dan menghasilkan estimasi parameter lebih akurat.

Juga, semakin besar standar deviasi untuk populasi, semakin besar


kesalahannya.

Untuk mendaparkan standar error yang kecil, kita harus menemukan standar
deviasi populasi terkecil dan menggunakan sampel sebanyak mungkin.

Tentu saja, kita harus mempertimbangkan batasan seperti waktu, uang, dan
kemampuan.

Sekilas Teorema Limit Pusat


Anggap saja, kita sudah memiliki nilai mean, standard error, dan standar deviasi
dari kelompok sampel.
Sekarang, anda harus menentukan apa distribusi sampling. Biasanya, ada dua
syarat dalam menentukan distribusi sampling.

Pertama, distribusi asli untuk populasi adalah normal, kedua, distribusi asli
populasi tidak normal, kadang-kadang distribusi tidak diketahui.

Kita basa satu per satu!

1. Jika distribusi populasi normal


Jika populasi normal, maka sampel juga akan memiliki distribusi normal. Kita
tidak perlu membahas ini secara rinci karena sudah terbukti.

2. Jika distribusi populasi tidak normal atau tidak diketahui


Jika distribusi populasi tidak normal atau mungkin tidak diketahui, kita tidak dapat
menyimpulkan bahwa sampel tersebut memiliki distribusi normal.

Kita harus mendekati dan mengukur sampel dengan Teorema Limit Pusat.


Teorema Limit Pusat menyatakan bahwa apapun distribusi populasinya,
distribusi sampling mendekati normal jika ukuran sampel cukup besar.
Sederhananya, Teorema Limit Pusat tidak peduli berapa distribusi populasi
selama sampelnya cukup besar.

Pertanyaannya adalah, berapa ukuran sampel yang bisa dikatakan “cukup


besar” menurut CLT?

Yah, sebagian besar ahli dan ahli statistik sepakat bahwa jika jumlah sampel (n)
setidaknya 30, Teorema Limit Pusat sudah bisa diterapkan pada kasus ini.

Saya tahu, terkadang ada beberapa pendapat berbeda. Tapi, ini yang paling
banyak digunakan orang dalam rumus statistik.

Semakin besar ukuran sampel, semakin besar peluang untuk menjadi distribusi
normal.

Menggunakan sampel sebanyak mungkin akan membuat hasilnya lebih baik


karena distribusi sampel akan mendekati normal.

Ingat, Anda tidak perlu menggunakan CLT jika distribusi populasi normal pada
awalnya.
Peluang untuk Sampel
Anggaplah “X” sebagai populasi, dan kita akan mengambil sampel populasi dari
X. Untuk itu, kita perlu menentukan apakah sampel yang kita gunakan memiliki
distribusi normal atau paling tidak mendekati normal.

Untuk menemukan probabilitas dari sampel tersebut, kita harus mengonversi


nilai rata-rata sampel menjadi nilai-z (yang memuat peluang) dengan
menggunakan Z-Tabel.

Rumusnya adalah:

Contoh: Misalkan X adalah populasi dengan tinggi siswa di sekolah dengan


distribusi normal, rata-rata 170 cm dan standar deviasi adalah 10. Anda bertugas
memilih 30 sampel dan mengukur tinggi badan mereka.

Berapa kemungkinan tingginya kurang dari 165 cm?

Jawab:

Kesimpulan: Probabilitas 30 siswa yang dipilih secara acak memiliki tinggi


kurang dari 165 cm adalah 0,0031 atau 0,31 persen.

Catatan: Hal yang perlu anda ingat adalah selama sampel cukup besar
(setidaknya 30 unit sampel), Anda masih dapat memperkirakan probabilitas
menggunakan metode distribusi normal standar (Z) dan mengkonversi nilainya
menggunakan Tabel-Z.
Bagaimana jika sampelnya tidak cukup besar atau kurang dari 30 unit? Untuk
kasus ini, anda bisa selesaikan dengan menggunakan menggunakan distribusi-
t.
Teorema Limit Pusat tidak hanya diterapkan untuk kasus sampel. Teorema ini
juga dapat digunakan untuk proses statistik lain seperti proporsi sampel.

Proporsi populasi adalah jumlah individu dalam populasi yang memiliki


karakteristik tertentu berdasarkan variabel acak binomial.

Proporsi sampel adalah jumlah individu dalam kelompok sampel yang memiliki
karakteristik yang sama.

Misalnya, jika Anda mengambil 1000 orang di sebuah kota dan menemukan 200
orang yang berpenghasilan lebih dari Rp. 10.000.000 per bulan, proporsi sampel
orang yang berpenghasilan lebih dari Rp. 10.000.000 per bulan adalah 0,2.

Catatan:

Hal yang perlu dicatat tentang proporsi populasi:

Contoh:

Ada 1000 mahasiswa universitas yang berpartisipasi dalam survei kesehatan


mental. Siswa ini dipilih secara acak. Ditemukan bahwa 35 persen dari siswa
memiliki masalah kesehatan mental.

Misalkan 40 persen dari mereka mengatakan mereka membutuhkan perawatan


kesehatan mental. Temukan probabilitas dari mahasiswa tersebut!
Kesimpulan: Jika 35 persen siswa memiliki masalah kesehatan mental, peluang
untuk mengambil 1000 sampel siswa dan mendapatkan kurang dari 40 persen
yang membutuhkan konselor adalah sekitar 0,998.

Kesimpulan

Distribusi sampling adalah distribusi pengukuran statistik seperti rata-rata,


standar deviasi, proporsi yang muncul sebagai akibat dari penggunaan sampel.

Semakin besar jumlah sampel, semakin kecil standar error sehingga statistik
yang dihasilkan semakin baik dalam menduga parameter.

Jika jumlah sampel 30, maka sampel sudah bisa diasumsikan memiliki distribusi
normal.

Peluang distribusi sampling bisa didekati dengan tabel Z.

Distribusi sampling sangat memengaruhi berbagai estimasi inferensial statistik.

Anda mungkin juga menyukai