Anda di halaman 1dari 4

1.

3 DISTRIBUSI INDUK DAN SAMPEL

Jika kita melakukan pengukuran x, dari suatu besaran x, kita mengharapkan pengamatan kita
untuk memperkirakan besaran tersebut, tetapi kita tidak mengharapkan titik data eksperimen
sama persis dengan besaran tersebut. Jika kita melakukan pengukuran lain, kita berharap untuk
mengamati perbedaan antara dua pengukuran karena kesalahan acak, dan kita tidak
mengharapkan penentuan keduanya tepat, yaitu sama dengan x. Saat kami melakukan lebih
banyak pengukuran, sebuah pola akan muncul dari data. Beberapa pengukuran akan terlalu
besar, beberapa akan terlalu kecil. Rata-rata, bagaimanapun, kami berharap mereka
didistribusikan di sekitar nilai yang benar, dengan asumsi kami dapat mengabaikan atau
mengoreksi kesalahan sistematis.
Jika kita dapat melakukan pengukuran dalam jumlah tak terhingga, maka kita dapat
menggambarkan dengan tepat distribusi titik-titik data. Ini tidak mungkin dalam praktiknya,
tetapi kita dapat berhipotesis tentang keberadaan distribusi semacam itu yang menentukan
probabilitas untuk mendapatkan pengamatan tertentu dalam satu pengukuran. Distribusi ini
disebut distribusi induk. Demikian pula, kita dapat berhipotesis bahwa pengukuran yang kita
lakukan adalah sampel dari distribusi induk dan mereka membentuk distribusi sampel. Dalam
batas jumlah tak hingga pengukuran, distribusi sampel menjadi distribusi induk.
CONTOH 1.2 Dalam percobaan laboratorium fisika, siswa menjatuhkan bola sebanyak 50 kali
dan mencatat waktu yang dibutuhkan bola untuk jatuh 2,00 m. Satu set pengamatan, dikoreksi
untuk kesalahan sistematis, berkisar dari sekitar 0,59 detik hingga 0,70 detik, dan beberapa
pengamatan identik. Gambar 1.2 menunjukkan histogram atau plot frekuensi dari pengukuran
ini. Tinggi batang data menunjukkan jumlah pengukuran yang berada di antara dua nilai yang
ditunjukkan oleh batas atas dan bawah batang pada absis plot. (Lihat Lampiran D.)
Jika distribusi hasil dari kesalahan acak dalam pengukuran, maka sangat mungkin bahwa itu
dapat dijelaskan dalam hal distribusi kesalahan Gaussian atau normal, kurva analisis statistik
berbentuk lonceng yang sudah dikenal, yang akan kita bahas di Bab 2. A Kurva Gaussian,
berdasarkan mean dan standar deviasi pengukuran ini, diplot sebagai garis padat pada Gambar
1.2. Kurva ini merangkum data distribusi sampel dalam model Gaussian dan memberikan
perkiraan distribusi induk.
Data yang diukur dan kurva yang diturunkan darinya jelas tidak sesuai. Kekasaran histogram
eksperimental membedakannya sekaligus dari kurva Gaussian teoretis yang halus. Kita dapat
membayangkan bahwa, jika siswa membuat banyak pengukuran atau menggabungkan beberapa
set pengukuran sehingga mereka dapat memplot histogram dalam bin yang lebih halus dan lebih
halus, dalam keadaan ideal, togramnya pada akhirnya akan mendekati kurva Gaussian yang
mulus. Jika mereka menghitung parameter dari sampel yang begitu besar, mereka dapat
menentukan distribusi induk yang diwakili oleh kurva putus-putus pada Gambar 1.2.
Lebih mudah untuk berpikir dalam bentuk fungsi kepadatan probabilitas p(x), atau dimalisasikan
ke satuan luas (yaitu, sehingga integral dari seluruh kurva sama dengan 1) dan didefinisikan
sedemikian rupa sehingga dalam batas yang sangat besar jumlah N pengamatan, jumlah AN
pengamatan variabel x antara x dan x + Ax diberikan oleh AN = Np(x)Ax. Kurva padat dan
putus-putus pada Gambar 1.2 telah diskalakan dengan cara ini sehingga nilai ordinat sesuai
langsung dengan jumlah pengamatan yang diharapkan dalam rentang Ax dari sampel 50 kejadian
dan area di bawah setiap kurva sesuai dengan total area histogram.

Notasi
Sejumlah parameter dari distribusi induk telah ditentukan oleh konvensi. Kami menggunakan
huruf Yunani untuk menunjukkan mereka, dan huruf Latin untuk menunjukkan perkiraan
eksperimental mereka.
8. Pengurangan Data dan Analisis Kesalahan untuk Ilmu Fisika

GAMBAR 1.2

Histogram pengukuran waktu sebuah bola jatuh 2,00 m. Kurva Gaussian padat
dihitung dari mean (T= 0,635 s) dan standar deviasi (s= 0,020 s) yang diperkirakan dari
pengukuran ini. Kurva putus-putus dihitung dari distribusi induk dengan mean = 0,639 s
dan standar deviasi o= 0,020 s.

Untuk menentukan parameter distribusi induk, kita asumsikan bahwa hasil


eksperimen mendekati besaran induk secara asimtotik ketika jumlah pengukuran
mendekati tak terhingga; yaitu, parameter distribusi eksperimen sama dengan parameter
distribusi induk dalam batas jumlah tak terhingga pengukuran. Jika kita menentukan
bahwa ada N pengamatan dalam percobaan yang diberikan, maka kita dapat menyatakan
ini dengan
Jika kita membuat N pengukuran dan memberi label X₁, X₂, X3, dan seterusnya,
hingga pengukuran akhir x, maka kita dapat mengidentifikasi jumlah semua pengukuran
ini sebagai

di mana ruas kiri diinterpretasikan sebagai jumlah pengamatan x, di atas dex i dari
i = 1 sampai i = N inklusif. Karena kita akan sering menggunakan menjumlahkan N
pengukuran berbagai kuantitas, kami menyederhanakan notasi dengan menghilangkan
indeks setiap kali kami mempertimbangkan jumlah di mana indeks i berjalan dari 1 ke N;

Rata-rata, Median, dan Modus


Dengan definisi sebelumnya, rata-rata x dari distribusi eksperimental diberikan
sebagai jumlah dari N penentuan x, dari kuantitas x dibagi dengan jumlah
penentuan

dan mean dari populasi induk didefinisikan sebagai limit

sehingga garis median memotong area distribusi kepadatan probabilitas


menjadi dua. Karena ketidaknyamanan dalam komputasi, median tidak sering digunakan
sebagai parameter statistik.

Modus, atau nilai Mmax yang paling mungkin, dari populasi induk adalah nilai
yang distribusi induknya memiliki nilai terbesar. Dalam pengukuran eksperimental apa
pun, nilai ini adalah yang paling mungkin diamati. Dalam batas sejumlah besar
pengamatan, nilai ini mungkin paling sering muncul

Hubungan mean, median, dan nilai yang paling mungkin satu sama lain
diilustrasikan pada Gambar 1.3. Untuk distribusi simetris, semua parameter ini akan
sama dengan simetri definisinya. Untuk distribusi asimetris seperti pada Gambar 1.3,
median umumnya berada di antara nilai yang paling mungkin dan mean. Nilai yang
paling mungkin sesuai dengan puncak distribusi, dan luas di kedua sisi median adalah
sama.

Penyimpangan

Penyimpangan d, dari setiap pengukuran x, dari rata-rata dari distribusi induk


didefinisikan sebagai perbedaan antara x, dan

10. Pengurangan Data dan Analisis Kesalahan untuk Ilmu Fisika

Anda mungkin juga menyukai