Anda di halaman 1dari 27

Distribusi probabilitas

tion. Sedikit pikiran akan menunjukkan bahwa standar .

deviasi dari nilai ini adalah Vit.


kasus lain mungkin timbul di mana tidak yakin
apakah distribusi induk sesuai dengan sampel yang
diberikan aku s distribusi Poisson. Misalnya, jika salah
satu mengamati jumlah telur yang diletakkan oleh
kawanan ayam di masing-masing beberapa hari, salah
satu mungkin ingin memastikan apakah probabilitas
untuk sejumlah tertentu telur pada hari tertentu
mengikuti distribusi Poisson. Dalam kasus seperti itu
beberapa uji goodness of fit, seperti tes dibahas dalam
Sec. 11, dapat digunakan.

9 Saya Gauss Distribusi, atau Kesalahan Fungsi


Normal

Kita sekarang mempertimbangkan distribusi


probabilitas lain yang adalah penting praktis yang besar,
distribusi Gauss. Hal ini penting karena beberapa
alasan. (1) Ini menggambarkan distribusidari kesalahan
acak dalam berbagai jenis pengukuran. (2) Hal ini
dimungkinkan untuk menunjukkan bahwa bahkan jika
kesalahan individuJangan mengikuti ini distribusi, rata-
rata kelompok kesalahan tersebut didistribusikan
dengan cara yang mendekati distribusi Gauss untuk
kelompok yang sangat besar. Kita mungkin memiliki,
misalnya,set pengamatan yang didistribusikan sesuai
dengan itu xyz distribusi, yang mungkin distribusi sama
sekali. Jika kita mengambil kelompokN observasi dan
rata-rata mereka, maka dalam batas yang sangat besar N
itu rata-rata akan didistribusikan sesuai dengan distribusi
Gauss. Satu-satunya syarat adalah bahwa varians darixyz
distribusi menjadi terbatas. Pernyataan ini
64
9 Gauss Distribusi, atau Kesalahan Fungsi Normal

dikenal sebagai teorema pusat-batas; sangat penting


dalam perkembangan lebih maju dalam matematika
statistik.
Distribusi Gauss dapat dianggap dalam dua
cara: sebagai hasil yang dapat diturunkan secara
matematis dari pertimbangan dasar atau sebagai
rumus ditemukan secara empiris setuju dengan
kesalahan acak yang benar-benar terjadi dalam
pengukuran tertentu. Seseorang telah berkomentar,
pada kenyataannya, bahwa semua orang percaya
bahwa distribusi Gauss menggambarkan distribusi
kesalahan acak, matematikawan karena mereka
berpikir fisikawan telah diverifikasi eksperimental,
dan fisikawan karena mereka berpikir
matematikawan telah terbukti secara teoritis!
Dari sudut pandang teoretis, kita dapat membuat
asumsi yang masuk akal bahwa setiap kesalahan acak
dapat dianggap sebagai hasil dari sejumlah besar
kesalahan elementer, semua sama besarnya, dan masing-
masing memiliki kemungkinan yang sama untuk menjadi
positif atau negatif. Distribusi Gauss karena itu dapat
dikaitkan dengan bentuk membatasi distribusi binomial
di mana jumlah kejadian independen N (Sesuai dengan
kesalahan SD) menjadi sangat besar, sementara
probabilitas p keberhasilan dalam masing-masing
(kemungkinan kesalahan elementer menjadi positif)
adalah i2. Derivasi dari distribusi Gauss dari
pertimbangan-pertimbangan ini diberikan dalam
Lampiran C.
Banyak orang merasa, bagaimanapun, bahwa
pembenaran nyata untuk menggunakan distribusi Gauss
untuk menggambarkan distribusi kesalahan acak adalah
bahwa banyak set pengamatan eksperimental berubah
menaatinya. Ini adalah lebih meyakinkan tentang
65
Distribusi probabilitas
ing alasan daripada derivasi matematika. Oleh karena
itu adalah titik yang valid pandang untuk mengobati
distribusi ini sebagai fakta eksperimental, menyatakan
rumus dogmatis, dan kemudian memeriksa apa artinya
dan apa itu baik untuk.
Fungsi distribusi Gauss sering disebut sebagai fungsi
kesalahan normal, dan kesalahan didistribusikan sesuai
dengan distribusi Gauss dikatakan terdistribusi secara
normal.
Distribusi Gauss adalah
f (x) = (9.1)
dimana Ah, dan m adalah konstanta dan x adalah nilai
yang diperoleh dari satu pengukuran. Distribusi ini
berbeda dari yang kita telah dipertimbangkan
sebelumnya bahwa kami akan menganggapx sebagai
variabel kontinu, bukan integer sebagai dengan distribusi
binomial dan Poisson. Hal ini akan memerlukan beberapa
diskusi lebih lanjut tentang pentingnyaf (x); tapi pertama
kita plot fungsi f (x) untuk mendapatkan gambaran
umum tentang perilakunya.
Gambar 9.1 adalah grafik dari fungsi distribusi
Gauss, Persamaan. (9.1). Kami mencatat
bahwaSEBUAH adalah tinggi maksimum fungsi, m
merupakan nilai dari x yang fungsi mencapai
ketinggian maksimum ini, dan h memiliki sesuatu
untuk dilakukan dengan luasnya atau sempitnya
kurva berbentuk lonceng. Nilai besarh sesuai dengan
sempit, kurva memuncak, sementara nilai kecil h
memberikan yang luas, kurva datar.
Sekarang, apa arti dari fungsi f (x)? Kita tergoda
untuk mengatakan bahwa f (x) mewakili probabil- yang
66
9 Gauss Distribusi, atau Kesalahan Fungsi Normal
ity mengamati nilai x dari kuantitas yang diukur. Tapi
ini tidak benar-benar benar. Mengingat bahwa x
adalah variabel kontinu, kita menyadari bahwa
probabilitas untuk x untuk memiliki tepat nilai tertentu
adalah nol. Yang harus kita bahas bukan adalah
probabilitas bahwa x kehendak memiliki nilai di daerah
tertentu, mengatakan antara x dan x
f (x)

0 m- mf--

Gambar. 9.1. fungsi distribusi Gauss. Intinya x = M 1 / jam, di


mana kurva memiliki lb dari ketinggian maksimum, akan
ditampilkan.
Jadi interpretasi yang tepat dari fungsi f (x) adalah
bahwa untuk interval kecil, dx merupakan probabilitas
mengamati pengukuran yang terletak di interval antara
x dan x dx.
Pernyataan ini memiliki interpretasi grafis
sederhana, Dalam Gambar. 9.2, wilayah strip diarsir
pada grafik mewakili f (x) tersebut. Oleh karena itu kita
dapat mengatakan bahwa
67
Distribusi probabilitas
daerah di bawah kurva dalam interval dx merupakan
probabilitas bahwa pengukuran akan jatuh dalam
interval ini. Demikian pula,

P (a, b) = ibf (x) dx


Sebuah (9.2)
adalah probabilitas bahwa pengukuran akan jatuh di
suatu tempat dalam interval a <x <b.
/ (X)

0x Sebuah
Gambar. 9.Z representasi grafis dari probabilitas. daerah yang
diarsir merupakan probabilitas untuk pengamatan jatuh di interval
yang sesuai.

Total probabilitas untuk pengukuran untuk jatuh


di suatu tempat tentu saja kesatuan; sehingga total
daerah di bawah kurvaf (x) harus kesatuan. Analitis,
kita dapat mengatakan bahwa itu harus benar
bahwa

Hal ini analog dengan eq. (6.1). Jika kondisi ini satis-
68
LIfix) dx = 1 (9.3)
9 Gauss Distribusi, atau Kesalahan Fungsi Normal
Tidur, fungsi memperbaiki) dikatakan dinormalisasi
dalam arti yang sama seperti fungsi di Secs. 7 dan 8
dinormalisasi, memiliki probabilitas total 1. Kami
telah memperluas jangkauan integrasi dari - (x) ke
+ co karena itu perlu untuk memasukkan semua
nilai yang mungkin dari x dalam integrasi.
Persyaratan bahwa fungsi memperbaiki)
dinormalisasi memaksakan pembatasan pada
konstanta yang muncul dalam fungsi. Jika kita tahu h
dan di, kemudian

.A_e-ht(xm)'d=1 (9.4)
akan puas hanya dengan satu nilai tertentu dari
konstanta SEBUAH. Untuk mendapatkan nilai ini dari
SEBUAH, kita harus benar-benar melakukan integrasi.
Untuk menyederhanakan integral kita membuat
perubahan variabel, membiarkan
h (x = z (9.5)
Persamaan (9.4) kemudian menjadi
AI
e`z' dz = V: rr (9.7)
e-2
dz = h (9.6)

Nilai dari integral dalam Persamaan. (9.6) dapat


ditunjukkan untuk menjadi
I: Mendapatkan nilai ini
membutuhkan ketidakjujuran
69
kecil, rincian yang diberikan
dalam L ampiran D. Memasukkan
Persamaan. (9.7) dalam Pers. (9.6),

A= (9.8)
r
Dengan demikian, kita menemukan bahwa dalam rangka
untuk memenuhi normaliza- yang
Distribusi probabilitas

Kondisi tion, Persamaan. (9.4), konstan SEBUAH harus


memiliki nilai A = h / Vir. Mulai sekarang, oleh
karena itu, kita menulis fungsi distribusi Gauss
sebagai
h
f (x) = - = e-h2 (x-'412 (9.9)
Udara
yang dinormalisasi untuk setiap nilai h.
Berikutnya, kita menemukan nilai rata-rata x untuk
distribusi ini. Arti dari berarti adalah sama seperti
biasa-rata-rata jumlah yang sangat besar dari
pengukuran kuantitas x. Kita bisa pergi melalui
penalaran yang sama seperti di Sec. 6 dengan
memperkenalkan jumlah total pengukuran Z dan
kemudian menunjukkan bahwa ia membagi dari
hasil akhir. Sebaliknya, kita amati hanya bahwa f (x)
dx merupakan probabilitas terjadinya pengukuran
dalam interval dx dan bahwa nilai rata-rata dari x
ditemukan hanya dengan mengintegrasikan produk dari
probabilitas ini dan nilai x sesuai dengan interval ini.
Itu adalah,
X = f xf (x) dx (9.10)
Ungkapan ini benar-benar analog dengan Persamaan.
(6.2); kita menggunakan integral di sini daripada jumlah
karenax adalah variabel kontinu daripada satu diskrit.
Untuk menghitung x kita memasukkan
Persamaan. (9.9) ke Persamaan. (9.10) dan membuat
perubahan variabel yang diberikan oleh
Persamaan. (9.5):
70
R = h saya
--_ xe h2 (x-7432 dx
-

__. mv r -4.
j

= v_l_r f (zh + m) ez dz
2
(9.11)
9 t Gauss Distribusi, atau Kesalahan Fungsi Normal
Istilah pertama ungkapan ini mengintegrasikan ke nol
karena kontribusi dari nilai-nilai negatif z persis
membatalkan mereka dari nilai-nilai positif. Bagian
yang bertahan adalah
m
= e - 2“ az = ARIR
v 7 - V ir
= (9.12)
hasil yang kita bisa menebak di tempat pertama hanya
dengan melihat grafik dari fungsi.
Perhitungan varians hasil dengan cara yang sama.
varians diberikan oleh
o-2 = (Xm) 2f (x) dx

= 'H (x - m) 2e-h '(zm) 2 dx


(9.13)
-. v ir
Untuk mengevaluasi terpisahkan ini kita membuat
perubahan variabel, Eq. (9,5), untuk mendapatkan
1
g2 SEBUAH h2/z 2e - z 2 dz (9.14)
W
Ini adalah bagian integral konvergen; pada nilai besarz, z2
menjadi sangat besar, tetapi e --- °' tumbuh kecil sangat
cepat sehingga produk zee-z2juga mendekati nol sangat
cepat. Integral dalam Pers. (9.14) dapat diintegrasikan
dengan bagian-bagian untuk mengubahnya menjadi
bentuk persamaan. (9,7), yang nilainya diketahui. Hasil
akhir adalah

71
0 0,2 = 1 atau 0- (9.15)
21/2 h
Distribusi probabilitas
Standar deviasi berbanding terbalik dengan h. Hal ini
tidak mengherankan, karena nilai-nilai yang lebih besar
dari h berarti kurva lebih runcing tajam serta nilai-nilai
yang lebih kecil dari Sebuah. Sejak h besar untuk
kurva memuncak tajam,
f (x)
h2

Hai

Gambar. 9.3. distribusi Gauss untuk dua nilai dari h dengan m


yang sama; h2 = 2121. Posisi dari dan untuk dua kurva yang
ditampilkan,

sesuai dengan spread kecil kesalahan, h kadang-kadang


disebut ukuran presisi dari distribusi. Distribusi Gauss
diplot pada Gambar. 9.3 untuk dua nilai dari h.
Hal ini sering berguna untuk menulis distribusi
Gauss dalam hal Sebuah daripada h. Menggunakan,
fungsi menjadi
72
9 f Gauss Distribusi, atau Kesalahan Fungsi Normal
f (x) = _ 1

e- (zm) t / 2 ° (9.16)
V271- sebuah
Deviasi mean untuk distribusi Gauss bahkan lebih
mudah untuk obtainthan varians. Hal ini diberikan oleh
.
x
a = f - m i
e-ht (xm) = d X
2h "
= F) kamu-kaki dy (9.17)

terpisahkan ini dapat dengan mudah dievaluasi


dengan membuat substitusi z = MY2. Seharusnya
tidak perlu memberikan rincian substitusi ini;
hasilnya hanya
Sebuah - (9.18)
h
Membandingkan hal ini dengan Persamaan. (9.15),
kita melihat bahwa untuk distribusi Gauss standar
deviasi dan berarti deviasi yang proporsional, karena
keduanya berbanding terbalik dengan h. Deviasi
standar adalah lebih besar dari dua; relasi adalah
(9.19)
a = \ f-Ira
5
,2
1
=
Persamaan ini cukup berguna ketika seseorang
ingin perkiraan kasar dari standar deviasi dari
serangkaian pengamatan yang kesalahan
diperkirakan akan terdistribusi secara normal. Alih -
alih menghitung dari data, satu menghitung (yang
umumnya lebih mudah karena tidak
73
Distribusi probabilitas
diperlukan untuk persegi semua penyimpangan) dan
kemudian menggunakan Persamaan. (9.19). Harus
ditekankan, meskipun, bahwa hubungan ini hanya
berlaku untuk distribusi Gauss; itu tidak berlaku
untuk distro lain.
Distribusi Gauss dapat digunakan untuk
menemukan probabilitas bahwa pengukuran akan
jatuh dalam setiap batas yang ditentukan. Secara
khusus, ada hal yang menarik untuk menghitung
probabilitas bahwa pengukuran akan jatuh dalam
dari nilai rata-rata. Hal ini akan memberikan
pemahaman yang lebih jelas tentang pentingnya standar
deviasi. probabilitasP bahwa pengukuran akan jatuh
antara m Sebuah- dan m Sebuah- diberikan oleh
P
= 1.
______ e-cH-m) 2 / 2" dx (9.20)
Membuat perubahan variabel t = (Xm) a, kita
menemukan 1 r1
P =, e-tv2 di (9.21)
V27 J-1
terpisahkan ini tidak dapat dievaluasi kecuali dengan
membuat perkiraan numerik. Untungnya, integral
tersebut digunakan cukup sering sehingga tabel luas
nilai-nilai mereka telah dihitung. A 'meja pendek dari
nilai-nilai dari integral
1
et 212 di
Hai
untuk berbagai nilai T diberikan pada akhir buku ini,
Tabel IL Juga termasuk untuk kenyamanan adalah tabel
74
9 1 Gauss Distribusi, atau Kesalahan Fungsi Normal
nilai-nilai fungsi (1 / V-2-Tr) e-472„ Table I. Referensi tabel
yang lebih luas juga diberikan.
Secara umum, probabilitas untuk pengukuran
terjadi dalam interval dalam Untuk-mean adalah
1T
P ( T ) = 1.4dt (9.22),

Nilai-nilai probabilitas ini untuk beberapa nilai T


adalah sebagai berikut:
P(1) = 0,683 1 - P (1) = 0,317
P(2) = 0,954 1 - P (2) = 0,046
P(3) = 0,997 1 - P (3) = 0,003
Angka-angka ini menunjukkan bahwa probabilitas
untuk pengukuran untuk jatuh dalam satu standar
deviasi dari mean adalah sekitar 68%; probabilitas
bahwa ia akan jatuh dalam waktu dua standar deviasi
adalah sekitar 95%, dan probabilitas bahwa hal itu akan
lebih jauh dari rata-rata dari tiga standar deviasi hanya
0,3%.
Berikut adalah contoh penggunaan beberapa ide
baru saja dibahas. Sebuah surveyor berjalan garis di
atas permukaan tanah antara dua titik sekitar 1000 ft
terpisah. Dia hati-hati membentang nya pita 100-ft
dengan ketegangan yang tepat untuk setiap segmen
pengukuran dan berlaku koreksi ternperatvre yang
tepat, untuk menghilangkan kesalahan sistematis frona
sumber-sumber ini. Dia mengulangi pengukuran 10
kali. Mengandaikan bahwa kesalahan yang tersisa
berhubungan dengan kesalahan acak dalam
75
pengukuran individu, dan bahwa kesalahan yang
dihasilkan didistribusikan secara acak, kita dapat
membuat perhitungan sebagai berikut:
Distribusi probabilitas
Observasi (x), ft Idil: ft
1023,56 0,055
1023,47 0,035
1023,51 0,005
1023,49 0,015
1023,51 0,005
1023,48 0,025
1023,50 0,005
1023,53 0,025
1023,48 0,025
1023,52 0,015
= 1023.505 ft 0.210 ft
Sebuah = 0,021
a- = 1.25Aft= 0,026 ft
Probabilitas untuk pengukuran individu untuk jatuh
dalam 0,026 ft dari mean adalah 0,683, jadi kami
mengharapkan sekitar 68% dari pengukuran untuk
berbohong antara 1023,48 dan 1023,53 ft. Probabilitas
untuk jatuh dalam dua standar penyimpangan mean
(1023,45 dan 1023,56 ft) adalah 0,95, dan sebagainya.
Pertanyaan yang lebih penting adalah: Apa
keandalanberarti? Pertanyaan ini dapat dijawab
dengan metode diperkenalkan di Sec. 12.

10 1 Penolakan Data
Pertanyaan kita mempertimbangkan berikutnya
adalah salah satu yang kontroversial. Ini menyangkut
masalah apa yang harus dilakukan jika, antara
himpunan pengamatan, satu atau lebih memiliki
penyimpangan begitu besar tampak tidak masuk akal.
Jika, misalnya, satu set pengukuran yang dilakukan
dengan caliper mikrometer memiliki standar deviasi
0,001 di., Tapi satu pengukuran berbeda dari mean
oleh 0,010 in., Maka kita tergoda untuk
76

Anda mungkin juga menyukai