Anda di halaman 1dari 8

Di mana q = (1-p) adalah probabilitas kegagalan setiap jejak.

Formula ini jarang digunakan karena


kerumitannya. Distribusi probabilitas ditabulasi untuk beberapa nilai kunci n dan x. Namun, perkiraan
normal untuk distribusi binomial digunakan untuk nilai-nilai non-kunci dari n dan x yang tidak ditabulasi.
(lihat bagian 3.5.4).

Mean μ dan varians σ2 dari variabel acak binomial x diberikan sebagai:

µ = np (3.8)

dan σ2 = np(1-p) (3.9)

Contoh 3.2. Temukan mean dan varians dari percobaan binomial melempar koin dua kali dan
mengamati kepala.

Larutan:

Percobaan memiliki n = 2 percobaan berulang di mana setiap percobaan memiliki probabilitas, p = 1/2.
Dengan demikian, mean dan varians dapat ditentukan menggunakan persamaan (3.8) dan (3.9), masing-
masing:
1
µ = np = 2. 2 = 1

1 1
dan σ2= np(1-p) = 2.(1-2) = 2

3.4.3 Distribusi Probabilitas Poisson

Ada eksperimen yang tidak berulang dengan dua hasil yang mungkin dilabeli sebagai keberhasilan dan
kegagalan, tetapi mereka tidak termasuk dalam distribusi probabilitas binomial. Eksperimen semacam
itu biasanya mengukur keberhasilan atau kegagalan dalam satuan ukuran kecil yang diberikan seperti
waktu, panjang, atau luas. Distribusi semacam itu dikenal sebagai distribusi probabilitas Poisson.

Mari kita lihat contoh seorang GIScinetist yang triesto melihat spesies burung lagi. Jika kita dapat
membagi kayu menjadi area yang lebih kecil dari satu hektar, maka kita dapat berbicara tentang
kemungkinan melihat burung di masing-masing plot satu hektar. Jika x adalah jumlah burung yang
terlihat di setiap plot, maka nilai x dapat 0 (tidak terlihat burung), 1 (satu terlihat burung), 2, 3, 4, dan
seterusnya, hingga jumlah terbesar yang mungkin (yaitu adalah jumlah kemungkinan kejadian).
Probabilitas P (x) ini disebut probabilitas Poisson.

Contoh lain dari probabilitas Poisson adalah x pohon menderita penyakit langka dalam satu hektar plot,
x rumah tangga berpenghasilan kurang dari RM500 per bulan dalam satu kilometer persegi, x outfall
pada setiap satu kilometer di sepanjang sungai, dan x pesawat kand dalam interval 15 menit . Dengan
demikian probabilitas Poisson memungkinkan GIScientists dengan berbagai spesialisasi seperti
rimbawan untuk menentukan probabilitas x pohon menderita penyakit langka dalam satu plot plot,
seorang ekonom untuk menentukan probabilitas x rumah tangga menghasilkan kurang dari RM500 per
bulan dalam satu kilometer persegi, dan pencinta lingkungan untuk menentukan kemungkinan x outfall
terjadi pada setiap satu kilometer di sepanjang sungai, dan pengontrol lalu lintas udara untuk
menentukan probabilitas x pesawat yang akan meminta izin untuk mendarat setiap 15 menit.

Jumlah kemungkinan kejadian untuk probabilitas Poisson bisa jadi besar tetapi jumlah kejadian aktual
dalam situasi kehidupan nyata relatif kecil. Untuk kasus rumah tangga yang berpenghasilan kurang dari
RM500 per bulan, kemungkinan kejadiannya bisa besar tetapi jumlah kejadian aktualnya relatif kecil.
Demikian pula, kemungkinan jumlah pesawat yang mendarat dalam interval 15 menit bisa jadi besar
tetapi jumlah pesawat yang sebenarnya mendarat dalam interval waktu itu pasti sangat kecil.

Tepatnya, probabilitas Poisson melengkapi properti berikut:

Variabel acak Poisson x adalah jumlah jumlah keberhasilan yang terjadi dalam satuan ukuran tertentu
dan x dapat mengambil nilai integer dari 0 hingga tak terbatas.

Jika unit ukuran dibagi lagi menjadi subunit yang sangat kecil, maka:

Probabilitas keberhasilan di setiap subunit akan sangat kecil.

Probabilitas dua atau lebih keberhasilan per subunit sangat kecil sehingga dapat dianggap nol.

Probabilitas keberhasilan di setiap subunit sama dengan di semua subunit lainnya.

Jumlah keberhasilan yang terjadi di setiap subunit tidak tergantung pada subunit yang dijadikan sampel.

Saat menggunakan distribusi probabilitas Poisson, kita harus mengasumsikan kondisi tersebut benar.
Kami tidak dapat memeriksa percobaan dan memverifikasi kondisi yang bertentangan dengan distribusi
probabilitas binomial.

Probabilitas dari nilai x yang diberikan, P (x), dari distribusi probabilitas Poisson didefinisikan oleh fungsi
probabilitas Poisson, diberikan sebagai:

λx e−λ
P (x) = 𝑥!
, untuk x = 0, 1, 2,…. (3.10)

Dimana

𝜆 adalah jumlah rata-rata keberhasilan dalam satuan ukuran yang diberikan.

X adalah keberhasilan dalam satuan ukuran tertentu.

E adalah konstanta 2.71828.

Probabilitas untuk nilai-nilai kunci 𝜆 dan x telah dihitung dan ditabulasi untuk kemudahan penggunaan.

Contoh 3.3. Temukan probabilitas x = 3 untuk variabel acak Poisson x mengingat 𝜆 = 2.

Solusi:

Aplikasi langsung persamaan (3.10) menghasilkan:


𝜆𝑥 𝑒 −𝜆
P(x = 3) =
𝑥!

23 (2.71828)−2
= 3.2.1
= 0.1804

Atau, kita dapat melihat tabel probabilitas Poisson yang diterbitkan dengan kolom yang diidentifikasi x =
3 dan baris yang diidentifikasi 𝜆 = 2. Nilai probabilitas P (x = 3) = 0,1804 ditemukan di persimpangan.

3.5 Distribusi Probabilitas Berkelanjutan

Seperti disebutkan dalam Bagian 3.2, variabel acak yang didefinisikan di atas ruang kontinu disebut
variabel acak kontinu. Dalam kebanyakan masalah praktis, variabel acak kontinu mewakili data yang
diukur.

Variabel acak kontinu memiliki probabilitas nol untuk mengasumsikan persis nilainya. Akibatnya,
probabilitasnya tidak dapat diberikan dalam bentuk tabel. Konsep ini paling baik diilustrasikan ketika kita
mempertimbangkan variabel acak x, di mana nilainya mungkin panjang dari batas banyak. Kami
mengukur panjang 50 kali dan pengukuran dicatat ke milimeter terdekat, seperti yang ditunjukkan pada
Tabel 3.5. Meskipun peralatan pengukur membatasi kita untuk mengukur ke tingkat akurasi apa pun,
namun x adalah variabel acak kontinu dengan jumlah pengukuran waktu tak terbatas yang jatuh dalam
interval apa pun, tak peduli seberapa kecil intervalnya. Di antara dua pengukuran, katakanlah 30 243,5
dan 30 244,5 mm atau bahkan 30 243,99 dan 30 244,01 mm, ada jumlah pengukuran yang tak terbatas,
salah satunya adalah 30 244 mm. oleh karena itu, probabilitas bahwa kita bisa mendapatkan
pengukuran tepat 30 244 mm dan bukan pengukuran lain yang mendekati 30 244 mm sangat jauh.
Dengan demikian, kami menetapkan probabilitas nol untuk acara ini, seperti mendapatkan nilai tepat 30
244 mm. Namun, jika kita berbicara tentang kemungkinan mendapatkan pengukuran kurang dari 30 243
mm tetapi tidak lebih dari 30 245 mm, maka kita berurusan dengan interval daripada nilai poin dari
variabel acak kita.

Tabel 3.5. Distribusi frekuensi pengukuran batas

Panjang (mm) Jumlah kali

30 237 - 30 239 2
30 240 - 30 242 8
30 243 - 30 245 14
30 246 - 30 248 19
30 249 - 30 251 7
Oleh karena itu, kita akan membahas probabilitas komputasi untuk berbagai interval variabel acak
kontinu x seperti P (a <x <b) atau P (x> c), dan sebagainya. Perhatikan bahwa:

P (a <x b) = P (a <x <b) + P (x = b)

= P (a <x <b)
Dengan kata lain, tidak masalah apakah kita memasukkan titik akhir interval atau sebaliknya ketika kita
berurusan dengan variabel acak kontinu.

Distribusi probabilitas variabel acak kontinu diwakili oleh fungsi kerapatan yang ditunjukkan oleh f (x).
Karena variabel x didefinisikan di atas ruang sampel kontinu, maka grafik f (x) kontinu dan dapat
mengambil beberapa bentuk. Beberapa grafik ditunjukkan pada Gambar 3.5. Karena area akan
digunakan untuk merepresentasikan probabilitas dan probabilitas adalah nilai numerik positif, maka
fungsi kerapatan harus terletak di atas sumbu x.

Fungsi kerapatan probabilitas dibangun sedemikian rupa sehingga area di bawah kurva yang dibatasi
oleh sumbu x sama dengan satu ketika dihitung pada seluruh rentang x yang ditentukan oleh f (x). Ini
berarti bahwa probabilitas bahwa x mengasumsikan nilai dalam seluruh rentang ruang sampel adalah
satu. Namun, probabilitas bahwa x mengasumsikan nilai antara a dan b sama dengan area yang diarsir di
bawah fungsi kerapatan antara ordinat pada x = a dan x = b, seperti yang ditunjukkan pada Gambar 3.6.

Gambar 3.5. Fungsi kerapatan tipikal

Gambar 3.6 Probabilitas P (a <x <b)

Fungsi kerapatan sering melibatkan rumus rumit dan perhitungan untuk area di bawah kurva tersebut
agak terlibat. Untungnya, area telah dihitung dan dilengkapi dalam bentuk tabel untuk banyak fungsi
probabilitas berkesinambungan populer, terutama yang diwakili oleh karakteristik kurva berbentuk
lonceng.
3.5.1 Distribusi Normal

Distribusi probabilitas berkesinambungan yang paling penting adalah distribusi normal. Grafiknya
disebut kurva normal yang memiliki karakteristik kurva berbentuk lonceng. Distribusi normal juga
disebut sebagai distribusi Gaussian.

Persamaan matematika untuk kurva normal tergantung pada dua parameter, yaitu mean (μ) dan
standar deviasi (σ). Setelah μ dan σ ditentukan, maka ordinat dari fungsi kerapatan f (x) dapat dengan
mudah dihitung dari persamaan kurva. Gambar 3.7 menunjukkan kurva normal dengan berbagai μ dan
σ. Gambar 3.7 (a) menunjukkan dua kurva normal dengan µ yang sama tetapi berbeda σ. Gambar 3.7 (b)
menunjukkan dua kurva dengan σ yang sama tetapi berbeda μ, sedangkan Gambar 3.7 (c) menunjukkan
kurva dengan μ dan σ berbeda.

Gambar 3.7 Kurva normal dengan berbagai μ dan σ

Berdasarkan gambar 3.7, kami menyimpulkan sifat kurva normal berikut:

(1) Mode, yang merupakan titik pada sumbu horizontal di mana kurva maksimum, terjadi pada x = µ.

(2) Kurva simetris tentang sumbu vertikal melalui rata-rata.

(3) Kurva normal mendekati sumbu horizontal asimtotik saat kami melanjutkan di kedua arah menjauh
dari rata-rata.

(4) Total area di bawah kurva dan di atas sumbu horizontal sama dengan satu.

Kurva normal, yang merupakan kurva probabilitas berkesinambungan, memiliki sifat yang sama
berkaitan dengan probabilitas di bawah kurva fungsi probabilitas kontinu (dibahas dalam Bagian 3.5).
Probabilitas bahwa variabel acak x mengasumsikan nilai antara x = x1 dan x = x2 sama dengan area di
bawah kurva yang dibatasi oleh dua ordinat x = x1 dan x = x2. Dengan demikian, untuk kurva normal, P
(x1 <x <x2) diwakili oleh luas wilayah yang diarsir (Gambar 3.8).
Gambar 3.8 Wilayah berbayang P (x1 <x <x2)

3.5.2 Distribusi Normal Standar

Dalam Bagian 3.5.1, kurva normal ditemukan tergantung pada mean dan standar deviasi dari distribusi
yang diselidiki. Area di bawah kurva antara dua ordinat juga harus bergantung pada nilai mean dan
standar deviasi. Gambar 3.9 menunjukkan daerah berarsir yang sesuai dengan P (x1 <x <x2) untuk dua
kurva dengan rata-rata berbeda dan standar deviasi. Perhatikan bahwa daerah yang diarsir berbeda
dalam ukuran. Oleh karena itu, probabilitas yang terkait dengan setiap distribusi akan berbeda
walaupun ordinatnya sama.

Gambar 3.9 P (x1 <x <x2) untuk kurva normal yang berbeda

Ini akan menjadi tugas yang sia-sia untuk mengatur tabel kurva normal yang terpisah untuk setiap nilai
rata-rata dan standar deviasi. Namun kita harus menggunakan tabel untuk menghindari penggunaan
rumus kurva yang rumit. Untungnya, kami dapat mengubah semua pengamatan dari setiap variabel acak
normal x menjadi serangkaian pengamatan baru dari variabel acak z yang disebut distribusi normal
standar.

Distribusi normal standar adalah distribusi variabel acak normal dengan rata-rata sama dengan nol dan
standar deviasi sama dengan satu. Transformasi variabel acak normal x ke variabel normal acak standar
z dapat dilakukan dengan:
𝑥− µ
Z= 𝜎
(3.11)

Skor z yang ditransformasikan dikenal sebagai variabel terstandarisasi karena unitnya merupakan deviasi
terstandarisasi

Distribusi asli dan yang ditransformasikan dari variabel acak normal diilustrasikan pada Gambar 3.10.
Semua nilai x yang jatuh antara x1 dan x2 memiliki nilai z yang sesuai antara z1 dan z2. Oleh karena itu,
area di bawah kurva x antara x1 dan x2 sama dengan area di bawah kurva z antara z1 dan z2. Karenanya,
kita memiliki P (x1 <x <x2) = P (z1 <z <z2).
Kami sekarang telah berhasil mengurangi jumlah tabel area kurva normal menjadi satu yaitu distribusi
normal standar. Area di bawah kurva distribusi normal standar telah dihitung dan ditabulasi.

Gambar 3.10 Distribusi normal asli dan transformasi

3.5.3 Teorema Limit Pusat

Central Limit Theorem (CLT) menyatakan bahwa jika sampel acak x1, x2, x3, ..., xn dari n pengamatan
dipilih dari suatu populasi (terlepas dari distribusi), maka ketika n cukup besar, distribusi sampling dari
rata-rata mean akan menjadi sekitar distribusi normal. Semakin besar ukuran sampel, semakin baik
perkiraan normal untuk distribusi sampling ẋ.

Dengan demikian, untuk sampel yang cukup besar, distribusi sampling ẋ mendekati normal. Ukuran
ukuran sampel n tergantung pada bentuk populasi sampel. Secara umum, semakin besar kemiringan
distribusi populasi sampel, semakin besar ukuran sampel harus sebelum distribusi normal adalah
perkiraan yang memadai untuk distribusi sampel ẋ. Untuk sebagian besar populasi sampel, ukuran
sampel n ≥ 30 akan cukup untuk perkiraan normal menjadi masuk akal.

Menurut CLT, ketika n ≥ 30 dan kami ingin menghitung P (a ≤ ẋ ≤ b), kami dapat memperlakukan itu
normal seperti biasa, membakukannya, dan menggunakan tabel normal. Jawaban yang dihasilkan akan
cukup akurat. Jawaban yang tepat hanya dapat diperoleh dengan menemukan distribusi aktual ẋ. CLT
memberikan jalan pintas yang mengesankan.

3.5.4 Aplikasi Distribusi Normal

Distribusi normal memiliki banyak aplikasi di berbagai bidang ilmu pengetahuan dan seni termasuk GISc.
Kami akan menunjukkan beberapa aplikasi di bagian ini melalui contoh.

Contoh 3.4. Catatan sistem manajemen darurat menunjukkan bahwa rata-rata waktu perjalanan untuk
ambulans dari kompleks olahraga ke rumah sakit adalah 100 menit dengan standar deviasi 10 menit.
Dengan asumsi bahwa waktu perjalanan didistribusikan secara normal, tentukan probabilitas bahwa
waktu perjalanan akan memakan waktu antara 90 dan 115 menit.

Solusi:

P (90 <x <115) diwakili oleh area yang diarsir pada Gambar 3.11 (a). Kita sekarang harus menemukan
wilayah ekivalen di bawah kurva normal standar z, seperti yang ditunjukkan pada Gambar 3.11 (b).
Pertama, variabel x harus ditransformasikan ke dalam variabel z menggunakan persamaan (3.11):
𝑥−µ 90−100
Ketika x = 90, z1 = 𝜎
= 10 = -1

𝑥−µ 115−100
Ketika x = 115, z2 = 𝜎
= 10
= 1.5

Oleh karena itu, P (90 <x <115) = P (-1 <z <1.5). Selanjutnya, cari area di bawah kurva z untuk z = -1, dan
z = 1.5, dan perbedaannya adalah area yang diperlukan:

Ketika z = -1, α = 0.1587

Ketika z = 1,5, α = 0,9332

Area yang diperlukan = 0,9332 - 0,1587 = 0,7745

Oleh karena itu, probabilitas bahwa waktu perjalanan akan memakan waktu antara 90 dan 115 menit
adalah 0,7745.

Gambar 3.11 Tranformasi P (90 <x <115) ke P (z1 <z <z2)

Anda mungkin juga menyukai