Alll Subjective Probability
Alll Subjective Probability
- Mengiterpretasikn probabilitas :
a. Dengan melakukan eksperimen ( frequentist)
b. Subjective : tingkat kepercayaan dari seorang decision maker terhadap ketidakpastian /
kejadian yang akan terjadi
- Mengapa menggunakan probabilitas subjektif
a. Frequentist tidak selalu memberikan jawaban yang sesuai ( terdapat kejadian yang tidak bisa
diulang)
b. Tingkat kepercayaan / opini subjektif tergantung pada orang dan kontennya
- Mengapa menggunakan opini dari seorang ekspert ? apakah tidak akan menimbulkan bias ?
c. Seorang ekspert mungkin ingin mengukur pendapatnya untuk kepentingan dirinya sendiri
d. Data yang tersedia mungkin tidak cocok untuk digunakan untuk menghitung secara statistik
e. Data tidak tersedia sehingga perlu ekstrapolasi dari informasi yang berhubungan
- Expert dan perhitungan probabilitas
Expert adalah mereka yang memiliki pengetahuan tentang apa yang akan diukur
Panduan untuk penilaian expert
a. Identifikasi variabel2 yang diperlukan untuk penilaian ahli (mencari literature untuk
membangun pengetahuan)
b. Identifikasi dan recruit expert ( in house expertise, external recruitment)
c. Motive experts ( menjalin hubungan dan membangun antusiasme)
d. Menyusun dan menguraikan ( membangun model umum untuk merepresentasikan
hubungan antar variabel)
e. Melakukan pelatihan penilaian ( menjelaskan prinsip penilaian, memberikan
kesempatan penilaian)
f. Probability elicitation and verification (membuat kebutuhan penilaian probabilitas dan
memeriksa konsistensi)
g. Menggabungkan distribsi peluang experts
- Bagiamana mengukur opini ?
- Penliaian dengan probabilitas diskrit
a. Direct methods
b. Indirect methods
Betting approach
Reference lottery
====================================================================================
Case : Kebakaran
Type I error
Type 1 Error = "rejection of the assumption (null hypothesis) when it should not have been rejected atau
incorectly rejecting null hypothesis, in this case a false alarm (false positive)
Type II error
Type II Error = "Failure to reject the assumption (null hypothesis) when it should have been rejected
atau incorectly not rejecting the null hypothesis in this case "apathy" or "under reaction"
Case berikutnya
Pada Toyota Production System, pekerja mempunyai kekuatan dan tanggung jawab untuk men stop
semua production line Ketika melihat/menduga ada problem yang serius, ini dilakukan dengan menarik
andon cord
Assumpsi adalah production line berjalan dengan benar. This is the minute by minute null hypothesis
Ketika pekerja notice ada defect, dia mempunyai pilihan untuk menarik cord atau tidak
- Jika andon cord ditarik, pekerja menolak asumsi bahwa proses berjalan normal (error free),
rejecting the null hypothesis -> Type I error
- Jika andon cord tidak ditarik, pekerja tidak menolak asumsi bahwa proses berjalan normal (error
free), thus maintaining the null hypothesis -> Type II error
Part 2 : https://www.youtube.com/watch?v=nkmzsyLg0tY&t=28s
Example 1 :
A bottled water manufacturer states on the production label that each bottle contains 355 ml of water.
You work for a government agency that protects consumers by testing product volumes. A sample of 50
bottles is tested
Example 2 :
According to the United States Department of Agriculture, in 2006 the average farm size in the state of
Texas was 2.3 km2. Since the decades-long trend as beenfor farm sizes to increase due to large
agribusiness, a business analyst wishes to test if current (2013) farm size is larger than it was in 2006.
Establish a null and alternative hypothesis
Jawab
Asumsi awal = tidak ada perubahan pada rata2 luas lahan sejak 2006 atau ada perubahan tapi malah
mengecil
Example 3 :
During the 2010-2011 English Premier League Season, Manchester United home matches had an
average attendance of 74961. A club marketing analyst would like to see if attendance decreased during
the most recent season. Establish a null and alternative hypothesis for this analysis
Jawab :
Ingatlah bahwa ketika memilih sampel, kita selalu tunduk pada hukum perubahan (the laws of
change)
Kita mungkin secara acak memilih sample yang tidak merepresentasikan populasi
- Mungkin memilih sample botol air yang isinya kurang atau lebih dari takaran seharusnya
- Mungkin memilih sample lahan pertanian yang terlalu kecil atau terlalu besar
- Sample berada pada jauh diujung dari sampling distribution
Teknik sampling kita mungkin cacat
Asumsi dalam null hypothesis mungkin cacat/salah
- mungkin data USDA (pada kasus example 2) yang salah?
Tetapi kasus yang biasa terjadi adalah karena “chance and chance alone”, sampling artinya
mempunyai sebuah sampling distribution”, ada peluang kita mendapatkan sample yang berada
jauh diujung dari sampling distribution
=====================================================================================
https://www.youtube.com/watch?v=x5Euj2d39kI
Timbangan :
- kemudahan/kenyamanan penggunaan
- kapasitas
- presisi
- akurasi
Presisi : seberapa dekat nilai pada beberapa percobaan (goup of value) pada nilai actual yang sama
Mengapa terjadi random errors missal pada timbangan elektronik? Bisa karena aliran udara yang
berubah, fluktuasi voltasi pada alat, jika pada timbangan biasa mungkin karena human estimation.
Nilai 0.029 adalah nilai ketidakpastian
(uncertainty) atau biasa disebut dengan
random errors.
Systematic error atau bisa disebut juga one sided error artinya percobaan hanya bisa menghasilkan nilai
yang terlalu tinggi atau nilai yang terlalu rendah (hanya salah satu). Mengapa terjadi systematic error?
Bisa karena kesalahan pada instrument, prosedur, maupun human errors.
- Least Count : smallest sub division yang dapat dihitung oleh instrument
====================================================================================
VApa itu Chi-Square Test ?
Memudahkan kita dalam memahami hubungan antara 2 varable categorical; grade level, sex,
age group, year, dll
Chi-squares melibatkan frequency dari kejadian; the count
Memudahkan kita dalam membandingkan apa yang sebenarnya kita amati dengan apa yang
sering kita harapkan menggunakan populasi data atau teoritical data
Chi-squares membimbing kita dalam menentukan peran dari random chance variation antara
variable kategori
Kita menggunakan chi square distribution dan critical value untuk menerima atau menolak
hipotesis
Misalnya saya punya 2 dadu, satu dadu normal, satu dadu yg diberi pemberat pada nomer 1-5-6. Saya
memberikan satu dadu dan memintamu untuk menentukan apakah dadu yang diberikan itu dadu
normal atau dadu yang diberi pemberat. Saya butuh kamu untuk memiliki keyakinan 95% dalam
kesimpulanmu.
Dalam 6 hari kamu diminta untuk melakukan pelemparan dadu sebanya 100 kali sehari sehingga total
pelemparan adalah 600 dan catat berapa kali setiap nomer keluar.
Mari mengasumsikan bahwa dadu adalah normal, apa yang kita harapkan terjadi?
Null hypothesis, H0
H0 : Dadu normal
"Apakah variasi dalam data pengamatan kita hanya karena kebetulan dari peluang acak, atau apakah
variasi itu berada di luar kemungkinan dari peluang acak seharusnya?"
"Seberapa jauh data kita bisa bervariasi sebelum kita harus menolak hipotesis nol kita dan
menyimpulkan bahwa dadu itu tidak adil?"
Jika hasil observasi dadu mu mempunyai χ 2 > 11.07 maka kamu harus menolak H 0 dan menyatakan
bahwa dadu sudah diberi pemberat
Observe
Number Expected Freq d O-E (O-E)^2 (O-E)^2/E
1 100 111 11 121 1.21
2 100 90 -10 100 1
3 100 81 -19 361 3.61
4 100 102 2 4 0.04
5 100 124 24 576 5.76
6 100 92 -8 64 0.64
Total 12.26
χ 2 dadu = 12.26 dimana > 11.07, maka H0 ditolak, dadu tidak normal
Frekuensi yang diamati dari setiap angka pada dadu berbeda secara signifikan dari apa yang diharapkan
pada “theoretically fair die”, χ 2 (5, N=600) = 12.26, p ≤ 0.05
Permasalahannya χ 2 = 12.26. Critical χ 2(0.05,5) adalah 11.07. Karena itu variasi kami terlalu bagus untuk
dijelaskan secara kebetulan saja. Karena itu kita harus menolak H0 (dadu itu adil) dan menerima H1,
dadu itu tidak adil.
Kami 95% confident bahwa kamu telah memberi pemberat pada dadu
Apabila kita naikkan level confident menjadi 99%, P-value menjadi ≤ 0.01, chi-square menjadi 15.09
(hasil dari excel chiinv(0.01,5)), sehingga
Frekuensi yang diamati dari setiap angka pada dadu tidak berbeda secara signifikan dari apa yang
diharapkan pada “theoretically fair die”, χ 2 (5, N=600) = 12.26, p ≤ 0.01
Permasalahannya χ 2 = 12.26. Critical χ 2(0.05,5) adalah 15.09. Karena itu variasi kami tidak terlalu bagus
untuk dijelaskan secara kebetulan saja. Karena itu kita harus menerima H0 (dadu itu adil) dan
menyimpulkan dadu itu adil.
Kami 99% confident bahwa kamu telah memberi dadu yang normal
Part 2
Example
You work in the Office of Institutional Research at small (but growing) regional 4-year university. Over
the past 5 years, the number of undergraduate students at each level (freshman, sophomore, junior,
senior and unclassified) has changed; headcount variation
Questions
Even though some headcount random variation is expected, is the variation beyond what we would
expected due to chance alone?
How can a chi-square test help us rule out variation due to chance alone?
Chi-Square Computation
Observe
d Expected O-E (O-E)^2 (O-E)^2/E
560 507.8189 52.18108 2722.864674 5.361881
369 355.3019 13.69812 187.6385064 0.52811
209 235.3447 -26.3447 694.0407561 2.94904
267 288.659 -21.659 469.1112423 1.62514
64 81.87557 -17.8756 319.5358983 3.902701
495 502.2879 -7.28788 53.11320585 0.105743
385 351.432 33.56798 1126.80958 3.206337
226 232.7813 -6.78134 45.98650522 0.197552
277 285.515 -8.51497 72.50472834 0.253944
70 80.9838 -10.9838 120.643814 1.489728
553 537.894 15.10603 228.1920584 0.424232
358 376.3443 -18.3443 336.5120371 0.89416
248 249.2827 -1.2827 1.645309148 0.0066
304 305.7545 -1.7545 3.078285032 0.010068
93 86.72456 6.275437 39.38111531 0.454094
547 546.5362 0.463772 0.21508435 0.000394
361 382.3909 -21.3909 457.5717479 1.196607
268 253.2879 14.71212 216.4464528 0.854547
328 310.667 17.33299 300.4324621 0.967056
77 88.11795 -11.118 123.6088576 1.402766
512 572.463 -60.463 3655.773664 6.386044
393 400.5309 -7.53091 56.71466273 0.141599
285 265.3034 19.69657 387.954678 1.462306
340 325.4045 14.59546 213.0275514 0.654655
126 92.29812 33.70188 1135.816679 12.30596
chi-squared 46.78126
Chi-Square Results
Problem chi-square test menghasilkan χ 2= 46.78126
P-value of p = 0.05
Degree of freedom = (5-1) x (5-1) = 16
Critical value, χ 2= 26.29623
Was our problem χ 2 > critical χ 2? Ya: 46.78126 > 26.29623
Maka kita harus menolak null hypothesis H0 dan menyimpulkan bahwa class level dan tahun
tidak independent. Mereka secara statistic terkait
Perbedaan antara apa yang diharapkan dengan observation terlalu besar untuk dijelaskan
secara kebetulan saja
Errors
Probable error : mendikasikan jumlah kesalahan yang diperkirakan untuk membuat pengukuran
1. Error in measurement
2. Error in hypothesis testing
3. Error in sampling
Measurement Errors
Blunder : biasanya terlihat sebagai titik data yang salah atau hasil yang tidak mendekati nilai yang
diharapkan
Kesalahan sistematik : misalnya : kerusakan pada alat (instrumen), pengaruh lingkungan terhadap alat
Kesalahan random : kesalahan yang tidak dapat langsung diketahui, karena perubahan-perubahan
parameter atau sistem pengukuran terjadi secara acak. Menggunakan statictical tools untuk
mengkategorikan dan mengukur error jenis ini. Contoh eror ini adalah : keterbatasan dari alat
pengukuran, kesalahan pembacaan output
Pengukuran berat badan dengan dua alat yang berbeda menghasilkan hasil yang berbeda
Bland – altman : analisis yang digunakan untuk memandingkan dua pengukuran terhadap variabel yang
sama
Source of error
Random error precision ( seberapa baik nilai yang dihasilkan dari pengukuran )
Characteristic of tools resolution
Error in sampling
e. Process
Kesalahan terjadi pada proses misalnya pembersihan data, pengambilan data dan
perubahan data. Dibutuhkan pengelolaan pada setiap tahapan, seperti pengecekan data
apakah data duplikasi / tidak. Bila perlu dibutuhkan training kepada staff untuk
melakukan pekerjaan ini.
Sampling error
a. Ukuran sample
Secara umum, ukuran sampel yang lebih besar mengurangi kesalahan sampling, namun
penurunan ini tidak berbanding lurus. Kesalahan non-sampling cenderung meningkat dengan
sample besar.
b. Fraksi sample
c. Variasi dalam populasi
Populasi besar = variasi besar, diperlukan stratifikasi (perbedaan dengan mengelompokan
berdasarkan kelas) untuk menjelaskan variabilitas populasi.
d. Desain sample
Menggunakan sampling yang efisien