Anda di halaman 1dari 25

- Subjective probability  subjective opinion

- Mengiterpretasikn probabilitas :
a. Dengan melakukan eksperimen ( frequentist)
b. Subjective : tingkat kepercayaan dari seorang decision maker terhadap ketidakpastian /
kejadian yang akan terjadi
- Mengapa menggunakan probabilitas subjektif
a. Frequentist tidak selalu memberikan jawaban yang sesuai ( terdapat kejadian yang tidak bisa
diulang)
b. Tingkat kepercayaan / opini subjektif tergantung pada orang dan kontennya
- Mengapa menggunakan opini dari seorang ekspert ? apakah tidak akan menimbulkan bias ?
c. Seorang ekspert mungkin ingin mengukur pendapatnya untuk kepentingan dirinya sendiri
d. Data yang tersedia mungkin tidak cocok untuk digunakan untuk menghitung secara statistik
e. Data tidak tersedia sehingga perlu ekstrapolasi dari informasi yang berhubungan
- Expert dan perhitungan probabilitas
 Expert adalah mereka yang memiliki pengetahuan tentang apa yang akan diukur
 Panduan untuk penilaian expert
a. Identifikasi variabel2 yang diperlukan untuk penilaian ahli (mencari literature untuk
membangun pengetahuan)
b. Identifikasi dan recruit expert ( in house expertise, external recruitment)
c. Motive experts ( menjalin hubungan dan membangun antusiasme)
d. Menyusun dan menguraikan ( membangun model umum untuk merepresentasikan
hubungan antar variabel)
e. Melakukan pelatihan penilaian ( menjelaskan prinsip penilaian, memberikan
kesempatan penilaian)
f. Probability elicitation and verification (membuat kebutuhan penilaian probabilitas dan
memeriksa konsistensi)
g. Menggabungkan distribsi peluang experts
- Bagiamana mengukur opini ?
- Penliaian dengan probabilitas diskrit
a. Direct methods
b. Indirect methods
 Betting approach
 Reference lottery
====================================================================================

Type 1 & 2 error


Part 1 : https://www.youtube.com/watch?v=VFMcGdWp0MQ&t=437s

Case : Kebakaran

ada tercium bau terbakar

apa yg mau dilakukan selanjutnya?

Type I error

1. Mencium bau terbakar


2. ini tidak normal, kamu menyalakan alarm kebakaran,
3. evakuasi bangunan, petugas pemadam melakukan investigasi
4. setelah dilakukan investigasi ternyata tidak ada kebakaran, kamu salah dalam menyalakan alarm
5. Ketika kamu menolak asumsi bahwa semua normal, dan ternyata kenyataannya normal, kamu
“commited type 1 error”. A "false alarm"

Type 1 Error = "rejection of the assumption (null hypothesis) when it should not have been rejected atau
incorectly rejecting null hypothesis, in this case a false alarm (false positive)

Type II error

1. kamu mencium asap


2. kamu berasumsi mungkin ada seseorang yang sedang menghangatkan makanan di microwave,
tidak ada masalah
3. kamu tidak menyalakan alarm kebakaran, you do not reject your assumption (null hypothesis)
that everything is OK. You uphold the null
4. ternyata ada kebakaran
5. Ketika kamu gagal dalam menolak asumsi bahwa semua normal, pada kenyataannya tidak
normal, kamu “commited Type II error”.

Type II Error = "Failure to reject the assumption (null hypothesis) when it should have been rejected
atau incorectly not rejecting the null hypothesis in this case "apathy" or "under reaction"
Case berikutnya

Pada Toyota Production System, pekerja mempunyai kekuatan dan tanggung jawab untuk men stop
semua production line Ketika melihat/menduga ada problem yang serius, ini dilakukan dengan menarik
andon cord

Assumpsi adalah production line berjalan dengan benar. This is the minute by minute null hypothesis

Ketika pekerja notice ada defect, dia mempunyai pilihan untuk menarik cord atau tidak

- Jika andon cord ditarik, pekerja menolak asumsi bahwa proses berjalan normal (error free),
rejecting the null hypothesis -> Type I error
- Jika andon cord tidak ditarik, pekerja tidak menolak asumsi bahwa proses berjalan normal (error
free), thus maintaining the null hypothesis -> Type II error

Part 2 : https://www.youtube.com/watch?v=nkmzsyLg0tY&t=28s
Example 1 :

A bottled water manufacturer states on the production label that each bottle contains 355 ml of water.
You work for a government agency that protects consumers by testing product volumes. A sample of 50
bottles is tested

Is there anything we can assume to be true ? Yes, 355 ml on the bottle

Which hypothesis pair seems to be appropriate?

H0: = 355ml H a: ≠ 355ml

Example 2 :

According to the United States Department of Agriculture, in 2006 the average farm size in the state of
Texas was 2.3 km2. Since the decades-long trend as beenfor farm sizes to increase due to large
agribusiness, a business analyst wishes to test if current (2013) farm size is larger than it was in 2006.
Establish a null and alternative hypothesis

Jawab

Asumsi awal = tidak ada perubahan pada rata2 luas lahan sejak 2006 atau ada perubahan tapi malah
mengecil

Example 3 :

During the 2010-2011 English Premier League Season, Manchester United home matches had an
average attendance of 74961. A club marketing analyst would like to see if attendance decreased during
the most recent season. Establish a null and alternative hypothesis for this analysis
Jawab :

 Ingatlah bahwa ketika memilih sampel, kita selalu tunduk pada hukum perubahan (the laws of
change)
 Kita mungkin secara acak memilih sample yang tidak merepresentasikan populasi
- Mungkin memilih sample botol air yang isinya kurang atau lebih dari takaran seharusnya
- Mungkin memilih sample lahan pertanian yang terlalu kecil atau terlalu besar
- Sample berada pada jauh diujung dari sampling distribution
 Teknik sampling kita mungkin cacat
 Asumsi dalam null hypothesis mungkin cacat/salah
- mungkin data USDA (pada kasus example 2) yang salah?
 Tetapi kasus yang biasa terjadi adalah karena “chance and chance alone”, sampling artinya
mempunyai sebuah sampling distribution”, ada peluang kita mendapatkan sample yang berada
jauh diujung dari sampling distribution
=====================================================================================

https://www.youtube.com/watch?v=x5Euj2d39kI

Part 1 : Random vs. Systematic Error

Timbangan :

- kemudahan/kenyamanan penggunaan
- kapasitas
- presisi
- akurasi

Akurasi : mendekati nilai sebenarnya

Presisi : seberapa dekat nilai pada beberapa percobaan (goup of value) pada nilai actual yang sama

pada 5 kali percobaan dalam menimbang, didapat 5 nilai yang


berbeda, kemudian data itu kita plot dan didapat rata2nya adalah
2,86 gram. Mengapa hal ini bisa terjadi? Jawabannya adalah karena
random errors. Random errors / two sided menyebabkan fluktuasi
dari nilai mean bisa menyebabkan nilainya terlalu tinggi dan terlalu
rendah dari nilai mean.

Mengapa terjadi random errors missal pada timbangan elektronik? Bisa karena aliran udara yang
berubah, fluktuasi voltasi pada alat, jika pada timbangan biasa mungkin karena human estimation.
Nilai 0.029 adalah nilai ketidakpastian
(uncertainty) atau biasa disebut dengan
random errors.

Presisi digambarkan dari range 2,84 – 2,88

Nilai pengukuran berada pada range 2,84 –


2,88 dengan rata-ratanya adalah 2,869 sedangkan berat aktualnya
adalah 2.929, jarak antara pengukuran dengan nilai sebenarnya
disebut akurasi, mengapa terjadi perbedaan ? ini dikarenakan oleh
systematic error.

Systematic error atau bisa disebut juga one sided error artinya percobaan hanya bisa menghasilkan nilai
yang terlalu tinggi atau nilai yang terlalu rendah (hanya salah satu). Mengapa terjadi systematic error?
Bisa karena kesalahan pada instrument, prosedur, maupun human errors.

Kesalahan mata manusia, melihat dari atas mengakibatkan nilai yang


terukur selalu terlalu rendah

kesalahan pada timbangan dimana nilai


awalnya bukan 0 tetapi -0.069, sehingga mengakibatkan nilainya
selalu lebih rendah sebesar 0.069

systematic error dinyatakan dalam persen error

% = (measured value – accepted value) / accepted value x 100%

Part 2 : Uncertainty in Measurements


https://www.youtube.com/watch?v=2JRwdeaX_w0

timbangan elektronik vs timbangan manual

menggunakan metode deviasi

Tanpa menggunakan metode deviasi :

Uncertainty of an instrument = setengah dari

- Least Count : smallest sub division yang dapat dihitung oleh instrument

- Last place value

====================================================================================
VApa itu Chi-Square Test ?

 Memudahkan kita dalam memahami hubungan antara 2 varable categorical; grade level, sex,
age group, year, dll
 Chi-squares melibatkan frequency dari kejadian; the count
 Memudahkan kita dalam membandingkan apa yang sebenarnya kita amati dengan apa yang
sering kita harapkan menggunakan populasi data atau teoritical data
 Chi-squares membimbing kita dalam menentukan peran dari random chance variation antara
variable kategori
 Kita menggunakan chi square distribution dan critical value untuk menerima atau menolak
hipotesis

Contoh : Experimen dadu.

Misalnya saya punya 2 dadu, satu dadu normal, satu dadu yg diberi pemberat pada nomer 1-5-6. Saya
memberikan satu dadu dan memintamu untuk menentukan apakah dadu yang diberikan itu dadu
normal atau dadu yang diberi pemberat. Saya butuh kamu untuk memiliki keyakinan 95% dalam
kesimpulanmu.

Dalam 6 hari kamu diminta untuk melakukan pelemparan dadu sebanya 100 kali sehari sehingga total
pelemparan adalah 600 dan catat berapa kali setiap nomer keluar.

Mari mengasumsikan bahwa dadu adalah normal, apa yang kita harapkan terjadi?

Number Expected Freq


1 100
2 100
3 100
4 100
5 100
6 100
Total 600

Null hypothesis, H0

H0 : Dadu normal

Dalam Bahasa sehari-hari, cara mengungkapkannya adalah :

"Apakah variasi dalam data pengamatan kita hanya karena kebetulan dari peluang acak, atau apakah
variasi itu berada di luar kemungkinan dari peluang acak seharusnya?"

"Seberapa jauh data kita bisa bervariasi sebelum kita harus menolak hipotesis nol kita dan
menyimpulkan bahwa dadu itu tidak adil?"

H1 : Dadu tidak normal (diberi pemberat)


- Confidence level : 95%
- Error probability : P-value = 0.05
- Degree of freedom (df) : (6-1) = 5
- Chi-square critical value = 11.07 (hasil dari excel chiinv(0.05,5))

Jika hasil observasi dadu mu mempunyai χ 2 > 11.07 maka kamu harus menolak H 0 dan menyatakan
bahwa dadu sudah diberi pemberat

Observe
Number Expected Freq d O-E (O-E)^2 (O-E)^2/E
1 100 111 11 121 1.21
2 100 90 -10 100 1
3 100 81 -19 361 3.61
4 100 102 2 4 0.04
5 100 124 24 576 5.76
6 100 92 -8 64 0.64
Total 12.26

χ 2 dadu = 12.26 dimana > 11.07, maka H0 ditolak, dadu tidak normal

Dalam APA format :

Frekuensi yang diamati dari setiap angka pada dadu berbeda secara signifikan dari apa yang diharapkan
pada “theoretically fair die”, χ 2 (5, N=600) = 12.26, p ≤ 0.05

Permasalahannya χ 2 = 12.26. Critical χ 2(0.05,5) adalah 11.07. Karena itu variasi kami terlalu bagus untuk
dijelaskan secara kebetulan saja. Karena itu kita harus menolak H0 (dadu itu adil) dan menerima H1,
dadu itu tidak adil.

Kami 95% confident bahwa kamu telah memberi pemberat pada dadu

Effect dari p value :

Apabila kita naikkan level confident menjadi 99%, P-value menjadi ≤ 0.01, chi-square menjadi 15.09
(hasil dari excel chiinv(0.01,5)), sehingga

χ 2 dadu = 12.26 dimana < 15.09, maka H0 diterima, dadu normal

Dalam APA format :

Frekuensi yang diamati dari setiap angka pada dadu tidak berbeda secara signifikan dari apa yang
diharapkan pada “theoretically fair die”, χ 2 (5, N=600) = 12.26, p ≤ 0.01

Permasalahannya χ 2 = 12.26. Critical χ 2(0.05,5) adalah 15.09. Karena itu variasi kami tidak terlalu bagus
untuk dijelaskan secara kebetulan saja. Karena itu kita harus menerima H0 (dadu itu adil) dan
menyimpulkan dadu itu adil.

Kami 99% confident bahwa kamu telah memberi dadu yang normal

Part 2
Example

You work in the Office of Institutional Research at small (but growing) regional 4-year university. Over
the past 5 years, the number of undergraduate students at each level (freshman, sophomore, junior,
senior and unclassified) has changed; headcount variation

Questions

Even though some headcount random variation is expected, is the variation beyond what we would
expected due to chance alone?

How can a chi-square test help us rule out variation due to chance alone?

Chi-Square Test of Independence

 The Chi-square can be thought of as a test of independence


o Are these two variables “statistically” independent? Related?
o It offers us nothing more than: relationship or no relationship
 Hypothesis:
o Null H0: The two categorical variables are independent
o Alternative H1: The two categorical variables are related (not independent)
 Observed frequency vs expected frequency
o Is the variation between the observed and expected frequencies minor enough to be
within what we may expect due to chance alone?
 Contingency Tables
o One variable along the top, the other down the left side
o Two Tables: Observation Contingency Table and an Expected Contingency Table
 Degree of freedom
o (#columns - 1) x (#rows – 1) = degrees of freedom
Undergrad Observed Headcount
2007 2008 2009 2010 2011 Total
Freshman 560 495 553 547 512 2667
Sophomore 369 385 358 361 393 1866
Junior 209 226 248 268 285 1236
Senior 267 277 304 328 340 1516
Unclassified 64 70 93 77 126 430
Total 1469 1453 1556 1581 1656 7715

Undergrad Expected Headcount


Tota
2007 2008 2009 2010 2011 l
507.818 502.287 546.536 266
Freshman 9 9 537.894 2 572.463 7
Sophomor 355.301 376.344 382.390 400.530 186
e 9 351.432 3 9 9 6
235.344 232.781 249.282 253.287 265.303 123
Junior 7 3 7 9 4 6
305.754 325.404 151
Senior 288.659 285.515 5 310.667 5 6
Unclassifie 81.8755 86.7245 88.1179 92.2981
d 7 80.9838 6 5 2 430
771
Total 1469 1453 1556 1581 1656 5

Chi-Square Computation
Observe
d Expected O-E (O-E)^2 (O-E)^2/E
560 507.8189 52.18108 2722.864674 5.361881
369 355.3019 13.69812 187.6385064 0.52811
209 235.3447 -26.3447 694.0407561 2.94904
267 288.659 -21.659 469.1112423 1.62514
64 81.87557 -17.8756 319.5358983 3.902701
495 502.2879 -7.28788 53.11320585 0.105743
385 351.432 33.56798 1126.80958 3.206337
226 232.7813 -6.78134 45.98650522 0.197552
277 285.515 -8.51497 72.50472834 0.253944
70 80.9838 -10.9838 120.643814 1.489728
553 537.894 15.10603 228.1920584 0.424232
358 376.3443 -18.3443 336.5120371 0.89416
248 249.2827 -1.2827 1.645309148 0.0066
304 305.7545 -1.7545 3.078285032 0.010068
93 86.72456 6.275437 39.38111531 0.454094
547 546.5362 0.463772 0.21508435 0.000394
361 382.3909 -21.3909 457.5717479 1.196607
268 253.2879 14.71212 216.4464528 0.854547
328 310.667 17.33299 300.4324621 0.967056
77 88.11795 -11.118 123.6088576 1.402766
512 572.463 -60.463 3655.773664 6.386044
393 400.5309 -7.53091 56.71466273 0.141599
285 265.3034 19.69657 387.954678 1.462306
340 325.4045 14.59546 213.0275514 0.654655
126 92.29812 33.70188 1135.816679 12.30596
chi-squared 46.78126

chi-square critical value


p=0.05 df=16 χ 2 =26.29623

Chi-Square Results
 Problem chi-square test menghasilkan χ 2= 46.78126
 P-value of p = 0.05
 Degree of freedom = (5-1) x (5-1) = 16
 Critical value, χ 2= 26.29623
 Was our problem χ 2 > critical χ 2? Ya: 46.78126 > 26.29623
 Maka kita harus menolak null hypothesis H0 dan menyimpulkan bahwa class level dan tahun
tidak independent. Mereka secara statistic terkait
 Perbedaan antara apa yang diharapkan dengan observation terlalu besar untuk dijelaskan
secara kebetulan saja
Errors

Probable error : mendikasikan jumlah kesalahan yang diperkirakan untuk membuat pengukuran

Tipe eror pada statistika :

1. Error in measurement
2. Error in hypothesis testing
3. Error in sampling

Measurement Errors

Blunder : biasanya terlihat sebagai titik data yang salah atau hasil yang tidak mendekati nilai yang
diharapkan

Kesalahan sistematik : misalnya : kerusakan pada alat (instrumen), pengaruh lingkungan terhadap alat

Kesalahan random : kesalahan yang tidak dapat langsung diketahui, karena perubahan-perubahan
parameter atau sistem pengukuran terjadi secara acak. Menggunakan statictical tools untuk
mengkategorikan dan mengukur error jenis ini. Contoh eror ini adalah : keterbatasan dari alat
pengukuran, kesalahan pembacaan output

Contoh kesalahan sistematik :

Pengukuran berat badan dengan dua alat yang berbeda menghasilkan hasil yang berbeda
Bland – altman : analisis yang digunakan untuk memandingkan dua pengukuran terhadap variabel yang
sama

Source of error

Systematic error  accuracy ( seberapa hasil mendekati nilai yang sebenarnya)

Random error  precision ( seberapa baik nilai yang dihasilkan dari pengukuran )
Characteristic of tools  resolution

Error in sampling

- Eror yang terjadi ketika proses pengumpulan data


- Dua tipe eror jenis ini adalah :
a. Non sampling error
b. Sampling error
- Non sampling error
 Source
a. Defect in sampling frame ( kesalahan dalam membuat kerangka sampling)
Contoh : data duplikasi, data tidak lengkap, data yang diambil melebihi atau kurang dari
cakupan yang didefinisikan
b. Failure to identify target population
Kesalahan terjadi karena penentuan target populasi tidak jelas. Survei populasi tidak
menrepresentasikan populasi target
c. Response
Kesalahan terjadi karena kuisioner, interviewer, proses survei tidak efesien. Dan hasil
respon tidak ditulis/disimpan dengan benar.
i) Poor questionnaire design  content, kata yang misleading, layout kuisioner
sulit untuk dibaca
Kuisioner tidak boleh duplikat, misleading atau ambigu. Diperlukan pengetesan
kuisoner sebelum diberikan kepada responden. Sehingga memerlukan waktu
untuk memperbaiki konten yang salah

ii) Interviewer bias


Responden harus mempunyai pemikiran yang netral terhadap kuisioner yang
diberikan.

iii) Respondent errors


Terjadi kerena informasi yang diberikan oleh responden salah , hal ini terjadi
karena kesalahan menafsikan pertanyaan dan privacy mereka ttg pertanyaan
yang diajukan. Hal ini bisa diatasi dengan pembuatan desain kuisioner yang baik
yang tentunya dilakukan pengetesan terlebih dahulu.

iv) Process with the survey process


Contohnya : mengambil respon dari seseorang yang bukant termasuk
responden
d. Non-response
Merupakan kondisi ketika data tidak dapat dikumpulkan karena respon dari responden
tidak ada / tidak lengkap .
Terdapat 2 jenis non-response
1. Total non-response
Ketika responden tidak bisa menyelesaikan pertanyaan karena beberapa alasan
2. Parsial non-response
Ketika responden tidak bisa menjawab beberapa pertanyaan biasanya pertanyaan
besifat sensitive dan terlalu banyak.

Pencegahan : membuat kuisioner sederhana, menjelaskan tujuan survei, menjaga kerahasiaan

e. Process
Kesalahan terjadi pada proses misalnya pembersihan data, pengambilan data dan
perubahan data. Dibutuhkan pengelolaan pada setiap tahapan, seperti pengecekan data
apakah data duplikasi / tidak. Bila perlu dibutuhkan training kepada staff untuk
melakukan pekerjaan ini.

- Mengurangi kesalahan non-sampling


a. Menggunakan kerangka sampling yang terbaru
b. Pemilihan waktu yang tepat untuk mengadakan survei
c. Menindaklanjuti non-respon
d. Desain kuesioner yang cermat
e. Memberikan pelatihan kepada pewawancara
f. Merancang sistem yang baik untuk proses pengolahan data respon

Sampling error

Kesalahan yang terjadi ketika sample sudah diambil , sumber kesalahan :

a. Ukuran sample
Secara umum, ukuran sampel yang lebih besar mengurangi kesalahan sampling, namun
penurunan ini tidak berbanding lurus. Kesalahan non-sampling cenderung meningkat dengan
sample besar.
b. Fraksi sample
c. Variasi dalam populasi
Populasi besar = variasi besar, diperlukan stratifikasi (perbedaan dengan mengelompokan
berdasarkan kelas) untuk menjelaskan variabilitas populasi.
d. Desain sample
Menggunakan sampling yang efisien

Mengurangi kesalahan sampling  mengimplementasikan sampling secara hati-hati dengan


keterbatasan yang tersedia.

Anda mungkin juga menyukai