Tugas 3
Kategori : Kelompok
KELOMPOK 1
PRODI STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS HASANUDDIN
MAKASSAR
2018
1
Daftar Isi
2
Unsur-unsur Infrensi Likelihood
2.1 Definisi Klasik
() = ( = 8)
disebut fungsi likelihood: lihat Gambar 2.1. Plot menunjukkan (J tidak mungkin kurang
dari 0,5 atau lebih besar dari 0,95, namun lebih mungkin berada di antara keduanya.
Dengan data sendiri (dan tidak ada informasi lain), kita harus memilih nilai antara 0,5 dan
0,95 pada nilai di luar ini.
Dengan cara yang sederhana dan deduktif kita telah menemukan jumlah numerik untuk
mengekspresikan urutan preferensi . Tentu saja kita masih belum tahu persisnya dimana
adalah, tapi kami telah menangkap informasi yang diberikan dalam data dengan
3
menunjukkan di mana kemungkinan akan jatuh. Ketidakpastian dalam data itu melekat,
dan itulah yang disampaikan dalam fungsi likelihood.
4
bab selanjutnya kita akan memulai sebuah tur besar untuk menunjukkan kekayaan dunia
kemungkinan dari model mainan sederhana hingga studi yang sangat kompleks.
Model Diskrit
Tidak ada ambiguitas tentang probabilitas data yang diamati dalam model diskrit,
karena ini adalah kuantitas nol yang didefinisikan dengan baik. Untuk contoh binomial
diatas, fungsi likelihood adalah
() = ( = )
= ( ) (1 )
Gambar 2.2 menunjukkan empat fungsi likelihood yang dihitung dari empat percobaan
binomial dengan = 10 dan = 0,2,5, 10. Interpretasi fungsi bersifat langsung.
Misalnya, bila = 0, kemungkinan terkonsentrasi mendekati nol, menunjukkan bukti
kuat bahwa sangat mendekati nol.
Gambar 2.2: Kemungkinan fungsi probabilitas keberhasilan fJ dalam empat percobaan binomial
dengan = 10 dan = 0,2,5,10. Fungsi dinormalisasi agar memiliki unit maksimal.
Model Kontinyu
Sedikit masalah teknis muncul saat berhadapan dengan hasil yang
berkesinambungan, karena secara teoritis probabilitas dari setiap nilai titik adalah nol.
Kita dapat mengatasi masalah ini dengan mengakui bahwa dalam kehidupan nyata hanya
ada ketepatan yang terbatas : mengamati adalah kependekan dari pengamatan
( 2 , + 2), dimana adalah batas presisi. Cukup kecil, untuk mengamati
kemungkinan
() = { ( , + )}
2 2
+
2
= () () (2.1)
2
5
Untuk tujuan membandingkan dalam model (), kemungkinan hanya bermakna
sampai konstanta sewenang-wenang (lihat Bagian 2.4), jadi kita dapat
mengabaikannya. Oleh karena itu, dalam semua model kontinyu dimana hasil
dilarutkan dengan baik ketepatan kita hanya akan menggunakan fungsi kepadatan ()
untuk menghitung kemungkinan.
Dalam banyak aplikasi, hasil terus-menerus tidak diukur dengan presisi yang baik.
Bisa juga terjadi bahwa hasilnya telah dikategorikan ke dalam beberapa kelas, jadi
datanya melibatkan rentang nilai Dalam pengamatan studi klinis biasanya disensor: masa
pakai suatu subjek hanya diketahui lebih besar dari pada suatu titik tertentu. Dalam kasus
ini, pendekatan sederhana (2.1) tidak berlaku, dan integral harus dievaluasi secara tepat
atau Pendekatan lain yang lebih tepat digunakan.
Konvensi Matematika
Perlakuan variabel acak diskrit atau kontinu berbeda sedikit dalam teori
probabilitas, dan istilah 'kepadatan probabilitas' atau 'probabilitas' akan diterapkan untuk
mencakup model diskrit dan kontinu. Dalam kebanyakan kasus, kemungkinan adalah
kepadatan probabilitas dilihat sebagai fungsi parameter. Definisi asli penting bila data
keduanya diskrit dan kontinu, atau bila kita membandingkan model yang terpisah.
Ketika kita mengatakan bahwa kita 'mengintegrasikan' kepadatan ini berarti (i) integrasi
biasa ketika kita berhadapan dengan variabel acak kontinu :
()
()
dimana () adalah beberapa fungsi kepadatan. Ketika kita membahas sebuah contoh
tertentu, kita bisa menggunakan integrasi atau penjumlahan, tergantung pada konteksnya,
namun harus dipahami bahwa gagasan yang dipertimbangkan biasanya mencakup kasus
kontinyu dan diskrit.
2.2 Contoh
Contoh 2.1 : Misalkan 100 bibit ditanam dan diketahui hanya benih 10 yang
berkecambah. Jumlah benih perkecambahan pasti tidak diketahui. Maka informasi
tentang diberikan oleh fungsi likelihood.
() = ( 10)
6
10
100 (1
= ( ) )
=0
Gambar 2.3: () Fungsi kemungkinan dari dua percobaan binomial : = 100 dan
< 11, dan = 100 dan = 5. (b) Kemungkinan jumlah pelacur. (c) Kemungkinan
prevalensi genotipe tertentu. (d) Kemungkinan mean normal berdasarkan pengamatan
0,9 < < 4 (garis padat), = 2,45 (garis putus-putus), dan maksimum (5) = 3,5
(garis putus-putus). Semua kemungkinan ditetapkan untuk memiliki satuan maksimum.
Contoh 2.2 : Teknik yang berguna untuk menghitung populasi adalah menandai
subkumpulan populasi, kemudian mengambil sampel acak dari campuran individu yang
ditandai dan tidak bertanda. Teknik capture-recapture ini digunakan, misalnya untuk
menghitung jumlah hewan liar. Dalam aplikasi sensus, sebuah survei pasca pencacahan
dilakukan dan orang menganggap individu yang sebelumnya dihitung sebagai 'ditandai'
dan yang baru sebagai 'tidak ditandai'; proporsi individu baru dalam survei ini akan
memberikan perkiraan jumlah orang di bawah selama sensus. Untuk memperkirakan
jumlah orang yang menghadiri sebuah demonstrasi besar, pertama-tama kami bisa
mendistribusikan topi warna-warni, kemudian mengambil sampel acak dari kerumunan.
Sebagai contoh spesifik, untuk memperkirakan jumlah badgers () pada tertentu
daerah, Departemen Pertanian tag = 25 dari mereka. Kemudian menangkap = 60
7
badgers, dan menemukan 2 = 55 untagged dan 1 = 5 tagged ones. Dengan
mengasumsikan badgers tertangkap secara acak, kemungkinan N dapat dihitung
berdasarkan pada probabilitas hipergeometrik:
25 25
( )( )
() = (1 = 5) = 5 55 .
( )
60
Gambar 2.3 (b) menunjukkan fungsi likelihood untuk rentang .
Contoh 2.3 : Tim ahli genetika menyelidiki prevalensi genotipe langka tertentu, yang
membuat penampakan pertamanya pada subjek ke-53 yang dianalisis. Dengan asumsi
subjek independen, kemungkinan probabilitas prevalensi diberikan oleh probabilitas
geometrik
() = (1 )52 .
Para ilmuwan telah merencanakan untuk berhenti ketika mereka menemukan lima subjek
dengan genotipe minat, pada saat mana mereka menganalisis 552 subjek. Kemungkinan
diberikan oleh probabilitas binomial negatif
552 1 5 (1
() = ( ) )5525 .
51
Gambar 2.3 (c) menunjukkan kemungkinan ini dalam garis padat dan garis putus-putus.
() = (() )
= ( , )
= {( )}
8
Jadi, kemungkinan berdasarkan pengamatan () adalah
1
() = (() ) = {(() )} (() )
Gambar 2.3 (d) menunjukkan kemungkinan garis putus-putus untuk = 5 dan () = 3,5.
Ada heuristik umum untuk menangani statistik pesanan untuk sampel iid dari densitas
kontinu (). Asumsikan presisi yang terbatas , dan bagikan garis sebenarnya ke
dalam grid biasa dengan lebar . Mengambil sampel iid 1 , , seperti melakukan
eksperimen multinomial: lempar bola ke sel dengan probabilitas () dan rekam
dimana mereka mendarat Misalnya, probabilitas statistik pesanan (1) , , () kira-kira
! (() )
9
Paradoks ini dihindari karena kita tidak dapat menggunakan rata-rata nilai likelihood
sebagai bobot.
Atau
Atau
10
Contoh 2.6 : jika x1 , , xn adalah Iid sample dari (, 2 ) dengan 2 yang
diketahui.
Kontribusi dari xi ke likelihood adalah :
Contoh 2.7 : Misalkan kita memiliki dua sampel independen yang diambil dari
(, 1).Dari sampel pertama dilaporkan bahwa ukuran sampel adalah n1 = 5, dan
Maksimum (5) = 3.5. Sampel kedua memiliki ukuran n2 = 3, dan sampelnya hanya
dietahuii = 4. Dari contoh 2.4 maka :
11
Grafik Likelihoodnya digambarkan pada gambar 2.4.
Gambar 2.4: grafik likelihood berdasarkan Maksimum (5) dari sampel pertama (garis putus-
putus), pada sampel mean = 4 dari sampel kedua (garis titik), dan pada gabungan data (garis
).
12
2.4 Likelihood Ratio
Karena hanya rasio yang penting, dalam model (), fungsi likelihood hanya
bermakna sampai konstanta perkalian. Ini berarti,Misalnya, dalam mengatur likelihood
dapat mengabaikan persyaratan yang tidak dilibatkan Parameternya. Proporsional
likelihood sama jika yang bersangkutan terbukti. Untuk membuatnya unik, biasanya
Menormalkan fungsi likelihood agar memiliki satuan maksimum, yaitu membagi fungsi
maksimal. Jika melaporkan nilai kemungkinan sebagai persentase itu dipahami sebagai
nilai yang dinormalisasi. Atau, kita dapat mengatur log-likelihood untuk memiliki nol
maksimum.
Contoh 2.8
Misalka x adalah sampel yang berdistribus binomial(n, ), dimana n diketahui. abaikan
istilah yang tidak relevan.
Atau
Apakah ada cara untuk mengkalibrasi nilai numerik ini dengan sesuatu yang
obyektif? Jawabannya adalah ya, tapi untuk saat ini kita akan mencoba menjawabnya
lebih subyektif dengan analogi.
13
Misalkan ambil kartu secara acak dari setumpuk kartu N dan pertimbangkan dua
hipotesis berikut ini:
Ho: the deck berisi N kartu berbeda berlabel 1 sampai N.
H2: the deck berisi kartu serupa N berlabel seperti, katakanlah, 2.
Misalkan yang didapatkan kartu dengan label 2, maka ratio likelihoodnya dari
kedua hipotesisnya adalah:
Artinya, H2 adalah N = 209 kali lebih dari pada Ho. Itulah yang bisa Diukur
'keyakinan rasional' tentang = 0,8 dan = 0,3 berdasarkan pengamatan x = 8.
Interpretasi seperti ini, sayangnya, tidak bisa tahan kecuali dengan Penelitian teoritis
(Bagian 2.6), oleh karena itu hanya disebut dengan interpretasi subjektif.
14