Anda di halaman 1dari 9

Tugas Kelompok

Inferensi Likelihood

Chapter 1.1 dan 1.5

OLEH
KELOMPOK 1
CITRA FARAHDIBA ISNANDAR (H121 13 022)
ANDI HARY MULYADI (H121 13 303)

PROGRAM STUDI STATISTIKA


JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS HASANUDDIN
2016

1.1 Bentuk Dasar Masalah Statistika


Misalkan masalah sederhana statistika nontrivial, hanya melibatakan dua
nilai. Studi terbaru menunjukkan angka signifikan dari pembicaraan driver di
ponsel merak selama mengemudi. Apakah ada dampak dari tingkat kecelakaan?
Seharusnya angka dari kemaatian meningkat dari 170 tahun kemarin menjadi 190
tahun ini. Angka 190 lebih tinggi dari 170, tapi itu belum selesai jika
meningkatnya itu nyata. Seharusnya malah angka tahun ini adalah 174, maka
dalam kasus ini kita merasa intuitif bahwa perubahan itu tidak nyata. Jika
angkanya 300, kita merasa lebih yakin bahwa itu pertambahannya nyata
(meskipun sangat berbeda apakah pertambahan dapat dikaitkan dengan
penggunaan ponsel).
Mari kita katakan bahwa perubahan signifikan, jika kita rasakan itu
perbahan yang real. Di level intuitif, apa pengertian dari signifikan? Itu pasti
merespon angka 174 kita rasa berbeda dari 300. Dimana titik kita merubah dari
tidak pasti menjadi lebih percaya? Tidak ada apa-apanya pada dasar hukum
aritmatika atau kalkulus untuk menjawab masalah ini. Dan tentu saja kita
jawabannya tidak dapat ditemukan total pada data itu sendiri (dua angka pada
kasus ini).
Ketidakpastian adalah dapat meliputi masalah yang berurusan di dunia
nyata, tapi statistik hanya cabang dari sains yang menempatkan upaya sistematik
untuk berurusan dengan ketidakpastian. Statistik cocok untuk masalah dengan
ketidakpastikan disebabkan oleh infromasi yang terbatas; itu tidak bertujuan
menghapus ketidakpastian tetapi di beberapa kasus itu hanya menghitungnya,
ketidakpastian dapat tetap bahkan setelah analisis itu selesai.

Contoh data aspirin


Di studi penting di tahun 1989, mengenai pemberian aspirin dosis rendah untuk
kesehatan pasien. total 22.071 individu sehat diacak ke kelompok aspirin atau

placebo dan kita ikuti selama rata-rata 5 tahun. Angka serangan jantung
ditunjukkan pada table 1.1
Group
Aspirin
Placebo
Total

Heart attacks
139
239
378

Strokes
119
98
217

Total
11.037
11.034
22.071

Pertanyaan utama adalah : apakah aspirin menguntungkan? Jelas, ada lebih


sedikit serangan janutng di kelompok aspirin 139 versus 239, tapi kita lihat
dengan pertanyaan yang sama: apakah bukti cukup kuat sehingga kita dapat
menjawab pertnyaan dengan percaya diri? Efek sebelahnya, perhitungan stroke,
lebih besar kelompok aspirin, 119 versus 98 yang tidak meyakinkan sebagai
manfaat aspirin.
Kita menyatakan manfaat aspirin dari resikonya sebagai berikut
139/11.037
=0,58
239 /11.034
Resiko pertama mengindikasikan aspirin tidak bermanfaat, sementara nilainya
lebih kecil dari indikasi manfaat. Apakah 0,58 cukup untuk satu? Jawaban
pertanyaannya butuh model stokastik yang mendeskrpsikan data yang kita amati.
Pada contoh ini, kita dapat model bahwa angka dari serangan jantung di grup
aspirin sebagai binomial dengan probabilitas

dan placebo sebagai binomial

dengan probabilitas 2 . Maka yang benar resiko relatifnya adalah = 1 / 2


Mari kita nyatakan resiko relative yang diobservasi

^
=0,59
. Tidak ada

ketidakpastian yang terkain dengan angka ini, jadi salah alamat statistika alamai
dari pertnyaan original. Apakah percobaan mengandung informasi bahwa

adalah benar kurang dari satu? Sekarang misalkan studi 10 kali lebih besar, jadi
asumsikan tingkat kejadian serupa, kita amati 1390 versus 2390 serangan jantung.

Maka

^
=0,58

sebelumnya, tapi secara intuitif informasinya sekarang kuat.

Jadi data harus mengandung perhitungan ketelitian

^ , dimana kita dapat

menilai kepercayaan kita jauh dari satu. Kita dapat sekarang dasar masalah dari
inferensi statistika: bagaimana kita pergi dari data pengamatan ke pernyataan
tentang parameter dari ?

1.5 Fisher dan Cara ketiga


Pendekatan Likelihood menawarkan jalan yang berbeda third way,
Bayesian-frequentist. Kita dapat menyebutnya Fisherian karena pengembangan
konsep oleh Fisher (1890-1962). Fisher jelas tidak menggunakan probabilitas
prior untuk bayesian , tapi dia juga sama tegas dalam penolakannya terhadap
frekuensi jangka panjang sebagai satu-satunya cara untuk menafsirkan
probabilitas. Fisher adalah frequentist dalam desakannya bahwa inferensi
statistika harus objektif dapat diverifikasi.
Dalam tulisan di Fishers Legacy, Efron (1998) membentuk segitiga
statistika

dengan

Fisherian,

Bayesian,

dan

frequentist.

Dia

kemudian

menempatkan berbagai teknik statistika diantara segitiga untuk mengindikasikan


keunikannya.
Fisher berupaya untuk inferensi yang objektif tanpa menggunakan
probability sebelumnya, membawanya terhadap ide probabilitas acuan. Konsep
ini meminta prosedur interval kepercayaan. Tampak bahwa Fisher tidak pernah
berhasil meyakinkan yang lain seperti apa itu probabilitas acuan, meskipun dia
menyatakan demikian, secara konsep, itu sepenuhnya identic dengan probabilitas
klasik dari penulis awal. Dari beberapa model probabilitas acuan bertepatan
dengan probabilitas frekuentis/frekuentis jangka panjang biasa. Masalah terjadi di
lebih banyak model kompleks dimana pernyataan probabilitas eksan tidak
mungkin.
Dari buku Fisher Statisical Method and Scientific Inference(1973),
menyatakan bahwa idenya adalah:
a. Bila memungkinkan untuk mendapatkan hasil yang tepat kita harus
mendasarkan pada pernyataan probabilitas, jika tidak maka harus
didasarkan pada likelihood
b. Kemungkinan (likelihood) dapat diinterpretasikan subjektif sebagai derajat
kepercayaan, tapi itu lebih lemah daripada probabilitas, ketika dia tidak
mengizinkan verifikasi eksternal (verifikasi dari objek yang diamati)

c. Untuk sampel yang besar ada Penguatan pernyataan likelihood di mana ia


menjadi mungkin untuk melampirkan beberapa sifat probabilistik
Ini tampaknya meringkas pandangan Fisher. Sekitar 40 tahun berlalu
antara definisi eksplisit dari likelihood sebagai tujuan estimasi dan keputusan
terakhir Fisher tentang inferensi likelihood. Yang istimewa adalah bahwa inferensi
mungkin langsung dari fungsi likelihood.
Pandangan-pandangan Fisherian juga berbeda dari apa yang disebut
'pandangan likelihood murni' yang menganggap likelihood sebagai satu-satunya
pembawa kepastian dalam inferensi stastika. Fisher mengakui dua tingkat yang
didefinisikan dengan status logis untuk ketidakpastian tentang parameter , salah
satu yang disediakan oleh probabilitas dan lainnya dengan likelihood.
Dasar dari inferensi Likelihood adalah analisa, meringkas (summary)
dan membicarakan bukti statistika mana yang lemah untuk menjadi pernyataan
probabilitas yang benar. Selanjutnya, jika dibolehkan, pernyataan probabilitas
seharusnya mengizinkan untuk verifikasi eksternal (verifikasi dari objek yang
diamati), jadi benar bahwa pertimbangan frekuentis juga penting dalam
pandangan Fisherian.
Syarat Fisher untuk inferensi probabilitas lebih ketat daripada yang
disebut exact inference pada statistic sekarang. Bentuk dasar dari inferensi
bebasis probabilitas eksak adalah interval kepercayaan untuk rata-rata normal.
Statementnya adalah
P( x 1,96 / n)< <( x 1,96 / n)=0,95

yang jelas dan pasti/objektif yang dapat diverifikasi; bentuk ideal untuk inferensi.
Namun, interval kepercayaan 95% untuk proporsi binomial, faktanya bukan tepat
95% dalam cakupan probabilitas, jadi secara logika status ini lebih rendah dari
interval eksak untuk model normal. Inilah situasi yang likelihood indikasikan.
Untuk

fisher,

baik

likelihood

ataupun

probabilitas

diukur

dari

ketidakpastian, tetapi mereka berbeda pijakan. Ini bukan pandangan Bayesian,


karena bagi pendukung Bayesian semua ketidakpastian diukur dengan
probabilitas. Elemen subjektif pada interpretasi likelihood mirip dengan sikap

Bayesian/non-frequentis. Ketika didukung oleh teori sample besar untuk


pernyataan probabilitas, mekanik dan hasil numerik dari inferensi likelihood
umumnya diterima di statistik frekuentis. Jadi, Fisherian sangat berani daripada
frekuentis dalam mengatakan bahwa inferensi itu mungkin dari fungsi likelihood
sendiri, tapi tidak sebagai Bayesian untuk mengakui prior terhadap argument.

Legacies
1920, ruang dari statistika haruslah menjadi membingungkan. Yates (1990)
menulis bahwa itu adalah umur dari korelasi dan koefisien. Untuk menilai asosiasi
di table 2x2 ada koefisien asosiasi, koefisien dari mean kuadrat kontingensi,
koefisien korelasi tetrakorik, dan koefisien koligasi, tetapi ide dari estimasi
asosisasi dan uji signifikasi bercampur. Ada banyak teknik yang dapat digunakan,
seperti prinsip kuadrat terkecil, metode moment, metode inverse probabilitas, uji
X2 , distibusi normal, kurva Pearson, teorema limit pusat dll, tetapi tidak ada
fondasi yang logis,.
Level dari kekacauan dituliskan oleh paper darii Edgeworth pada 1908 dan
Pearson editorial di Biometrika 1913; On The Probable Errors Of Frequency
Constants yang pada zaman modern dinamakan, standar error untuk fixed
parameter. Tidak ada perbedaan atau istilah yang tersedia untuk parameter dan
estimasinya. Dari segi matematika, uji X2 untuk asosiasi table 2x2 memiliki
derajat kebebasan 3.
Sumber kekacauan yang serius nampaknya penggunaan implisit dari
pernyataan invers probabilitas di banyak pekerjaan statistika, tidak diragukan lagi
mempengaruhi Laplace. Peran distribusi prior pada pernyataan invers probabilitas
tidak pernah serius sampai abad ke-20. Ketika dinyatakan secara eksplisit,
kesewenang-wenangan spesifikasi prior mungkin batu sandungan bagi apresiasi
dari statistic adalah pernyataan objektif. Boole (1854) menulis Laws of
Thoughts, bahwa kesewenang-wenangan tampkanya menyiratkan bahwa solusi
yang pasti tidak mungkin, dan untuk menandai titik dimana penyelidikan harus

berhenti. Boole mendiskusikan bahwa metode invers probabilitas panjang lebar


dan mengidenfikasikan kelemahannya, namun tidak ada alternative lain, dia
menganggap pertanyaan dari inferensi induktif sebagai kepentingan teori
probabilitas, akan menerima perhatian yang layak.
Dalam kerjanya di teori errors, Gauss juga sadar masalahnya, tetapi dia
membenarkan dengan metode estimasi dengan istilah prinsil kuadrat terkecil;
prinsip ini berpusat pada pengenalan model regresi, yang sangat disayangkan,
ketika (i) dalam dirinya sendiri sama sekali tanpa konten inferensial, (ii) tidak
natural untuk model probabilitas umum.
Fisher menjawab tantangan Boole dengan mengidentifikasikan likelihood
sebagai kunci inferensi kuantitas dimana tidak ada kemungkinan subjektif prior.
Fisher menekankan jika, data prior, kita belum mengetahui apapun tentang
parameter, maka segala informasi dari data itu ada pada likelihood. Dari subjektif
yang sama, Bayesan mendinterpreatasikan kemungkinan, likelihood menyediakan
derajat kebebasan rasional dari nilai parameter yang mungkin; perbedaan
fundamental adalah likelihood tidak mengikuti Hukum probabilitas. Jadi
probabilitas dan likelihood adalah konsep yang berbeda yang terlihat pada
perbedaan level ketidakmungkinan.
Penulis yang lainnya, seperti Daniel Bernoulli atau Venn, yang menyebut
ide maksimum likelihood dalam bentuk yang belum sempurna. Biasanya muncul
dengan nama most probable value, mengindikasikan pengaruh argument invers
probabilitas. Bahkan Fisher pada 1912 menggunakan nama itu. Kekacauan selesai
pada tahun 1921 ketika Fisher memperkenalkan likelihood.
Seri paper yang paling berpengaruh oleh Fisher (1922-1925) di statistic
adalah memperkenalkan pertama kali dengan memberi nama konsep fundamental
seperti parameter, statistic, variansi, kecukupan, konsistensi, informasi, estimate,
estimasi maksimum likelihood, efisiensi dan optimal. Dia yang pertama
menggunakan huruf Yunani untuk parameter yang tidak diketahui dan huruf Latin

untuk

estimasi.

Dia

mengagendakan

untuk

penelitian

statistic

dengan

mengindentifikasi dan memformulasi pertanyaan terpenting.


Fisher memperbaiki derajat kebebasan dari uji X 2 untuk table 2x2 di 1922.
Dia mengakui paper oleh Student di 1908 untuk uji t, dimana diabaikan oleh
large-sample-based statistika dunia pada saat itu; itu adalah uji eksak pertama. Dia
menekankan pentingnya inferensi berdasarkan distirbusi eksak dan identifikasi
masalah distribusinya sebagai cabang dari statistic teoritis. Fisher tak
tertandingin dalam hal ini, menjadi yang pertama memperoleh distribusi eksak
dari statistic t dan F, seperti juga korelasi sampel dan koefisien korelasi.

Anda mungkin juga menyukai