PENDAHULUAN
Pada bab ini berisi tentang latar belakang masalah, rumusan masalah,
batasan masalah, tujuan masalah, metode penelitian, dan sistematika penulisan.
Ruang lingkup pada penelitian yang sedang dilakukan yaitu analisis data yang
dimana data berupa data kategori yaitu suatu data atau variabel-variabel yang telah
dikelompokan. Teknik statistika untuk menganalisis data salah satunya yang
seringkali digunakan untuk analisis data yaitu analisis regresi. Analisis yang
digunakan dalam penelitian ini adalah regresi linier berganda. Pada kasus ini adanya
masalah multikolinieritas. Oleh karena itu metode yang digunakan untuk menentukan
nilai estimasi parameternya menggunakan metode regresi ridge. Untuk
menentukan nilai peluang yang dimana dipengaruhi oleh efek acak dan efek kausal.
Nilai peluang dapat diperoleh dari model kausal. Adapun ruang lingkup penelitian
Estimasi Parameter
Regresi Ridge
Model Peluang
=1− 1− ς =1 1 −
Jumlah penyebab
=
=0
Metode yang akan dilakukan dalam penelitian ini yaitu dimulai dari
merumuskan masalah, yaitu dengan menyusun rencana penelitian yang dimulai
dengan suatu masalah data kategori. Dari rumusan masalah tersebut, kemudian
melakukan studi kepustakaan terhadap berbagai referensi yang berkaitan dengan
penelitian yang dilakukan bersumber dari buku, jurnal, dan penelitian
sebelumnya. Pada tahapan studi literatur berupa pemahaman tentang model
peluang untuk efek acak dan efek kausal. Menetukan data sekunder yang relevan
dengan penelitian yang akan dikaji. Data yang telah diperoleh kemudian
dilakukannya analisis data, yaitu dengan melakukan estimasi parameter
menggunakan metode regresi ridge. Untuk menentukan estimasi parameter, maka
analisisnya menggunakan software yaitu Program R atau Minitab. Selanjutnya
menetukan nilai peluang dengan menggunakan model kausal. Tahapan terkahir
yaitu memberikan kesimpulan berdasarkan hasil analisis.
G. Sitematika Penulisan
Berdasarkan sistematika penelitian Studi Literatur ini terdiri atas empat bab
serta daftar pustaka, dimana dalam setiap bab terdapat beberapa subab.
BAB I : PENDAHULUAN
Bab ini berisi latar belakang masalah, rumusan masalah, batasan
masalah, tujuan penelitian,ruang lingkup penelitian dan
sistematika penelitian.
BAB II : LANDASAN TEORI
Bab ini berisi tentang teori-teori yang mendasari pembahasan
dalam paper secara garis besar, meliputi regresi linier
berganda,metode kuadrat terkecil, multikolinieritas,estimasi
parameter menggunakan metode regresi ridge, dan model kausal
untuk menentukan nilai peluang.
BAB III : MODEL PELUANG UNTUK EFEK CAUSAL DAN EFEK
ACAK
Bab ini berisi pembahasan utama dari skripsi ini yang meliputi
pembahasan yang mengenai estimasi parameter, model peluang
untuk efek acak dan efek kausal.
BAB IV : STUDI KASUS
BAB V : PENUTUP
Bab ini merupakan intisari dari bab-bab sebelumnya yang tersiri
dari kesimpulan dan saran untuk pengembangan penelitian yang
lebih baik.
DAFTAR PUSTAKA
BAB II
LANDASAN TEORI
Pada bab ini berisi teori-teori yang mendasari pembahasan model peluang
untuk pengaruh efek kausal dan efek acak.
Terdapat dua tipe skala, yaitu skala nominal dan skala ordinal. Skala nominal
merupakan skala pengukuran paling sederhana atau tingkatannya paling rendah di
dalam suatu penelitian. Skala ini hanya digunakan untuk memberikan kategori
saja. Misalnya digunakan pada variabel jenis kelamin yaitu laki-laki dan
perempuan. Sedangkan skala ordinal Skala ordinal merupakan skala pengukuran
yang sudah menyatakan peringkat atau tingkatan. Misalnya skala ordinal pada
variabel sikap seseorang terhadap suatu pernyataan, sikap tersebut berupa sangat
setuju, setuju, biasa saja, tidak setuju, sangat tidak setuju.
Selain dari tipe skala ada juga variabel kontinu merupakan variabel yang
dapat memuat variabel seperangkat nilai yang tidak terbatas antara dua tingkatan
variabel atau variabel kontinu ini mempunyai sifat nilai pecahan , misalnya tinggi
badan seseorang 1,5 meter , 1,6 meter atau 1,75 meter. Sedangkan variabel diskrit
merupakan variabel yang hanya dapat memuat sepertangkat nilai terbatas atau
nilai bulat tertentu. Misalnya, jumlah mahasiswa dalam suatu universitas
merupakan variabel diskrit karena jumlah ini akan berupa bilangan bulat,
misalnya 325 ; tidak akan ada jumlah mahasiswa 325,5.
Variabel penelitian dapat dikategorikan ke dalam dua bentuk, yaitu variabel
kuantitatif dan variabel kualitatif. Variabel kuantitatif yaitu varibel yang
menunjukan unsur numerik atau angka contohnya berat badan. Sedangkan variabel
kualitatif menunjukan unsur deskriftif atau narasi tekstual contohnya keindahan [1].
̂= + (2.1)
Dimana :
= variabel terkait
= variabel bebas
= intersep
= koefisien regresi
Pendugaan parameter bila diberikan data contoh {( , ) ; = 1, 2, … }, maka nilai dugaan kuadrat terkecil bagi parameter dalam garis regresi.
̂= +
∑ 2 − ∑
=1 =1
Dan
= ̅- ̅ (2.3)
Membahas masalah pendugaan atau peramalan nilai peubah tak bebas berdasarkan hasil pengukuran pada beberapa
peubah bebas 1, 2, … , . Contoh acak berukuran dari populasi itu dapat dituliskan sebagai { 1, 2, … , ; = 1,2, … , }. Secara
umum model regresi linier multipel dengan variabel dependen dan variabel bebas, dapat dituliskan sebagai:
= 0 + 1 1 + 1 2 + ⋯ ++
(2.4)
Dimana :
Nilai dugaan kuadrat terkecil bersifat 0, 1, dan 2 dapat diperoleh dengan memecahkan persamaan linier.
0 +1 1+2 2=
=1
=1 =1
+2 +=
0 1 1 1 2 1 2 1
=1 =1 =1 =1
02 +1 1 2 +2 2
2
=2 (2.5)
=1 =1 =1 =1
Sistem persamaan linier tersebut dapat diselesaikan untuk mendapatkan 1 dan 2 dengan berbagai cara yang tersedia, antara lain dengan kaidah cramer, dan kemudian 0
dapat diperoleh dari persamaan pertama bahwa:
= ̅− −
̅ ̅
(2.6)
0 1 1 2 2
4. Variabel independen 1, 2, 3, … , konstan dalam sampling yang terulang dan independen terhadap galat .
Metode kuadrat terkecil adalah suatu metode yang digunakan untuk menduga koefisien regresi klasik
dengan cara meminimumkan jumlah kuadrat galat yaitu meminimumkan ∑ =1 2 [2].
Estimator dalam metode kuadrat terkecil diperoleh dengan cara meminimumkan
2= − 0−1 1− 2 2−⋯− 2
⋮ 1 2
(2.8)
Diperoleh
= −
(2.9)
= ′ − ′ − ′′ + ′′
(2.10)
= ′ −2′ + ′
= −2 − 0 − 1 1 − 2 2 −⋯− =0
̂ ̂ ̂ ̂
0 + 11+ 2 2 + ⋯ +=
̂ ̂ 2 ̂ ̂
1 +1 +2 2 1 1 =1
0 1 + ⋯+
̂ ̂ ̂ 2 ̂
2 +1 +22 2 =2
0 1 2 + ⋯+
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
̂0 + ̂1 1 + ̂2 2 +⋯+̂ 2=
(2.12)
′ −1 ′ ̂= ′ −1 ′
̂=
′ −1 ′
̂ ′ −1 ′
(2.13)
̂ ′ −1 ′ (2.14)
=
Dengan demikian, jika diasumsikan bahwa = 0 dan ′ = 2 dan kolom
adalah independen linier maka,
( ̂) = ′ −1 ′ =
Sehingga ̂ adalah sebuah estimasi tak bias untuk . Asumsi bahwa tidak berkorelasi dan memiliki variansi yang sama yaitu
( , )= 2
Dan asumsikan juga bahwa = = 2 , akan diperlihatkan bahwa [ ] = yaitu sebagai berikut :
[]= [ − ][ − ]′
= 2
Selanjutnya yaitu untuk [ ] yaitu :
[]= [ − ][ − ]′
= 2
Oleh karena itu []= [ ] = 2 , sehingga variansi ̂ dapat dijabarkan dengan cara sebagi berikut :
( ̂) = [ ′ −1 ′]
= {[ ′ −1 ′ − ′ −1 ′ ][ ′ −1 ′ − ′ −1 ′ ]′ }
∗ = [{ ′ −1 ′ + } ]
(2.15)
Untuk adalah matriks yang berupa ukuran × sehingga nilai harapannya yaitu
∗ = { ′ −1 ′+ }
= +
∗ merupakan penduga tak bias bagi , jika = 0. Sehingga = 0 atau ′ = 0, sehingga ′ ′ = 0. Dengan demikian
∗ = {[ ∗ − ∗ ][ ∗ − ∗ ] ′}
Model regresi ridge didasarkan pada penambahan konstanta bias pada diagonal matriks ′ sehingga :
̂ = ′ + −1 ′
Model kausal adalah suatu model yang digunakan untuk mengetahui sebab akibat dari variabel dependen
terhadap variabel independen. Terdapat contoh yang dimana berdampak langsung dari beberapa penyebab pada
hasil biner Y dengan Y=1 dan Y=0 yang artinya efek dari kasus tersebut telah terjadi atau tidak terjadi. Perhatikan
kasus pada atribut 1, 2, … , (dimana = 1 dan = 0 menunjukan kehadiran atau tidak adanya ke- , dengan = 1,2, … ).
Atribut dalam kasus yang ada diwakili oleh kategori variabel yaitu, variabel biner, variabel ordinal dan variabel
nominal. Selain itu juga terdapat sebuah vektor yang di cirikan sebagai = 1, 2, … , dan mungkin mewakili tingkat
yang sama atau berbeda kategori variabel. Misalkan 1 = pria, 2 = perempuan dan 3 = anak kecil, maka diasumsikan
bahwa atribut merupakan efek kausal = 1 dengan peluang [2].
Konsep dasar dalam peluang kausal dimana adanya yang diartikan sebagai
peluang intrinsik. Peluang intrinsik kausal merupakan peluang dasar kausal,
misalkan terdapat suatu data yang berisi satu variabel X yang menyebabkan
variabel Y. Sehingga tidak terjadinya peristiwa adalah :
1− = ∏ 1−
{ : =1}
Dimana :
= peluang intrinsik
Selain efek sebab akibat ada juga “ penyebab acak “ yang diartikan sebagai
suatu kemungkinan yang tersamar menunjukan faktor-faktor lain yang tidak
secara eksplisit dianggap oleh atribut. Dan efek acak yang diasumsikan sebagai
independen dari atribut lain dan hasilnya (ditunjukan sebagai dalam suatu akibat)
adalah konstanta pada seluruh konfigurasi atribut yang mungkin hadir bagi
individu tertentu.
Dari dua faktor tersebut efek kausal dan efek acak menjadikan kesatuan yang
menghasilkan probabilitas yang diharapkan pada tingakat populasi sebagai
kesatuan dari kausal dan sumber acak. Yang dimana dapat dirumuskan sebagai
berikut :
= + − ∙
= 1 − 1 − (1 − )
=1− 1− ∏ 1−
{ ; =1}
Dimana :
= parameter yang mewakili jumlah terkait dengan kehadiran dari setiap atribut
.
Tujuan dari model kausal ini untuk mengestimasikan parameter + 1, 1, 2, … dan r atas basis sampel hasil realisasi = {1,0} dan notasi vektor
yang terkait. Pada kedua model diatas dari peluang intrinsik (kausal) yang
berasumsi bahwa penyebab tunggal sudah cukup untuk kejadian terjadi,
sedangkan untuk peristiwa yang tidak terjadi dikarenakan semua penyebab
potensial tidak efektif.
a. Etimasi Parameter
Estimasi paramater pada regresi linier biasanya menggunakan metode
kuadrat terkecil. Dalam analisis kausal juga metode yang digunakan untuk
estimasi parameternya menggunakan metode kuadrat terkecil. Dengan bentuk
persamaannya yaitu :
= ′ −1 ′
Dimana adalah vektor dari urutan ke- , adalah desain matrik dari nilai dan adalah vektor dari
semua parameter + 1. Jika tidak ada pengamatan yang cukup, matriks kedua pada saat ′ bisa
jadi matriks tersebut singular dan tidak memungkinkan invers atau menghasilkan koefisien
terlalu melambung. Matriks singular dikatakan jika matriks persegi dan det = 0, maka invers
dari matriks tersebut tidak ada dan dikatakan bahwa singular. Dengan keadaan tersebut metode
kuadrat terkecil tidak digunakan untuk estimasi parameternya. Dengan itu dapat menggunakan
regresi ridge untuk estimasi parameter.
= ′ + −1 ′
Parameter yang membedakan regresi ridge dari metode kuadrat terkecil adalah
. Tetapan yang relatif kecil ditambahkan pada diagonal utam matriks ′ , sehingga koefisien estimator regresi ridge dipenuhi dengan besarnya
tetapan.
Dalam prakteknya, perhitungan estimator regresi ridge dengan menyelesaikan
persamaan di atas sangatlah rumit, oleh itu dilakukan penyederhanaan dengan
membawanya kedalam bentuk matriks. Estimasi regresi ridge diperoleh dengan
meminimumkan jumlah kuadrat galat untuk model :
Atau
= −
̂ ̂
Dicaridengan memecah | =0
= − ̂ ′( − ̂ ) + ( ̂ ′ ̂ − 2)
= ′ − ′ ̂ − ̂ ′ + ̂ ′ ′ ̂ + ( ̂ ′ ̂ − 2)
= ′ + 2 ̂ ′ ′ ̂ + ( ̂ ′ ̂ − 2)
|̂=0
−2 ′ + 2 ′ ̂+ 2 ̂ =0
−′ + ′ ̂+ ̂ =0
′̂+̂=′′+̂=′
̂ = ′ + −1 ′
̂
Dimana = + ′ −1 ′ dengan 0≤ ≤ ∞, itulah yang disebut sebagai Regresi Ridge.
≥ 0 adalah nilai konstan yang dipilih sebagi indeks dari kelas estimator
= −2 + 2 ′ ′ ̂ +2 ̂
=2′ +2 >0
̂
′ + >0
Dimana = ′ + −1
= =
(3.1)
Jadi ̂ yang diperoleh dari metode regresi ridge merupakan penaksir linier bias yang memiliki variansi minimum untuk .
Metode regresi ridge dan metode kuadrat terkecil adalah salah satu cara untuk
mendapatka koefisien regresi pada persamaan regresi linier berganda. Perbedaan
antara dua metode tersebut adalah jika pada metode kuadrat terkecil menghasilkan
penaksiran terbaik (tak bias dan bervariansi munimum). Sedangkam metode
regresi ridge jika tidak ada korelasi antar variabel bebas, adanya nilai variabel tak
bebas yang ditransformasikan melalui prosedur centering dan rescaling.
√ −1
̅
∗=
1 (
−
), dimana = 1,2,3, … ,
√ −1
̅ = rata-rata
= standar deviasi dari
̅ 2
=
√ ∑ ( − )
=1
−1
=√ =1
∑ −̅2
−1
(3.5)
Sedangkan rescaling dilakukan dengan menghilangkan ̂0 (intersep), dari model regresi linier berganda :
= 0+1 1+1 2+⋯+ +
= 0 + 1 1 + 1 2 + ⋯ ++ 1 1 − ̅1 + 2 2 − ̅2 + ⋯
+
̅
− +
0 = ̅ − 1 ̅1 − ̅ −⋯−
22 ̅
Maka berlaku :
̅ = 0 + 1 ̅1 + 2 ̅2 + ⋯ + ̅
Sehingga
−̅= 0+ 1 1 + 1 2 +⋯+ +
− 0 + 1 ̅1 + ̅
22 +⋯+ ̅
= 1 1 − ̅1 + 2 2 − ̅2 + ⋯ +− ̅ +
Jika
= −̅
1 = 1 −1
̅
2 = 2 − ̅2
= −̅
Untuk menentukan nilai tetap bias hal yang sulit untuk mencapai koefisien
regresi yang stabil. Maka oleh karena itu ada beberapa metode untuk mencari
nilai tetap bias ,yaitu :
1. Ridge Trace
Ridge trace adalah plot anatara koefisien regresi ridge terhadap nilai-nilai , dengan ∈ [0,1]. Untuk nilai yang berbeda-beda dapat
ditentukan
̂ . Tujuan dari ridge trace adalah untuk memilih yang bernilai kecil, dimana tersebut dianggap terlalu
subjektif karena memerlukan keputusan peneliti untuk menentukan nilai yang akan dipilih.
2. Menghitung
= ̂2
̂ ′̂
(3.6)
=
( − ) −
̂2
− −1
̂2
4) Jika +1 − ≈ 10−10 maka iterasi berakhir, namun jika tidak maka +1 akan menjadi konstanta bias dan kembali ke langkah (2).
b. Analisis Kausal
= 0+1 1+⋯+
(3.3)
Setiap parameter asli dari probabilitas yang dapat diperoleh dari relasi pada
persamaan (3.2) dengan ditransformasikan sebagai berikut :
= 1 − exp 0
Bukti,
0 = ln 1 −
exp 0 = exp ln 1 −
exp 0 = 1 −
= 1 − exp 0
(3.4)
Diperoleh estimasi parameter pada peluang ,
= 1 − exp
Bukti,
= ln 1 −
exp = exp ln 1 −
exp =1−
= 1 − exp
(3.5)
Untuk mencapai estimasi tambahan pengaruh dari masing-masing sebab dapat
menggunakan rumus sebagai berikut:
ln 1 −
=
ln 1 −
(3.6)
Dimana total penyebab (termasuk yang acak sesuai dengan indeks k=0)
disetiap sel sama dengan proporsi yang diprediksi yaitu :
=
=0
(3.7)