Anda di halaman 1dari 26

BAB I

PENDAHULUAN

Pada bab ini berisi tentang latar belakang masalah, rumusan masalah,
batasan masalah, tujuan masalah, metode penelitian, dan sistematika penulisan.

A. Latar Belakang Masalah

Data kategori merupakan data yang variabel-variabelnya dikelompokan


menjadi beberapa kategori [1]. Analisis data suatu cara untuk mengolah data yang
dimana dapat memberikan suatu informasi, sehingga karakteristik data tersebut
mudah untuk dipamahi dan juga dapat menjawab masalah-masalah yang berkaitan
dengan penelitian yang sedang dilakukan. Untuk mengatasi ataupun menjawab
masalah, maka teknik statistika membantu dalam menganalisis data. Terdapat
beberapa teknik statistika yang digunakan untuk analisis data, salah satu yang
seringkali digunakan adalah model regresi. Regresi linier merupakan persamaan
matematika yang memungkinkan kita meramalkan nilai-nilai suatu perubah tak
bebas dari nilai-nilai satu atau lebih perubah bebas disebut persamaan regresi.
Selain itu juga regresi linier merupakan metode statistika yang dimana berfungsi
untuk menguji sejauh mana hubungan sebab akibat antara variabel faktor
penyebab ( ) terhadap variabel faktor akibatnya ( ) [2]. Regresi linier berganda
merupakan lanjutan dari regresi linier sederhana. Ketika regresi linier sederhana
hanya menyediakan satu variabel independen ( ) dan menyediakan satu variabel
dependen ( ). Sedangkan regresi linier berganda memiliki lebih dari satu variabel
independen ( ) dan satu variabel dependen ( ). Untuk menentukan suatu nilai
estimasi parameter pada regresi linier sederhana maupun regresi linier berganda
keduanya bisa menggunakan metode kuadrat terkecil (ordinary least square).
Metode kuadrat terkecil merupakan suatu metode yang digunakan untuk menduga
koefisien regresi klasik dengan cara meminimumkan jumlah kuadrat galat. Metode
kuadrat terkecil sering disebut juga dengan Ordinary Least Square (OLS).
Metode regresi ridge bertujuan untuk mengatasi multikolonieiritas pada
analisis regresi. Regresi ridge diperoleh dengan cara yang sama seperti metode
kuadrat terkecil, yaitu dengan meminimumkan jumlah kuadrat sisaan. Metode
regresi ridge didasarkan pada penambahan konstan bias (k) sehingga koefisien
berkurang dan mendekati nol.
Model kausal atau analisis hubungan sebab akibat suatu model yang ingin
menunjukan hubungan sebab akibat antara variabel atau kelompok variabel yang
bersagkutan. Pada penelitian yang sedang dilakukan dimana adanya kasus yang
dipengaruhi efek acak dan efek kausal, maka digunakan model kausal. Model
kausal bertujuan untuk menentukan nilai pengaruh atas hubungan kausal.
Pengaruh hubungan kausal mengasumsikan adanya pengaruh acak dan sebab
akibat. Pada penyederhanaan model algoritma yang digunakan adalah model
regresi linier. Dimana dengan adanya penyederhanaan akan diperoleh suatu
persamaan yang sederhana. Persamaan tersebut diperoleh dari model kausal
setelah itu diambil algoritma pada persamaan tersebut makan akan diperoleh suatu
model parameter estimasi.
Dalam analisis yang dikaji adanya dua estimasi untuk menyelesaikan
permasalahan dalam peristiwa hubungan kausal. Estimasi parameter yang pertama
kali harus ditentukan dengan dua metode yaitu, metode kuadrat terkecil dan regresi
ridge. Metode kuadrat terkecil digunakan pada data yang dimana data pengamtannya
cukup dan tidak singular. Sedangkan regresi ridge digunakan jika data pengamatan
lebih banyak akan berpengaruh pada dua keadaan matriks tersebut yang akan
menyebabkan hasil nilainya mendekati pada 0 atau singular dan tidak mungkin
memiliki invers atau menghasilkan nilai koefisien yang terlalu besar, tindakatan agar
masalah tersebut tidak terjadi maka untuk menentukan estimasi parameter yang sesuai
digunakanlah regresi ridge. Estimasi parameter yang kedua adalah estimasi parameter
untuk peluang penyebabnya. Persamaan yang diguanakan yaitu persamaan yang
ditransformasikan dimana akan menunjukan
danyang menyatakan sebagai estimasi peluang penyebabnya.

Kecelakaan lalu lintas didefinisikan kejadian dimana sebuah kendaraan


bermotor bertabrakan dengan benda lain yang mengakibatkan kerusakan.
Terkadang kecelakaan tersebut mengakibatkan korban luka-luka atau kematian
pada manusia ataupun hewan. Kecelakaan lalu lintas menelan korban jiwa sekitar
1,2 juta manusi setiap tahunnya [3]. Pada kecelakaan lalu lintas tersebut terdapat
faktor-faktor yang mengakibatkan kecelakaan. Misalnya faktor alam, faktor
manusia, faktor jalan dan sebagainya. Meningkatnya jumlah kendaraan di
Indonesia mengiringi meningkatnya terjadinya kecelakaan lalu lintas. Dalam
penelitian ini menggunakan regresi linier berganda dimana variabel prediktor
yang mempengaruhi jumlah kecalakaan lalu lintas yaitu : faktor alam, faktor jalan,
faktor kendaraan, dan faktor manusis.
B. Rumusan Masalah

Berdasarkan latar belakang yang telah penulis sampaikan sebelumnya,


penulis merumuskan masalah dalam penulisan skripsi ini yaitu :
1. Bagaimana menetukan estimasi parameter menggunakan metode regresi
ridge ?
2. Bagaimana menentukan nilai peluang untuk efek acak dan efek kausal ?
C. Batasan Masalah

Untuk mengarahkan pembahasan dalam skripsi ini agar tidak menyimpang


dari sasaran yang dituju, maka perlu membuat batasan ruang lingkup
permasalahan. Batasan masalahskripsi ini adalah sebagai berikut :
1. Data yang di ambil data sekunder dari Polantas dalam angka 2013
2. Data yang di ambil pada tahun 2013
3. Software yang digunakan adalah program R.
D. Tujuan Masalah

Tujuan dari skripsi ini adalah sebagai berikut :


1. Mengetahui nilia estimasi parameter menggunakan metode regresi ridge.
2. Mengetahui nilai peluang untuk efek acak dan efek kausal menggunakan
model kausal.
E. Ruang Lingkup Penelitian

Ruang lingkup pada penelitian yang sedang dilakukan yaitu analisis data yang
dimana data berupa data kategori yaitu suatu data atau variabel-variabel yang telah
dikelompokan. Teknik statistika untuk menganalisis data salah satunya yang
seringkali digunakan untuk analisis data yaitu analisis regresi. Analisis yang
digunakan dalam penelitian ini adalah regresi linier berganda. Pada kasus ini adanya
masalah multikolinieritas. Oleh karena itu metode yang digunakan untuk menentukan
nilai estimasi parameternya menggunakan metode regresi ridge. Untuk
menentukan nilai peluang yang dimana dipengaruhi oleh efek acak dan efek kausal.
Nilai peluang dapat diperoleh dari model kausal. Adapun ruang lingkup penelitian

adalah sebagai berikut :


Data Kategori

Regresi Linier Berganda

Estimasi Parameter

Metode Kuadrat Terkecil

Regresi Ridge

Estimasi Parameter Penyebab


= 1 − exp 0 = 1 − exp

Model Peluang
=1− 1− ς =1 1 −

Penambahan faktor penyebab


ln 1 −
=
ln 1 −

Jumlah penyebab
=
=0

Gambar 1. Ruang Lingkup Penelitian


F. Metode penelitian

Metode yang akan dilakukan dalam penelitian ini yaitu dimulai dari
merumuskan masalah, yaitu dengan menyusun rencana penelitian yang dimulai
dengan suatu masalah data kategori. Dari rumusan masalah tersebut, kemudian
melakukan studi kepustakaan terhadap berbagai referensi yang berkaitan dengan
penelitian yang dilakukan bersumber dari buku, jurnal, dan penelitian
sebelumnya. Pada tahapan studi literatur berupa pemahaman tentang model
peluang untuk efek acak dan efek kausal. Menetukan data sekunder yang relevan
dengan penelitian yang akan dikaji. Data yang telah diperoleh kemudian
dilakukannya analisis data, yaitu dengan melakukan estimasi parameter
menggunakan metode regresi ridge. Untuk menentukan estimasi parameter, maka
analisisnya menggunakan software yaitu Program R atau Minitab. Selanjutnya
menetukan nilai peluang dengan menggunakan model kausal. Tahapan terkahir
yaitu memberikan kesimpulan berdasarkan hasil analisis.
G. Sitematika Penulisan

Berdasarkan sistematika penelitian Studi Literatur ini terdiri atas empat bab
serta daftar pustaka, dimana dalam setiap bab terdapat beberapa subab.
BAB I : PENDAHULUAN
Bab ini berisi latar belakang masalah, rumusan masalah, batasan
masalah, tujuan penelitian,ruang lingkup penelitian dan
sistematika penelitian.
BAB II : LANDASAN TEORI
Bab ini berisi tentang teori-teori yang mendasari pembahasan
dalam paper secara garis besar, meliputi regresi linier
berganda,metode kuadrat terkecil, multikolinieritas,estimasi
parameter menggunakan metode regresi ridge, dan model kausal
untuk menentukan nilai peluang.
BAB III : MODEL PELUANG UNTUK EFEK CAUSAL DAN EFEK
ACAK
Bab ini berisi pembahasan utama dari skripsi ini yang meliputi
pembahasan yang mengenai estimasi parameter, model peluang
untuk efek acak dan efek kausal.
BAB IV : STUDI KASUS

Bab ini berisi data dan juga pembahasannya berupa perhitungan


dengan bantuan software yaitu Program R / Minitab untuk
mencari nilai estimasi parameter.

BAB V : PENUTUP
Bab ini merupakan intisari dari bab-bab sebelumnya yang tersiri
dari kesimpulan dan saran untuk pengembangan penelitian yang
lebih baik.

DAFTAR PUSTAKA
BAB II

LANDASAN TEORI

Pada bab ini berisi teori-teori yang mendasari pembahasan model peluang
untuk pengaruh efek kausal dan efek acak.

2.1 Data Kategori

Analisis data kategori merupakan pengelompokan sebuah observasi menjadi


dua atau lebih kategori. Sedangkan variabel respon (dependen) adalah variabel
yang mendefinisikan tentang semua hal yang terjadi apabila suatu hal melakukan
tindakan terhadap percobaan atau akibat dari variabel bebas (independen).
Sedangkan variabel bebas (independen) adalah variabel yang menjadi sebab
timbulnya atau berubahnya variabel respon (dependen) [1].

Terdapat dua tipe skala, yaitu skala nominal dan skala ordinal. Skala nominal
merupakan skala pengukuran paling sederhana atau tingkatannya paling rendah di
dalam suatu penelitian. Skala ini hanya digunakan untuk memberikan kategori
saja. Misalnya digunakan pada variabel jenis kelamin yaitu laki-laki dan
perempuan. Sedangkan skala ordinal Skala ordinal merupakan skala pengukuran
yang sudah menyatakan peringkat atau tingkatan. Misalnya skala ordinal pada
variabel sikap seseorang terhadap suatu pernyataan, sikap tersebut berupa sangat
setuju, setuju, biasa saja, tidak setuju, sangat tidak setuju.
Selain dari tipe skala ada juga variabel kontinu merupakan variabel yang
dapat memuat variabel seperangkat nilai yang tidak terbatas antara dua tingkatan
variabel atau variabel kontinu ini mempunyai sifat nilai pecahan , misalnya tinggi
badan seseorang 1,5 meter , 1,6 meter atau 1,75 meter. Sedangkan variabel diskrit
merupakan variabel yang hanya dapat memuat sepertangkat nilai terbatas atau
nilai bulat tertentu. Misalnya, jumlah mahasiswa dalam suatu universitas
merupakan variabel diskrit karena jumlah ini akan berupa bilangan bulat,
misalnya 325 ; tidak akan ada jumlah mahasiswa 325,5.
Variabel penelitian dapat dikategorikan ke dalam dua bentuk, yaitu variabel
kuantitatif dan variabel kualitatif. Variabel kuantitatif yaitu varibel yang
menunjukan unsur numerik atau angka contohnya berat badan. Sedangkan variabel
kualitatif menunjukan unsur deskriftif atau narasi tekstual contohnya keindahan [1].

2.2 Regresi Linier Sederhana

Analisis regresi adalah metodologi statistika yang memanfaatkan hubungan


antara dua atau lebih banyak variabel kuantitatif sehingga variabel respon atau
hasil dapat diprediksi. Hubungan fungsional antara dua variabel dilambangkan
oleh rumus matematika. Jika menunjukan variabel independen dan menunjukan
variabel dependen [2].

Regresi linier merupakan persamaan matematika yang memungkinkan kita


meramalkan nilai-nilai suatu perubah tak bebas dari nilai-nilai satu atau lebih
perubah bebas disebut persamaan regresi. Selain itu juga regresi linier merupakan
metode statistika yang dimana berfungsi untuk menguji sejauh mana hubungan
sebab akibat antara variabel faktor penyebab ( ) terhadap variabel faktor akibatnya
( ). Bila hubungan linier ada, maka dinyatakan secara matematik dengan sebuah
persamaan garis lurus yang disebut garis regresi linier.

̂= + (2.1)

Dimana :
= variabel terkait
= variabel bebas
= intersep
= koefisien regresi

Pendugaan parameter bila diberikan data contoh {( , ) ; = 1, 2, … }, maka nilai dugaan kuadrat terkecil bagi parameter dalam garis regresi.
̂= +

Dapat diperoleh dari rumus


∑ − ∑ ∑ (2.2)
=1 =1 =1

∑ 2 − ∑

=1 =1

Dan
= ̅- ̅ (2.3)

2.3 Regresi Linier Berganda (Multiple)

Regresi linier berganda merupakan lanjutan dari regresi linier sederhana.


Ketika regresi linier sederhana hanya menyediakan satu variabel independen ( )
dan menyediakan satu variabel dependen ( ). Sedangkan regresi linier berganda
memiliki lebih dari satu variabel independen ( ) dan satu variabel dependen ( ) [2].

Membahas masalah pendugaan atau peramalan nilai peubah tak bebas berdasarkan hasil pengukuran pada beberapa
peubah bebas 1, 2, … , . Contoh acak berukuran dari populasi itu dapat dituliskan sebagai { 1, 2, … , ; = 1,2, … , }. Secara
umum model regresi linier multipel dengan variabel dependen dan variabel bebas, dapat dituliskan sebagai:

= 0 + 1 1 + 1 2 + ⋯ ++
(2.4)

Dimana :

= nilai variabel dependen dalam pengamatan ke-i


0, 1, 2, … , = parameter yang tidak diketahui nilainya
, , ,…,
1 2 3 = nilai variabel independen dari parameter pengamatan ke-i

= galat yang bersifat acak dan berdistribusi normal

Nilai dugaan kuadrat terkecil bersifat 0, 1, dan 2 dapat diperoleh dengan memecahkan persamaan linier.
0 +1 1+2 2=
=1
=1 =1

+2 +=
0 1 1 1 2 1 2 1

=1 =1 =1 =1

02 +1 1 2 +2 2
2
=2 (2.5)
=1 =1 =1 =1

Sistem persamaan linier tersebut dapat diselesaikan untuk mendapatkan 1 dan 2 dengan berbagai cara yang tersedia, antara lain dengan kaidah cramer, dan kemudian 0
dapat diperoleh dari persamaan pertama bahwa:

= ̅− −
̅ ̅
(2.6)
0 1 1 2 2

Analisis regresi berganda memiliki beberapa asumsi yang harus dipenuhi,


asumsinya sebagai berikut :
1. Nilai rata-rata galat bernilai 0, yaitu= 0 untuk = 1,2, … , .
2. Varian = 2 = 2.
3. Tidak terjadi autokorelasi antara galat, berarti kovarian ( , ) = 0, ≠ .

4. Variabel independen 1, 2, 3, … , konstan dalam sampling yang terulang dan independen terhadap galat .

5. Tidak terjadi multikolinieritas.


6. ∽ 0; 2 artinya galat berdistribusi normal dengan rata-rata 0 dan varian
2.

2.4 Metode Kuadrat Terkecil

Untuk mengestimasi parameter atau koefisien untuk model regresi linier


berganda menggunakan metode kuadrat terkecil atau OLS (Ordinary Least
Square). Untuk mencari koefisien regresi dengan OLS, yang pertama diketatahui
model regresi linier berganda (2.4) .

Metode kuadrat terkecil adalah suatu metode yang digunakan untuk menduga koefisien regresi klasik
dengan cara meminimumkan jumlah kuadrat galat yaitu meminimumkan ∑ =1 2 [2].
Estimator dalam metode kuadrat terkecil diperoleh dengan cara meminimumkan
2= − 0−1 1− 2 2−⋯− 2

Dengan ∑ 2 adalah jumlah kuadrat galat (JKG).


(2.7)

Pada notasi matriks jumlah kuadrat galat ∑ 2 dapat dituliskan sebagai

′ =[1 2 … ][2 ]= 2+2 +⋯+2 =2

⋮ 1 2

(2.8)

Diperoleh
= −

(2.9)

Oleh karena itu, perkalian matrik galat menjadi


= ′ = − ′ −
= ′− ′ ′ −

= ′ − ′ − ′′ + ′′
(2.10)
= ′ −2′ + ′

Untuk meminimumkan ′ maka ′ diturunkan terhadap sehingga diperoleh permasaan normal :


0
= −2 − 0 − 1 1 − 2 2 −⋯− =0
1 = −2 − 0 − 1 1 − 2 2 −⋯− 1=0
2
= −2 − 0
− 1 1
− 2 2
−⋯− 2
=0
(2.11)
⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

= −2 − 0 − 1 1 − 2 2 −⋯− =0

Setelah disusun kembali dan menggatikan semua parameter dengan estimatornya,


sistem persamaan ini dapat ditulis sebagai berikut [5] :

̂ ̂ ̂ ̂

0 + 11+ 2 2 + ⋯ +=

̂ ̂ 2 ̂ ̂

1 +1 +2 2 1 1 =1
0 1 + ⋯+

̂ ̂ ̂ 2 ̂

2 +1 +22 2 =2
0 1 2 + ⋯+

⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯
̂0 + ̂1 1 + ̂2 2 +⋯+̂ 2=

Bila ditulis dalam bentuk matriks,


′ ̂ = ′

(2.12)
′ −1 ′ ̂= ′ −1 ′

̂=
′ −1 ′

̂ ′ −1 ′

(2.13)

Dari hasil penyederhanaan persamaan di atas secara aljabar, menghasilkan


penaksir untuk yaitu

̂ ′ −1 ′ (2.14)
=
Dengan demikian, jika diasumsikan bahwa = 0 dan ′ = 2 dan kolom
adalah independen linier maka,
( ̂) = ′ −1 ′ =
Sehingga ̂ adalah sebuah estimasi tak bias untuk . Asumsi bahwa tidak berkorelasi dan memiliki variansi yang sama yaitu
( , )= 2

Dan asumsikan juga bahwa = = 2 , akan diperlihatkan bahwa [ ] = yaitu sebagai berikut :
[]= [ − ][ − ]′
= 2
Selanjutnya yaitu untuk [ ] yaitu :
[]= [ − ][ − ]′
= 2

Oleh karena itu []= [ ] = 2 , sehingga variansi ̂ dapat dijabarkan dengan cara sebagi berikut :
( ̂) = [ ′ −1 ′]
= {[ ′ −1 ′ − ′ −1 ′ ][ ′ −1 ′ − ′ −1 ′ ]′ }

Dengan melakukan penyerderhanaan secara aljabar maka diperoleh


( ̂) = 2 ′ −1

Selanjutnya memperlihatkan mempunyai variansi yang minimum. Untuk itu


misalkan ada suatu penduga lain yaiitu :

∗ = [{ ′ −1 ′ + } ]
(2.15)
Untuk adalah matriks yang berupa ukuran × sehingga nilai harapannya yaitu
∗ = { ′ −1 ′+ }
= +

∗ merupakan penduga tak bias bagi , jika = 0. Sehingga = 0 atau ′ = 0, sehingga ′ ′ = 0. Dengan demikian
∗ = {[ ∗ − ∗ ][ ∗ − ∗ ] ′}

Dengan menggunakan sifat-sifat ekspektasi akan diperoleh


∗ = 2 ′ −1 + ′ 2
Karena ′ adalah matriks kuadratik, maka
∗ ≥ ( ̂)
Jadi ̂ yang diperoleh dari metode kuadrat terkecil merupakan penaksiran linier tak bias yang memiliki variansi minimum untuk .
BAB III

Model Peluang untuk Efek Acak dan Efek Kausal


Pada bab ini diberikan pembahasan mengenai model peluang efek kausal dan
efek acak. Adapun estimasi parameternya menggunakan metode regresi ridge.

3.1 Regresi Ridge

Hoerl dan Kennard memperkenalkan estimasi parameter dengan metode yang


berbeda yaitu regresi ridge [7]. Secara umum regresi ridge merupakan teknik untuk
menganalisis data regresi multiple yang mengalami multikolinieritas. Dan ketika
multikolinieritas terjadi, perkiraan kuadrat terkecil tidak bias, tetapi variasinya besar
sehingga mungkin jauh dari nilai sebenarnya. Multikolinieritas atau collinearity
adalah keberadaan hubungan near-linier diantara variabel independen.

Model regresi ridge didasarkan pada penambahan konstanta bias pada diagonal matriks ′ sehingga :
̂ = ′ + −1 ′

3.2 Model Kausal

Model kausal adalah suatu model yang digunakan untuk mengetahui sebab akibat dari variabel dependen
terhadap variabel independen. Terdapat contoh yang dimana berdampak langsung dari beberapa penyebab pada
hasil biner Y dengan Y=1 dan Y=0 yang artinya efek dari kasus tersebut telah terjadi atau tidak terjadi. Perhatikan
kasus pada atribut 1, 2, … , (dimana = 1 dan = 0 menunjukan kehadiran atau tidak adanya ke- , dengan = 1,2, … ).
Atribut dalam kasus yang ada diwakili oleh kategori variabel yaitu, variabel biner, variabel ordinal dan variabel
nominal. Selain itu juga terdapat sebuah vektor yang di cirikan sebagai = 1, 2, … , dan mungkin mewakili tingkat
yang sama atau berbeda kategori variabel. Misalkan 1 = pria, 2 = perempuan dan 3 = anak kecil, maka diasumsikan
bahwa atribut merupakan efek kausal = 1 dengan peluang [2].
Konsep dasar dalam peluang kausal dimana adanya yang diartikan sebagai
peluang intrinsik. Peluang intrinsik kausal merupakan peluang dasar kausal,
misalkan terdapat suatu data yang berisi satu variabel X yang menyebabkan
variabel Y. Sehingga tidak terjadinya peristiwa adalah :
1− = ∏ 1−
{ : =1}

Dimana :

= peluang intrinsik

= parameter yang mewakili jumlah terkait dengan kehadiran dari setiap


atribut .

Selain efek sebab akibat ada juga “ penyebab acak “ yang diartikan sebagai
suatu kemungkinan yang tersamar menunjukan faktor-faktor lain yang tidak
secara eksplisit dianggap oleh atribut. Dan efek acak yang diasumsikan sebagai
independen dari atribut lain dan hasilnya (ditunjukan sebagai dalam suatu akibat)
adalah konstanta pada seluruh konfigurasi atribut yang mungkin hadir bagi
individu tertentu.

Dari dua faktor tersebut efek kausal dan efek acak menjadikan kesatuan yang
menghasilkan probabilitas yang diharapkan pada tingakat populasi sebagai
kesatuan dari kausal dan sumber acak. Yang dimana dapat dirumuskan sebagai
berikut :
= + − ∙
= 1 − 1 − (1 − )
=1− 1− ∏ 1−
{ ; =1}

Dimana :

= peluang yang diharapkan dari kesatuan kausal dan sumber acak

= peluang intinsik kausal


= konstanta pada seluruh konfigurasi atribut yang mungkin ada bagi individu
tertentu.

= parameter yang mewakili jumlah terkait dengan kehadiran dari setiap atribut
.

Tujuan dari model kausal ini untuk mengestimasikan parameter + 1, 1, 2, … dan r atas basis sampel hasil realisasi = {1,0} dan notasi vektor

yang terkait. Pada kedua model diatas dari peluang intrinsik (kausal) yang
berasumsi bahwa penyebab tunggal sudah cukup untuk kejadian terjadi,
sedangkan untuk peristiwa yang tidak terjadi dikarenakan semua penyebab
potensial tidak efektif.

3.3 Estimasi Parameter dan Analisis Kausal

a. Etimasi Parameter
Estimasi paramater pada regresi linier biasanya menggunakan metode
kuadrat terkecil. Dalam analisis kausal juga metode yang digunakan untuk
estimasi parameternya menggunakan metode kuadrat terkecil. Dengan bentuk
persamaannya yaitu :
= ′ −1 ′

Dimana adalah vektor dari urutan ke- , adalah desain matrik dari nilai dan adalah vektor dari
semua parameter + 1. Jika tidak ada pengamatan yang cukup, matriks kedua pada saat ′ bisa
jadi matriks tersebut singular dan tidak memungkinkan invers atau menghasilkan koefisien
terlalu melambung. Matriks singular dikatakan jika matriks persegi dan det = 0, maka invers
dari matriks tersebut tidak ada dan dikatakan bahwa singular. Dengan keadaan tersebut metode
kuadrat terkecil tidak digunakan untuk estimasi parameternya. Dengan itu dapat menggunakan
regresi ridge untuk estimasi parameter.
= ′ + −1 ′

Parameter yang membedakan regresi ridge dari metode kuadrat terkecil adalah
. Tetapan yang relatif kecil ditambahkan pada diagonal utam matriks ′ , sehingga koefisien estimator regresi ridge dipenuhi dengan besarnya
tetapan.
Dalam prakteknya, perhitungan estimator regresi ridge dengan menyelesaikan
persamaan di atas sangatlah rumit, oleh itu dilakukan penyederhanaan dengan
membawanya kedalam bentuk matriks. Estimasi regresi ridge diperoleh dengan
meminimumkan jumlah kuadrat galat untuk model :

Model Ridge Regression


= +

Atau
= −

Dengan menggunakan metode pengali Langrenge yang meminimumkan fungsi:


′ = − ̂

Dengan syarat pembatas


̂′ ̂− 2=0
= −
̂ ′( − ̂ ) + ( ̂ ′ ̂ − 2)

Yang memenuhi syarat


|̂=0

Dimana c pengali Langrange tidak bergantung pada dan c konstanta positif


berhingga

̂ ̂
Dicaridengan memecah | =0

= − ̂ ′( − ̂ ) + ( ̂ ′ ̂ − 2)
= ′ − ′ ̂ − ̂ ′ + ̂ ′ ′ ̂ + ( ̂ ′ ̂ − 2)
= ′ + 2 ̂ ′ ′ ̂ + ( ̂ ′ ̂ − 2)
|̂=0
−2 ′ + 2 ′ ̂+ 2 ̂ =0
−′ + ′ ̂+ ̂ =0

′̂+̂=′′+̂=′
̂ = ′ + −1 ′

̂
Dimana = + ′ −1 ′ dengan 0≤ ≤ ∞, itulah yang disebut sebagai Regresi Ridge.
≥ 0 adalah nilai konstan yang dipilih sebagi indeks dari kelas estimator
= −2 + 2 ′ ′ ̂ +2 ̂

Adalah turunan pertama dari G terhadap , agar G minimum maka


̂
harus

lebih besar dari nol atau bernilai positif

=2′ +2 >0
̂

′ + >0

Agar diperoleh fungsi G minimum maka dipilih c > 0 sedemikian sehingga


′ + >0

Estimator Regresi Ridge juga dapat ditanyakan dalam bentuk :


̂ = ′

Dimana = ′ + −1

Sifat-sifat pendugaan regresi ridge :


1. Bias
Dimana merupakan matriks konstant, sehingga bias dari estimator ridge
dapat diperoleh sebagai berikut :
( ̂ )= ′ + −1 ′

= =

(3.1)

Berdarkan persamaan (3.1) maka regresi ridge bukan merupakan penduga


yang tak bias, tetapi marupakan penduga yang bias.
2. Variansi minimum
Variansi minimum dapat diperoleh berdasakan persamaan (3.1)
( ̂ )=
= 2 ′ −1 ′

Jadi ̂ yang diperoleh dari metode regresi ridge merupakan penaksir linier bias yang memiliki variansi minimum untuk .

Metode regresi ridge dan metode kuadrat terkecil adalah salah satu cara untuk
mendapatka koefisien regresi pada persamaan regresi linier berganda. Perbedaan
antara dua metode tersebut adalah jika pada metode kuadrat terkecil menghasilkan
penaksiran terbaik (tak bias dan bervariansi munimum). Sedangkam metode
regresi ridge jika tidak ada korelasi antar variabel bebas, adanya nilai variabel tak
bebas yang ditransformasikan melalui prosedur centering dan rescaling.

Pemusatan dan penskalaan data merupakan bagian dari membakukan


(standardized) variabel. Modifikasi sederhana dari pembakuan atau standarisasi
variabel ini adalah transformasi korelasi (correlation transformation). Pemusatan
merupakan perbedaan antara masing-masing pengamatan dan rata-rata dari
semua pengamatan untuk variabel. Sedangkan penskalaan meliputi gambaran
pengamatan pada kesatuan (unit) standar deviasi dar pengamatan untuk variabel
[8].
̅
∗ =
1 (

), dimana = 1,2,3, … , , = 1,2,3, … ,

√ −1

̅
∗=
1 (

), dimana = 1,2,3, … ,

√ −1

Dengan : ∗ = variabel dalam bentuk baku


∗ = variabel dalam bentuk baku
̅ = rata-rata dari

̅ = rata-rata
= standar deviasi dari

= standar deviasi dari Y

̅ 2
=
√ ∑ ( − )
=1

−1

=√ =1
∑ −̅2
−1

Hubungan parameter dari kedua model tersebut ditanyakan sebagai berikut :


=( ) ∗, dengan = 1,2, … ,
0= ̅ − 1 ̅1 − ⋯ − ̅ = ̅− ̅
=1

(3.5)

Dengan : = parameter ke-j yang tidak diketahui


0 = intersep

Prosedur di atas disebut prosedur penskalaan (centering).

Sedangkan rescaling dilakukan dengan menghilangkan ̂0 (intersep), dari model regresi linier berganda :
= 0+1 1+1 2+⋯+ +

Dapat dibentuk menjadi :


= 0+1 1 − ̅1 + 1 1 + 2 2 − ̅2 + 2 2 +⋯+ −̅
+ +

= 0 + 1 1 + 1 2 + ⋯ ++ 1 1 − ̅1 + 2 2 − ̅2 + ⋯
+
̅
− +

Menurut rumus untuk mendapatkan 0 yaitu :

0 = ̅ − 1 ̅1 − ̅ −⋯−
22 ̅

Maka berlaku :
̅ = 0 + 1 ̅1 + 2 ̅2 + ⋯ + ̅

Sehingga
−̅= 0+ 1 1 + 1 2 +⋯+ +
− 0 + 1 ̅1 + ̅
22 +⋯+ ̅

= 1 1 − ̅1 + 2 2 − ̅2 + ⋯ +− ̅ +

Jika
= −̅
1 = 1 −1
̅
2 = 2 − ̅2
= −̅

Maka didapat model baru yaitu :


= 11 + 2 2 +⋯ + +

Prosedur untuk membentuk model pertama menjadi model terakhir disebut


dengan prosedur rescaling.

Untuk menentukan nilai tetap bias hal yang sulit untuk mencapai koefisien
regresi yang stabil. Maka oleh karena itu ada beberapa metode untuk mencari
nilai tetap bias ,yaitu :

1. Ridge Trace
Ridge trace adalah plot anatara koefisien regresi ridge terhadap nilai-nilai , dengan ∈ [0,1]. Untuk nilai yang berbeda-beda dapat
ditentukan
̂ . Tujuan dari ridge trace adalah untuk memilih yang bernilai kecil, dimana tersebut dianggap terlalu
subjektif karena memerlukan keputusan peneliti untuk menentukan nilai yang akan dipilih.

2. Menghitung
= ̂2

̂ ′̂

(3.6)

Dimana : = konstanta bias oleh Hoerl, Kennard dan Balwin


= banyaknya variabel bebas
∗ ∗̂ ′ ∗ ∗̂

=
( − ) −

̂2
− −1

= estimasi parameter dari metode kuadrat terkecil


3. Iterasi
Berikut langkah-langkahnya:
1) Nilai awal dari konstanta bias diperoleh dari parameternya diperoleh dari
metode kuadrat terkecil.
2) Selanjutnya mengestimasi parameter regresi ridge dari nilai awal, pada
(2.16)
3) Untuk memperoleh nilai konstanta bias yang baru +1 , digunakan

̂2

parameter regresi ridge dari langkah (2), yaitu +1 =̂ ̂ .

4) Jika +1 − ≈ 10−10 maka iterasi berakhir, namun jika tidak maka +1 akan menjadi konstanta bias dan kembali ke langkah (2).

b. Analisis Kausal

Model kausal dalam bentuk umum :

=1− 1− ∏1− (3.1)


=1

Dimana : = 1,2, … , adalah jumlah variabel


= kriteria “ paling sedikit “ satu variabel berdampak pada
kemunculan peristiwa

= peluang pengaruh acak


= peluang efek kausal

Kita dapat menyusun persamaan dengan mengambil algoritma pada


persamaan bentuk umum dan juga menggunakan notasi dari model regresi,
didapatlah persamaan sebagai berikut :
=1− 1− ∏1−
=1
1− = 1− ∏1−
=1
ln 1 − = ln 1 − ∏1−
=1
ln 1 − = ln 1 − + 1−
=1
ln 1 − = ln 1 − + ln 1 −
ln 1 − = ln 1 − + 1 − 1 1 + 1 − 2 2 + 1 − 3 3 + ⋯ + 1 −
= ln 1 − , 0 = ln 1 − , = ln 1 −

Persamaan diatas mewakili dalam bentuk persamaan linier yaitu :

= 0+1 1+⋯+
(3.3)

Setiap parameter asli dari probabilitas yang dapat diperoleh dari relasi pada
persamaan (3.2) dengan ditransformasikan sebagai berikut :
= 1 − exp 0

Bukti,
0 = ln 1 −
exp 0 = exp ln 1 −
exp 0 = 1 −
= 1 − exp 0

(3.4)
Diperoleh estimasi parameter pada peluang ,
= 1 − exp

Bukti,
= ln 1 −
exp = exp ln 1 −
exp =1−
= 1 − exp

Diperoleh estimasi parameter pada peluang .

(3.5)
Untuk mencapai estimasi tambahan pengaruh dari masing-masing sebab dapat
menggunakan rumus sebagai berikut:
ln 1 −
=
ln 1 −

(3.6)

Dimana total penyebab (termasuk yang acak sesuai dengan indeks k=0)
disetiap sel sama dengan proporsi yang diprediksi yaitu :

=
=0
(3.7)

3.4 Langkah-langkah untuk menentukan estimasi parameter menggunakan


Regresi Ridge dan Model Kausal
1. Input data variabel 1, 2, … ,

2. Data tersebut dikategorikan menjadi beberapa kelompok


3. Menentukan nilai estimasi parameter menggunakan regresi ridge
a. Input data variabel y dan variabel – variabel 1, 2, 3

b. Menentukan konstanta bias (q) menggunakan iterasi HKB.


c. Jika konstanta bias (q) sudah ditentukan, maka dapat diperoleh
parameter regresi ridge.
4. Diperoleh nilai koefisien regresi
5. Nilai koefisien regresi di substitusikan pada persamaan (3.4) dan (3.5)
6. Diperoleh peluang estimasi penyebab dan 1, 2, … ,

7. Menentukan nilai peluang penyebab dengan mengsubstitusikan hasil


langkah (6) pada persamaan (3.1)
8. Jika terdapat estimasi tambahan pengaruh dari masing-masing
penyebab dapat menggunakan persamaan (3.6)
9. Memprediksi total penyebab menggunakan persamaan (3.7)

Anda mungkin juga menyukai