Adoc - Pub - Bab I Pendahuluan Regresi Linier Adalah Teknik Pem
Adoc - Pub - Bab I Pendahuluan Regresi Linier Adalah Teknik Pem
PENDAHULUAN
dependen merupakan variabel yang dijelaskan atau diestimasi oleh variabel penjelas.
regresi linier untuk satu variabel penjelas. Sedangkan, model regresi linier ganda
variabel dependen dimodelkan untuk dua atau lebih variabel penjelas (Hayter, 2012:
543-608).
awal yang diperoleh masih kurang optimal. Hal ini dilatar belakangi oleh 3 alasan.
Alasan pertama adalah terjadinya overspecified, yaitu terlalu banyak variabel yang
dimasukan ke dalam model. Alasan kedua, model tidak mengandung variabel yang
tepat. Dan alasan ketiga, model tidak memiliki hubungan matematis yang benar
(Freund, Wilson, and Sa, 2006: 227). Terdapat beberapa metode untuk menyeleksi
variabel penjelas yang layak masuk dalam model sehingga diperoleh model terbaik.
yaitu model dengan satu variabel. Selanjutnya dilanjutkan dengan variabel lain satu
per satu sampai didapat model yang memenuhi kriteria terbaik. Terdapat beberapa
1
2
kriteria untuk mengevaluasi pemilihan model terbaik dalam Best Subset Regrression.
Salah satu diantaranya dapat menggunakan statistik C-p Mallow (Hanum, 2011).
Statistik C-p Mallow dikembangkan oleh Colin Mallows sebagai alat dalam
membandingkan ketepatan dan bias dari model penuh dengan model subset terbaik
dari jumlah variabel penjelas. Sebuah model dengan terlalu banyak variabel penjelas
dapat menghasilkan model yang tidak tepat (Nirmalraj dan Malliga, 2011). Pada
statistik C-p Mallow, model yang baik memiliki nilai statistik C-p Mallow mendekati
jumlah parameter. Selain itu, diketahui juga model dengan nilai C-p Mallow yang
yang dapat memberikan manfaat jika model yang benar telah dipilih dan asumsi lain
yang mendasari model terpenuhi (Freund, Wilson, and Sa, 2006:119). Dalam model
regresi linier terdapat asumsi klasik yang diperlukan untuk mendapatkan estimator
Ordinary Least Squared (OLS) yang bersifat Best Linear Unbiased Estimator
(BLUE). Terdapat empat asumsi klasik yang harus terpenuhi yaitu uji normalitas
Pelanggaran pada uji normalitas yaitu residual tidak berdistribusi normal. Salah satu
cara yang dilakukan untuk mengatasi residual yang tidak berdistribusi normal adalah
residual variance berubah-ubah. Salah satu metode estimasi parameter yang bisa
mengatasi hal tersebut adalah metode regresi kuantil median (Uthami, Sukarsa,
3
dihasilkan masih tidak efisien. Dalam mengatasi autokorelasi terdapat beberapa cara
yang dapat dilakukan, dua diantaranya yaitu menggunakan Generalized Least Square
(GLS) dan Feasible Generalized Least Square (FGLS). GLS digunakan apabila
nilai Durbin Watson, nilai residual, atau cochrane orcutt iterative procedure.
estimasi parameter model yang dihasilkan tidak stabil sehingga hal tersebut harus
diatasi. Salah satu metode yang digunakan untuk mengatasi adanya kasus
dan partial least squares untuk memperoleh model bebas multikolinearitas dan
outlier. Kasus yang terjadi pada penelitian tersebut yaitu terdapat multikolinearitas
dan outlier pada data tingkat penghunian kamar hotel di kota Kendari. Dengan
squares diperoleh model yang bebas multikolinearitas dan outlier, dan model yang
diperoleh masih mempunyai nilai R2 yang kecil (Ohyver, 2013). Pada tahun 2011
terdapat penelitian tentang faktor konsumsi bahan bakar yang dianalisis secara
statistik dan menghasilkan model regresi yang optimal. Hasil analisis dari Best
Subset Regression yaitu diperoleh lima variabel penjelas yang menunjukkan bahwa
model memiliki nilai adjusted R2 yang tinggi serta nilai statistik C-p Mallow dan
kuadrat residual (S2) terendah (Nirmalraj and Malliga, 2011). Pada tahun 2010,
4
itu, sebesar 47,3% variabel keputusan menginap dapat dijelaskan melalui variabel
penjelas. Sedangkan sisanya 52,7% dijelaskan oleh variabel lain diluar ketiga
Sultra ditetapkan sebagai daerah otonom berdasarkan Perpu No. 2 tahun 1964 Jungto
UU No. 13 Tahun 1964. Pada awalnya terdiri atas empat kabupaten dan kini setelah
pemekaran Sultra telah mempunyai sepuluh kabupaten dan dua kota, di mana
ibukotanya terletak di kota Kendari. Salah satu komponen utama yang penting dalam
industri pariwisata yaitu jasa perhotelan. Jasa perhotelan mendapat perhatian khusus
dari pemerintah karena selain merupakan salah satu sumber pendapatan, juga dapat
menciptakan lapangan kerja baru untuk masyarakat (BPS Provinsi Sultra, 2011).
Berdasarkan data yang terdapat di BPS, diperoleh jumlah sampel hotel di kota
Kendari sebanyak 90 hotel dengan jumlah kamar 471 buah, dan jumlah tempat tidur
673 buah. Jumlah tamu yang berkunjung selama tahun 2010, sebanyak 157.537
orang. Banyaknya jumlah hotel yang terdapat di kota Kendari, membuat setiap
perusahaan perhotelan tentu ingin menaikkan jumlah pengunjung hotel. Untuk itu,
tamu hotel.
Analisis data perhotelan kota Kendari tentu akan menjadi sumbangan untuk
dicurigai terdapat korelasi tinggi antar variabel penjelas yang dapat menyebabkan
5
dimana semakin banyak jumlah fasilitas suatu hotel maka tarif maksimal hotel
tersebut akan meningkat. Selain itu, semakin banyak jumlah kamar maka jumlah
tenaga kerja akan semakin banyak juga. Terdapat beberapa cara yang dapat
digunakan dalam mengatasi korelasi antar variabel penjelas. Salah satu diantaranya
mempengaruhi jumlah tamu tidak optimal. Hal ini yang melatarbelakangi penelitian
tentang aplikasi pemilihan model terbaik menggunakan Best Subset Regression dan
regresi ridge.
1.2.1. Variabel penjelas mana saja yang terpilih dengan menggunakan Best Subset
1.2.2. Apakah model yang diperoleh sudah dapat digunakan untuk mengestimasi
Agar penelitian tidak meluas dan menyimpang dari pembahasan maka perlu
Mallow.
perhotelan di kota Kendari berdasarkan model yang diperoleh dari Best Subset
Regression.
Language.
2. Bagi peneliti lain : sebagai bahan referensi dalam menentukan model terbaik
regresi.