variabel kuantitatif sehingga salah satu variabel dapat diprediksi dari variabel yang lain.
Contohnya, jika diketahui hubungan antara biaya iklan dan penjualan, maka dapat
diperkirakan nilai penjualan berdasarkan analisis regresi dengan biaya iklan yang ditentukan.
REGRESI VS KORELASI
Persamaan : Keduanya mempelajari hubungan antar variabel
REGRESI
1. Mempelajari bentuk hubungan antar variabel melalui suatu persamaan (RLS, RLB,
Regresi non Linier). Hubungan bisa berupa hubungan sebab akibat
2. Dapat mengukur seberapa besar suatu variabel mempengaruhi variabel lain
3. Dapat digunakan untuk melakukan peramalan nilai suatu variabel berdasarkan
variabel lain
KORELASI
1. Mempelajari keeratan hubungan antar 2 variabel kuantitatif yang bisa dilihat dari
besarnya angka, bukan tandanya
2. Dapat mengetahui arah hubungan yang terjadi (berbanding lurus jika tandanya positif,
dan berbanding terbalik jika tandanya negatif)
3. Nilainya berkisar -1 sampai dengan 1
4. Tidak bisa menyatakan hubungan sebab akibat
”Korelasi yang tinggi tidak selalu berarti bahwa suatu variabel
menyebabkan/mempengaruhi variabel yang lain”
Contoh :
- Data Eksperimen
Diperoleh dengan melakukan kontrol terhadap variabel X -> dapat menyatakan hubungan
sebab-akibat
KONSEP DASAR
- Pada suatu nilai X tertentu akan terdapat banyak kemungkinan nilai-nilai Y (Y akan
terdistribusi mengikuti suatu fungsi peluang tertentu->diasumsikan berdistribusi normal)
dengan nilai rata-rata E(Y) dan nilai varians tertentu.
- Nilai rata-rata E(Y) diasumsikan berubah secara sistematik mengikuti perubahan nilai X,
yang digambarkan dalam bentuk garis linier
- Nilai varians pada setiap nilai X akan sama
Tahapan-tahapan dalam analisis regresi:
1. Identifikasi dan pembentukan model
2. Pendugaan parameter model
3. Pengujian keberartian parameter
4. Penilaian ketepatan model (goodness of fit) dan pemeriksaan asumsi
IDENTIFIKASI MODEL
>> Menggunakan scatter plot/diagram pencar :
- Bila pencaran titik-titik pada plot ini menunjukkan adanya suatu kecenderungan (trend)
yang linier maka model regresi linier layak digunakan. Bila bentuk pencarannya parabola
maka regresi kuadratik yang layak digunakan, dan sebagainya.
>> Beberapa contoh model regresi linier (linier artinya linier dalam parameter):
Contoh kasus:
Seorang mahasiswa bernama Hermawan ingin meneliti tentang
pengaruh biaya promosi terhadap volume penjualan pada perusahaan jual
beli motor. Dengan ini di dapat variabel dependen (Y) adalah volume
penjualan dan variabel independen (X) adalah biaya promosi. Dengan ini
Hermawan menganalisis dengan bantuan program SPSS dengan alat analisis
regresi linear sederhana. Data-data yang di dapat ditabulasikan sebagai
berikut:
Y’ = a + bX
Y’ = -28764,7 + 0,691X
Berdasarkan dua contoh tersebut mungjkin sudah membuka pikiran untuk kasus
seperti apa regresi logistik digunakan. intinya variabel dependentnya dikotomi
artinya memiliki dua kategori seperti pada kasus diatas yang ditebal.
Kenapa cuma dua kategori aja? tidak bisa lebih dari tiga kategori?
Untuk metode ini tidak bisa karena hanya bisa dua sesuai dengan namanya. untuk
masalah diatas ada metode lain yang bisa digunakan yaitu regresi logistik ordinal.
dengan π(x) adalah peluang kejadian sukses dengan nilai probabilita 0≤π(x)≤1 dan
βj adalah nilai parameter dengan j = 1,2,......,p. π(x) merupakan fungsi yang non
linier, sehingga perlu dilakukan transformasi ke dalam bentuk logit untuk
memperoleh fungsi yang linier agar dapat dilihat hubungan antara variabel bebas
dan variabel tidak bebas. Dengan melakukan transformasi dari logit π(x), maka
didapat persamaan yang lebih sederhana, yaitu:
Jika dari beberapa variabel bebas ada yang berskala nominal atau ordinal, maka
variabel tersebut tidak akan tepat jika dimasukkan dalam model logit karena angka-
angka yang digunakan untuk menyatakan tingkatan tersebut hanya sebagai
identifikasi dan tidak mempunyai nilai numerik dalam situasi seperti ini diperlukan
variabel dummy. Untuk variabel bebas dengan skala ordinal maupun nominal
dengan k kategori, akan diperlukan sebanyak k-1 variabel dummy.
Kategori dalam variabel independent harus terpisah satu sama lain atau
bersifat eksklusif
Pendugaan Parameter
Metode untuk mengestimasi parameter-parameter yang tidak diketahui dalam model
regresi logistik ada 3 yaitu:
1. Metode kemungkinan maksimum (Maximum Likelihood Method)
2. Metode kuadrat terkecil tertimbang noniterasi (Noniterative Weight Least
Square Method)
3. Analisis fungsi diskriminan (Discriminant Fuction Analysis)
Dengan :
Lo = Maksimum Lieklihood dari model reduksi (Reduced Model) atau model yang
terdiri dari konstanta saja
Lp = Maksimum Likelihood dari model penuh (Full Model) atau dengan semua
variabel bebas.
Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p sehingga
hipotesis ditolak jika p-value < α, yang berarti variabel bebas X secara bersama-
sama mempengaruhi variabel tak bebas Y.
Hipotesis akan ditolak jika p-value < α yang berarti variabel bebas Xj secara partial
mempengaruhi variabel tidak bebas Y.
Odds Ratio
Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami
kejadian ‘sukses ‘ antara satu kategori dengan kategori lainnya, didefinisikan
sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko
atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika
dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala
kontinyu maka interpretasi dari koefisien βj pada model regresi logistik adalah setiap
kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1,
adalah exp(c.βj) kali lebih besar.