variabel kuantitatif sehingga salah satu variabel dapat diprediksi dari variabel yang lain.
Contohnya, jika diketahui hubungan antara biaya iklan dan penjualan, maka dapat
diperkirakan nilai penjualan berdasarkan analisis regresi dengan biaya iklan yang ditentukan.
REGRESI VS KORELASI
Persamaan : Keduanya mempelajari hubungan antar variabel
REGRESI
1. Mempelajari bentuk hubungan antar variabel melalui suatu persamaan (RLS, RLB,
Regresi non Linier). Hubungan bisa berupa hubungan sebab akibat
2. Dapat mengukur seberapa besar suatu variabel mempengaruhi variabel lain
3. Dapat digunakan untuk melakukan peramalan nilai suatu variabel berdasarkan
variabel lain
KORELASI
1. Mempelajari keeratan hubungan antar 2 variabel kuantitatif yang bisa dilihat dari
besarnya angka, bukan tandanya
2. Dapat mengetahui arah hubungan yang terjadi (berbanding lurus jika tandanya positif,
dan berbanding terbalik jika tandanya negatif)
3. Nilainya berkisar -1 sampai dengan 1
4. Tidak bisa menyatakan hubungan sebab akibat
Korelasi yang tinggi tidak selalu berarti bahwa suatu variabel
menyebabkan/mempengaruhi variabel yang lain
Contoh :
Misal didapatkan hasil High positive correlation. Pertanyaanya Apakah soft drink
menyebabkan kematian??
VARIABEL BEBAS (INDEPENDENT) DAN VARIABEL TAK BEBAS (DEPENDENT)
- Dependent Variable / Variabel Tak Bebas (Y) : Variabel yang nilainya ditentukan oleh
variabel lain. Diasumsikan bersifat random/stochastic.
- Independent Variable / Variabel Bebas (X) : Variabel yang nilainya ditentukan secara bebas
(variabel yang diduga mempengaruhi variabel tak bebas). Diasumsikan bersifat fixed/non
stochastic.
Syarat :
Y: Berjenis data kuantitatif
- Data Eksperimen
Diperoleh dengan melakukan kontrol terhadap variabel X -> dapat menyatakan hubungan
sebab-akibat
KONSEP DASAR
- Pada suatu nilai X tertentu akan terdapat banyak kemungkinan nilai-nilai Y (Y akan
terdistribusi mengikuti suatu fungsi peluang tertentu->diasumsikan berdistribusi normal)
dengan nilai rata-rata E(Y) dan nilai varians tertentu.
- Nilai rata-rata E(Y) diasumsikan berubah secara sistematik mengikuti perubahan nilai X,
yang digambarkan dalam bentuk garis linier
- Nilai varians pada setiap nilai X akan sama
Tahapan-tahapan dalam analisis regresi:
1. Identifikasi dan pembentukan model
2. Pendugaan parameter model
3. Pengujian keberartian parameter
4. Penilaian ketepatan model (goodness of fit) dan pemeriksaan asumsi
IDENTIFIKASI MODEL
>> Menggunakan scatter plot/diagram pencar :
- Bila pencaran titik-titik pada plot ini menunjukkan adanya suatu kecenderungan (trend)
yang linier maka model regresi linier layak digunakan. Bila bentuk pencarannya parabola
maka regresi kuadratik yang layak digunakan, dan sebagainya.
>> Beberapa contoh model regresi linier (linier artinya linier dalam parameter):
Contoh kasus:
Seorang mahasiswa bernama Hermawan ingin meneliti tentang
pengaruh biaya promosi terhadap volume penjualan pada
perusahaan jual beli motor. Dengan ini di dapat variabel dependen
(Y) adalah volume penjualan dan variabel independen (X) adalah
biaya promosi. Dengan ini Hermawan menganalisis dengan bantuan
program SPSS dengan alat analisis regresi linear sederhana. Data-
data yang di dapat ditabulasikan sebagai berikut:
Volume
No Biaya Promosi
Penjualan
1 12,000 56,000
2 13,500 62,430
3 12,750 60,850
4 12,600 61,300
5 14,850 65,825
6 15,200 66,354
7 15,750 65,260
8 16,800 68,798
9 18,450 70,470
10 17,900 65,200
11 18,250 68,000
12 16,480 64,200
13 17,500 65,300
14 19,560 69,562
15 19,000 68,750
16 20,450 70,256
17 22,650 72,351
18 21,400 70,287
19 22,900 73,564
20 23,500 75,642
Y = a + bX
Y = -28764,7 + 0,691X
Analisis regresi logistik digunakan untuk menjelaskan hubungan antara variabel respon
yang berupa data dikotomik/biner dengan variabel bebas yang berupa data berskala interval
dan atau kategorik (Hosmer dan Lemeshow, 1989). Variabel yang dikotomik/biner adalah
variabel yang hanya mempunyai dua kategori saja, yaitu kategori yang menyatakan kejadian
sukses (Y=1) dan kategori yang menyatakan kejadian gagal (Y=0). pada model model linear
umum komponen acak tidak harus mengikuti sebaran normal, tapi harus masuk
dalam sebaran keluarga eksponensial.Sebaran bernoulli termasuk dalam salah satu dari
sebaran keluarga eksponensial. Variabel respon Y ini, diasumsikan mengikuti distribusi
Bernoulli.
Berdasarkan dua contoh tersebut mungjkin sudah membuka pikiran untuk kasus
seperti apa regresi logistik digunakan. intinya variabel dependentnya dikotomi
artinya memiliki dua kategori seperti pada kasus diatas yang ditebal.
Kenapa cuma dua kategori aja? tidak bisa lebih dari tiga kategori?
Untuk metode ini tidak bisa karena hanya bisa dua sesuai dengan namanya. untuk
masalah diatas ada metode lain yang bisa digunakan yaitu regresi logistik ordinal.
Jika dari beberapa variabel bebas ada yang berskala nominal atau ordinal, maka
variabel tersebut tidak akan tepat jika dimasukkan dalam model logit karena angka-
angka yang digunakan untuk menyatakan tingkatan tersebut hanya sebagai
identifikasi dan tidak mempunyai nilai numerik dalam situasi seperti ini diperlukan
variabel dummy. Untuk variabel bebas dengan skala ordinal maupun nominal
dengan k kategori, akan diperlukan sebanyak k-1 variabel dummy.
Kategori dalam variabel independent harus terpisah satu sama lain atau
bersifat eksklusif
Pendugaan Parameter
Metode untuk mengestimasi parameter-parameter yang tidak diketahui dalam model
regresi logistik ada 3 yaitu:
1. Metode kemungkinan maksimum (Maximum Likelihood Method)
2. Metode kuadrat terkecil tertimbang noniterasi (Noniterative Weight Least
Square Method)
3. Analisis fungsi diskriminan (Discriminant Fuction Analysis)
Dengan :
Lo = Maksimum Lieklihood dari model reduksi (Reduced Model) atau model yang
terdiri dari konstanta saja
Lp = Maksimum Likelihood dari model penuh (Full Model) atau dengan semua
variabel bebas.
Hipotesis akan ditolak jika p-value < yang berarti variabel bebas Xj secara partial
mempengaruhi variabel tidak bebas Y.
Odds Ratio
Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami
kejadian sukses antara satu kategori dengan kategori lainnya, didefinisikan
sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko
atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika
dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala
kontinyu maka interpretasi dari koefisien j pada model regresi logistik adalah setiap
kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1,
adalah exp(c.j) kali lebih besar.