Anda di halaman 1dari 18

MODUL PERKULIAHAN

Statistik Bisnis

Uji Regresi dan Korelasi


Sederhana Dengan Software
Statistik

Fakultas Program Studi Tatap Muka Kode MK Disusun Oleh

10
Ekonomi dan Bisnis Akuntansi F041700012 Putri Renalita Sutra Tanjung,SE.,MM.,MAk

Abstract Kompetensi
Memahami dan mengerti regresi dan Mahasiswa mampu memahami dan
korelasi linier sederhana, uji regresi mengerti regresi dan korelasi linier
logistik sederhana, uji regresi logistik
Regresi Linier Sederhana
Pengertian
Istilah “regresi” pertama kali diperkenalkan oleh Sir Francis Galton pada tahun 1886. Galton
menemukan adanya tendensi bahwa orang tua yang memiliki tubuh tinggi, memiliki anak-
anak yang tinggi pula dan orang tua yang pendek memiliki anak-anak yang pendek pula.
Kendati demikian, ia mengamati ada kecenderungan bahwa tinggi anak bergerak menuju
rata-rata tinggi populasi secara keseluruhan.
Dengan kata lain, ketinggian anak yang amat tinggi atau orang tua yang amat pendek
cenderung bergerak ke arah rata-rata tinggi populasi
Interprestasi modern mengenai regresi agak berlainan dengan regresi versi Galton. Secara
umum, analisis regresi pada dasarnya adalah studi mengenai ketergantungan variable
dependen (terikat) dengan satu atau lebih variable independen (variable penjelas/bebas)
dengan tujuan untuk mengestimasi dan/atau mempredikasi rata-rata populasi atau nilai rata-
rata variable dependen berdasarkan nilai variable independen yang diketahui (Gujarati,
2003).
Analisis regresi digunakan untuk mengetahui besarnya pengaruh satu variabel bebas atau
lebih terhadap satu variabel tidak bebas. Data yang dianalisis dengan regresi merupakan
data kuantitatif yang memiliki skala pengukuran minimal interval.
Analisa korelasi digunakan untuk mengetahui keeratan hubungan dua variabel acak yang
memiliki skala pengukuran minimal interval dan berdistribusi normal bivariat.
Analisis regresi digunakan untuk mengetahui besarnya pengaruh satu variabel bebas atau
lebih terhadap satu variabel tidak bebas. Data yang dianalisis dengan regresi merupakan
data kuantitatif yang memiliki skala pengukuran minimal interval.
Analisa korelasi digunakan untuk mengetahui keeratan hubungan dua variabel acak yang
memiliki skala pengukuran minimal interval dan berdistribusi normal bivariat.

ANALISIS REGRESI
a) Tentukan dulu variabel bebas (independent variable) disimbolkan dengan X dan variabel
tidak bebas (dependent variable) disimbolkan Y
b) Berdasarkan jumlah variabel bebas dan pangkat dari variabel bebas, analisa regresi
terdiri dari :

2021 Statistik Bisnis


2 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Regresi linear
sederhana
Regresi linear Regresi linear
multipel (berganda)

Regresi
Regresi non linear
sederhana
Regresi non linear
Regresi non linear
multipel (berganda)

Karakteristik Regresi Sederhana


 Terdiri dari variabel dependent (Y) dan independent (X)
 Regresi merupakan analisis sebab akibat
 Pengaruh dari variabel yang terlibat tidak bersifat timbal balik (hanya satu arah)
 Pendugaan koefisien menggunakan OLS (ordinary Least Square)
 Hal penting yang harus dipelajari :
1) Teori yang diperlukan
2) Model matematis yang dipilih
3) Hasil pengujian statistik :
Uji t : uji parsial koefisien
Uji F : uji keseluruhan model
 Kekuatan model ditunjukkan dengan R-square

REGRESI LINEAR SEDERHANA


Model persamaan regresi linear sederhana :
Y = α + βX + ε (model populasi)
Y = a + bX + e (model sampel)
a dan b adalah estimate value untuk α dan β
a adalah kontanta, secara grafik menunjukkan intersep
b adalah koefisien regresi yang menunjukkan besarnya pengaruh X terhadap Y, secara
grafik menunjukkan slope (kemiringan garis regresi).
Jika data hasil observasi terhadap sampel acak berukuran n telah tersedia, maka
untuk mendapatkan persamaan regresi Y = a + bX, perlu dihitung a dan b dengan metode
kuadrat kekeliruan terkecil (least square error methods).

2021 Statistik Bisnis


3 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Korelasi Linier Sederhana

Analisis korelasi pertama kali dikembangkan oleh Karl Pearson pada tahun 1990. Tujuan
dari analisis korelasi adalah untuk menentukan seberapa erat hubungan antara dua
variabel.
Analisis korelasi adalah suatu teknik statistika yang digunakan untuk mengukur keeratan
hubungan atau korelasi antara dua variabel.

Jenis-jenis korelasi:
1) Korelasi negatif menunjukan bahwa kedua peubah (X dan Y) memiliki kecenderungan
yang berlawanan (yaitu kenaikan nilai X, diikuti dengan penurunan nilai Y, demikian juga
sebaliknya penurunan nilai X diikuti dengan kenaikan nilai Y)
2) Korelasi nol (r=0) menunjukan bahwa kedua peubah tidak berkorelasi, yaitu kenaikan
atau penurunan nilai peubah X, tidak mempengaruhi nilai peubah Y
3) Korelasi positif menunjukan bahwa kedua peubah memiliki kecenderungan yang sama,
yaitu kenaikan nilai X, diikuti dengan kenaikan nilai Y, demikian juga sebaliknya
penurunan nilai X diikuti dengan penurunan nilai Y

HUBUNGAN POSITIF DAN NEGATIF

2021 Statistik Bisnis


4 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Analisis korelasi mencoba mengukur keeratan hubungan antara dua variabel X dan Y.
Keeratan hubungan antara dua variabel tersebut dinyatakan dalam bentuk koefisien korelasi
yang dilambangkan dengan huruf r. Koefisien korelasi (r) menunjukkan seberapa dekat titik
kombinasi antara variabel Y dan X pada garis lurus sebagai garis dugaannya. Semakin
dekat titil kombinasi dengan garis dugaannya maka nilai korelasi semakin membesar.
Sebaliknya, semakin menyebar dari garis dugaannya, maka nilai korelasi semakin kecil.
Berdasarkan gambar diatas terlihat adanya korelasi yang positif yaitu titik kombinasi yang
menggerombol pada garis dugaan dengan kemiringan positif (gambar hubungan produksi
dan harga minyak). Selain itu, ada korelasi yang negatif yaitu titik-titik kombinasi yang
menggerombol pada garis dugaan dengan kemiringan negatif (gambar hubungan antara
inflasi dan suku bunga).

Koefisien Korelasi
Ukuran korelasi antara dua buah variabel yang paling banyak digunakan adalah koefisien
korelasi yang dikembangkan oleh Pearson.
Untuk menunjukkan besarnya keeratan hubungan antara dua variabel acak yang masing-
masing memiliki skala pengukuran minimal interval dan berdistribusi bivariat, digunakan
koefisien korelasi yang dirumuskan sebagai berikut:

Dimana:
r : nilai koefisien korelasi
∑X : jumlah pengamatan variabel X
∑Y : jumlah pengamatan variabel Y
∑XY : jumlah hasil perkalian variabel X dan Y
(∑X2) : jumlah kuadrat dari pengamatan variabel X
(∑X)2 : jumlah kuadrat dari jumlah pengamatan variabel X
(∑Y2) : jumlah kuadrat dari pengamatan variabel Y
(∑Y)2 : jumlah kuadrat dari jumlah pengamatan variabel Y
n : jumlah pasangan pengamatan Y dan X

Koefisien korelasi yang dirumuskan seperti itu disebut koefisien korelasi Pearson atau
koefisien korelasi product moment.

2021 Statistik Bisnis


5 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
 Besar r adalah − 1 ≤ rxy ≤ + 1
 Tanda + menunjukkan pasangan X dan Y dengan arah yang sama, sedangkan tanda −
menunjukkan pasangan X dan Y dengan arah yang berlawanan.
 rxy yang besarnya semakin mendekati 1 menunjukkan hubungan X dan Y cenderung
sangat erat. Jika mendekati 0 hubungan X dan Y cenderung kurang kuat.
 rxy = 0 menunjukkan tidak terdapat hubungan antara X dan Y

HUBUNGAN KUAT DAN LEMAHNYA SUATU KORELASI

Tepat Koefisien korelasi mempunyai nilai antara -1 sampai 1. Nilai r = -1 yang disebut
dengan linier sempurna negatif, terjadi apabila titik contoh atau kombinasi terletak tepat
pada suatu garis lurus yang mempunyai kemiringan negatif. Nilai r = 1 disebut dengan linier
sempurna positif dan hal ini terjadi apabila semua titik contoh terletak tepat pada satu garis
lurus dengan kemiringan positif. Nilai koefisien korelasi yang mendekati -1 atau 1
menyatakan bahwa hubungan kedua variabel adalah kuat atau korelasi kedua variabel
tinggi. Akan tetapi apabila nilai r mendekati 0, hubungan antara kedua variabel sangat lemah
atau mungkin tidak ada sama sekali.

2021 Statistik Bisnis


6 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Contoh Kasus Regresi dan Korelasi Linier
Sederhana
Berdasarkan teori penawaran, maka dapat diduga adanya hubungan antara produksi
dengan harga. Apabila harga meningkat, maka produksi meningkat pula. Jadi, hubungan
antara produksi dan harga adalah positif. Buktikan bahwa hal tersebut benar dengan
menggunakan data produksi dan harga minyak mentah kelapa sawit (CPO) dari tahun 2002
sampai 2012 sebagai berikut:

Langkah-langkahnya:
1) Buka software SPSS
2) Import data yang sudah ditabulasi di Excel, maka tampilannya sebagai berikut:

2021 Statistik Bisnis


7 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Tampilan di variabel view:

3) Selanjutnya pilih Analyze > Regression > Linier


4) Masukkan variabel Harga pada kolom Dependent list, kemudian variabel produksi pada
kolom independent

Lalu pilih Ok

2021 Statistik Bisnis


8 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Maka hasil outputnya sebagai berikut:

Interpretasi hasil:
Nilai koefisien korelasi 0,860 ini menunjukkan hubungan korelasi yang positif, apabila
harga minya mentah kelapa sawit (CPO – di Rotterdam) meningkat, maka produksi juga
akan meningkat. Nilai koefisien sebesar 0,860 termasuk kedalam korelasi positif yang
kuat. Ini menunjukkan eratnya hubungan variabel harga dengan produksi. Jadi, dengan
demikian teori penawaran tersebut dapat dibenarkan.

Persamaan regresi:
Produksi = 6076119,73 + 14648,80 Harga
Arti koefisien b0 yaitu apabila Produksi sama dengan nol maka harga sama dengan
6076119,73. Sedangkan arti koefisien b1 yaitu apabila produksi naik sebanyak satu satuan
(nilai produksi = 1), maka harga akan bertambah banyak 14648,80 rupiah

Regresi Logistik
Logistic regression sebetulnya mirip dengan diskriminan yaitu kita ingin menguji apakah
probabilitas terjadinya variable terikat diprediksi dengan variable bebasnya.
Berikut ini beberapa contoh kasus yang umumnya di analisis dengan logistic regression:
 Seorang dokter ingin mengetahui apakah probabilitas seorang pasien terserang
penyakit jantung dapat di prediksi dari tekanan darah, kadar kolesterol, kalori yang
dimakan, jenis kelamin dan gaya hidup
 Seorang auditor ingin menentukan probabilitas sebuah perusahaan bangkrut dengan
melihat beberapa rasio keuangan, ukuran besarnya perusahaan (besar atau kecil)

2021 Statistik Bisnis


9 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Regresi logistik adalah sebuah pendekatan untuk membuat model prediksi seperti halnya
regresi linear atau yang biasa disebut dengan istilah Ordinary Least Squares (OLS)
regression. Perbedaannya adalah pada regresi logistik, peneliti memprediksi variabel terikat
yang berskala dikotomi. Skala dikotomi yang dimaksud adalah skala data nominal dengan
dua kategori, misalnya: Ya dan Tidak, Baik dan Buruk atau Tinggi dan Rendah
Apabila pada OLS mewajibkan syarat atau asumsi bahwa error varians (residual)
terdistribusi secara normal. Sebaliknya, pada regresi ini tidak dibutuhkan asumsi tersebut
sebab pada regresi jenis logistik ini mengikuti distribusi logistik.

Asumsi Regresi Logistik antara lain:


 Regresi logistik tidak membutuhkan hubungan linier antara variabel independen dengan
variabel dependen.
 Variabel independen tidak memerlukan asumsi multivariate normality.
 Asumsi homokedastisitas tidak diperlukan
 Variabel bebas tidak perlu diubah ke dalam bentuk metrik (interval atau skala ratio).
 Variabel dependen harus bersifat dikotomi (2 kategori, misal: tinggi dan rendah atau baik
dan buruk)
 Variabel independen tidak harus memiliki keragaman yang sama antar kelompok variabel
 Kategori dalam variabel independen harus terpisah satu sama lain atau bersifat eksklusif
 Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50
sampel data untuk sebuah variabel prediktor (independen).
 Dapat menyeleksi hubungan karena menggunakan pendekatan non linier log
transformasi untuk memprediksi odds ratio. Odd dalam regresi logistik sering dinyatakan
sebagai probabilitas

Model Persamaan Regresi Logistik


Model persamaan aljabar layaknya OLS yang biasa kita gunakan adalah berikut: Y = B0 +
B1X + e. Dimana e adalah error varians atau residual. Dengan model regresi ini, tidak
menggunakan interpretasi yang sama seperti halnya persamaan regresi OLS. Model
Persamaan yang terbentuk berbeda dengan persamaan OLS
Berikut persamaannya:

2021 Statistik Bisnis


10 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Uji Regresi Logistik
Misalkan kita akan melakukan uji regresi logistik sebuah penelitian yang berjudul Pengaruh
Rokok dan Riwayat Kanker Terhadap Kanker Paru. Di mana variabel bebas ada 2 yaitu
rokok dan riwayat kanker pada keluarga dan variabel terikatnya adalah kejadian kanker
paru. Rokok terdiri dari 2 kategori yaitu “tidak merokok (kode 0)” dan “merokok (kode 1).”
Riwayat terdiri dari 2 kategori yaitu “tidak ada riwayat (kode 0)” dan “ada riwayat (kode 1).”
Kanker paru terdiri dari 2 kategori yaitu “tidak mengalami kanker (kode 0)” dan “mengalami
kanker (kode 1).” Sebagai catatan: kategori yang terburuk diberi kode 1 dan kategori yang
terbaik diberi kode 0.

1) Buka SPSS
2) Import data yang sudah di input pada Excel,
3) Pilih variabel view, sebagai berikut:

2021 Statistik Bisnis


11 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
4) Lalu isikan value untuk variabel X1 sebagai berikut

5) Lalu isikan value untuk variabel X2 sebagai berikut

6) Lalu isikan value untuk variabel X2 sebagai berikut

2021 Statistik Bisnis


12 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
7) Kemudian pada menu, klik Analyze -> Regression -> Binary Logistic. Kemudian
masukkan variabel terikat ke kotak dependent dan masukkan semua variabel bebas ke
kotak Covariates

8) Save Regresi Logistik
9) Tekan tombol Save lalu centang Probabilities, Group membership, Unstandardized dan
Studentized kemudian klik Continue

2021 Statistik Bisnis


13 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
10) Tekan tombol Options lalu centang Classification plots, Hosmer-lemeshow goodness-of-
fit, Casewise listing residuals dan pilih Outliers outside dan isi dengan angka 2,
Correlation of Opsi Regresi Logistik
11) Sedangkan nilai Maximum iteration biarkan tetap sebesar 20 dan nilai Classification
Cutofftetap 0.5. Nilai ini disebut dengan the cut value atau prior probability, yaitu
peluang suatu observasi untuk masuk ke dalam salah satu kelompok sebelum
karakteristik variabel penjelasnya diketahui. Apabila kita tidak mempunyai informasi
tambahan tentang data kita, maka bisa langsung menggunakan nilai default yaitu 0,5.
Jika tidak ada penelitian sebelumnya, dapat digunakan classification cutoff sebesar 0,5.
Namun, jika ada penelitian lain yang telah meneliti maka bisa
dinaikkan/diturunkan classification cutoff sesuai hasil penelitian
12) estimates, Iteration history, CI for exp(B) dan isi dengan 95

2021 Statistik Bisnis


14 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
13) Kemudian pada jendela utama, klik OK
Maka hasilnya sebagai berikut:

Di atas adalah kode variabel dependen. Yaitu kategori “Tidak Mengalami Kanker”
dengan kode 0 dan “Mengalami Kanker” dengan kode 1. Oleh karena yang diberi kode
1 adalah “Mengalami Kanker”, maka “Mengalami Kanker” menjadi referensi atau efek
dari sebab. Sebab yang dimaksud adalah kejadian yang dihipotesiskan sebagai
penyebab munculnya efek atau masalah. Dalam hal ini, merokok (kode 1) dan ada
riwayat keluarga (kode 1) menjadi sebab yang dapat meningkatkan resiko terjadinya
kanker paru (kode 1)

Iteration History: Interprestasi Regresi Logistik dengan SPSS

Di atas: Tabel Iteration History pada block 0 atau saat variabel independen tidak
dimasukkan dalam model: N=40 mendapatkan Nilai -2 Log Likelihood: 54,55
Degree of Freedom (DF) = N – 1 = 40-1=39. Chi-Square (X2) Tabel Pada DF 39 dan
Probabilitas 0.05 = 54,57.
Nilai -2 Log Likelihood (54,55) < X2 tabel (54,57) sehingga menerima H0, maka
menunjukkan bahwa model sebelum memasukkan variabel independen adalah FIT
dengan data.

2021 Statistik Bisnis


15 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Classification Table: Interprestasi Regresi Logistik dengan SPSS

• Di atas pada tabel Classifacation Table: Merupakan tabel kontingensi 2 x 2 yang


seharusnya terjadi atau disebut juga frekuensi harapan berdasarkan data empiris
variabel dependen, di mana jumlah sampel yang memiliki kategori variabel dependen
referensi atau akibat buruk (kode 1) yaitu “Mengalami Kanker” sebanyak 17.
Sedangkan yang “Tidak mengalami Kanker” sebanyak 23 orang.  Jumlah sampel
sebanyak 40 orang. Sehingga nilai overall percentage sebelum variabel independen
dimasukkan ke dalam model sebesar: 23/40 = 57,5%

Variabel Dalam Persamaan Tahap Beginning: Interprestasi Regresi Logistik dengan


SPSS

• Di atas pada tabel Variables in The Equation: Saat sebelum var independen di


masukkan ke dalam model, maka belum ada variabel independen di dalam model. Nilai
Slope atau Koefisien Beta (B) dari Konstanta adalah sebesar -0,302 dengan Odds Ratio
atau Exp(B) sebesar 0,739. Nilai Signifikansi atau p value dari uji Wald sebesar 0,345.
• Perlu diingat bahwa nilai B identik dengan koefisien beta pada Ordinary Least Square
(OLS)atau regresi linear. Sedangkan Uji Wald identik dengan t parsial pada OLS.
Sedangkan Exp(B) adalah nilai eksponen dari B, maka Exp(-0,302) = 0,739

Variabel Tidak Dalam Persamaan Tahap Beginning: Interprestasi Regresi Logistik


dengan SPSS

2021 Statistik Bisnis


16 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
• Di atas pada tabel Variables not in the Equation: Menunjukkan variabel yang belum
dimasukkan ke dalam model regresi, yaitu variabel X1 dan X2. Di mana X1 adalah
variabel merokok dan X2 adalah variabel riwayat keluarga

2021 Statistik Bisnis


17 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id
Daftar Pustaka
J. Supranto, 2009, Statstika. Teori dan Aplikasi. Erlangga
Suharyadi dan Purwanto, 2009, Statistika untuk Ekonomi dan Keuangan Modern, Salemba
Empat
Suharyadi dan Purwanto, 2016, Statistika untuk Ekonomi dan Keuangan Modern Edisi 3,
Salemba Empat
Ghozali, Imam. 2013. Aplikasi Analisis Multivariate dengan Program IBM SPSS 21 Update
PLS Regresi. Semarang: Badan Penerbit Universitas Diponegoro

2021 Statistik Bisnis


18 Putri Renalita Sutra Tanjung,SE.,MM.,MAk
Pusat Bahan Ajar dan eLearning
http://www.mercubuana.ac.id

Anda mungkin juga menyukai