Anda di halaman 1dari 23

Analisis Regresi dan

Korelasi
ANALISIS HUBUNGAN

Dalam kehidupan sehari-hari sering dijumpai hubungan


antara suatu variabel dengan satu atau lebih variabel
lainnya. Sebagai contoh: Tingkat Pendidikan seseorang
berhubungan dengan besarnya gaji yang diperolehnya,
Biaya advertensi suatu produk berhubungan dengan
volume penjualan, Tingkat Suku Bunga Bank
berhubungan dengan Investasi Perusahaan, Kondisi
Sadar Hukum berhubungan dengan Tingkat Kriminalitas,
Skor aptitude Test berhubungan dengan Potensi Kerja
Karyawan dan sebagainya.
Dalam analisis hubungan ini secara umum ada dua
macam (jenis) hubungan antara dua atau lebih variabel
yaitu; bentuk hubungan dan ke-eratan hubungan.
Bila ingin mengetahui bentuk hubungan dua variabel
atau lebih, digunakan Analisis Regresi. Analisis Regresi
adalah teknik statistika yang berguna untuk memeriksa
dan memodelkan hubungan diantara variabel-variabel.
Sedangkan untuk mengetahui seberapa besar ke-eratan
hubungan dua variabel atau lebih, digunakan Analisis
Korelasi.
Contoh-Contoh Bentuk Hubungan

Berat Orang Dewasa Laki-laki sampai taraf tertentu akan


bergantung kepada tinggi badannya,
Hasil Produksi padi akan sangat tergantung pada jumlah
dan kualitas pupuk yang digunakan,
Hasil Omzet penjualan sebuah super market akan
dipengaruhi oleh banyaknya pengunjung,
Produktivitas Kerja suatu institusi sangat bergantung pada
motivasi kerja dan kompetensi pegawai pada institusi
tersebut,
Tekanan dari semacam gas akan bergantung pada
besaran temperatur yang diberikan.
Efektivitas Organisasi yang sudah berjalan baik akan
mendukung mekanisme proses Pendistribusian Beras bagi
masyarakat miskin.
Model-Model Hubungan Antar
Variabel

Hubungan Simetris, terjadi apabila variabel


yang satu tidak disebabkan atau dipengaruhi oleh
variabel yang lainnya.
Hubungan Asimetris, terjadi antar dua variabel
atau lebih yang satu menyebabkan variabel yang
lainnya.
Hubungan Timbal Balik, terjadi apabila
variabel yang satu dapat menjadi sebab dan juga
bisa merupakan akibat dari variabel yang lainnya.
Analisis Regresi
Terapan analisis regresi di berbagai bidang pada umumnya dikaitkan
dengan studi ketergantungan suatu variabel (variabel tak bebas: Y)
pada variabel lainnya (variabel bebas: X).
Variabel Y (tak bebas) sering pula disebut variabel respon, variabel
yang diregresi, yaitu variabel yang nilainya dipengaruhi oleh variabel
bebas.
Variabel X (bebas) sering pula disebut variabel penjelas atau variabel
peregresi umumnya variabel ini ditetapkan lebih dahulu baru
kemudian dilakukan pengamatan terhadap nilai-nilai responnya.
Dalam analisis regresi secara empiris banyak dijumpai hubungan
sebab akibat yang kuat antara variabel respon dan variabel-variabel
penjelas --- untuk memantapkan adanya hubungan sebab akibat yang
sebenarnya akan lebih baik apabila ada landasan teori yang
mendukungnya.
Dengan kata lain, pembentukan model yang sebenarnya harus
didasarkan pada suatu pengetahuan, teori sementara, atau tujuan
yang beralasan dan bukan asal ditentukan saja.
Analisi Regresi Linier Sederhana
Model populasi regresi linier sederhana dinyatakan dalam persamaan:
Yi X j
i 1,2,3......., n
X1, X2, X3,., Xn adalah variabel kontrol
j adalah komponen sisaan yang tidak diktehui nilainya (acak)
dan adalah parameter yang nilainya tidak diketahui sehingga diduga (ditaksir)
menggunakan statistik sampel.

Model populasi linier ini diduga dengan metode kuadrat terkecil (Least
Square Method). Prinsip metode ini adalah meminimumkan selisih kuadrat
antara Y observasi dengan Y taksiran. Untuk model sampel regresi linier
sederhana adalah:
i Y a bX i
Dalam hal ini:
Y=variabel tak bebas
X=variabel bebas
a=penduga bagi intersep ()
b=penduga bagi koefisien regresi
Rumus Untuk Mendapatkan Nilai a dan b Dalam Regresi
Linier Sederhana
n( XY ) ( X )( Y )
b
n( X ) ( X )2 2
Metode Kuadrat Terkecil
a Y bX

Contoh Kasus: Dari hasil pencatatan antara biaya iklan dan volume penjualan sebuah
perusahaan jasa eceran produk Komputer, diperoleh informasi sebagai berikut:

Biaya Iklan (jutaan Rp) X Volume Penjualan (ribuan unit) Y

3 12
4 11
5 13
6 12
7 13
8 14
9 16

Tentukan Persamaan Regresi Linier Sederhana dari data di atas, dan jika biaya iklan
dinaikan sampai Rp12 juta. Berapa volume penjualan yang diperoleh perusahaan
tersebut?
Penyelesaian Kasus:
X Y X2 Y2 XY
3 12 9 144 36
4 11 16 121 44
5 13 25 169 65
6 12 36 144 72
7 13 49 169 91
8 14 64 196 112
9 16 81 256 144
X= 42 Y=91 X2=280 Y2=1199 XY=564

Dengan menggunakan rumus metode kuadrat terkecil diperoleh:


n( XY ) ( X )( Y ) 7(564) 42(91)
b 0,6429
n( X ) ( X )
2 2
7(280) (42) 2
91 42
a Y bX (0,6429) 9,1426
7 7
Maka persamaan regresi linier sederhana adalah:
Y a bX 9,1426 0,6429 X
Jika biaya iklan dinaikan Rp 12 Juta, maka Y=9,1426+0,6429(12)=?
Standard Error Pendugaan (Se):
Dalam analisis regresi, standar error mencerminkan standar deviasi yang
mengukur variasi titik-titik di atas dan dibawah garis regresi populasi.
Nilai Standard error ini dibutuhkan untuk keperluan inferensial. Karena nilai
populasinya tidak diketahui, maka e ditaksir oleh Se (standard errror
pendugaan).
Se ini bisa dikatakan sebagai standar deviasi yang menggambarkan variasi
titik-titik di atas dan di bawah regresi sampel.
Nilai Se diperoleh dengan menggunakan rumus:
Se
( y y ) 2
n2

4,433
Se 0,94
Dengan menggunakan kasus 72
sebelumnya, maka diperoleh nilai Se adalah:
Catatan: Khusus untuk regresi linier sederhana, rumus mencari nilai S e ini bisa
dimodifikasi menjadi:
Se
Y 2
a Y b XY
n2
1199 9,1426(91) 0,6429(564)
Se 0,94
72

Semakin tinggi nilai Se, maka kesalahan pendugaan akan semakin tinggi pula.
Analisis Korelasi
(Analisis Keeratan Hubungan)

Dalam hal keeratan hubungan antara variabel, analisis korelasi ini paling
sering digunakan dalam Statistika.
Tersedia lebih dari satu jenis analisis korelasi yang dapat digunakan, hal ini
tergantung kepada skala pengukuran datanya.
Untuk Skala pengukuran minimal interval analisis yang digunakan adalah
analisis korelasi Pearson --- digunakan dalam analisis statistika parametrik.
Untuk Skala pengukuran ordinal digunakan analisis korelasi Spearman ----
digunakan dalam analisis statistika non-parametrik.
Untuk Skala pengkuran nominal digunakan uji kebebasan dalam analisis
tabel kontingensi.
Korelasi Pearson (Product Moment)
Koefisien korelasi Pearson digunakan untuk mengetahui tingkat (derajat)
keeratan hubungan linier antara dua atau lebih variabel yang minimal berskala
pengukuran interval.
Bila variabel yang terlibat hanya dua, maka analisis korelasinya disebut
analisis sederhana. Bila variabel yang terlibat lebih dari dua, disebut analsis
korelasi berganda.
Nilai koefisien korelasi yang diperoleh dari populasi dilambangkan dengan ,
sedangkan bila dari sampel dilambangkan dengan r.
Sifat-sifat dari koefisien korelasi (r) adalah:
Nilainya berkisar dari -1 r 1
Bila r = 0 atau mendekati nol, berarti antara dua variabel yang diobservasi
(misal X dan Y) tidak terdapat hubungan linier atau hubungan liniernya
sangat lemah.
Bila r mendekati 1 (satu), hubungan linier X dan Y sangat kuat.
Tanda koefisien korelasi menunjukkan arah hubungan variabel X dan Y. Bila
r positif, pergerakan nilai kedua variabel bersifat searah. Dengan kata lain,
kenaikan dan penurunan nilai X akan diikuti oleh kenaikan dan penurunan
nilai Y. Bila r negatif, pergerakan X dan Y akan terjadi dalam arah yang
berlawanan. Dengan kata lain, bila X meningkat, maka Y menurun, atau
sebaliknya jika X menurun, maka Y naik.
Rumus Koefisien Korelasi Pearson
n XY X Y
r
n X 2
( X ) 2 n Y 2 ( Y ) 2

Nilai korelasi berkisar antara -1 dan 1, dengan kriteria:


r = 0 --- kedua variabel tidak berkorelasi
r = -1 --- kedua variabel berhubungan negatif sempurna
R = 1 --- kedua variabel berhubungan positif sempurna

Keandalan nilai r akan sangat tergantung pada besarnya sampel (n). Misalnya ryx
diperoleh besar hubungan 0,8, kondisi ini didapat dari hasil perhitungan untuk 15
unit sampel tentunya tidak memiliki keterandalan yang sama dengan nilai ryx =
0,8 yang diperoleh dari 100 unit sampel. Semakin besar ukuran sampelnya akan
menghasilkan r dengan keterandalan yang semakin tinggi.
Contoh Kasus:
Dari hasil survai terhadap 6 orang karyawan yang bekerja diperusahaan
asing, diperoleh informasi tentang besarnya pendapatan (X) dan
pengeluaran (Y) dalam bentuk tabel sebagai berikut:

Pendapatan (ribu dollar/tahun) X Pengeluaran (ribu dollar/tahun) Y

10 7
20 21
30 23
40 34
50 36
60 53

Berapa besarnya hubungan antara variabel pendapatan dan pengeluaran untuk


6 orang karyawan tersebut?
Penyelesaian Kasus:

Untuk dapat mengukur besarnya hubungan antara ke dua variabel


pendapatan dengan pengeluaran, perlu dihitung terlebih dahulu:
X = 210, Y = 174, XY = 7520, X2 = 9100, dan Y2 = 6280
Dihitung dengan korelasi Pearson sebagai berikut::

6(7250) (210)(174)
r 0,973
6(9100) (210) 6(6280) (174)
2 2

Dari hasil perhitungan tersebut dapat disimpulkan bahwa hubungan antara


variabel pendapatan dengan variabel pengeluaran sangat erat dan cenderung
sempurna.
Pengujian Hipotesis Koefisien Korelasi
Bentuk hipotesis yang digunakan adalah:
Ho : =0 (Tidak terdapat hubungan antara variabel X dan Y)
H1 : 0 (Terdapat hubungan antara variabel X dan Y)

Statistik Uji yang digunakan adalah:

r (n 2)
t ,v n 2
(1 r )
2

V= degrees of fredom

Kriteria Uji:
Jika t hitung > t tabel --- maka Ho ditolak
Dengan menggunakan hasil perhitungan korelasi antara pendapatan
dengan pengeluaran, maka akan dilakukan pengujian hipotesis terhadap
koefisien korelasi tersebut.
Ho : =0 (Tidak terdapat hubungan antara variabel pendapatan dengan
variabel pengeluaran)
H1 : 0 (Terdapat hubungan antara variabel pendapatan dengan
variabel pengeluaran)
Tingkat Keberartian
r (nPengujian
2) 0,973 (6= 25%
)
t 8,43
Statistik Uji: (1 r 2 ) (1 0,973 2 )

Dari tabel diperoleh nilai t tabel = 2,78.


Dengan demikian t hitung > t tabel, maka Ho ditolak, dan dapat disimpulkan
bahwa ada hubungan linier antara pendapatan dengan pengelauaran
keluarga.
KOEFISIEN DETERMINASI (r2)
Nilai koefisien determinasi merupakan suatu ukuran yang menunjukkan
besar sumbangan dari variabel penjelas terhadap variabel respon
Dengan perkataan lain, koefisien determinasi menunjukkan ragam
(variasi) naik turunnya Y yang diterangkan oleh pengaruh linier X
(berapa bagian keragaman dalam variabel Y yang dapat dijelaskan
oleh beragamnya nilai-nilai variabel X).
Kegunaan Koefisien Determinasi adalah:
Sebagai ukuran ketepatan atau kecocokan garis regresi yang dibentuk dari
hasil pendugaan terhadap sekelompok data hasil observasi. Makin besar nilai
r2 semakin bagus garis regresi yang terbentuk. Dan sebaliknya jika nilai r 2
semakin kecil, maka akan semakin tidak tepat garis regresi tersebut dalam
mewakili data hasil observasi.
Dapat digunakan untuk mengukur besarnya sumbangan variiabel penjelas
(X) terhadap vaiasi variabel respon (Y).
Rumus Koefisien Determinasi adalah:
KD r x 100%
2

r koefisien korelasi
Kasus 1:
Data pada suatu pabrik kertas menunjukkan bahwa banyaknya kertas rusak
ada hubungannya dengan kecepatan beroperasinya mesin cetak. Hal ini
dapat dilihat pada tabel berikut:

Kecepatan 8,1 10,2 10,8 10,9 12,0 13,1 13,2 13,8 14,9 15,8 16,4 17,4
Mesin per-
menit (X)
Jumlah 6,0 7,0 7,5 5,7 7,0 9,6 9,4 9,2 12,2 9,0 11,4 12,3
kerusakan
kertas
(lembar) Y

a. Tentukan persamaan regresi linier dengan menggunakan metode kuadrat terkecil


b. Berapa perkiraan jumlah kertas yang rusak, bila kecepatan mesin per-menit adalah 18,5
c. Tentukan koefisien korelasi dan koefisien determinasi data tersebut serta interperetasikan
hasilnya.
d. Lakukan pengujian terhadap koefisien korelasi yang diperoleh.
Kasus 2:
Sebuah riset dilakukan oleh sebuah Supermal yang mempunyai banyak
cabang usaha. Hasil pengamatan dilapangan diperoleh informasi data
sebagai berikut:

Radius dalam (Km) X 1 2 4 3 5 3 5 6


Penjualan Supermarket 2 4 5 5 7 4 8 9
(dalam juta $) Y

1. Tentukan persamaan regresi linier dengan menggunakan metode kuadrat terkecil


2. Berapa perkiraan Penjualan Supermarket, jika jarak (km) 10 km
3. Tentukan koefisien korelasi dan koefisien determinasi data tersebut serta
interpretasikan .
4. Lakukan pengujian hipotesis terhadap koefisien korelasi?
PERBEDAAN ANALISIS REGRESI
DAN ANALISIS KORELASI

Korelasi hanya menguji hubungan dua variabel secara


kualitatif. Seperti angka korelasi 0,9 adalah korelasi yang
kuat. Namun tidak dapat dikatakan bahwa angka korelasi
0,9 adalah dua kali lebih kuat daripada angka korelasi 0,45.
Analisis Korelasi hanya menghasilkan angka dan bukan
sebuah model. Kedudukan variabel pada korelasi adalah
setara.
Sedangkan pada analisis regresi, justru akan dicari sebuah
angka yang akan ditaksir secara kuantitatif. Analisis regresi
akan menghasilkan sebuah persamaan regresi atau model
regresi. Kedudukan pada analisis regresi kedua variabel
tidak setara, sebuah variabel adalah dependen dan yang
lainnya adalah independen.
Tambahan Materi
Estimasi dan Interval
Kepercayaan
I. Sebuah Estimasi titik adalah suatu nilai
(statistik) tunggal yang digunakan dalam
memperkirakan suatu nilai
populasi(parameter)
II. Interval Kepercayaan (confidence interval)
adalah sebuah jangkauan nilai yang
didalamnya parameter populasi diharapkan
akan terjadi.
Faktor yang menentukan lebarnya suatu suatu
interval kepercayaan untuk suatu rata-rata
adalah :
1. Jumlah pengamatan dalam sampel, n.
2. Variabilitas dalam populasi, biasaanya
diperkirakan oleh simpangan
baku(standar deviasi) sampel s.
3. Tingkat kepercayaan.
a. standar deviasi populasi diketahui,
sampel besar

X Z
n
b. standar deviasi tidak diketahui,
sampel kecil
s
X t
n
Contoh :
Sebuah perusahaan pembuat ban bermaksud
mengetahui masa pakai ban yang
diproduksinya. Diambil sampel 10 ban
digunakan sejauh 50.000 mil dan hasilnya
didapat rata-rata masa pakai ban memiliki
ketebalan 0.32 inci dan standar deviasi 0.09
inci. Dengan interval kepercayaan 95%
untuk rata-rata populasinya. Apakah masuk
akal jika pabrik tersebut menyimpulkan
bahwa setelah penggunaan 50.000 mil,
rata-rata populasinya masih memiliki
ketebalan jejak 0.30 inci?