Anda di halaman 1dari 20

ANALISIS REGRESI

DAN
ANALISIS KORELASI

STATISTIKA
Iwan Kurniawan
ANALISIS HUBUNGAN

 Dalam kehidupan sehari-hari sering dijumpai hubungan antara


suatu variabel dengan satu atau lebih variabel lainnya. Sebagai
contoh: Tingkat Pendidikan seseorang berhubungan dengan
besarnya gaji yang diperolehnya, Biaya advertensi suatu produk
berhubungan dengan volume penjualan, Tingkat Suku Bunga
Bank berhubungan dengan Investasi Perusahaan, Kondisi Sadar
Hukum berhubungan dengan Tingkat Kriminalitas, Skor aptitude
Test berhubungan dengan Potensi Kerja Karyawan dan
sebagainya.
 Dalam analisis hubungan ini secara umum ada dua macam
(jenis) hubungan antara dua atau lebih variabel yaitu; bentuk
hubungan dan ke-eratan hubungan.
 Bila ingin mengetahui bentuk hubungan dua variabel atau lebih,
digunakan Analisis Regresi. Analisis Regresi adalah teknik
statistika yang berguna untuk memeriksa dan memodelkan
hubungan diantara variabel-variabel.
 Sedangkan untuk mengetahui seberapa besar ke-eratan
hubungan dua variabel atau lebih, digunakan Analisis Korelasi.
Contoh-Contoh Bentuk Hubungan
 Berat Orang Dewasa Laki-laki sampai taraf tertentu akan
bergantung kepada tinggi badannya,
 Hasil Produksi padi akan sangat tergantung pada jumlah dan
kualitas pupuk yang digunakan,
 Hasil Omzet penjualan sebuah super market akan dipengaruhi
oleh banyaknya pengunjung,
 Produktivitas Kerja suatu institusi sangat bergantung pada
motivasi kerja dan kompetensi pegawai pada institusi tersebut,
 Tekanan dari semacam gas akan bergantung pada besaran
temperatur yang diberikan.
 Efektivitas Organisasi yang sudah berjalan baik akan mendukung
mekanisme proses Pendistribusian Beras bagi masyarakat
miskin.
Model-Model Hubungan Antar Variabel

 Hubungan Simetris, terjadi apabila variabel yang satu


tidak disebabkan atau dipengaruhi oleh variabel yang
lainnya.
 Hubungan Asimetris, terjadi antar dua variabel atau
lebih yang satu menyebabkan variabel yang lainnya.
 Hubungan Timbal Balik, terjadi apabila variabel yang
satu dapat menjadi sebab dan juga bisa merupakan
akibat dari variabel yang lainnya.
Analisis Regresi
 Terapan analisis regresi di berbagai bidang pada umumnya dikaitkan
dengan studi ketergantungan suatu variabel (variabel tak bebas: Y) pada
variabel lainnya (variabel bebas: X).
 Variabel Y (tak bebas) sering pula disebut variabel respon, variabel yang
diregresi, yaitu variabel yang nilainya dipengaruhi oleh variabel bebas.
 Variabel X (bebas) sering pula disebut variabel penjelas atau variabel
peregresi umumnya variabel ini ditetapkan lebih dahulu baru kemudian
dilakukan pengamatan terhadap nilai-nilai responnya.
 Dalam analisis regresi secara empiris banyak dijumpai hubungan sebab
akibat yang kuat antara variabel respon dan variabel-variabel penjelas ---
untuk memantapkan adanya hubungan sebab akibat yang sebenarnya akan
lebih baik apabila ada landasan teori yang mendukungnya.
 Dengan kata lain, pembentukan model yang sebenarnya harus didasarkan
pada suatu pengetahuan, teori sementara, atau tujuan yang beralasan dan
bukan asal ditentukan saja.
Analisi Regresi Linier Sederhana
 Model populasi regresi linier sederhana dinyatakan dalam persamaan:

Yi     X   j
i  1,2,3......., n
 X1, X2, X3,…., Xn adalah variabel kontrol
 ξj adalah komponen sisaan yang tidak diktehui nilainya (acak)
 α dan β adalah parameter yang nilainya tidak diketahui sehingga diduga (ditaksir)
menggunakan statistik sampel.

 Model populasi linier ini diduga dengan metode kuadrat terkecil (Least Square
Method). Prinsip metode ini adalah meminimumkan selisih kuadrat antara Y observasi
dengan Y taksiran. Untuk model sampel regresi linier sederhana adalah:

Yi  a  bX i
Dalam hal ini:
Y=variabel tak bebas
X=variabel bebas
a=penduga bagi intersep (α)
b=penduga bagi koefisien regresi
Rumus Untuk Mendapatkan Nilai a dan b Dalam Regresi Linier Sederhana

n (  XY ) (  X )( Y )
b 
n( X 2
)  ( X ) 2 Metode Kuadrat Terkecil
a  Y  bX

Contoh Kasus: Dari hasil pencatatan antara biaya iklan dan volume penjualan sebuah
perusahaan jasa eceran produk Komputer, diperoleh informasi sebagai berikut:

Biaya Iklan (jutaan Rp) X Volume Penjualan (ribuan unit) Y

3 12
4 11
5 13
6 12
7 13
8 14
9 16

Tentukan Persamaan Regresi Linier Sederhana dari data di atas, dan jika biaya iklan
dinaikan sampai Rp12 juta. Berapa volume penjualan yang diperoleh perusahaan
tersebut?
Penyelesaian Kasus:
X Y X2 Y2 XY
3 12 9 144 36
4 11 16 121 44
5 13 25 169 65
6 12 36 144 72
7 13 49 169 91
8 14 64 196 112
9 16 81 256 144
Σ X= 42 Σ Y=91 Σ X2=280 Σ Y2=1199 Σ XY=564

Dengan menggunakan rumus metode kuadrat terkecil diperoleh:


n( XY ) ( X )( Y ) 7(564)  42(91)
b   0,6429
n ( X )  (  X )
2 2
7( 280)  (42) 2
91 42
a  Y  bX   (0,6429)  9,1426
7 7
Maka persamaan regresi linier sederhana adalah:
Y   a  bX  9,1426  0,6429 X
Jika biaya iklan dinaikan Rp 12 Juta, maka Y=9,1426+0,6429(12)=?
Standard Error Pendugaan (Se):
 Dalam analisis regresi, standar error mencerminkan standar deviasi yang mengukur
variasi titik-titik di atas dan dibawah garis regresi populasi.
 Nilai Standard error ini dibutuhkan untuk keperluan inferensial. Karena nilai
populasinya tidak diketahui, maka σe ditaksir oleh Se (standard errror pendugaan).
 Se ini bisa dikatakan sebagai standar deviasi yang menggambarkan variasi titik-titik di
atas dan di bawah regresi sampel.
 Nilai Se diperoleh dengan menggunakan rumus:

Se 
(y  y ) 2
n  2

 Dengan menggunakan kasus sebelumnya,


4, 433 maka diperoleh nilai S e adalah:
Se   0,94
72
Catatan: Khusus untuk regresi linier sederhana, rumus mencari nilai S e ini bisa
dimodifikasi menjadi:
Se 
Y 2
 a  Y  b  XY
n2
1199  9,1426(91)  0,6429(564)
Se   0,94
72

Semakin tinggi nilai Se, maka kesalahan pendugaan akan semakin tinggi pula.
Analisis Korelasi
(Analisis Keeratan Hubungan)
 Dalam hal keeratan hubungan antara variabel, analisis korelasi ini paling sering
digunakan dalam Statistika.
 Tersedia lebih dari satu jenis analisis korelasi yang dapat digunakan, hal ini
tergantung kepada skala pengukuran datanya.
 Untuk Skala pengukuran minimal interval analisis yang digunakan adalah analisis
korelasi Pearson --- digunakan dalam analisis statistika parametrik.
 Untuk Skala pengukuran ordinal digunakan analisis korelasi Spearman ---- digunakan
dalam analisis statistika non-parametrik.
 Untuk Skala pengkuran nominal digunakan uji kebebasan dalam analisis tabel
kontingensi.
Korelasi Pearson (Product Moment)
 Koefisien korelasi Pearson digunakan untuk mengetahui tingkat (derajat) keeratan
hubungan linier antara dua atau lebih variabel yang minimal berskala pengukuran
interval.
 Bila variabel yang terlibat hanya dua, maka analisis korelasinya disebut analisis
sederhana. Bila variabel yang terlibat lebih dari dua, disebut analsis korelasi
berganda.
 Nilai koefisien korelasi yang diperoleh dari populasi dilambangkan dengan “ρ”,
sedangkan bila dari sampel dilambangkan dengan “r”.
 Sifat-sifat dari koefisien korelasi (r) adalah:
 Nilainya berkisar dari -1 ≤ r ≤ 1
 Bila r = 0 atau mendekati nol, berarti antara dua variabel yang diobservasi (misal
X dan Y) tidak terdapat hubungan linier atau hubungan liniernya sangat lemah.
 Bila r mendekati 1 (satu), hubungan linier X dan Y sangat kuat.
 Tanda koefisien korelasi menunjukkan arah hubungan variabel X dan Y. Bila r
positif, pergerakan nilai kedua variabel bersifat searah. Dengan kata lain,
kenaikan dan penurunan nilai X akan diikuti oleh kenaikan dan penurunan nilai Y.
Bila r negatif, pergerakan X dan Y akan terjadi dalam arah yang berlawanan.
Dengan kata lain, bila X meningkat, maka Y menurun, atau sebaliknya jika X
menurun, maka Y naik.
Rumus Koefisien Korelasi Pearson
n XY   X  Y
r
n X 2
 ( X ) 2 n Y 2  ( Y ) 2 

Nilai korelasi berkisar antara -1 dan 1, dengan kriteria:


r = 0 --- kedua variabel tidak berkorelasi
r = -1 --- kedua variabel berhubungan negatif sempurna
R = 1 --- kedua variabel berhubungan positif sempurna

Keandalan nilai r akan sangat tergantung pada besarnya sampel (n). Misalnya r yx
diperoleh besar hubungan 0,8, kondisi ini didapat dari hasil perhitungan untuk 15
unit sampel tentunya tidak memiliki keterandalan yang sama dengan nilai ryx =
0,8 yang diperoleh dari 100 unit sampel. Semakin besar ukuran sampelnya akan
menghasilkan r dengan keterandalan yang semakin tinggi.
Contoh Kasus:
 Dari hasil survai terhadap 6 orang karyawan yang bekerja diperusahaan asing,
diperoleh informasi tentang besarnya pendapatan (X) dan pengeluaran (Y) dalam
bentuk tabel sebagai berikut:

Pendapatan (ribu dollar/tahun) X Pengeluaran (ribu dollar/tahun) Y

10 7
20 21
30 23
40 34
50 36
60 53

Berapa besarnya hubungan antara variabel pendapatan dan pengeluaran untuk


6 orang karyawan tersebut?
Penyelesaian Kasus:

 Untuk dapat mengukur besarnya hubungan antara ke dua variabel pendapatan


dengan pengeluaran, perlu dihitung terlebih dahulu:
 Σ X = 210, ΣY = 174, Σ XY = 7520, Σ X2 = 9100, dan Σ Y2 = 6280
 Dihitung dengan korelasi Pearson sebagai berikut::

6(7520)  ( 210)(174)
r  0,973
6(9100)  (210) 6(6280)  (174) 
2 2

Dari hasil perhitungan tersebut dapat disimpulkan bahwa hubungan antara


variabel pendapatan dengan variabel pengeluaran sangat erat dan cenderung
sempurna.
Pengujian Hipotesis Koefisien Korelasi

 Bentuk hipotesis yang digunakan adalah:


Ho : ρ=0 (Tidak terdapat hubungan antara variabel X dan Y)
H1 : ρ±0 (Terdapat hubungan antara variabel X dan Y)

 Statistik Uji yang digunakan adalah:

r (n  2)
t ,v  n  2
2
(1  r )

V= degrees of fredom

 Kriteria Uji:
Jika t hitung > t tabel --- maka Ho ditolak
 Dengan menggunakan hasil perhitungan korelasi antara pendapatan dengan
pengeluaran, maka akan dilakukan pengujian hipotesis terhadap koefisien korelasi
tersebut.
 Ho : ρ=0 (Tidak terdapat hubungan antara variabel pendapatan dengan variabel
pengeluaran)
H1 : ρ±0 (Terdapat hubungan antara variabel pendapatan dengan variabel
pengeluaran)
 Tingkat Keberartian Pengujian α = 5%
 Statistik Uji:

r ( n  2) 0,973 (6  2)
t    8,43
(1  r 2 ) (1  0,973 2 )

 Dari tabel diperoleh nilai t tabel = 2,78.


 Dengan demikian t hitung > t tabel, maka Ho ditolak, dan dapat disimpulkan bahwa ada
hubungan linier antara pendapatan dengan pengelauaran keluarga.
KOEFISIEN DETERMINASI (r2)

 Nilai koefisien determinasi merupakan suatu ukuran yang menunjukkan besar


sumbangan dari variabel penjelas terhadap variabel respon
 Dengan perkataan lain, koefisien determinasi menunjukkan ragam (variasi) naik
turunnya Y yang diterangkan oleh pengaruh linier X (berapa bagian keragaman
dalam variabel Y yang dapat dijelaskan oleh beragamnya nilai-nilai variabel X).
 Kegunaan Koefisien Determinasi adalah:
 Sebagai ukuran ketepatan atau kecocokan garis regresi yang dibentuk dari hasil
pendugaan terhadap sekelompok data hasil observasi. Makin besar nilai r 2 semakin
bagus garis regresi yang terbentuk. Dan sebaliknya jika nilai r 2 semakin kecil, maka akan
semakin tidak tepat garis regresi tersebut dalam mewakili data hasil observasi.
 Dapat digunakan untuk mengukur besarnya sumbangan variiabel penjelas (X) terhadap
vaiasi variabel respon (Y).
 Rumus Koefisien Determinasi adalah:

I  r 2 x 100%
r  koefisien korelasi
Kasus 1:
 Data pada suatu pabrik kertas menunjukkan bahwa banyaknya kertas rusak ada
hubungannya dengan kecepatan beroperasinya mesin cetak. Hal ini dapat dilihat pada
tabel berikut:

Kecepatan 8,1 10,2 10,8 10,9 12,0 13,1 13,2 13,8 14,9 15,8 16,4 17,4
Mesin per-
menit (X)
Jumlah 6,0 7,0 7,5 5,7 7,0 9,6 9,4 9,2 12,2 9,0 11,4 12,3
kerusakan
kertas
(lembar) Y

a. Tentukan persamaan regresi linier dengan menggunakan metode kuadrat terkecil


b. Berapa perkiraan jumlah kertas yang rusak, bila kecepatan mesin per-menit adalah 18,5
c. Tentukan koefisien korelasi dan koefisien determinasi data tersebut serta interperetasikan
hasilnya
d. Tentukan kesalahan baku taksiran yang diberikan oleh persamaan regresi tersebut.
e. Lakukan pengujian terhadap koefisien korelasi yang diperoleh.
Kasus 2:

 Sebuah riset dilakukan oleh sebuah Supermal yang mempunyai banyak cabang
usaha. Hasil pengamatan dilapangan diperoleh informasi ata sebagai berikut:

Radius dalam (Km) X 1 2 4 3 5 3 5 6


Penjualan Supermarket 2 4 5 5 7 4 8 10
(dalam juta $) Y

1. Tentukan persamaan regresi linier dengan menggunakan metode kuadrat terkecil


2. Berapa perkiraan Penjualan Supermarket, jika jarak (km) 10 km
3. Tentukan koefisien korelasi dan koefisien determinasi data tersebut serta
interpretasikan
4. Tentukan kesalahan baku taksiran yang diberikan oleh persamaan regresi tersebut.
5. Lakukan pengujian terhadap koefisien korelasi yang diperoleh.
PERBEDAAN ANALISIS REGRESI
DAN ANALISIS KORELASI

 Korelasi hanya menguji hubungan dua variabel secara kualitatif.


Seperti angka korelasi 0,9 adalah korelasi yang kuat. Namun
tidak dapat dikatakan bahwa angka korelasi 0,9 adalah dua kali
lebih kuat daripada angka korelasi 0,45. Analisis Korelasi hanya
menghasilkan angka dan bukan sebuah model. Kedudukan
variabel pada korelasi adalah setara.
 Sedangkan pada analisis regresi, justru akan dicari sebuah
angka yang akan ditaksir secara kuantitatif. Analisis regresi akan
menghasilkan sebuah persamaan regresi atau model regresi.
Kedudukan pada analisis regresi kedua variabel tidak setara,
sebuah variabel adalah dependen dan yang lainnya adalah
independen.

Anda mungkin juga menyukai