Anda di halaman 1dari 13

MATERI PERTEMUAN OL-56

STATISTIK 2

UNIVERSITAS ESA UNGGUL


Dosen : Ir. Nixon Erzed MT

REGRESI DAN

KORELASI LINEAR SEDERHANA


REGRESI DAN KORELASI LINEAR SEDERHANA

Deskripsi umum
1. Regresi Linear Sederhana
Regresi merupakan suatu alat ukur yang juga digunakan untuk mengukur ada atau
tidaknya korelasi antarvariabelnya. Jika kita memiliki dua buah variabel atau lebih maka
sudah selayaknya apabila kita ingin mempelajari bagaimana variabel-variabel itu
berhubungan atau dapat diramalkan. Istilah regresi itu sendiri berarti ramalan atau
taksiran. Persamaan yang digunakan untuk mendapatkan garis regresi pada data
diagram pencar disebut persamaan regresi.
Analisis regresi mempelajari hubungan yang diperoleh dinyatakan dalam persamaan
matematika yang menyatakan hubungan fungsional antara variabel-variabel.
Hubungan fungsional antara satu variabel prediktor dengan satu variabel kriterium
disebut analisis regresi sederhana (tunggal), sedangkan hubungan fungsional yang
lebih dari satu variabel disebut analisis regresi ganda.
Jenis-jenis Persamaan Regresi :
a. Regresi Linear
- Regresi Linear Sederhana
- Regresi Linier Berganda
b. Regresi Nonlinier
- Regresi Eksponensial
Persamaan regresi linier dari Y terhadap X dirumuskan sebagai berikut:

Y=a+bX
Keterangan:

Y = variabel terikat
X = variabel bebas
a = intersep
b = koefisien regresi/slop

Regresi Linear Sederhana adalah Metode Statistik yang berfungsi untuk menguji sejauh
mana hubungan sebab akibat antara variabel faktor penyebab (X) terhadap variabel
akibatnya. Faktor penyebab pada umumnya dilambangkan dengan X atau disebut juga
dengan predictor sedangkan variabel akibat dilambangkan dengan Y atau disebut juga
dengan Response. Regresi Linear Sederhana atau sering disingkat dengan SLR
(Simple Linear Regression) juga merupakan satu diantara metode statistik yang
dipergunakan dalam produksi untuk melakukan peramalan ataupun prediksi tentang
karakteristik kualitas maupun kuantitas.
2. Korelasi Linear Sederhana
Korelasi adalah alat untuk mengukur kekuatan (kuat/tidaknya) hubungan antarvariabel.
Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi (hubungan) linear antara
dua variabel. Korelasi tidak menunjukkan hubungan fungsional atau dengan kata lain,
analisis korelasi tidak membedakan antara variabel dependen dengan variabel
independen.
Korelasi linear sederhana merupakan suatu teknik statistik yang digunakan untuk
mengukur kekuatan hubungan 2 variabel dan untuk dapat mengetahui bentuk
hubungan antara 2 variabel tersebut dengan hasil yang sifatnya kuantitatif. Kekuatan
hubungan antara 2 variabel yang dimaksud disini adalah hubungan tersebut erat,
lemah, atau tidak erat, sedangkan bentuk hubungannya adalah bentuk korelasi yang
linear positif ataupun linear negatif.
Koefisien korelasi sederhana disebut juga dengan koefisien korelasi Pearson karena
rumus perhitungan koefisien korelasi sederhana ini dikemukakan oleh Karl Pearson
yaitu seorang ahli Matematika yang berasal dari Inggris.
Rumus yang digunakan untuk menghitung koefisien korelasi sederhana adalah sebagai
berikut. Rumus ini disebut juga dengan Pearson Product Moment

nΣxy – (Σx) (Σy)


r=
√{nΣx² – (Σx)²} {nΣy2 – (Σy)2}

Keterangan :
n = Banyaknya Pasangan data X dan Y
Σx = Total Jumlah dari Variabel X
Σy = Total Jumlah dari Variabel Y
Σx2 = Kuadrat dari Total Jumlah Variabel X
Σy 2
= Kuadrat dari Total Jumlah Variabel Y
Σxy = Hasil Perkalian dari Total Jumlah Variabel X dan Variabel Y
ANALISIS REGRESI DAN KORELASI SEDERHANA

 Analisis regresi digunakan untuk mengetahui besarnya pengaruh satu variabel bebas atau
lebih terhadap satu variabel tidak bebas.
 Data yang dianalisis dengan regresi merupakan data kuantitatif yang memiliki skala
pengukuran minimal interval.
 Analisa korelasi digunakan untuk mengetahui keeratan hubungan dua variabel acak yang
memiliki skala pengukuran minimal interval dan berdistribusi normal bivariat.

ANALISIS REGRESI
 Tentukan dulu variabel bebas (independent variable) disimbolkan dengan X dan variabel
tidak bebas (dependent variable) disimbolkan Y
 Berdasarkan jumlah variabel bebas dan pangkat dari variabel bebas, analisa regresi terdiri
dari :

Regresi linear
sederhana

Regresi linear

Regresi linear multipel


(berganda)

Regresi
Regresi non linear
sederhana

Regresi non linear

Regresi non linear


multipel (berganda)

REGRESI LINEAR SEDERHANA

 Model persamaan regresi linear sederhana :


Y = α + βX + ε (model populasi)

Y = a + bX + e (model sampel)

a dan b adalah estimate value untuk α dan β

a adalah kontanta, secara grafik menunjukkan intersep

b adalah koefisien regresi yang menunjukkan besarnya pengaruh X terhadap Y, secara


grafik menunjukkan slope (kemiringan garis regresi).
 Jika data hasil observasi terhadap sampel acak berukuran n telah tersedia, maka untuk
mendapatkan persamaan regresi Y = a + bX, perlu dihitung a dan b dengan metode
kuadrat kekeliruan terkecil (least square error methods).
n n n
n X iYi   X i  Yi
b i 1 i 1 i 1
2
; a  Y  bX
n
  n
n X    X i 
i
2

i 1  i 1 

ANALISIS KORELASI

 Untuk menunjukkan besarnya keeratan hubungan antara dua variabel acak yang masing-
masing memiliki skala pengukuran minimal interval dan berdistribusi bivariat, digunakan
koefisien korelasi yang dirumuskan sebagai berikut:

𝑛 ∑𝑛𝑖=1 𝑋𝑖 𝑌𝑖 − ∑𝑛𝑖=1 𝑋𝑖 ∑𝑛𝑖=1 𝑌𝑖


𝑟𝑥𝑦 =
2 2
√𝑛 ∑𝑛𝑖=1 𝑋𝑖2 − (∑𝑛𝑖=1 𝑋𝑖 ) √𝑛 ∑𝑛𝑖=1 𝑌𝑖2 − (∑𝑛𝑖=1 𝑌𝑖 )

 Koefisien korelasi yang dirumuskan seperti itu disebut koefisien korelasi Pearson atau
koefisien korelasi product moment.
 Besar r adalah − 1 ≤ rxy ≤ + 1
 Tanda + menunjukkan pasangan X dan Y dengan arah yang sama, sedangkan tanda −
menunjukkan pasangan X dan Y dengan arah yang berlawanan.
 rxy yang besarnya semakin mendekati 1 menunjukkan hubungan X dan Y cenderung sangat
erat. Jika mendekati 0 hubungan X dan Y cenderung kurang kuat.
 rxy = 0 menunjukkan tidak terdapat hubungan antara X dan Y

INDEKS DETERMINASI (R2)

 Dalam analisis regresi, koefisien korelasi yang dihitung tidak untuk diartikan sebagai ukuran
keeratan hubungan variabel bebas (X) dan variabel tidak bebas (Y), sebab dalam analisis
regresi asumsi normal bivariat tidak terpenuhi.
 Untuk itu, dalam analisis regresi agar koefisien korelasi yang diperoleh dapat diartikan maka

dihitung indeks determinasinya, yaitu hasil kuadrat dari koefisien korelasi: R 2x y  (rx y ) 2
 Indeks determinasi yang diperoleh tersebut digunakan untuk menjelaskan persentase
variasi dalam variabel tidak bebas (Y) yang disebabkan oleh bervariasinya variabel bebas
(X). Hal ini untuk menunjukkan bahwa variasi dalam variabel tak bebas (Y) tidak semata-
mata disebabkan oleh bervariasinya variabel bebas (X), bisa saja variasi dalam variabel tak
bebas tersebut juga disebabkan oleh bervariasinya variabel bebas lainnya yang
mempengaruhi variabel tak bebas tetapi tidak dimasukkan dalam model persamaan
regresinya.
PENGUJIAN HIPOTESIS KOEFISIEN REGRESI LINEAR SEDERHANA

 Selanjutnya dilakukan pengujian hipotesis secara statistis terhadap koefisien regresi yang
diperoleh tersebut. Ada dua jenis pengujian yaitu uji t dan uji F.
 Uji t digunakan untuk menguji koefisien regesi secara individual atau untuk menguji ada
tidaknya pengaruh variabel bebas (X) terhadap variabel tidak bebas (Y).
 Uji F digunakan untuk menguji koefisien regresi secara simultan serentak atau untuk
menguji keberartian model regresi yang digunakan.

UJI t
 Hipotesis statistiknya:
Ho : β = 0 (X tidak berpengaruh terhadap Y)
H1 : β ≠ 0 (X berpengaruh terhadap Y)
b
 Statistik uji: t 
sb

se2
sb  n

x
i 1
2
i

e 2
i
se2  i 1
n2
2 
n n n


i 1
ei
2
 
i 1
yi
2
 b   xi2 
 i 1 

 Kriteria uji: Tolak H0 jika thit ≥ ttab atau thit ≤ ttab atau terima H0 jika ttab< thit < ttab

Dengan t tab  t 0.5;df n2

UJI F
 Hipotesis statistiknya:
Ho : β = 0 (model regresi Y terhadap X tidak berarti)
H1 : β ≠ 0 (model regresi Y terhadap X memiliki arti)
RJK reg
 Statistik uji: F 
RJK 
 n n

JK reg
 n  X i  Yi 
 b  X iYi   ; JK 
RJK reg  ; JK reg i 1 i 1
RJK  
1  i 1 n  n2
 
 

2
 n 
  Yi 
JK    Yi 2   i 1   JK reg
n

i 1 n

 Kriteria uji: Tolak H0 jika Fhit ≥ Ftab


Ftab = Fα(v1,v2) dimana v1 = 1 dan v2 = n  2
PENGUJIAN KOEFISEN KORELASI
 Hipotesis statistiknya:
Ho: ρXY = 0 (Tidak terdapat hubungan antara X dan Y)
H1: ρXY ≠ 0 (Terdapat hubungan antara X dan Y)

𝑟√𝑛−2
 Statistik uji: 𝑡 =
√1−𝑟 2

 Kriteria uji: Tolak H0 jika thit ≥ ttab atau thit ≤ ttab atau terima H0 jika ttab< thit < ttab

Dengan t tab  t 0.5;df n2

CONTOH SOAL ANALISIS REGRESI LINEAR SEDERHANA

 Tabel berikut adalah hasil observasi terhadap sampel acak yang terdiri dari 8 desa di kota
“Alfabet” mengenai pendapatan dan pengeluaran kesehatan penduduk desa bersangkutan
selama tahun 2010.

Pendapatan Peng Kesehatan


Desa
(juta rupiah) (juta rupiah)
A 21 4
B 15 3
C 15 3.5
D 9 2
E 12 3
F 18 3.5
G 6 2.5
H 12 2.5

(a). Dengan menggunakan least square error methods, tentukan persamaan regresi linear
sederhana pengeluaran kesehatan terhadap pendapatan. Kemudian jelaskan arti
koefisien yang terdapat dalam persamaan tersebut.
(b). Berapakah rata-rata pengeluaran kesehatan penduduk suatu desa yang memiliki rata-
rata pendapatan penduduknya sebesar Rp 25 juta per tahun.
(c). Hitung indeks determinasinya, kemudian jelaskan artinya.
(d). Lakukan uji t dan uji F dengan menggunakan α = 5%, bagaimana kesimpulan dari kedua
pengujian koefisien regresi tersebut.
CONTOH SOAL ANALISIS KORELASI
Tabel berikut menunjukkan hasil pengamatan terhadap sampel acak yang terdiri dari 15 usaha
kecil di suatu kecamatan mengenai omzet penjualan dan laba (dalam juta rupiah).

Omzet
Obs Laba
Penjualan
1 34 32
2 38 36
3 34 31
4 40 38
5 30 29
6 40 35
7 40 33
8 34 30
9 35 32
10 39 36
11 33 31
12 32 31
13 42 36
14 40 37
15 42 35

a. Hitunglah koefisien korelasi Pearson


b. Ujilah koefisien korelasi yg diperoleh dalam a) dengan menggunakan level of signifikans α = 1%

INDEKS DETERMINASI
 Dalam analisis regresi, koefisien korelasi yang dihitung tidak untuk diartikan sebagai ukuran
keeratan hubungan variabel bebas (X) dan variabel tidak bebas (Y), sebab dalam analisis
regresi asumsi normal bivariat tidak terpenuhi.
 Asumsi dalam analisis regresi berkaitan dengan distribusi probabilitas dari kekeliruan (e),
dalam hal ini variabel acak (e) diasumsikan berdistribusi normal. Dalam analisis regresi,
variabel bebas (X) merupakan fixed variable, sedangkan variabel bebas (Y) merupakan
variabel acak, sehingga uji kenormalan dalam analisis regresi dapat dilakukan terhadap Y,
mengingat e adalah variabel acak yang unobservable. Jadi dalam analisis regresi, asumsi
distribusi normal berkaitan dengan variabel acak Y semata-mata, sehingga asumsi
kenormalan merupakan distribusi normal univariat.
 Untuk itu, dalam analisis regresi agar koefisien korelasi yang diperoleh diartikan dalam

bentuk ukuran determinasi, yaitu hasil kuadrat dari koefisien korelasi: R 2x y  (rx y ) 2
 Indeks determinasi yang diperoleh tersebut digunakan untuk menjelaskan persentase variasi
dalam variabel tidak bebas (Y) yang disebabkan oleh bervariasinya variabel bebas (X). Hal ini
untuk menunjukkan bahwa variasi dalam variabel tak bebas (Y) tidak semata-mata disebabkan
oleh bervariasinya variabel bebas (X), bisa saja variasi dalam variabel tak bebas tersebut juga
disebabkan oleh bervariasinya variabel bebas lainnya yang mempengaruhi variabel tak bebas
tetapi tidak dimasukkan dalam model persamaan regresinya.
CONTOH SOAL REGRESI LINEAR SEDERHANA

Hubungan antara kompetensi (X) dan kinerja pegawai (Y) kita ambil sampel acak 15 0rang
pegawai sebagai berikut:

𝑿 𝒀
40 4
55 16
32 12
55 24
50 15
52 24
61 22
44 17
30 4
22 14
40 24
64 26
58 20
48 9
44 14

Akan ditentukan persamaan regresi 𝑌 𝑎𝑡𝑎𝑠 𝑋 maka didapat:

𝑿 𝒀 𝑿𝟐 𝑿𝒀
22 14 484 308
30 4 900 120
32 12 1024 384
40 4 1600 160
40 24 1600 960
44 17 1936 748
44 14 1936 616
48 9 2304 432
50 15 2500 750
52 24 2704 1248
55 16 3025 880
55 24 3025 1320
58 20 3364 1160
61 22 3721 1342
64 26 4096 1664
695 245 34219 12092

dari rumus XIV(6) kita peroleh harga-harga :

(∑ 𝑌)(∑ 𝑋 2 ) − (∑ 𝑋)(∑ 𝑋𝑌)


𝑎=
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2
(245)(34219) − (695)(12092)
𝑎=
15(34219) − (695)2
8383655 − 8403940
𝑎=
513285 − 483025

𝑎 = −0,670

𝑛 ∑ 𝑋𝑌 − (∑ 𝑋)(∑ 𝑌)
𝑏=
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2

15(12092) − (695)(245)
𝑏=
15(34219) − (695)2

181380 − 170275
𝑏=
513285 − 483025

𝑏 = 0,367

Dengan demikian, persamaan regresi linear 𝑌 atas 𝑋 untuk soal diatas adalah: 𝑌̂ = +𝑏𝑋

𝑌̂ = −0,67 + 0,367𝑋

PENCARIAN REGRESI LINEAR SEDERHANA 𝑌 𝐴𝑇𝐴𝑆 𝑋 𝐷𝐸𝑁𝐺𝐴𝑁 𝑀𝐸𝑁𝐺𝐺𝑈𝑁𝐴𝐾𝐴𝑁 𝑆𝑃𝑆𝑆


Coefficientsa

Unstandardized Standardized
Coefficients Coefficients

Model B Std. Error Beta t Sig.

1 (Constant) -.670 6.142 -.109 .915

kompetensi .367 .129 .621 2.854 .014

a. Dependent Variable: pegawai

Contoh Penggunaan Analisis Korelasi di Produksi :

1. Apakah ada hubungan antara suhu ruangan dengan jumlah cacat Produksi?
2. Apakah ada hubungan antara lamanya waktu kerusakan mesin dengan jumlah cacat
produksi?
3. Apakah ada hubungan antara jumlah Jam lembur dengan tingkat absensi?

Contoh Kasus Analisis Korelasi Sederhana :

Seorang Engineer ingin mempelajari apakah adanya pengaruh Suhu Ruangan terhadap
Jumlah Cacat yang dihasilkan dan juga ingin mengetahui keeratan serta bentuk hubungan
antara dua variabel tersebut. Engineer tersebut kemudian mengambil data selama 30 hari
terhadap rata-rata (mean) suhu ruangan dan Jumlah Cacat Produksi seperti dibawah ini :
Tanggal Rata-rata Suhu Ruangan Jumlah Cacat
1 24 10
2 22 5
3 21 6
4 20 3
5 22 6
6 19 4
7 20 5
8 23 9
9 24 11
10 25 13
11 21 7
12 20 4
13 20 6
14 19 3
15 25 12
16 27 13
17 28 16
18 25 12
19 26 14
20 24 12
21 27 16
22 23 9
23 24 13
24 23 11
25 22 7
26 21 5
27 26 12
28 25 11
29 26 13
30 27 14

Penyelesaian :

Pertama-tama hitunglah X², Y², XY dan totalnya seperti tabel dibawah ini :

Rata-rata
Jumlah
Tanggal Suhu X2 Y2 XY
Cacat (Y)
Ruangan (X)
1 24 10 576 100 240
2 22 5 484 25 110
3 21 6 441 36 126
4 20 3 400 9 60
5 22 6 484 36 132
6 19 4 361 16 76
7 20 5 400 25 100
8 23 9 529 81 207
9 24 11 576 121 264
10 25 13 625 169 325
11 21 7 441 49 147
12 20 4 400 16 80
13 20 6 400 36 120
14 19 3 361 9 57
15 25 12 625 144 300
16 27 13 729 169 351
17 28 16 784 256 448
18 25 12 625 144 300
19 26 14 676 196 364
20 24 12 576 144 288
21 27 16 729 256 432
22 23 9 529 81 207
23 24 13 576 169 312
24 23 11 529 121 253
25 22 7 484 49 154
26 21 5 441 25 105
27 26 12 676 144 312
28 25 11 625 121 275
29 26 13 676 169 338
30 27 14 729 196 378
Total 699 282 16487 3112 6861

Kemudian hitunglah Koefisien Korelasi berdasarkan rumus korelasi dibawah ini :

r= nΣxy – (Σx) (Σy)


. √{nΣx² – (Σx)²} {nΣy2 – (Σy)2}

r= (30. 6861) – (699) (282)


. √{30. 16487 – (699)²} {30 .3112 – (282)2}

r= (205830) – (197118)
. √{494610 – 488601} {93360 – 75924}

r= 8712
. 9118.13

r = 0.955

Jadi Koefisien Korelasi antara Suhu Ruangan dan Jumlah Cacat Produksi adalah 0.955,
berarti kedua variabel tersebut memiliki hubungan yang ERAT dan bentuk hubungannya
adalah Linear Positif.

Jika Hubungan Suhu Ruangan dan Jumlah Cacat Produksi dibuat dalam bentuk Scatter
Diagram (Diagram Tebar), maka bentuknya akan seperti dibawah ini :
Analisis Korelasi (Correlation Analysis) juga merupakan salah satu alat (tool) yang digunakan
dalam Metodologi Six Sigma di Tahap Analisis.

Anda mungkin juga menyukai