Statistics
Week 10
Simple Linear Regression
STAT6111 - Statistic
LEARNING OUTCOMES
STAT6111 - Statistic
ISI MATERI
1. Analisis Korelasi
Suatu teknik statistika yang digunakan untuk mengukur keeratan hubungan atau
korelasi antara dua variabel adalah analisis korelasi. Hubungan dua variabel ada yang positif
dan negatif. Hubungan X dan Y dikatakan positif apabila kenaikan X pada umumnya diikuti
oleh kenaikan Y, dan sebaliknya. Sebaliknya dikatakan negatif kalau kenaikan X pada
umumnya diikuti oleh penurunan Y, dan sebaliknya.
Sumber:
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&uact=8&ved=0CC4QFjAC&url=http%3A%
2F%2Fwww.mdp.ac.id%2Fmateri%2F2013-2014-3%2Fsp246%2F002003%2Fsp246-002003-761-
28.doc&ei=S323VLWSK4yLuwSPt4GgBw&usg=AFQjCNH-nZvA5FS1Td4h0-MgY_jFgnbCOQ&bvm=bv.83640239,d.c2E
Jadi, kalau variabel X dan Y ada hubungan, maka bentuk diagram pencarnya adalah
mulus/teratur. Apabila bentuk diagram pencar tidak teratur, artinya kenaikan/penurunan X
pada umumnya tidak diikuti oleh naik turunnya Y, maka dikatakan X dan Y tidak berkorelasi.
Kuat dan tidaknya hubungan antara X dan Y dapat dinyatakan dengan fungsi linear
(paling tidak mendekati), diukur dengan suatu nilai yang disebut koefisien korelasi. Nilai
koefisien korelasi ini paling sedikit –1 dan paling besar 1. Jadi jika r = koefiaien korelasi,
maka r dapat dinyatakan sebagai berikut : -1 r 1.
Jika r =1, hubungan X dan Y sempurna dan positif, r = -1, hubungan X dan Y
sempurna dan negatif, r mendekati 1, hubungan sangat kuat dan positif, r mendekati –1,
hubungan sangat kuat dan negatif.
Di sini X dikatakan mempengaruhi Y, jika berubahnya nilai X akan menyebabkan
perubahan nilai Y.
STAT6111 - Statistic
Koefisien Determinasi
Naik turunnya Y adalah sedemikian rupa sehingga nilai Y bervariasi, tidak semata-
mata disebabkan oleh X, karena masih ada faktor lain yang menyebabkannya. Jadi untuk
mengetahui berapa besar kontribusi dari X terhadap naik turunnya nilai Y maka harus
dihitung dengan koefisien determinasi. Koefisien determinasi = (koefisien korelasi)2.
x y
n n n
i i n X iYi X i Yi
r i 1
r i 1 i 1 i 1
n n
xi2 yi2
2 2
n
n n
n
atau n X X i
i
2
Yi Yi
2
i 1 i 1 i 1 i 1 i 1 i 1
Contoh 1:
Diberikan data tinggi (X) dalam cm dan berat (Y) dalam kg sebagai berikut :
X 12 10 14 11 12 9
Y 18 17 23 19 20 15
Hitung koefisien korelasi dan koefisien determinasi bagi kedua variabel tersebut serta berikan
penjelasan.
Jawab :
6 6 6 6 6
xi 68 ,
i 1
yi 112 ,
i 1
xi yi 1292 ,
i 1
x 7865,16 ,
i 1
2
i y
i 1
2
i 2128 , didapat
(6)(1292) (68)(112)
r 0,947
(6)(786) (68) 2 (6)(2128) (112) 2
r2 = 0,897 artinya keragaman nilai variabel respon Y yang dapat dijelaskan oleh variabel
bebas X sebesar 89,7%.
STAT6111 - Statistic
2. Analisis Regresi Linear Sederhana
Dalam kehidupan sehari-hari seringkali kita ingin melihat hubungan antara dua
variabel, seperti hubungan antara panjang bayi dan bobot bayi, protein dan kadar
hemoglobin, tinggi badan dan berat badan, IQ anak dan nilai matematikanya. Umumnya
suatu variabel bersifat mempengaruhi variabel yang lainnya, variabel pertama disebut
variabel bebas (independent variable) sedangkan variabel yang kedua disebut variabel tak
bebas (dependent variable). Secara kuantitatif hubungan antara variabel bebas dan variabel
tak bebas dapat dimodelkan dalam suatu model matematik. Metode yang digunakan untuk
mencari pola hubungan fungsional antara satu variabel bebas (independen / prediktor / X)
dengan satu variabel tak bebas (dependen / respons / Y) adalah analisis regresi sederhana.
Model analisis regresi sederhana Y terhadap X adalah :
yi xi i
dengan yi = variabel respon ke-i
xi = variabel prediktor ke-i
= parameter intersep
= parameter slope (kemiringan)
i = error ke-i
Dengan menggunakan metode kuadrat terkecil (least square) persamaan regresi diatas dapat
diduga dengan :
yˆ i a bxi
dengan
n n
( xi x )( yi y ) x y i i nx y
S xy
b i 1
n
i 1
n
(x x
S xx
i x ) 2 2
i nx 2
i 1 i 1
a y bx
Contoh 2:
Hasil proses kimia diperkirakan merupakan fungsi jumlah katalisator yang ditambahkan pada
reaksi tersebut. Data yang didapat disajikan pada tabel berikut :
STAT6111 - Statistic
Hasil (%) : Y 60,5 63,9 63,8 60,2 66,7 71,7 70,8 65,7
Katalisator (lb) : X 0,9 1,4 1,6 1,7 1,8 2,0 2,1 2,3
Tentukan estimasi model regresi linier sederhana berdasarkan data sampel diatas!
Jawab :
Dalam kasus ini variabel respon Y adalah hasil (%), sedangkan variabel bebas X adalah
katalisator (lb). Berdasarkan data pada tabel, didapat :
8 8 8 8
xi 13,8 ,
i 1
yi 523,3 ,
i 1
xi yi 911,58 ,
i 1
x
i 1
2
i 25,16
(8)(911,58) (13,8)(523,3)
x 1,725 dan y 65,412 sehingga didapat b 6,559
(8)(25,16) (13,8) 2
a = 65,412 - (6,56)(1,725) = 54,096
Didapat estimasi model regresi linier sederhana y 54,096 6,559 x
Contoh 3:
Suatu perusahaan perkebunan durian di kota A melakukan uji coba pemberian pupuk organik
dan diharapkan dapat mempengaruhi produksi durian. Selama uji coba pada tahun 2003 ,
diperoleh data sebagai berikut :
Jumlah Produksi Jumlah Pupuk
Durian (kilogram) : Y Organik (kilogram) : X
100 2
120 2
140 3
150 3
165 3
190 4
200 4
220 5
STAT6111 - Statistic
Tentukan garis regresi untuk data diatas.
Jawab :
Model matematika :
Yi 0 1 X i i ; i = 1,2,…,8
dimana :
Yi : jumlah produksi durian
0 , 1 : parameter
i : error , diasumsikan i N 0, 2
Dari data kita peroleh :
8 8 8 n
xi 26
i 1
; yi 1285
i 1
; xi yi 4465
i 1
; y
i 1
2
i 218.225
x
i 1
2
i 92 ; x 3, 25 ; y 160,625
Maka :
b1
8 4465 26 1285 38,5
8 92 26
2
STAT6111 - Statistic
a. Uji serentak atau simultan (Draper and Smith, 1981; Kutner et al., 2004)
1. Hipotesis pengujian
H0 : β1 = β2 = ..... = βp = 0
H1 : minimal ada satu βi ≠ 0 ( i = 1, 2, ....., p)
dengan p adalah banyaknya variabel prediktor
2. Statistik uji
2 2
Y
Y Y
n ^ n ^
MS Re gresi Y
i i
F
i
dengan MS Re gresi i 1 dan MSError i 1
MSError p 1 n p
3. Daerah penolakan
Tolak H0 jika F > Fα;(v1=p-1,v2=n-p) atau P-value < α.
b. Uji individu atau parsial (Draper and Smith, 1981; Kutner et al., 2004)
1. Hipotesis pengujian
H0 : βi = 0
H1 : βi ≠ 0 ( i = 0, 1, 2, ....., p )
2. Statistik uji
^
i b1 1
t
^
sb1
stdev i
3. Daerah penolakan
Tolak H0 jika │t│> tα/2;df=n-p atau P-value < α.
Contoh 4:
Berdasarkan contoh 3, akan dilakukan pengujian parameter terhadap β1
H 0 : 1 0
H1 : 1 0
Pilih 0,05
s 2
1,0714 ; s 2
1688,8393
8 8 1 8 8 1
x y
STAT6111 - Statistic
se2
7
6
2
1688,8393 38,5 1, 0714 117,55 ; sb1
117,55
7 1, 0714
3,825
Statistik uji :
b1 1 38,5 0
t 10, 065
sb1 3,825
Wilayah kritik :
t t0,025;6 dan t t0,025;6 ; t0,025;6 2, 447
Kesimpulan :
Ada hubungan linier antara jumlah pupuk organik dengan hasil produksi durian.
STAT6111 - Statistic
SIMPULAN
Suatu teknik statistika yang digunakan untuk mengukur keeratan hubungan atau
korelasi antara dua variabel adalah analisis korelasi. Hubungan dua variabel ada yang positif
dan negatif. Hubungan X dan Y dikatakan positif apabila kenaikan X pada umumnya diikuti
oleh kenaikan Y, dan sebaliknya. Sebaliknya dikatakan negatif kalau kenaikan X pada
umumnya diikuti oleh penurunan Y, dan sebaliknya. Rumus untuk menghitung koefisien
korelasi adalah :
x y
n n n
i i n X iYi X i Yi
r i 1
atau r i 1 i 1 i 1
n n
xi2 yi2
2 2
n
n n
n
n X X i
i
2
Yi Yi
2
i 1 i 1 i 1 i 1 i 1 i 1
Kedua rumus diatas disebut koefisien korelasi Pearson.
Analisis regresi mempelajari hubungan antara rerata semua Y yang berkaitan dengan
X tertentu. Dalam analisis regresi sederhana kita menganggap bahwa hubungan antara X dan
Y berbentuk garis lurus yaitu:
Y 0 1 X ; dimana merupakan suku galat yang bersifat acak.
Dengan metode kuadrat terkecil kita duga persamaan regresi tersebut berdasarkan data
berpasangan (Xi, Yi) i=1, 2, 3, ..., n. Adapun rumus dugaan dari koefisien regresi tersebut
adalah:
n X i Yi ( X i )( Yi )
b1 , dan
n X i2 ( X i ) 2
b0 Y b1 X .
Dari nilai dugaan koefisien regresi tersebut di atas didapatkan penduga garis regresi sebagai
berikut:
Yˆ b0 b1 X .
STAT6111 - Statistic
DAFTAR PUSTAKA
1. Anderson, David R., Sweeney, Dennis J., Williams, Thomas A. (2011). Statistics for
Business and Economics. 11th Edition. Cengage Learning. USA. ISBN: 978-
0538481649.
2. Draper, N.R., and Smith, H. 1981. Applied Regression Analysis. Second Edition,
John Wiley & Sons, Inc.
3. Kutner, M.H., Nachtsheim, C.J., and Neter, J. 2004. Applied Linear Regression
Models. McGraw Hill International. New York.
4. http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&u
act=8&ved=0CC4QFjAC&url=http%3A%2F%2Fwww.mdp.ac.id%2Fmateri%2F201
3-2014-3%2Fsp246%2F002003%2Fsp246-002003-761-
28.doc&ei=S323VLWSK4yLuwSPt4GgBw&usg=AFQjCNH-nZvA5FS1Td4h0-
MgY_jFgnbCOQ&bvm=bv.83640239,d.c2E
STAT6111 - Statistic