Anda di halaman 1dari 11

LECTURE NOTES

Statistics

Week 10
Simple Linear Regression

STAT6111 - Statistic
LEARNING OUTCOMES

1. Peserta diharapkan mampu mengaplikasikan metode statistika ke dalam masalah nyata.


2. Menganalisis keputusan yang sesuai dari penyelesaian metode statistika yang digunakan.

OUTLINE MATERI (Sub-Topic):


1. Analisis Korelasi
2. Analisis Regresi Linear Sederhana
3. Pengujian Parameter Model Regresi Linear Sederhana

STAT6111 - Statistic
ISI MATERI

1. Analisis Korelasi
Suatu teknik statistika yang digunakan untuk mengukur keeratan hubungan atau
korelasi antara dua variabel adalah analisis korelasi. Hubungan dua variabel ada yang positif
dan negatif. Hubungan X dan Y dikatakan positif apabila kenaikan X pada umumnya diikuti
oleh kenaikan Y, dan sebaliknya. Sebaliknya dikatakan negatif kalau kenaikan X pada
umumnya diikuti oleh penurunan Y, dan sebaliknya.

Hubungan Inflasi dan Suku Hubungan Produksi dan


2. Bunga (Korelasi Negatif) Harga Minyak Goreng
(Korelasi Positif)
3. 700
35
30 600
4. 25 500
20 400
15 5. 300
10 200
5 6. 100
0 0
2,01 9,35 12,55 10,33 7. 637 740 722 781 849 881
Inflasi Harga Minyak Goreng
8.

Sumber:
http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&uact=8&ved=0CC4QFjAC&url=http%3A%
2F%2Fwww.mdp.ac.id%2Fmateri%2F2013-2014-3%2Fsp246%2F002003%2Fsp246-002003-761-
28.doc&ei=S323VLWSK4yLuwSPt4GgBw&usg=AFQjCNH-nZvA5FS1Td4h0-MgY_jFgnbCOQ&bvm=bv.83640239,d.c2E

Jadi, kalau variabel X dan Y ada hubungan, maka bentuk diagram pencarnya adalah
mulus/teratur. Apabila bentuk diagram pencar tidak teratur, artinya kenaikan/penurunan X
pada umumnya tidak diikuti oleh naik turunnya Y, maka dikatakan X dan Y tidak berkorelasi.
Kuat dan tidaknya hubungan antara X dan Y dapat dinyatakan dengan fungsi linear
(paling tidak mendekati), diukur dengan suatu nilai yang disebut koefisien korelasi. Nilai
koefisien korelasi ini paling sedikit –1 dan paling besar 1. Jadi jika r = koefiaien korelasi,
maka r dapat dinyatakan sebagai berikut : -1 r  1.
Jika r =1, hubungan X dan Y sempurna dan positif, r = -1, hubungan X dan Y
sempurna dan negatif, r mendekati 1, hubungan sangat kuat dan positif, r mendekati –1,
hubungan sangat kuat dan negatif.
Di sini X dikatakan mempengaruhi Y, jika berubahnya nilai X akan menyebabkan
perubahan nilai Y.

STAT6111 - Statistic
Koefisien Determinasi
Naik turunnya Y adalah sedemikian rupa sehingga nilai Y bervariasi, tidak semata-
mata disebabkan oleh X, karena masih ada faktor lain yang menyebabkannya. Jadi untuk
mengetahui berapa besar kontribusi dari X terhadap naik turunnya nilai Y maka harus
dihitung dengan koefisien determinasi. Koefisien determinasi = (koefisien korelasi)2.

Cara Menghitung Koefisien Korelasi

x y
n n n
i i n X iYi   X i  Yi
r i 1
r i 1 i 1 i 1
n n

 xi2  yi2
2 2
n
 n  n
 n 
atau n X    X i 
i
2
 Yi    Yi 
2
i 1 i 1 i 1  i 1  i 1  i 1 

Kedua rumus diatas disebut koefisien korelasi Pearson.

Contoh 1:
Diberikan data tinggi (X) dalam cm dan berat (Y) dalam kg sebagai berikut :
X 12 10 14 11 12 9
Y 18 17 23 19 20 15
Hitung koefisien korelasi dan koefisien determinasi bagi kedua variabel tersebut serta berikan
penjelasan.

Jawab :
6 6 6 6 6

 xi  68 ,
i 1
 yi  112 ,
i 1
 xi yi  1292 ,
i 1
 x  7865,16 ,
i 1
2
i y
i 1
2
i  2128 , didapat

(6)(1292)  (68)(112)
r  0,947
(6)(786)  (68) 2 (6)(2128)  (112) 2

r2 = 0,897 artinya keragaman nilai variabel respon Y yang dapat dijelaskan oleh variabel
bebas X sebesar 89,7%.

STAT6111 - Statistic
2. Analisis Regresi Linear Sederhana
Dalam kehidupan sehari-hari seringkali kita ingin melihat hubungan antara dua
variabel, seperti hubungan antara panjang bayi dan bobot bayi, protein dan kadar
hemoglobin, tinggi badan dan berat badan, IQ anak dan nilai matematikanya. Umumnya
suatu variabel bersifat mempengaruhi variabel yang lainnya, variabel pertama disebut
variabel bebas (independent variable) sedangkan variabel yang kedua disebut variabel tak
bebas (dependent variable). Secara kuantitatif hubungan antara variabel bebas dan variabel
tak bebas dapat dimodelkan dalam suatu model matematik. Metode yang digunakan untuk
mencari pola hubungan fungsional antara satu variabel bebas (independen / prediktor / X)
dengan satu variabel tak bebas (dependen / respons / Y) adalah analisis regresi sederhana.
Model analisis regresi sederhana Y terhadap X adalah :
yi     xi   i
dengan yi = variabel respon ke-i
xi = variabel prediktor ke-i
 = parameter intersep
 = parameter slope (kemiringan)
i = error ke-i

Dengan menggunakan metode kuadrat terkecil (least square) persamaan regresi diatas dapat
diduga dengan :
yˆ i  a  bxi
dengan
n n

 ( xi  x )( yi  y ) x y i i  nx y
S xy
b i 1
n
 i 1
n

 (x x
S xx
i x ) 2 2
i  nx 2
i 1 i 1

a  y  bx

Contoh 2:
Hasil proses kimia diperkirakan merupakan fungsi jumlah katalisator yang ditambahkan pada
reaksi tersebut. Data yang didapat disajikan pada tabel berikut :

STAT6111 - Statistic
Hasil (%) : Y 60,5 63,9 63,8 60,2 66,7 71,7 70,8 65,7
Katalisator (lb) : X 0,9 1,4 1,6 1,7 1,8 2,0 2,1 2,3

Tentukan estimasi model regresi linier sederhana berdasarkan data sampel diatas!

Jawab :
Dalam kasus ini variabel respon Y adalah hasil (%), sedangkan variabel bebas X adalah
katalisator (lb). Berdasarkan data pada tabel, didapat :
8 8 8 8

 xi  13,8 ,
i 1
 yi  523,3 ,
i 1
 xi yi  911,58 ,
i 1
x
i 1
2
i  25,16

(8)(911,58)  (13,8)(523,3)
x  1,725 dan y  65,412 sehingga didapat b   6,559
(8)(25,16)  (13,8) 2
a = 65,412 - (6,56)(1,725) = 54,096

Didapat estimasi model regresi linier sederhana y  54,096  6,559 x

Contoh 3:
Suatu perusahaan perkebunan durian di kota A melakukan uji coba pemberian pupuk organik
dan diharapkan dapat mempengaruhi produksi durian. Selama uji coba pada tahun 2003 ,
diperoleh data sebagai berikut :
Jumlah Produksi Jumlah Pupuk
Durian (kilogram) : Y Organik (kilogram) : X

100 2
120 2
140 3
150 3
165 3
190 4
200 4
220 5

STAT6111 - Statistic
Tentukan garis regresi untuk data diatas.

Jawab :
Model matematika :
Yi  0  1 X i   i ; i = 1,2,…,8
dimana :
Yi : jumlah produksi durian

Xi : jumlah pupuk organik

0 , 1 : parameter
i : error , diasumsikan  i N 0, 2
 
Dari data kita peroleh :
8 8 8 n

 xi  26
i 1
;  yi  1285
i 1
;  xi yi  4465
i 1
; y
i 1
2
i  218.225

x
i 1
2
i  92 ; x  3, 25 ; y  160,625

Maka :

b1 
8 4465   26 1285  38,5
8 92    26 
2

b0  160,625  8 3, 25  35,5

Jadi garis regresinya adalah :


yˆ  35,5  38,5x

3. Pengujian Parameter Model Regresi Linear Sederhana


Pengujian parameter dalam model regresi bertujuan untuk mengetahui apakah
parameter tersebut telah menunjukkan hubungan yang nyata antara variabel prediktor dan
variabel respon. Selain itu juga untuk mengetahui kelayakan parameter dalam menerangkan
model. Terdapat dua tahap pengujian yaitu uji serentak (simultan) dan uji parsial (individu).

STAT6111 - Statistic
a. Uji serentak atau simultan (Draper and Smith, 1981; Kutner et al., 2004)
1. Hipotesis pengujian
H0 : β1 = β2 = ..... = βp = 0
H1 : minimal ada satu βi ≠ 0 ( i = 1, 2, ....., p)
dengan p adalah banyaknya variabel prediktor
2. Statistik uji
2 2

  Y 
  Y  Y 
n ^ n ^
MS Re gresi Y 
i i 
F 
i
dengan MS Re gresi  i 1 dan MSError  i 1 
MSError p 1 n p

3. Daerah penolakan
Tolak H0 jika F > Fα;(v1=p-1,v2=n-p) atau P-value < α.

b. Uji individu atau parsial (Draper and Smith, 1981; Kutner et al., 2004)
1. Hipotesis pengujian
H0 : βi = 0
H1 : βi ≠ 0 ( i = 0, 1, 2, ....., p )
2. Statistik uji
^
i b1  1
t 
 ^
sb1
stdev   i 
 

3. Daerah penolakan
Tolak H0 jika │t│> tα/2;df=n-p atau P-value < α.

Contoh 4:
Berdasarkan contoh 3, akan dilakukan pengujian parameter terhadap β1
H 0 : 1  0

H1 : 1  0
Pilih   0,05

8 92    26  8 218.225  1285


2 2

s 2
  1,0714 ; s 2
  1688,8393
8  8  1 8  8  1
x y

STAT6111 - Statistic
se2 
7
6
 2

1688,8393   38,5 1, 0714   117,55 ; sb1 
117,55
 7 1, 0714 
 3,825

Statistik uji :

b1  1 38,5  0
t   10, 065
sb1 3,825

Wilayah kritik :
t  t0,025;6 dan t  t0,025;6 ; t0,025;6  2, 447

Karena t  10,065  2, 447 maka H 0 ditolak pada   0,05

Kesimpulan :
Ada hubungan linier antara jumlah pupuk organik dengan hasil produksi durian.

STAT6111 - Statistic
SIMPULAN

Suatu teknik statistika yang digunakan untuk mengukur keeratan hubungan atau
korelasi antara dua variabel adalah analisis korelasi. Hubungan dua variabel ada yang positif
dan negatif. Hubungan X dan Y dikatakan positif apabila kenaikan X pada umumnya diikuti
oleh kenaikan Y, dan sebaliknya. Sebaliknya dikatakan negatif kalau kenaikan X pada
umumnya diikuti oleh penurunan Y, dan sebaliknya. Rumus untuk menghitung koefisien
korelasi adalah :

x y
n n n
i i n X iYi   X i  Yi
r i 1
atau r i 1 i 1 i 1
n n

 xi2  yi2
2 2
n
 n  n
 n 
n X    X i 
i
2
 Yi    Yi 
2
i 1 i 1 i 1  i 1  i 1  i 1 
Kedua rumus diatas disebut koefisien korelasi Pearson.

Analisis regresi mempelajari hubungan antara rerata semua Y yang berkaitan dengan
X tertentu. Dalam analisis regresi sederhana kita menganggap bahwa hubungan antara X dan
Y berbentuk garis lurus yaitu:
Y   0  1 X   ; dimana  merupakan suku galat yang bersifat acak.
Dengan metode kuadrat terkecil kita duga persamaan regresi tersebut berdasarkan data
berpasangan (Xi, Yi) i=1, 2, 3, ..., n. Adapun rumus dugaan dari koefisien regresi tersebut
adalah:
n X i Yi  ( X i )( Yi )
b1  , dan
n X i2  ( X i ) 2

b0  Y  b1 X .

Dari nilai dugaan koefisien regresi tersebut di atas didapatkan penduga garis regresi sebagai
berikut:
Yˆ  b0  b1 X .

STAT6111 - Statistic
DAFTAR PUSTAKA

1. Anderson, David R., Sweeney, Dennis J., Williams, Thomas A. (2011). Statistics for
Business and Economics. 11th Edition. Cengage Learning. USA. ISBN: 978-
0538481649.
2. Draper, N.R., and Smith, H. 1981. Applied Regression Analysis. Second Edition,
John Wiley & Sons, Inc.
3. Kutner, M.H., Nachtsheim, C.J., and Neter, J. 2004. Applied Linear Regression
Models. McGraw Hill International. New York.
4. http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=3&cad=rja&u
act=8&ved=0CC4QFjAC&url=http%3A%2F%2Fwww.mdp.ac.id%2Fmateri%2F201
3-2014-3%2Fsp246%2F002003%2Fsp246-002003-761-
28.doc&ei=S323VLWSK4yLuwSPt4GgBw&usg=AFQjCNH-nZvA5FS1Td4h0-
MgY_jFgnbCOQ&bvm=bv.83640239,d.c2E

STAT6111 - Statistic

Anda mungkin juga menyukai