Regresi adalah pengukur hubungan dua variabel atau lebih yang dinyatakan
dengan bentuk hubungan atau fungsi. Untuk menentukan bentuk hubungan
(regresi) diperlukan pemisahan yang tegas antara variabel bebas yang sering diberi
simbul X dan variabel tak bebas dengan simbul Y. Pada regresi harus ada variabel
yang ditentukan dan variabel yang menentukan atau dengan kata lain adanya
ketergantungan variabel yang satu dengan variabel yang lainnya dan sebaliknya.
Kedua variabel biasanya bersifat kausal atau mempunyai hubungan sebab akibat
yaitu saling berpengaruh. Sehingga dengan demikian, regresi merupakan bentuk
fungsi tertentu antara variabel tak bebas Y dengan variabel bebas X atau dapat
dinyatakan bahwa regresi adalah sebagai suatu fungsi Y = f(X). Bentuk regresi
tergantung pada fungsi yang menunjangnya atau tergantung pada persamaannya.
2.
Korelasi adalah pengukur hubungan dua variabel atau lebih yang dinyatakan
dengan derajat keeratan atau tingkat hubungan antarvariabel-variabel. Mengukur
derajat hubungan dengan metode korelasi yaitu dengan koefisien korelasi r. Dalam
hal ini, dengan tegas dinyatakan bahwa dalam analisis korelasi tidak
mempersoalkan apakah variabel yang satu tergantung pada variabel yang lain atau
sebaliknya. Jadi metode korelasi dapat dipakai untuk mengukur derajat hubungn
antarvariabel bebas dengan variabel bebas yang lainnya atau antar fua variabel.
Selain contoh di atas, masih banyak lagi contoh yang lain yang serupa. Dari contohcontoh di atas dapat dilakukan pendekatan yang sesuai seperti: analisis regresi dapat
dipakai pada contoh-contoh nomer: 1; 2; 3; 5; dan 9. Sedangkan, analisis korelasi dapat
dipakai pada semua contoh di atas.
2.3.1
Regresi linier.
Regresi linier ialah bentuk hubungan di mana variabel bebas X maupun variabel
tergantung Y sebagai faktor yang berpangkat satu.
Regresi linier ini dibedakan menjadi:
1). Regresi linier sederhana dengan bentuk fungsi: Y = a + bX + e,
2). Regresi linier berganda dengan bentuk fungsi: Y = b0 + b1X1 + . . . + bpXp + e
Dari kedua fungsi di atas 1) dan 2); masing-masing berbentuk garis lurus (linier
sederhana) dan bidang datar (linier berganda).
2.3.2
Regresi non linier ialah bentuk hubungan atau fungsi di mana variabel bebas X dan atau
variabel tak bebas Y dapat berfungsi sebagai faktor atau variabel dengan pangkat
tertentu. Selain itu, variabel bebas X dan atau variabel tak bebas Y dapat berfungsi
sebagai penyebut (fungsi pecahan), maupun variabel X dan atau variabel Y dapat
berfungsi sebagai pangkat fungsi eksponen = fungsi perpangkatan.
Y = a + bX + cX (fungsi kuadratik).
2
Y = a + bX + cX + bX (fungsi kubik)
2
Y = a + bX + cX + dX + eX (fungsi kuartik),
5
Y = a + bX + cX
Y = a + bX + cX
(3/2)
+ dX
, atau
Y = a + bX + cX + dX .
Dari contoh-contoh tersebut di atas perhatikan pangkat dari variabel bebas X.
2).
atau
= a + b/X.
4).
bX
atau
bX
10 .
a + becX, ini disebut kurva logistik atau "tipe umum dari model
pertumbuhan".
Y = e
, disebut dengan transformasi logaritmik resiprokal, yang umum
disebut dengan model Gompertz.
5). Regresi logaritmik. Bentuk fungsi dari regresi adalah: di mana variabel bebas Y
berfungsi sebagai pangkat (eksponen) dan variabel bebas X mempunyai bentuk
perpangkatan.
Model regresi ini adalah:
Y
e = a+b
2.4 K o r e l a s i
Pembicaraan mengenai keeratan hubungan atau korelasi yang diukur dengan tingkat
atau derajat keeratan hubungan. Tingkat atau derajat keeratan hubungan dapat diukur
dengan memakai, koefisien korelasi dengan simbul r untuk bubungan linier sederhana
dan indeks korelasi dengan simbul R untuk hubungan bukan linier sederhana. Koefisien
korelasi r dipakai hanya untuk menyatakan keeratan hubungan yang bersifat linier
sederhana, sedangkan indeks korelasi R untuk menyatakan keeratan hubungan dari
bentuk-bentuk linier berganda dan bentuk non linier. Indeks korelasi R sering disebut
juga koefisien korelasi berganda. Selain koefisien korelasi sederhana r, dan indeks
korelasi R, terdapat juga modifikasi atau fraksi dari R, yang disebut dengan
koefisien korelasi parsiil, korelasi rank, korelasi serial, dan korelasi biserial, korelasi
kotingensi, dan korelasi kanonikal.
2
Apabila r dan R, jika dikuadratkan akan memberikan suatu nilai tertentu yaitu r atau R
2
2
2
yang kadang-kadang nilai r atau R keduanya diberi simbul yang sama yaitu R atau D.
2
Kedua nilai D atau R disebut koefisien determinasi atau koefisien penentu atau indeks
penentu. Selanjutnya, mengenai korelasi dan modifikasinya akan dibicarakan tersendiri
setelah pembicaraan regresi.
Perlu ditekankan lebih luas bahwa hubungan dapat dibuat regresinya, demikian pula,
tidak semua variabel atau gejala-gejala alam dapat dicari korelasinya. Oleh karena itu,
agar lebih berhati-hati dalam menggunakan alat statistika ini di dalam penarikan
kesimpulan, lebih-lebih membuat suatu keputusan yang lebih jauh.
Akan tetapi, yang jelas bahwa kedua alat ukur tersebut di atas dapat memberikan
sumbangan atau pandangan yang lebih jauh terhadap masalah yang dihadapi, karena
terutama analisis regresi mempunyai daya ramal atau daya taksir yang menyakinkan
apabila diuji dengan taraf nyata yang peka atau jitu. Dan inilah yang merupakan tujuan
pembicaraan yang pokok pada analisis regresi dan korelasi selanjutnya.
2.5
Telah dijelaskan di muka bahwa regresi adalah membicarakan bentuk hubungan atau
fungsi antara dua variabel atau lebih. Perlu ditekankan bahwa dalam bentuk hubungan
tersebut terdapat sebuah variabel tak bebas Y, dengan sekurang-kurangnya sebuah
variabel bebas X. Untuk mendapatkan bentuk hubungan yang sesuai antara variabel
bebas X dengan variabel tak bebas Y maka kedua variabel tersebut harus dinyatakan
dalam nilai yang terukur atau kuantitatif sekurang-kurangnya dengan skala interval.
10
2.5.1
Bentuk hubungan yang paling sederhana antara variabel X dengan variabel Y adalah
berbentuk garis lurus atau berbentuk hubungan linier yang disebut dengan regresi linier
sederhana atau sering disebut regresi linier saja dengan persamaan matematikanya
adalah sebagai berikut:
[2.1].
Y = A + BX
Apabila A dan B mengambil nilai seperti: A = 0 dan B = 1,persamaan [2.1] akan menjadi:
[2.2].
Y = X
Persamaan [2.2] adalah suatu bentuk persamaan yang paling sederhana dari regresi
linier sederhana. Dari persamaan [2.1] A dan B disebut konstanta atau koefisien regresi
linier sederhana atau parameter garis regresi linier sederhana. A disebut intercept
coefficient atau intersep yaitu jarak titik asal atau titik acuan dengan titik potong garis
regresi dengan sumbu Y; dan B disebut slope coefficient atau slup yang menyatakan
atau menunjukkan kemiringan atau kecondongan garis regresi terhadap sumbu X. Dari
persamaan garis regresi [2.1] di atas, dalam hubungan tersebut terdapat satu variabel
bebas X dan satu variabel tak bebas Y.
Sebagai ilustrasi hubungan antara variabel bebas X dan variabel tak bebas Y diberikan
contoh dari persamaan [2.1] yaitu pengaruh tingkat pendapatan dengan konsumsi
makanan bagi petani pedesaan, seperti pada Tabel 2.1 berikut ini.
11
Tabel 2.1.
No.
Pendapatan
125
150
175
200
225
1
2
3
4
5
Konsumsi
75
100
125
135
150
125
100
75
50
25
0
100
125
150
175
200
225
250
Pendapatan (X)
12
2.5.3
Untuk menentukan garis regresi berdasarkan pasangan-pasangan nilai X,Y diberikan dua
metode yang umum yaitu:
1).
Metode tangan bebas. Metode tangan bebas merupakan suatu metode yang
berdasarkan kira-kira dari diagram titik atau diagram pencar atau scatter diagram
yang diperoleh dari hasil pengamatan antara variabel X dan variabel Y. Diagram
pencar didapatkan dengan menggambar titik-titik pasangan pengamatan antara X
dan Y atau X,Y pada suatu sistem salib sumbu atau sistem koordinat. Dengan
memperhatikan letak titik-titik pasangan pada absis X dan ordinat Y, maka
kumpulan titik-titik tersebut dapat memberi petunjuk untuk memperkirakan garis
regresi yang akan dibuat. Metode ini hanya dapat dilakukan oleh seorang ahli dan
berpengalaman seperti pada Gambar 2.2.
2).
Jika pencaran atau sebaran titik pasangan X,Y tersebut disekitar garis lurus, maka cukup
beralasan untuk menduganya dengan persamaan regresi linier sederhana atau regresi
garis lurus. Dilain pihak, jika sebaran titik-titik pasangan X,Y tersebut bukan linier, tetapi
melengkung atau non linier yang paling menghampiri. Untuk hal tersebut dan
menentukan analisis dan gambarnya dapat dilihat bentuk-bentuk hubungan pada bukubuku matematika. Bentuk mana yang paling sesuai atau paling dihampiri oleh titik-titik
pasangan tersebut.
Untuk pendekatan linier atau regresi linier sederhana, perhatikan diagram pencar berikut
yang berasal dari Tabel 2.1 di muka antara tingkat pendapatan (X) dengan konsumsi (Y)
diambil sebagaian saja seperti pada Tabel 2.2.
Tabel 2.2.
No.
Pendapatan
Konsumsi
125
75
150
100
Sehingga garis regresi linier yang dapat dibuat dari Tabel 2.2 seperti pada Gambar 2.2
berikut. Garis regresi yang melalui dua buah titik pengamatan P dan Q, di mana
kedudukan kedua titik tersebut adalah bebas atau sembarang pada garis regresi yang
melewati. Maka dapat dibuat persamaannya dengan menggunakan dua buah titik.
Dasar teori, melalui dua buah titik dapat dibuat sebuah garis lurus yaitu PQ yang akan
dicari persamaannya.
Perhatikan sudut yang sisi-sisi siku-sikunya adalah Y = Y2 - Y1 dan X = X2 - X1
sehingga tangen sudut = Y/X, maka persamaan garis PQ menjadi: Y = A + X.
Dari persamaan tersebut dengan penyelesaian matematika sehingga akan didapatkan
bentuk persamaan liniernya seperti persamaan [2.1].
13
125
Q
100
Konsunsi
75
50
25
0
120
Y = Y2-Y1
X = X2 - X1
Y2
140
X2
Y1
X1
160
Pendapatan
2.6
Adalah tidak mungkin untuk memperkirakan bentuk hubungan antara dua variabel atau
lebih tanpa diawali dengan membuat asumsi terlebih dahulu. Dalam beberapa hal
dimungkinkan untuk mengecek atau menguji asumsi atau hipotesis setelah bentuk
hubungan itu diperkirakan.
Suatu bentuk hubungan atau fungsi linier atau regresi linier di samping mudah
interprestasinya, juga dapat dipergunakan sebagai pendekatan bentuk hubungan yang
bukan linier (non linier) menjadi bentuk linier. Fungsi linier sama dengan persamaan
linier atau model linier atau regresi linier yang mempunyai bentuk hubungan atau bentuk
fungsi: Y = A + BX. Seperti pada persamaan [2.1] A dan B adalah konstanta, yaitu
parameter yang digunakan. A ialah: jarak titik acuan (0, 0) dengan perpotongan antara
sumbu tegak Y dengan garis linier atau besarnya nilai variabel Y, apabila nilai X = 0.
A sering disebut intersep atau intercept coefficient dan B ialah: koefisien arah adalah
koefisien garis regresi yang sama dengan tangen arah yang menunjukkan besarnya
pengaruh perubahan X terhadap perubah Y yaitu apabila variabel X naik atau turun atau
berubah satu unit satuan X, maka variabel Y bertambah atau menurun atau
berubah sebanyak B kali. B sering disebut kemiringan atau kecondongan garis
regresi atau slope atau slope coefficient adalah tangen sudut yang dibuat oleh garis
regresi dengan sumbu X.
Perhatika Gambar 2.3 di bawah ini, yang menunjukkan garis-garis regresi linier dari
beberapa pengamatan.
Oleh karena dalam pembicaraan ini hendak berusaha mencari cara untuk menentukan
persamaan garis regresi linier sederhana yang baik atau yang terbaik. Untuk itu haruslah
terlebih dahulu mengetahui apa yang dimaksud dengan garis regresi yang baik. Suatu
pertanyaan yang berhubungan dengan hal tersebut di atas adalah: "Kapankah suatu
garis regresi dapat dikatakan sebagai garis regresi yang baik?".
Dengan demikian kembali ke Gambar 2.3 di atas yang manakah dari ketiga garis
tersebut termasuk garis regresi yang terbaik, yang dipakai untuk menghampiri titik-titik P,
Q dan R. Apabila ada garis tertentu selain ketiga garis YPQ, YPR, dan YQR
yang merupakan garis regresi terbaik sebagai penghampir titik-titik pasangan
pengamatan Xi,Yi sebagai garis regresi tersebut.
14
150
R
Konsunsi
125
100
75
=+X
50
25
0
120
140
160
Pendapatan
Gambar 2.3. Penggambaran Regresi Penduga = + X
Sebuah garis dikatakan sebagai garis regresi terbaik yang disebut dengan garis regresi
penduga diberi simbul dengan: (dibaca Y topi atau Y cup atau Y penduga).
Sehingga garis regresi linier sederhana dengan persamaan penduga menjadi :
[2.3a]. = + X
[2.3b]. = 0 + 1 X
atau
untuk populasi
[2.3c]. = 1 + 2 X
[2.4a]. = a + b X
[2.4b]. = b0 + b1 X
atau
untuk sampel
[2.4c]. = b1 + b2 X
Suatu hal yang harus dipahami bahwa dalam pendugaan garis regresi, besarnya nilai
variabel tak bebas Y, tidak hanya tergantung pada variabel bebas X saja, tetapi ada
faktor-faktor lain yang ikut mempengaruhi. Faktor-faktor tersebut secara keseluruhan
dinamakan kesalahan pengganggu (disturbance error) yang diberi simbul dengan e.
Kadang-kadang nilai e diartikan faktor-faktor tertentu yang belum diketahui penyebabnya
atau faktor-faktor yang belum dijelaskan.
Faktor-faktor tersebut yang dapat terdiri atas: salah hitung, salah catat, salah ukur, alat
kurang sempurna, dan nilai-nilai kebetulan, serta banyak lagi nilai-nilai yang lainnya.
Kesalahan pengganggu e tersebut menyebabkan ramalan menjadi kurang tepat terhadap
garis regresi penduga seperti:
[2.5].
= A + BX
untuk populasi
Jadi kesalahan e tersebut dapat mengakibatkan adanya resiko. Oleh karena itu, resiko
tersebut hendaknya dibuat sekecil-kecilnya atau minimal. Untuk melakukan dugaan atau
membuat keputusan selalu ada resiko walaupun betapa kecilnya.
15
Karena dalam suatu pendugaan nilai A dan B tidak dapat dihitung (belum diketahui
nilainya), biasanya ditaksir dengan nilai a dan b atau dengan nilai b0 dan b1; sehingga
garis regresi linier penduga mempunyai bentuk persamaan:
[2.6].
= b0 + b1 X
untuk sampel
atau
[2.7b]. e = Yi -
Untuk sejumlah n pasangan pengamatan, maka penulisannya menjadi seperti:
[2.8].
ei = Yi - (b0 + b1 X)
Nilai e sebagai penduga nilai kesalahan E adalah kesalahan penggangu populasi dan e
adalah kesalahan penganggu sampel.
Nilai e dapat berharga positif bila nilai pengamatan Yi berada di atas garis penduga ;
dapat berharga negatif bila nilai pengamatan Yi berada di bawah garis penduga ; dan
dapat pula berharga nol bila nilai pengamatan Yi berada tepat pada garis penduga .
Seperti yang ditunjukkan pada Gambar 2.3 dengan menggambar scatter diagram dengan
, Yi, dan ei.
150
(+) e3
Konsumsi
125
100
75
e2 (-)
50
25
Y2
e1
(+
0
120
130
140
150
160
Pendapatan
Gambar 2.3. Nilai Penduga , Nilai Pengamatan Yi, dan Nilai
Kesalahan Penganggu ei
16
2.7
Ada beberapa cara pendekatan matematika untuk mendapatkan garis regresi penduga
yang terbaik seperti:
1. Garis penduga menjadi garis regresi terbaik apabila jumlah semua kesalahan adalah
minimal ditulis dengan: ei = minimal atau ( Yi - ) = minimal. Sesuai dengan
teori aljabar maka akibatnya ei sama dengan nol (minimal), sebab nilai negatif
mengkompen nilai positif, seperti yang ditunjukkan pada Gambar 2.4.
2. Garis penduga merupakan garis regresi yang terbaik, apabila jumlah harga mutlak
dari nilai kesalahan atau e adalah minimal. Cara ini lebih baik dari cara pertama
sebab tidak ada saling kompensasi antara nilai ei yang negatif dengan positif.
3. Garis penduga merupakan garis regresi yang terbaik, apabila jumlah pangkat
dua (kuadrat) nilai kesalahan-kesalahan (ei) adalah minimal atau ditulis dengan
2
rumus: e i = 0.
Cara pendekatan terakhir disebut dengan Metode Kuadrat Terkecil atau dengan
Least Squares Methods. Sampai sekarang metode kuadrat terkecil ini adalah suatu
metode yang paling ampuh pada perhitungan untuk menduga suatu garis regresi yang
terbaik dibandingkan dengan metode-metode yang lainnya. Mengapa metode kuadrat
terkecil, disebut metode yang terbaik bagi penduga garis regresi linier sederhana?. Di
antaranya terdapat suatu teorema dari GaussMarkov yang berbunyi sebagai berikut:
Di antara penaksir-penaksir linier tak bias bagi parameter-parameter A dan B, di mana
Y = A + BX + E, penaksir pangkat dua terkecil (metode kuadrat terkecil) yang
mempunyai ragam paling kecil.
2).
3).
4).
Selain teori kuadrat terkecil, ada suatu teori Maximum Like Lihood Estimation
yang kedua-duanya membuktikan bahwa meminimalkan kesalahan ei
merupakan estimasi atau penaksiran yang terbaik.
Suatu syarat penaksir garis atau garis penduga yang terbaik, di samping mempunyai nilai
ragam galat atau ragam kesalahan atau ragam residu atau ragam sisa yang terkecil,
tetapi harus memenuhi juga syarat-syarat yang lain yaitu:
1).
Model regresi atau bentuk fungsi yang dipakai haruslah mendekati titik-titik
pasangan X,Y; dan harus betul-betul tepat atau cocok; hal ini akan dibicarakan
pada uji kecocokan garis regresi penduga.
2).
17
Manipulasi matematis dari metode kuadrat terkecil akan menghasilkan koefisien a dan b.
Perhatikan pertanyaan matematis dari persamaan [2.7b] yang ditulis kembali seperti:
[2.9].
ei = Yi -
dapat ditulis:
Secara matematis ei minimal dapat dinyatakan dengan teori defrensial bahwa turunan
2
pertama dari: ei terhadap b0 dan terhadap b1 haruslah sama dengan nol atau dapat
2
ditulis: ei / bi = 0.
2
[2.14]. Yi Xi - b0 Xi - b1 Xi = 0
Persamaan-persamaan [2.13] dan [2.14] di atas disebut dengan persamaan normal.
Persamaan (2.13) disebut dengan persamaan Normal 1.
Persamaan (2.14) disebut dengan persamaan Normal 2.
Perhatikan pengali dari setiap penaksir-penaksir yang berhubungan koefisien regresi
seperti b0 dan b1 Apabila syarat-syarat dalam meminimalkan G dipenuhi, maka sistem
persamaan normal dari [2.13] dan [2.14] dapat diselesaikan secara serentak untuk
menentukan besarnya nilai b0 dan b1 sebagai penaksir pangkat dua terkecil atau
Least Squares Method bagi parameter B0 dan B1.
18
Biasanya, sistem persamaan normal [2.13], dan [2.14] dapat diselesaikan secara
serentak untuk mendapatkan nilai b0 dan b1. Oleh karena jumlah sampel = n diketahui
dan jumlah-jumlah yang terdapat dalam sistem persamaan normal itu dapat dihitung dari
data sampel; dengan demikian koefisien regresi b0 dan b1 dalam analisis regresi linier
sederhana yang mengandung sebuah variabel bebas X dan sebuah variabel tak bebas Y
dapat ditaksir atau dihitung.
Yi - b0 - b1 Xi = 0
(Persamaan Normal 1)
Yi /n - nb0 /n - b1 Xi/n =
-
Y
[2.15].
b0 - b1 X
atau
b0 = Y - b1 X
Yi Xi - b0 Xi - b1 Xi2 = 0
(Persamaan Normal 2)
[2.16a]. Yi Xi - ( Y - b1 X ) Xi - b1 Xi2 = 0
x1
= (X1 - X 1 ),
2
x2 = (X2 - X 2 ), dan y = (Y - Y )
2
[2.18a]. y = Y - (Y) /n
2
2
2
[2.18b]. x = X - (X) /n
[2.18c]. xy = XY - X Y/n
disebut dengan JK Y
disebut dengan JK X
disebut dengan JHK XY
xy
x 2
[2.19b]. b1 =
JHK XY
atau dengan menggunakan notasi lain nilai b1 menjadi:
JK X
X Y
n
(
)2
X
2
X
n
XY
[2.19c]. b1 =
19
Sehingga persamaan regresi penduga dari suatu pengamatan atau untuk pengaruh
variabel bebas X terhadap variabel tak bebas Y menjadi:
[2.20]. = b0 + b1 X
Selanjutnya, untuk membuktikan bahwa garis regresi yang diperoleh tersebut merupakan
garis regresi yang terbaik untuk menghampiri setiap titik-titik pengamatan X,Y.
Unuk menjawab pernyataan tersebut maka dapat dikatakan bahwa garis regresi
penduga = b0 + b1 X nyata secara statistika, perlu dilakukan pengujian keberartiannya.
2).
3).
2.8.1 Uji varians regresi atau uji F regresi atau uji ragam regresi
Uji keragaman untuk menentukan garis regresi yang terbaik sering disebut dengan uji F
garis regresi atau lebih terkenal dengan sidik ragam regresi.
Dari Gambar 2.4 dapat diuraikan bahwa persamaan [2.20] di mana ei = Yi - b0 - bi Xi.
Dan jika persamaan [2.15] b0 = Y - b1 X disubstitusikan ke dalam persamaan [2.20]
= b0 + b1 X sehingga didapatkan pesamaan:
[2.21a]. ei = Yi - ( Y - b1 X ) - b1 Xi
G = ei
atau
[2.22b]
[2.22c]
G = ei(yi - b1 xi)
[2.22d]
G = eiyi - b1 eI xi)
[2.22e]
G = eiyi
atau
sebab eIxi = 0
sehingga
G = yiei
[2.23b]
G = yi (yi - b1 xi)
[2.23c]
20
150
Konsumsi
125
100
ei
(Yi - Y )
= b0 + bi X
( Y )
Y75
50
25
0
120
X
140
130
X i 150
160
Pendapatan
Gambar 2.4. Nilai-nilai Y , , Yi, dan ei
Sehingga, hubungan antara komponen-komponen pada analisis keragaman (JK Total,
JK Regresi, dan JK Galat) seperti berikut:
[2.24].
JK Regresi = b1 yi xi
JK Regresi = b1 JHK XY
JK Regresi = b1 yi x1 + b2 yi x2 + . . . + bp yi xp
JK Regresi = (b1 JHK X1Y + b2 JHK X2Y + . . . + bp JHK XpY)
KT Regresi
2).
KT Galat
Fhit =
KT Regresi
KT Galat
21
Hasil perhitungan keragaman di atas dibuatkan Tabel Sidik Ragam Regresi seperti pada
Tabel 2.3 berikut di bawah ini.
Tabel 2.3. Bagan Sidik Ragam Regresi
Sumber
Derajat
Keragaman Bebas
(DB)
(SK)
Regresi
p = 1
Residual
atau Galat
Total
Jumlah
Kuadrat
(JK)
b1 yi x1 atau
(b1 JHK XY)
np
Kuadrat
Nilai
Tengah
F hitung
(KT)
(Fhit)
JK Reg/p = KT Regresi
KT Reg
KT Galat
JK Galat
=
n p 1
KT Galat
JK Galat
1
n1
F tabel
5%
1%
Lihat tabel F
yi2 = JK Total
= JK Y
F-hitung disimbulkan dengan Fhit ini diartikan bahwa dalam pengujian F akan dibuktikan
suatu hipotesis nol atau H0: Fhit = 0 dan H1: Fhit > 0
Kemudian F-hitung dibandingkan dengan F tabel yang biasa ditulis dengan:
Fhitung Ftabel
Jika Fhit F(tabel 5%). Hal ini berarti bahwa garis regresi penduga () linier
sederhana yang didapat tersebut bukan garis regresi yang terbaik untuk
menghampiri pasangan pengamatan X,Y. Atau dapat dikatakan ini berarti
bahwa terdapat hubungan bukan linier pada pasangan pengamatan X,Y
tersebut.
2).
Jika Fhit > F(tabel 5%). Hal ini berarti bahwa terdapat hubungan linier antara
pengaruh X terhadap Y.
Atau dapat dikatakan bahwa garis regresi
penduga () linier sederhana yang didapat tersebut adalah garis regresi
penduga yang terbaik untuk menghampiri pasangan pengamatan X,Y.
2.8.2
Pengujian yang dilakukan dengan uji F seperti cara tersebut di atas, dapat
memberikan petunjuk apakah setiap variabel X menunjukkan pengaruh atau hubungan
yang nyata terhadap variabel tak bebas Y. Jika uji F atau uji ragam regresi menunjukkan
bahwa Fhit > F(tabel 5%) barulah dilanjutkan dengan uji t dan sebaliknya.
Modifikasi dari pengaruh variabel bebas X terhadap variabel tak bebas Y atu uji F, maka
dapat dilakukan dengan uji t atau uji koefisien regresi apabila uji F signifikan.
Secara umum uji t mempunyai rumus adalah:
W
SW
W nilai yang diuji, sehingga untuk pengujian koefisien regresi (bi), maka rumusnya
menjadi:
[2.28]. t-hitung W =
[2.29]. t-hitung b0 =
b0
Sb 0
dan
t-hitung b1 =
22
b1
S b1
Dari persamaan [2.29] dalam menyederhakan penulisan salah baku koefisien regresi bi
yang biasa ditulis dengan Bi (salah baku = standard error koefisien regresi Bi).
Perhitungan nilai Bi didasarkan pada ragam galat regresi atau KT Galat Regresi.
2
Karena besarnya nilai e (Ragam Galat Regresi) populasi tidak diketahui, maka dapat
2
diduga dengan nilai S e atau KT Galat Regresi sampel yang mempunyai persamaan
yaitu:
[2.30].
Selanjutnya, dalam uji t nilai salah baku bi yang ditulis (Sbi) mempunyai persamaan
seperti berikut:
[2.31].
Sbi =
var bi
var b0
KT Galat Re gresi
n JK X
[2.32b]. Sb1 =
=
X 2
var b1
KT Galat Re gresi
JK X
Seperti dalam uji F, penulisan t-hitung dapat ditulis dengan notasi thit (artinya uji t untuk
pengujian hipotesis nol atau H0: bi = 0 dan H1: minimal satu dari bi 0).
Kemudian t-hitung dibandingkan dengan t tabel yang biasa ditulis dengan:
thitung ttabel
Berdasarkan hasil uji t ternyata bahwa kreteria pengujian nilai thit adalah:
1).
Jika thit t(tabel 5%, db galat). Hal ini dapat dikatakan bahwa terima H0.
Untuk pengujian b0 yang berarti bahwa b0 melalui titik acuan (titik 0,0) yaitu
nilai Y = 0 jika X = 0. Untuk b1, jika thit t(tabel 5%, db galat) maka garis regresi
penduga dikatakan sejajar dengan sumbu X pada nilai b0.
2).
Jika thit > t(tabel 5%, db galat) Hal ini dikatakan bahwa tolak H0, yang berarti bahwa
garis regresi penduga tidak melalui titik acuan (X,Y = 0,0). Dengan kata
lain, ini berarti bahwa koefisien arah b1 yang berangkutan dapat dipakai
sebagai penduga dan peramalan yang dapat dipercaya. Pengujian yang
dilakukan dengan cara tersebut di atas, dapat memberikan petunjuk apakah
setiap variabel Xi memberikan pengaruh atau hubungan yang nyata terhadap
variabel tak bebas Y. Perlu diingatkan bahwa dalam pengujian di atas (baik
uji F maupun uji t), didasarkan metode kuadrat terkecil.
Selanjutnya, nilai salah baku koefisien regresi Sbi yang diperoleh, selain untuk pengujian
hipotesis juga dapat dipakai pada perkiraan nilai interval koefisien regresi populasi i
yang sering disebut dengan perkiraan nilai populasi beta ().
23
untuk b0
untuk b1
[2.35a]. rXY =
atau
x 2 y 2
JHK XY
[2.35b]. rXY =
JK X JK Y
menjadi:
X Y
XY
[2.35c]. rXY =
( X ) 2
X 2
n
( Y ) 2
Y 2
n
(n = jumlah sampel)
Perhitungan nilai r berdasarkan rumus di atas disebut nilai koefisien korelasi seserhana
atau koefisien korelasi order nol atau koefisien korelasi produc moment atau koefisien
korelasi Pearson.
Sepintas gambaran bahwa nilai r berkisar antara 1 sampai dengan + 1 atau sering
ditulis dengan -1 r +2. Jadi nilai koefisien korelasi itu selalu pecahan seperti:
r = 0,87; r = 0,78; r = - 0,347; dan lain sebagainya.
Hubungan antara koefisien korelasi r dengan koefisien regresi b2. Lihatlah kembali
rumus koefisien regresi seperti [2.19c] dan koefisien korelasi r seperti [2.35c]:
[2.19c]. b1 =
X Y
XY
n
( X ) 2
X
n
atau
( X ) 2
b1 X 2
n
b1 JK X
X Y
XY
n
= JHK XY
24
atau
dan
[2.35c]. r =
r =
X Y
XY
( X ) 2
X 2
n
( Y ) 2
Y 2
n
X Y di mana
XY
n
( (JK X ) (JK Y ) )
= JHK XY
Dari kesamaan kedua persamaan di atas [2.19] dan [2.356] dapat ditulis menjadi:
[2.36a] b1 JK X = r
( (JK X ) (JK Y ) )
( (JK X ) (JK Y ) )
atau
( (JK X ) (JK X ) ) = r ( (JK X ) (JK Y ) ) atau
[2.36b] b1 JK X = r
[2.36c] b1
Jadi:
[2.36d] b1
JK X
[2.36e] b1
JK X
JK X
= r
= r
JK X
JK Y
atau
atau
JK Y
n 1 maka
didapatkan:
[2.36e] b1
[2.36f]
b1
JK X
n 1
KT X
= r
= r
JK X
atau
n 1
atau
KT Y
[2.36g] b1 SX = r SY
Apabila data yang dianalisis dinyatakan dalam nilai standar baku atau data di
(Xi X )
)
SX
dan ZY =
(Yi Y )
) , sehingga nilai
SY
25
Berdasarkan hasil uji r ternyata bahwa kreteria pengujian nilai rhitung adalah:
1).
Jika rhitung
r(tabel 5%, db galat)
Hal ini dapat dikatakan bahwa tidak
terdapat hubungan linier atau korelasi sederhana antara variabel
yang satu dengan variabel yang lainnya.
2).
Jika rhitung > r(tabel 5%, db galat) Hal ini dikatakan bahwa tolak H0, yang berarti
bahwa terdapat hubungan linier atau korelasi sederhana antara
variabel yang satu dengan variabel yang lainnya.
Selain pengujian r seperti di atas nilai r hitung dapat pula diuji dengan menggunakan uji t
dengan rumus pengujian seperti berikut yaitu:
[2.37a].
r
Sr
t-hitung r =
(1 r 2 )
( n 2)
Sr =
[2.37b].
t-hitung r =
[2.37c].
t-hitung r =
sehingga
atau
(1 r 2 )
( n 2)
r ( n 2)
(1 r 2 )
Berdasarkan hasil uji t untuk nilai r ternyata bahwa kreteria pengujian adalah:
1).
Jika thitung
2).
Jika thitung
Hubungan lain antara parameter r, b1, dan dengan garis regresi penduga dapat
dijabarkan kembali melalui persamaan: [2.35b] seperti berikut.
[2.35b].
rXY
JHK XY
JK X JK Y
2
[2.38b].
[2.38c].
[2.38d].
[2.38e].
Jadi [2.38f].
XY
( JHK XY ) ( JHK XY )
( JK X ) ( JK Y )
atau
XY
( JHK XY ) ( JHK XY )
( JK X )
( JK Y )
ingat: b1 =
XY
b1
XY
XY
[2.38a].
( JHK XY )
( JK Y )
( JHK XY )
( JK X )
ingat: JK Y = JK Total
(b1 JHK XY )
( JK Y )
JK Re gresi
( JK Total )
JK regresi = r . JK Total
26
Yang lebih penting dalam pembicaraan hubungan antara koefisien korelasi r; koefisien
2
regresi b1; atau dengan garis regresi penduga adalah parameter r yang dalam
2
persamaan regresi sering ditulis dengan R yang disebut dengan koefisien determinasi
atau koefisien penentu atau coeficien of determination.
2
Arti dari pada koefisien determinasi atau koefisien penentu (R ) adalah suatu nilai yang
menunjukkan bahwa persentase dari variasi keragaman total Y atau variasi Y yang dapat
diterangkan oleh variasi X.
2
Atau sering diartikan bahwa koefisien determinasi R adalah persentase dari variabel tak
2
bebas Y yang dipengaruhi oleh variabel bebas X. Sisanya 1 - R yang menunjukkan
persentase dari variasi total atau variabel Y yang disebabkan oleh faktor lain diluar X
atau variabel selain X.
Dalam analisis keragaman atau uji F regresi di mana:
[2.39a].
[2.39b].
[2.39c].
[2.39d].
atau
atau
= JK Total - r . JK Total
atau
= (1 - r ) . JK Total
JK Total =
[2.41a].
F-hitung
KT Re grasi
KT Galat
JK Re grasi / 1
JK Galat /(n 2)
(n 2) JK Re grasi
[2.41c].
F-hitung =
JK Galat
Masukan persamaan [2.40] ke dalam persamaan [2.41c] maka menghasilkan:
[2.41b].
F-hitung
[2.42a].
F-hitung
(n 2) r 2 JK Total
(1- r 2 ) JK Total
sehingga didapatkan
( n 2) r 2
(1- r 2 )
Kreteria pengujian nilai Fhitung sama seperti pengujian-pengujian di atas, sehingga kreteria
pengujian adalah:
[2.42b].
F-hitung
1).
Jika Fhit F(tabel 5%). Hal ini berarti bahwa garis regresi penduga () linier sederhana
yang didapat tersebut bukan garis regresi yang terbaik.
2).
Jika Fhit > F(tabel 5%). Hal ini berarti bahwa terdapat hubungan linier yang nyata (p =
0,05), bahwa terdapat pengaruh antara variabel X terhadap variabel tak bebas Y.
27
2.9
- t(/2, n 2) S
XY
+ t(/2, n 2) S
Di mana:
S adalah nilai salah baku dari penaksiran rata-rata dengan rumus:
Y
S 2 = KT Galat Regresi +
Y
n
( X 0 X )2
JK X
- t(/2, n 2) S Y + t(/2, n 2) S
Y
Di mana:
( X 0 X )2
JK X
S 2 = KT Galat Regresi 1 + +
Y
n
28
X
9,750
10,500
11,250
12,600
11,900
15,200
12,250
12,900
14,300
13,250
15,300
8,900
10,600
7,500
11,900
178,100
11,873
Y
0,650
0,750
0,900
1,150
0,950
1,750
1,050
1,000
1,700
1,250
1,800
0,600
0,500
0,720
0,950
15,720
1,048
X2
95,063
110,250
126,563
158,760
141,610
231,040
150,063
166,410
204,490
175,563
234,090
79,210
112,360
56,250
141,610
2183,330
145,555
29
Y2
0,423
0,563
0,810
1,323
0,903
3,063
1,103
1,000
2,890
1,563
3,240
0,360
0,250
0,518
0,903
18,908
1,261
XY
6,338
7,875
10,125
14,490
11,305
26,600
12,863
12,900
24,310
16,563
27,540
5,340
5,300
5,400
11,305
198,253
13,217
JK Y
=
=
=
y = Y - (Y) /n
2
18,908 - (5,720) /15
2,4338
JK X
=
=
=
x1 = X1 - (X) /n
2
2183,330 - (178,100) /15
68,6893
JHK XY
=
=
=
Selanjutnya, dilakukan perhitungan untuk mencari nilai b0 dan b1 seperti berikut ini.
Nilai b1 adalah:
JHK XY
JK X
11,6037
68,6893
b1 =
=
=
0,16893
Nilai b0 adalah:
b0 =
=
=
Y - b1 X
1,048 - (0.16893) (11,873)
- 0,95776
b0 + b1 X
- 0,95776 + 0,16893 X
Sehingga, dari persamaan peduga di atas dapat diartikan bahwa setiap perubahan satu
satuan X, maka akan menyebabkan terjadinya perubahan Y sebesar 0,16893 satuan Y.
Selanjutnya, dilakukan pengujian terhadap garis regresi penduga. Dalam pengujian garis
regresi penduga terdapat tiga macam uji yaitu:
1).
2).
3).
JK Total =
=
=
=
y
2
2
Y - (Y) /n
2
18,908 - (5,720) /15
2,43384
30
2). JK Regresi
=
=
=
b1 JHK XY
(0,16893) (11,6037)
1,96021
=
=
=
JK Total - JK Regresi
2,43384 - 2.96021
0.47363
KT Regresi
=
=
=
2).
KT Galat Regresi =
=
=
Derajat
Bebas
(DB)
Jumlah
Kuadrat
(JK)
Kuadrat
Tengah
(KT)
F
hitung
Regresi
1,96021
1,96021
53,8037
Residual
Total
13
14
0,47363
2,43384
0,03643
-
F tabel
5%
1%
**
4,67 9,07
Keterangan:
Jumlah sampel (n) = 15.
= berpengaruh sangat nyata pada p<0,01
**
Berdasarkan hasil analisis varians di atas ternyata bahwa Fhit > F(tabel 1%) atau dapat
dikatakan bahwa hipotesis nol ditolak, yang berarti bahwa terdapat pengaruh variabel
bebas X yang sangat nyata (p<0,01) terhadap variabel tak bebas Y.
2.10.3
=
=
KT Galat Re gresi X 2
n JK X
0,03643 2183,330
15 x 68,6893
0,277853
31
Sb1 =
0,03643
68,6893
= 0,023030
Uji t terhadap nilai koefisien regresi b0:
t-hitung b0 =
b0
Sb
- 0,95776
=
0,277853
= - 3,4470
(diambil harga
mutlaknya)}.
Selanjutnya, uji t terhadap nilai koefisien regresi b1:
t-hitung b1 =
b1
Sb
0,16893
=
0,023030
7,335101
Berdasarkan hasil uji t ternyata bahwa nlai thitung yang diperoleh dibandingkan dengan
ttabel atau t(5%, db galat = 13) yaitu sebesar 2,131 dan t(1%,13) = 2,947. Ternyata bahwa
t-hitung > ttabel 1% baik untuk nilai b0 maupun untuk b2. Ini berarti bahwa dari analisis
tersebut H0 ditolak baik untuk uji b0 maupun untuk uji b1
Sehingga, dapat dikatakan bahwa:
1).
2).
Selanjutnya, dengan nilai salah baku koefisien regresi b0 dan b1 yang diperoleh; selain
untuk pengujian hipotesis, juga dapat dipakai pada perkiraan nilai interval koefisien
regresi b0 dan b1 yang sering disebut dengan perkiraan nilai beta () populasi dengan
rumus sebai berikut:
p {bi - t/2 sbi i bi - t/2 sbi} = 1-
Untuk perkiraan 0 dengan nilai salah baku Sb0 dengan = 5% dari data di atas
didapatkan:
p {b0 - t(/2,n-2) Sb0 0 b0 + t(/2,n-2) Sb0} = 1-
p {- 0,95776 - (2,131) (0,277853) 0 - 0,95776 + (2,131) (0,277853)} = 1-
p { - 1,558029 0 - 0,35750} = 1 -
32
untuk b0
1.8
Y = - 0,9578 + 0,1689 X
R2 = 80,54%
1.6
1.4
1.2
1.0
0.8
0.6
0.4
0.2
6.0
8.0
10.0
12.0
14.0
16.0
X Y
XY
r
( X ) 2
X 2
n
( Y ) 2
Y 2
n
Untuk perhitungan nilai r diperlukan hasil penjumlahan data pada Tabel 3.1 di atas
seperti:
X =
2
X =
XY =
178,100
2183,330
198,253
Y
2
Y
=
=
33
15,720
18,908
Sehingga:
178,100) (15,720)
15
(178,100) 2
(15,720) 2
18,908
2183,330
15
15
198,53
0,897
r
.
Sr
(1 r 2 )
( n 2)
Sr
(1 0,897 2 )
(15 2)
0,13765
Sehingga:
t-hitung =
r
Sr
0,897
0,13765
= 6,51653
Berdasarkan hasil uji t, maka nilai thitung ttabel. Nilai ttabel atau t(5%, db galat = 13) yaitu
sebesar 2,131 dan t(1%,13) = 2,947. Ternyata bahwa t-hitung > ttabel 1%. Hal ini dapat
dikatakan bahwa terdapat hubungan atau korelasi yang sangat erat antara variabel
bebas X dengan variabel tak bebas Y.
34
2.10.5
Dalam perhitungan taksiran atau ramalan garis regresi diperlukan selang kepercayaan
yaitu sebesar 1 , di mana = 5%, sehingga = 95%. Dengan menggunakan dasar
perhitungan analisis ragam regresi dan KT Galatnya seperti di atas didapatkan taksiran
nilai rata-rata seperti berikut ini.
1).
XY
= - 0,95776 + 0,16893 X
= - 0,95776 + 0,16893 (10)
= 0,73154
S =
Y
2
1 (X0 X )
KT Galat Regresi +
JK X
n
Ketentuan:
JK X
KT Galat
n_
X
X0
t(5%, 13)
=
=
=
=
=
=
=
0,73154
68,6893
0,03643
15
11,873
10
2,131
1 ( X 0 X )2
KT Galat Regresi +
JK X
n
S =
Y
1
(10 11,873) 2
0,03643 +
68,6893
15
= 0,01377
Selanjutnya, taksiran nilai rata-rata XY:
- t(/2, n 2)
S
Y
XY
+ t(/2, n 2)
S
Y
XY
0,76088
35
- t(/2, n 2) S Y - t(/2, n 2) S
Y
= - 0,95776 + 0,16893 X
= - 0,95776 + 0,16893 (10)
= 0,73154
_
1 ( X 0 X )2
+
KT Galat Regresi 1 +
Y
n
JK X
Ketentuan:
S =
=
JK X
=
KT Galat =
=
_n
=
X
X0
=
t(5%, 13) =
0,73154
68,6893
0,03643
15
11,873
10
2,131
S =
Y
1 ( X 0 X )2
KT Galat Regresi 1 +
+
n
JK X
1
(10 11,873) 2
0,03643 1 +
+
15
68,6893
0,01558
- t(/2, n 2)
S
Y
+ t(/2, n 2)
S
Y
0,76473
0,69835
Y
36
Tabel 2.6
Y dari Nilai-nilai Xi
No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
9,750
10,500
11,250
12,600
11,900
15,200
12,250
12,900
14,300
13,250
15,300
8,900
10,600
7,500
11,900
0,650
0,750
0,900
1,150
0,950
1,750
1,050
1,000
1,700
1,250
1,800
0,600
0,500
0,720
0,950
0,689
0,816
0,943
1,171
1,053
1,610
1,112
1,221
1,458
1,281
1,627
0,546
0,833
0,309
1,053
Keterangan :
n =
X =
Y =
=
XY =
0,656
0,794
0,932
1,159
1,048
1,558
1,105
1,205
1,420
1,259
1,574
0,499
0,813
0,241
1,048
0,722
0,838
0,953
1,183
1,057
1,662
1,119
1,238
1,496
1,302
1,680
0,592
0,853
0,377
1,057
0,653
0,789
0,924
1,151
1,036
1,556
1,095
1,199
1,417
1,254
1,571
0,497
0,807
0,239
1,036
Y upper
0,726
0,843
0,961
1,190
1,069
1,664
1,129
1,244
1,499
1,307
1,682
0,595
0,858
0,379
1,069
15 (jumlah sampel)
variabel bebas X
variabel tak bebas Y
nilai penduga dari Y
taksiran rata-rata dari Y
taksiran individu dari Y
perbedaan nilai antara XY dan Y yang sangat sempit maka gambarnya kelihatan tiga
garis yang seharusnya lima garis seperti pada Tabel 2.6 di atas.
2,0
1,8
Konsumsi daging
1,6
1,4
1,2
1,0
0,8
0,6
0,4
0,2
6,0
8,0
10,0
12,0
Pendapatan
37
14,0
16,0
2.12
0.8974
0.8054
0.7904
0.1909
15
DB
SS
MS
Significance F
Regression
2.9602
2.9602
53.8037
0.0000
Residual
13
0.4736
0.0364
Total
14
2.4338
X1
0.16893
0.02303 7.3351
0.00001 0.11918
38
0.21868
0.09956
0.23830
simbul R 2 dan yang mengkoreksi adalah nilai Galat Regresi dan KT Total dengan
_
rumus: R 2 = 1
_
ei2 /(n p 1)
( n 1)
atau R 2 = 1 (1 R 2 )
2
(n p 1)
y i /(n 1)
KT Y
n
39
40
Lower dan Upper adalah sama dengan perkiraan nilai interval b0 dan b1 atau pendugaan
nilai 0 dan 1 dengan rumus: p {bi - t/2 sbi i bi - t/2 sbi} = 1- .
Nilai 95% atau 99% = 1- tergantung pada nilai yang dipakai 5% atau 1%.
Perkiraan nilai 0 berkisar antara - 1,558029 sampai dengan - 0,35750 untuk
nilai = 5%; dan antara - 1,79474 sampai dengan - 0,12079 untuk = 1%;
Perkiraan nilai 1 berkisar antara 0,119176 sampai dengan 0,21868 untuk = 5%;
dan antara 0,09956 sampai dengan 0,23830 untuk = 1%;
Perhatikan nilai Lower dan Upper, apabila nilai Lower dan Upper bersifat definit positif
atau definit negarif artinya baik Lower maupun Upper mempunyai tanda bilangan
yang positif atau negarif ( + , - ) berarti dalam uji t-hitung bi menunjukkan
signifikansi yang nyata pada taraf = 5% atau 1%.
Sebaliknya, apabila nilai Lower bertanda negarif dan Upper bertanda positif
berarti dalam uji t-hitung bi menunjukkan signifikansi yang tidak nyata pada taraf
nilai = 5% atau 1%.
41