Anda di halaman 1dari 10

4-3 PENGENALAN TERHADAP ANALISIS REGRESI

untuk memperkenalkan analisis regresi, katakanlah seorang manaje ingin menentukan


hubungan antara pengeluaran biaya iklan perusahaan dengan pendapatan penjualannya.
Manejer ini ingin menguji hipotesis yang mengatakan bahwa semakin tinggi biaya untuk iklan
maka akan semakin tinggi pula penerimaan penjualan perusahaa, dan seterusnya, dia ingin
mengestimasi kekuatan hubungan tersebut (berapa banyak peningkatan penjualan setiap dolar
kenaikan biaya iklan). Sampai akhirnya, manajer tersebut mengumpulkan data pengeluaran
iklan dan penerimaan penjualan perusahaan tersebut untuk 10 tahun yang lalu. Dalam hal ini,
tingkat pengeluaran iklah (X) merupakan suatu variabel bebas atau variabel penjelas,
sementara penerimaan penjulaan (Y) merupaka variabel terikat yang ingin dijelaskan oleh
manajer. Misalkan bahwa data pengeluaran iklan-penjualan untuk perusahaan dalam 10 tahun
terakhir yang telah dikumpulkan tersebut disajikan dalam tabel 4-2.

Tabl 4-2. Pengeluaran Iklan dan Penerimaan Penjualan suatu Perusahaan (dalam jutaan dolar)

Tahun (t) 1 2 3 4 5 6 7 8 9 10

Pengeluaran Iklan (X) 10 9 11 12 11 12 13 13 14 15


Penerimaan Penjualan (Y) 44 40 42 46 48 52 54 58 56 60

Jika kita menggambarkan setiap pasangan nilai iklan-penjualan dalam Tabel 4-2
sebagai suatu titik dalam suatu grafik, dengan pengeluaran iklan (variabel bebas atau variabel
penjelas) diukur sepanjang sumbu horizontal dan penerimaan penjualan (variabel terikat) diukur
sepanjang sumbu vertikal, kita akan memperoleh titik-titik seperti dalam Figur 4-2. Ini disebut
sebagai diagram pencar (scatter diagram) karena ini menunjukkan penyebaran dari titik-titik
dalam daerah X-Y. Dari Figur 4-2 (diagram pencar), kita lihat bahwa terdapat hubungan yang
positif antara tingkat pengeluaran iklan perusahaan dengan penerimaan penjualannya (tingkat
pengeluaran iklan yang lebih tinggi berhubungan dengan tingkat penerimaan yang lebih tinggi
pula) dan bahwa hubungan ini diperkirakan merupakan hubungan linear.
Salah satu cara mengestimasi hubungan linear antara pengeluaran iklan perusahaan
dengan penerimaan penjualannya adalah dengan menggambarkan, secara pandangan mata,
suatu garis lurus dengan kemiringan positif yang paling dapat mewakili di antara titik-titik data
yang ada (sehingga titik-titik data tersebut berada pada jarak yang kurang lebih sama pada
kedua sisi garis). Dengan memperpanjang garis tersebut ke sumbu vertikal, kita dapat
mengestimasi penerimaan penjualan perusahaan tersebur dengan pengeluaran iklan sama
dengan nol. Kemiringan garis ini bisa digunakan untuk estimasi peningkatan penerimaan
penjualan yang bisa diharapkan oleh perusahaan setiap kenaikan $1 juta dolar pengeluaran
iklan. Ini akan memberikan estimasi kasar mengenai hubungan linear antara penerimaan
penjualan (Y) dengan pengeluaran iklan (X) dari bentuk Persamaan 4-1 :

Y =a+bX
(4-1)

Dalam persamaan 4-1, a adalah titik potong vertikal dari estimasi hubungan linear dan
memberikan nilai Y pada saat X = 0, sementara b merupakan kemiringan dari garis itu dan
memberikan estimasi kenaikan Y yang diakibatkan peningkatan setiap unit dari X. Manajer
tersebut dapat menggunakan estimasi ini untuk mengestimasi seberapa banyak penerimaan
penjualan perusahan yang akan terjadi jika pengeluaran iklan berada anatara $9 Jjuta dan %15
juta per tahun (kisaran pengeluaran iklan yang diberikan pada Tabel 4-2 dan Figur 4-2), atau
jika pengeluaran iklan meningkat, katakanlah menjadi $16 juta per tahun, atau jatuh menjadi $8
juta per tahun.
Figur 4-2 Pengeluaran Iklan dan Penerimaan Penjualan suatu Perusahaan dalam 10 Tahunan

Pengeluaran iklan (X), variabel bebas, diukur sepanjang sumbu horizontal, sementara
penerimaan penjualan (Y) variabel terikat, diukur sepanjang sumbu vertikal. Setiap titik (dot)
dalam gambar mewakili satu kombinasi pengeluaran iklan-penjualan yang ada dalam tabel 4-2.

Kesulitan dengan membuat garis yang cocok dengan titik-titik data dalam Figur 4-2
secara visual adalah bahwa peneliti yang berbeda mungkin akan merasa cocok dengan garis
yang berbeda pula untuk titik-titik data yang sama sehingga menghasilkan hasil yang berbeda.
Analisis regresi (refression analysis) merupakan teknik statistik yang dapat menghasilkan
garis yang paling baik yang cocok dengan data yang sesuai dengan kriteria statistika yang
objektif, sehingga semua peneliti yang melihat data yang sama akan mempunyai hasil yang
sama (menghasilkan garis yang sama). Secara sepesifik, garis regresi (regression line)
merupakan garis yang dihasilkan dengan meminimumkan jumlah dari simpangan kuadrat pada
sumbu vertikal dari setiap titik dari garis regresi tersebut. Metode ini kemudian disebut sebagai
metode kuadrat terkecil biasa (ordinary least-squares-OLS method).” Garis regresi yang
memenuhi metode kuadrat terkecil (least-square method) ini diperlihatkan pada Figur 4-3.
Dalam Figur 4-3, Y 1 dimaksudkan sebagai penerimaan penjualan aktual atau yang
diobservasi sebesar $44 juta dihubungkan dengan pengeluaran iklan sebesar $10 juta pada
tahun pertama data ini dikumpulkan (lihat Tabel 4-2). Nilai Y ^1 (dibaca: Y topi sub 1)
menunjukkan penerimaan penjualan yang diperoleh dari estimasi garis regresi untuk
pengeluaran iklan sebesar $10 juta pada tahun pertama. Simbol e 1 dalam gambar simpangan
pada sumbu vertikal atau galat penerimaan penjualan aktual atau hasil observasi dari
penerimaan penjualan yang diperoleh dari estimasi garis regresi pada tahun pertama. Di mana,

e 1=Y 1−Y^1
(4-2)

Galat tipe ini timbul karena (1) berbagai variabel penjelas yang mempunyai sedikit pengaruh
dan kurang beraturan terhadap Y tidak dimasukkan ke dalam Persamaan 4-1, (2) terdapat
kemungkinan adanya kesalahan pengukuran pada Y, dan (3) perilaku manusia yang acak
membuahkan hasil yang berbeda (katakan, pembelian yang berbeda dari suatu komoditas)
dalam kondisi yang sama.
Karena terdapat 10 titik observasi pada Figur 4-3, kita memiliki 10 buah galat atau
simpangan pada sumbu vertikal. Ini diberi nama e 1 hingga e 10 dalam figur. Garis regresi yang
diperlihatkan pada Figur 4-3 merupakan garis yang paling cocok untuk titik data dalam
pengertian bahwa jumlah hasil kuadrat (secara vertikal) deviasi dari garis yang ada adalah
minimum. Artinya, setiap nilai dari ke-10 e yang ada pertama-tama dikuadratkan kemudian
dijumlahkan. Garis regresi merupakan garis yang jumlah simpangan kuadratnya paling kecil.
Bagaimana nilai a^ (titik potong vertikal) dan b^ (koefisien kemiringan) dari garis regresi yang
mempu meminimumkan jumlah dari simpangan kuadrat sesungguhnya diperoleh, akan dibahas
berikut ini.

Figur 4-3 Menggambarkan Garis Regresi

Garis regresi yang diperlihatkan pada gambar ini merupakan garis yang paling cocok yang
dapat mewakili titik-titik data dalam arti kata jumlah simpangan kuadrat pada sumbu vertikal dari
titik-titik adalah yang minimum.

4-4 ANALISIS REGRESI SEDERHANA

Dalam bagian ini kita membahas bagaimana (1) menghitung nilai a (titik potong vertikal) dan
nilai b (koefisien kemiringan) dari garis regresi; (2) mengadakan uji signifikansi dari estimasi-
estimasi parameter; (3) membuat interval keyakinan untuk parameter yang sebenarnya; (4)
menguji kekuatan penjelas secara keseluruhan dari regresi. Sementara semua biasanya
dilakukan dengan komputer, kita akan mulai mengerjakan semua operasi ini secara manual
terlebih dahulu dengan angka-angka yang sederhana dengan tujuan menunjukkan bagaiman
analisis regresi dibuat dan apa saja isinya.

Metode Kuadrat Terkecil Biasa


Kita telah melihat pada bagian sebelumnya bahwa suatu garis regresi merupakan suatu garis
terbaik yang cocok dengan titik-titik data dalam artian bahwa jumlah simpangan kuadrat pada
garis adalah minimum. Tujuan analisis regresi adalah untuk menghasilkan estimasi nilai a (titik
potong vertikal) dan b (kemiringan) dari garis regresi:

Y^t =a^ + b^ X t
(4-3)

^ t adalah estimasi dari penerimaan penjualan tahun t yang diperoleh


Dalam Persamaan 4-3, Y
dari garis regresi untuk tingkat pengeluaran iklan pada tahun t (X 1 ), serta a^ dan b^ merupakan
estimasi dari paramater a dan b . Deviasi dari galat (e t ) dari setiap observasi penerimaan
^
penjualan (Y t ) dari nilainya yang berhubungan yang berasal dari garis regresi ( Y
^ t ), yaitu:

e t =Y t−Y^ t=Y t −a^ −b^ X t


(4-4)

Jumlah dari simpangan kuadrat atau galat ini dapat dituliskan sebagai:
(4-5)

di mana ∑tn=1 adalah jumlah keseluruhan observasi, dari periode waktu t = 1 sampai ke t = n.
Estimasi dari nilai a dan b (yaitu, a^ dan b^ ) diperoleh dari meminimumkan jumlah simpangan
kuadrat (meminimumkan persamaan 4-5) nilai b^ diberikan oleh :

(4-6)

di mana Ý dan X́ adalah rata-rata nilai dari Y t dan X t , nilai a^ tersebut kemudian diperoleh dari

a^ =Ý − b^ X́
(4-7)

Tabel 4-3 menunjukkan perhitungan untuk menentukan nilai a^ dan b^ untuk data iklan-
penjualan pada Tabel 4-2. Dengan mensubstitusi nilai yang dihasilkan dari Tabel 4-3 ke dalam,
Persamaan 4-6, kita memperoleh nilai b^ sebagai berikut:

(4-8)

Nilai a^ dan b^ diperoleh dengan menemukan turunan parsial dari persamaan 4-5
terhadap a^ dan b^ , kemudian menyamakan kedua persamaan normal tersebut dengan nol, dan
menyelesaikannya secara simultan untuk menghasilkan Persamaan 4-6. [Lihat Dominick
Salvatore dan Derrick Reagle, Theory and Problems of Statistics and Econometrics, edisi ke-2
(New York: McGraw-Hill, 2002), Bab 6.]

Lalu dengan mensubtitusi nilai b^ yang diperoleh di atas nilai dan nilai Ý dan X́ yang diperoleh
dari Tabel 4-3 ke dalam Persamaan 4-7, kita memperoleh nilai a^ :

a^ =Ý − b^ X́=50−3,533 ( 12 )=7,60

Sehingga, persamaan dari garis regresinya adalah:

Y^ t =7,60+3,53 X t
(4-8)

Garis regresi ini menunjukkan bahwa pengeluaran iklan sebesar nol (dengan X t =0 ),
^ t ) adalah sebesar $7,60 juta. Dengan iklan sebesar
penerimaan penjualan yang diharapkan (Y
$10 juta pada tahun pertama observasi ( X 1 = $10 juta), Y
^ 1 = $7,60 + $3,53(10) = $42,90 juta.
^
Pada saat yang lain, dengan X 10 = $15 juta, Y
^ 1 = $7,60 + $3,53(15) = $60,55 juta. Dengan
menggambarkan kedua titik terakhir ini (10; 42,90) dan (15; 60,55) dan menggabungkan
keduanya dengan garis lurus, kita menghasilkan garis regresi pada Figur 4-3.
Garis regresi hasil estimasi juga dapat digunakan untuk mengestimasi bahwa
penerimaan penjualan perusahaan dengan mengeluarkan iklan $16 juta akan menjadi $7,60 +
$3,53(16) = $64,08 juta, atau $3,53 juta lebih tinggi dibandingkan dengan pengeluaran iklan
sebesar $15 juta. Perlu diingatkan dalam penggunaan garis regresi untuk mengestimasi
penerimaan penjualan dari perusahaan untuk pengeluaran iklan jauh berbeda dengan yang
digunakan pada saat mengestimasi garis regresi itu sendiri. Akan tetapi, garis regresi
seharusnya hanya dipakai untuk mengestimasi penerimaan penjualan perusahaan yang berasal
dari pengeluaran iklan yang masih termasuk dalam kisaran atau setidaknya masih mendekati
dengan nilai iklan yang dipakai dalam estimasi garis regresi. Jadi, tidak banyak keyakinan yang
dapat diikutsertakan dalam nilai estimasi koefisien a^ , karena ini memberikan penerimaan
penjualan perusahaan pada saat pengeluaran iklan sama dengan nol (jauh dari nilai observasi)
karena hal inilah, kita akan mengonsentrasikan perhatian kita pada nilai b^ , atau koefisien
kemiringan. Nilai b^ mengukur peningkatan dari penerimaan penjualan perusahaan yang
diakibatkan karena adanya peningkatan setiap unit (dalam hal ini setiap $1 juta) dari
pengeluaran iklan perusahaan. Artinya, b^ = △ Y / △ X . Dalam istilah yang kita gunakan pada
Bab 2. b^ mengukur efek marginal terhadap Y (penjualan) dari setiap unit perubahan X (iklan).

t Xt Yt
X t − X́ Y t −Ý ( X ¿ ¿t− X́)( Y t−Ý )¿ ( X ¿ ¿t− X́)2 ¿
Tahun Iklan Penjualan
1 10 44 -2 -6 12 4
2 9 40 -3 -10 30 9
3 11 42 -1 -8 8 1
4 12 46 0 -4 0 0
5 11 48 -1 -2 2 1
6 12 52 0 2 0 0
7 13 54 1 4 4 1
8 13 58 1 8 8 1
9 14 56 2 6 12 4
10 15 60 3 10 30 9
n = 10 ∑ X t=120 ∑ Y t =500
0 0 106 30
∑ Y = 20 Y = 50

Analisis regresi dilandasi oleh beberapa asumsi yang penting. Yaitu bahwa faktor galat
(1) mempunyai distribusi normal, (2) mempunyai rata-rata atau nilai harapan sama dengan nol,
dan (3) mempunyai varians yang konstan dalam setiap periode waktu dan pada semua nilai X ,
serta (4) nilainyan pada suatu periode tertentu tidak tergantung pada nilainya dalam periode
mana pun juga. Asumsi-asumsi ini dibutuhkan untuk menghasilkan estimasi koefisien
kemiringan yang tidak bias dan mampu memenuhi teori probabilitas untuk menguji keandalan
dari estimasi. Bagaimana ini dilakukan akan ditunjukkan berikutnya.

Uji Signifikansi Estimasi Parameter


Dalam subbab sebelumnya, kita telah mengestimasi koefisien kemiringan (b^ ) dari satu sampel
data iklan-penjualan suatu perusahaan. Jika kita menggunakan sampel yang berbeda
(katakanlah data untuk 10 tahun yang berbeda), kita akan mendapatkan hasil estimasi b yang
berbeda. Semakin besar dispersi dari (semakin besar penyebarannya) estimasi nilai b (yang
akan kita hasilkan jika kita menjalankan regresi dari sampel yang berbeda), semakin kecil
interval keyakinan yang kita miliki dalam estimasi nilai koefisien b .
Untuk menguji hipotetsis bahwa b adalah signifikan secara statistik (bahwa iklan
mempengaruhi penjualan secara positif), pertama kita perlu menghitung galat baku
(simpangan) dari b^ . Galat baku dari b^ (S b^ ) sudah disediakan secara langsung oleh hasil
komputer dalam suatu analisis regresi, tetapi penting sekali untuk mengetahui bagaimana cara
menghitungnya dan bagaimana menggunakannya untuk melakukan uji signifikansi ini. Galat
baku dari b^ diberikan oleh:


2 2

Sb^ =
∑ (Y t −Y^ t ) =¿
( n−k) ∑ ( X t − X́ )
2
√ ∑ et
(n−k ) ∑ ( X t− X́ )
2
¿

(4-9)

Dimana Y t dan X t merupakan sampel observasi aktual dari variabel terikat dan bebas pada
^ t merupakan nilai variabel terikat pada tahunt yang diestimasi dari garis regresi, X́
tahun t , Y
merupakan rata-rata atau nilai yang diharapkan dari variabel bebas, e merupakan faktor galat
^ t , n adalah jumlah observasi atau titik data yang dipakai dalam mengestimasi garis
atau Y t −Y
regresi, dan k adalah jumlah koefisien yang diestimasi dalam regresi. Nilai n−k disebut sebagai
derajat kebebasan (degrees of freedom – df). Karena dalan analisis regresi sederhana
(simple regression analysis) kita mengestimasi dua parameter, a^ dan b^ , maka nilai k adalah 2,
sehingga derajat kebebasan adalah n−2.

Tabel 4-4 Kalkulasi untuk Mengestimasi Galat Standar b^


(1) (2) (3) (4) (5) (6) (7)
2 2
Tahun Xt Yt Y^ t Y t −Y^ t =e t (Y t −Y t ) =e t ( X ¿ ¿1− X́ )2 ¿
1 10 44 42,90 1,10 1,2100 4
2 9 40 39,37 0,63 0,3969 9
3 11 42 46,43 -4,43 19,6249 1
4 12 46 49,96 -3,96 15,6816 0
5 11 48 46,43 1,57 2,4649 1
6 12 52 49,96 2,04 4,1616 0
7 13 54 53,49 0,51 0,2601 1
8 13 58 53,49 4,51 20,3401 1
9 14 56 57,02 -1,02 1,0404 4
10 15 60 60,55 -0,55 0,3025 9
∑ X t=120 ∑ Y t =500
n = 10 e t2=65,4830 ∑( X ¿¿ 1− X́)2=30 ¿
Y = 20 Y = 50

Nilai Sb^ dari contoh iklan-penjualan ini dapat dihitung dengan mensubstitusikan nilai-nilai
dari Tabel 4-4 (perpanjangan dari Tabel 4-3) ke dalam Persamaan 4-9. Dalam Tabel 4-4, nilai
Y^ t pada kolom 4 diperoleh dengan mensubstitusi berbagai nilai pengeluaran iklan pada kolom 2
ke dalam Persamaan 4-8. Kolom 5 diperoleh dengan mengurangi nilai pada kolom 4 dari nilai
pada kolom 3, dan kolom 6 diperoleh dengan cara mengkuadratkan nilai pada kolom 5, dan
akhirnya pada kolom 7 diperoleh dari Tabel 4-3.
Maka, nilai Sb^ adalah sama dengan

∑ et 2
Sb^ =

( n−k)∑( X ¿ ¿ 1− X́ )
2
=
√ 65,4830
( 10−2 ) (30)
=√ 0,2728=0,52 ¿

Setelah diperoleh nilai Sb^ , berikutnya kita menghitung nilai b^ /S ^b. Ini disebut sebagai nilai
statistik t (t statistic) atau rasio t. Semakin tinggi rasio t, semakin yakin bahwa nilai b yang
benar (tetap tidak diketahui) yang kita cari adalah tidak sama dengan nol (terdapat hubungan
yang signifikan antara iklan dan penjualan). untuk contoh penjualan-iklan kita, diperoleh nilai

b^ 3,53
t= = =6,79
S b^ 0,52
(4-10)

Untuk menghasilkan uji signifikansi (significance test) yang objektif untuk b^ , kita
bandingkan hasil perhitungan rasio t dengan nilai kritis (critical value) dari distribusi t dengan
n−k =10−2=8 df yang diberikan oleh Tabel C-2. Ini disebut sebagai uji t (t test) dari
signifikansi secara statistikal dari koefisien hasil estimasi yang biasanya dilakukan pada tingkat
signifikansi 5 persen. Lalu, turun pada kolom yang bagian atasnya menunjukkan nilai 0,05
(menunjukkan nilai 2,5 persen daerah atau probabilitas dari setiap ujung dari distribusi t , untuk
total 5 persen bagi kedua ujung) pada tabel C-2 sampai kita mendapat df = 8. Ini memberikan
nilai kritis dari t=2,306 untuk uji t dua ujung.
Karena nilai t=6,79 melebihi nilai tabel t=2,306 untuk tingkat signifikansi 5 persen
dengan df = 8, maka kita menolak hipotesis nol bahwa tidak terdapat hubungan antara X (iklan)
an Y (penjualan) serta menerima hipotesis alternatif yang mengatakan adanya hubungan yang
signifikan antara X dan Y. Untuk mengatakan adanya hubungan yang signifikan secara statistik
antara X dan Y pada tingkat 5 persen berari kita 95 persen percaya bahwa hubungan seperti itu
ada. Dengan kata lain, terdapat kurang dari 1 dari 20 kemungkinan (kurang dari 5 persen) itu
adalah salah, atau menerima hipotesis bahwa terdapat hubungan yang signifikan antara X dan
Y, di mana sebenarnya tidak.

Aspek Lainnya dalam Uji Signifikansi dan Interval Keyakinan


Pada bagian sebelumnya kita sudah menunjukkan bagaiman melakukan suatu uji statistik untuk
memperlihatkan bahwa koefisien kemiringan adalah berbeda dari nil pada tingkat signifikan 5
persen. Beberapa uji yang lainnya juga masih ada. Sebagai contoh, kita juga dapat
menghasilkan interval keyakinan untuk parameter yang sesungguhnya dari koefisien yang
diestimasi.
Lebih lanjut, kita dapat menguji suatu hipotesis yang mengatakan bahwa koefisien
kemiringan itu berbeda dari nol pada tingkat signifikansi 1 persen dan bukannya 5 persen.
Dalam hal ini kita hanya mengizinkan 1 kemungkinan salah pada 100 kemungkinan yang ada
(kemungkinan menerima hipotesis alternatif bahwa terdapat hubungan antara X dan Y pada
saat sebenarnya tidak terdapat hubungan seperti itu). Untuk menguji hipotesis pada tingkat
signifikansi 1 persen, kita turun pada kolom yang bagian atasnya tertulis 0,1 pada tabel C-2
sampai mencapai angka df = 8. Nilai kritis untuk t yang didapat dari tabel t adalah 3,355.
Karena nilai t hitung adalah 6,79 melebihi nilai tabel kritis, kita menerima hipotesis yang
menyatakan bahwa terdapat pula hubungan yang signifikan antara X dan Y pada tingkat 1
persen juga.
Meskipun uji signifikansi kadang dilakukan pada tingkat 1 persen atau bahkan pada
tingkat signifikan 10 persen, lebih umum untuk menggunakan tingkat 5 persen. Catat juga
bahwa semakin besar derajat kebebasan (semakin besar jumlah observasi atau titik data dalam
hubungan terhadap jumlah parameter yang diestimasi dalam analisis regresi), semakin kecil
nilai kirits t dalam Tabel C-2, tidak peduli tingkat signifikansi yang kita pilih. Jadi, semakin besar
nilai derajat kebebasan, semakin mungkin bagi kita untuk menerima hipotesis yang mengatakan
adanya hubungan yang signifikan secara statistik antara variabel bebas dan variabel terikat.
Catat bahwa uji signifikansi biasanya tidak dilakukan untuk koefisien a^ (titik potong
vertikal), karena koefisien ini biasanya mempunyai tingkat signifikansi yang kecil atau tidak
sama sekali. Juga perlu diingat dalam presentasi kita, kita hanya menguji hipotesis yang
mengatakan bahwa b^ secara signifikan berbeda dari nol. Karena b^ dapat secara signifikan
berbeda dari nol dengan menjadi positif atau negatif, maka kita mengadakan uji dua ujung.
Artinya, kita mengizinkan kemungkinan b^ menjadi signifikan secara positif atau negatif dan
daerah probabilitasnya di bawah distribusi t pada kedua ujung. Kita juga dapat menguji,
bagaimanapun juga, hipotesis bahwa b^ lebih besar atau lebih kecil dari suatu nilai tertentu.
Dalam kasus seperti itu, kita akan mengadakan uji satu ujung dan memeriksa area
(probabilitas) bahwa nilai dari b^ jatuh hanya pada sisi kanan atau sisi kiri dari distribusi t (dan
lihat dibawah kolom 0,10 untuk uji 5 persen).
Konsep di atas juga dapat digunakan untuk menentukan interval keyakinan
(confidence interval) untuk nilai koefisien b yang sesungguhnya. Sehingga, dengan
menggunakan nilai tabel t=2,306 untuk tingkat signifikansi 5 persen (2,5 persen untuk masing-
masing ujung) dan df = 8 dalam contoh iklan-penjualan kita, kita dapat mengatakan bahwa kita
95 persen yakin bahwa nilai sesungguhnya dari b akan terletak antara

b^ ± 2,306( Sb^ )
3,53  2,306 (0,52)
3,53  1,20

Artinya, bahwa kita percata 95 persen nilai b terletak antara 2,33 dan 4,73. Sama halnya, kita
juga dapat mengatakan bahwa kita 99 persen yakin nilai sesunggunya dari b akan terletak
antara 3,53  3,3355 (0,52), atau 1,79 dan 5,27 ( nilai t = 3,355 diperoleh dengan menelusuri
kolom yang bagian atasnya menunjukkan 0,01 pada Tabel C-2 sampai kita mencapai df = 8).

Uji Kecocokan Model dan Korelasi


Selain menguji signifikansi secara statistik dari parameter tertentu hasil estimasi, kita juga dapat
menguji kekuatan variabel penjelas secara keseluruhan dari keseluruhan regresi. ini didapat
dengan menghitung nilai koefisien determinasi, yang biasanya diberi simbol R2. Koefisien
determinasi (coefficient of determination - R2) dinyatakan sebagai proporsi dari variasi total atau
disperse dari variabel terikat (di sekitar reratanya) yang bisa dijelaskan oleh variasi dari
variabel-variabel bebas atau penjelas pada regresi. Dalam hubungan dengan contoh iklan-
penjualan, R2 mengukur berapa besar variasi penjualan perusahaan yang dapat dijelaskan oleh
variasi dari pengeluaran iklannya. Meski dekat titik-titik data hasil observasi jauh pada garis
regresinya, semakin besar proporsi variasi dari penjualan perusahaan yang dapat dijelaskan
oleh variasi dari pengeluaran iklan, dan semakin besar nilai dari koefisien derminisasi R2.
Kita dapat menghitung koefisien determinasi ( R2 ) dengan menentukan total variasi Y ,
variasi Y yang dapat dijelaskan, dan variasi residual yang tidak dapat dijelaskan dari variabel
terikat Y . Variasi total (total variation) pada Y dapat diukur dengan mengkuadratkan
simpangan dari setiap nilai observasi Y dari rata-ratanya dan kemudian menjumlahkannya.
Yaitu:

n
Y =∑ (Y t −Y^ t )2
t =1
(4-13)

Artinya, variasi yang tidak dapat dijelaskan atau variasi residual dari Y diperoleh pertama
dengan mengurangkan setiap nilai observasi Y nilai estimasi dari Y ^ , kemudian dikuadratkan
dan dijumlahkan.
Secara singkat, kita peroleh

Variasi total = variasi yang dapat dijelaskan + variasi yang tidak dapat dijelaskan

∑ (Y t ¿−Ý )2=∑ (Y^ t −Ý )2+ ∑ (Y t −Y^ t )2 ¿


(4-14)

Pemisahan dari variasi total dari Y tersebut menjadi variasi yang dapat dijelaskan dan variasi
yang tidak dapat dijelaskan dalam Figur 4-4 untuk satu observasi data tertentu dalam contoh
iklan-penjualan.

Figur 4-4 Variasi total yang Bisa Dijelaskan dan yang Tidak Bisa Dijelaskan

Variasi total pada variabel terikat ∑ (Y t ¿−Ý )2 ¿, sama dengan variasi yang dapat dijelaskan,
∑ (Y^ t −Ý )2, ditambah variasi
2
yang tidak dapat dijelaskan atau residual, ∑ (Y t −Y t ) . Untuk
^ t −Ý =53,49−50=3,49 , dan ( Y t −Y^ t )=4,51
observasi X 13, Y = 58, Y t −Ý =58−50=8, Y
( Y^ t =53,49) adalah nilai estimasi dari Y t untuk X =13 pada kolom 4 di Tabel 4-4).
Tabel 4-5 Perhitungan untuk Mengestimasi Nilai Koefisien Determinasi ( R2)
(1) (2) (3) (4) (5) (6) (7) (8)
Tahun Yt Y t −Ý ¿¿¿ Y^ t Y^ t −Ý ( Y^ ¿¿ t−Ý )2 ¿ (Y t −Y^ t )2
1 44 -6 36 42,90 -7,10 50,4100 1,2100
2 40 -10 100 39,37 -10,63 112,9969 0,3969
3 42 -8 64 46,43 -3,57 12,7449 19,6249
4 46 -4 16 49,96 -0,04 0,0016 15,6816
5 48 -2 4 46,43 -3,57 12,7449 2,4649
6 52 2 4 49,96 -0,04 0,0016 4,1616
7 54 4 16 53,49 3,49 12,1810 0,2601
8 58 8 64 53,49 3,49 12,1810 20,3401
9 56 6 36 57,02 7,02 49,2804 1,0404
10 60 10 100 60,55 10,55 111,3025 0,3025
∑ Y t =500 ∑( Y t−Y^ t¿)2 =65,4830
n = 10 ∑( Y ¿¿ t−Ý )2=440 ¿ ∑( Y^ ¿¿ t−Ý )2=373,8430
Y = 50

Sekarang, koefisien determinasi, R2, didefinisikan sebagai rasio antara variasi Y yang
dapat dijelaskan dengan variasi total. Atau data dituliskan

variasi yang dapat dijelaskan padaY ∑( Y^ ¿¿ t−Ý )2


R 2= = ¿
variasi total pada Y ∑( Y ¿¿ t− Ý )2 ¿
(4-15)

Jika semua titik-titik data jatuh di atas garis regresi (sangat jarang terjadi), semua variasi dari
veriabel terikat (Y ) akan dapat dijelaskan oleh variasi dalam variabel bebas atau penjelas ( X ),
dan R2 akan sama dengan 1 atau 100 persen. Pada ekstrem sebaliknya, jika tidak ada variasi
dari Y yang diterangkan oleh variasi X , maka R2 akan sama dengan nol. Maka, nilai R2 dapat
diasumsikan sebagai nilai antara 0 dan 1.
Ssementara koefisien determinasi juga secara rutin disediakan oleh hasil komputer dari
analisis regresi, sekarang kita akan menunjukkan bagaimana sesungguhnya menghitung R2
dari masalah iklan-penjualan di atas. Perhitungannya ditunjukkan pada Tabel 4-5. Dari bagian
bawah kolom 4, kita melihat variasi total dari Y (penjualan) sebesar $440 juta. Variasi juga
dapat dijelaskan sebesar $373,84 juta, seperti yang ditunjukkan pada bagian bawah pada
kolom 7. Maka dari itu, koefisien determinasi untuk masalah iklan-penjualan adalah:

$ 373,84
R 2= =0,85
$ 440

Ini berarti bahwa 85 persen dari variasi total dalam penjualan perusahaan dipengaruhi oleh
variasi dalam pengeluaran iklan perusaan.
Kolom terakhir pada tabel 4-5 memberikan variasi yang tidak dapat dijelaskan dari Y
(yang dusah disalin dari kolom 6 dalam tabel 4-4). Variasi yang tidak dapat dijelaskan dari Y
untuk contoh iklan-penjualan adalah $65,48 juta. Jumlah variasi yang dapat dijelaksan dan yang
tidak dapat dijelaskan dari Y ( $ 373,84+ $ 65,48=$ 439,32) adalah sama dengan variasi total
dari Y ($ 440), kecuali untuk kesalahan pembulatan.
Dua hal terakhir yang harus diperhatikan terhadap koefisien determinasi. Pertama
bahwa dalam analisis regresi sederhana, akar kuadrat dari koefisien determinasi ( R2 ¿
merupakan (nilai absolut dari) koefisien korelasi (coefficient of correlation), yang dituliskan
sebagai r . Dimana,

r =√ R 2
(4-16)

Ini merupakan ukuran sederhana dari derajat hubungan atau kovarian yang ada antara variabel
X dan Y . Untuk contoh iklan-penjualan,

r =√ R 2=√ 0,85=0,92

Anda mungkin juga menyukai