Tabl 4-2. Pengeluaran Iklan dan Penerimaan Penjualan suatu Perusahaan (dalam jutaan dolar)
Tahun (t) 1 2 3 4 5 6 7 8 9 10
Jika kita menggambarkan setiap pasangan nilai iklan-penjualan dalam Tabel 4-2
sebagai suatu titik dalam suatu grafik, dengan pengeluaran iklan (variabel bebas atau variabel
penjelas) diukur sepanjang sumbu horizontal dan penerimaan penjualan (variabel terikat) diukur
sepanjang sumbu vertikal, kita akan memperoleh titik-titik seperti dalam Figur 4-2. Ini disebut
sebagai diagram pencar (scatter diagram) karena ini menunjukkan penyebaran dari titik-titik
dalam daerah X-Y. Dari Figur 4-2 (diagram pencar), kita lihat bahwa terdapat hubungan yang
positif antara tingkat pengeluaran iklan perusahaan dengan penerimaan penjualannya (tingkat
pengeluaran iklan yang lebih tinggi berhubungan dengan tingkat penerimaan yang lebih tinggi
pula) dan bahwa hubungan ini diperkirakan merupakan hubungan linear.
Salah satu cara mengestimasi hubungan linear antara pengeluaran iklan perusahaan
dengan penerimaan penjualannya adalah dengan menggambarkan, secara pandangan mata,
suatu garis lurus dengan kemiringan positif yang paling dapat mewakili di antara titik-titik data
yang ada (sehingga titik-titik data tersebut berada pada jarak yang kurang lebih sama pada
kedua sisi garis). Dengan memperpanjang garis tersebut ke sumbu vertikal, kita dapat
mengestimasi penerimaan penjualan perusahaan tersebur dengan pengeluaran iklan sama
dengan nol. Kemiringan garis ini bisa digunakan untuk estimasi peningkatan penerimaan
penjualan yang bisa diharapkan oleh perusahaan setiap kenaikan $1 juta dolar pengeluaran
iklan. Ini akan memberikan estimasi kasar mengenai hubungan linear antara penerimaan
penjualan (Y) dengan pengeluaran iklan (X) dari bentuk Persamaan 4-1 :
Y =a+bX
(4-1)
Dalam persamaan 4-1, a adalah titik potong vertikal dari estimasi hubungan linear dan
memberikan nilai Y pada saat X = 0, sementara b merupakan kemiringan dari garis itu dan
memberikan estimasi kenaikan Y yang diakibatkan peningkatan setiap unit dari X. Manajer
tersebut dapat menggunakan estimasi ini untuk mengestimasi seberapa banyak penerimaan
penjualan perusahan yang akan terjadi jika pengeluaran iklan berada anatara $9 Jjuta dan %15
juta per tahun (kisaran pengeluaran iklan yang diberikan pada Tabel 4-2 dan Figur 4-2), atau
jika pengeluaran iklan meningkat, katakanlah menjadi $16 juta per tahun, atau jatuh menjadi $8
juta per tahun.
Figur 4-2 Pengeluaran Iklan dan Penerimaan Penjualan suatu Perusahaan dalam 10 Tahunan
Pengeluaran iklan (X), variabel bebas, diukur sepanjang sumbu horizontal, sementara
penerimaan penjualan (Y) variabel terikat, diukur sepanjang sumbu vertikal. Setiap titik (dot)
dalam gambar mewakili satu kombinasi pengeluaran iklan-penjualan yang ada dalam tabel 4-2.
Kesulitan dengan membuat garis yang cocok dengan titik-titik data dalam Figur 4-2
secara visual adalah bahwa peneliti yang berbeda mungkin akan merasa cocok dengan garis
yang berbeda pula untuk titik-titik data yang sama sehingga menghasilkan hasil yang berbeda.
Analisis regresi (refression analysis) merupakan teknik statistik yang dapat menghasilkan
garis yang paling baik yang cocok dengan data yang sesuai dengan kriteria statistika yang
objektif, sehingga semua peneliti yang melihat data yang sama akan mempunyai hasil yang
sama (menghasilkan garis yang sama). Secara sepesifik, garis regresi (regression line)
merupakan garis yang dihasilkan dengan meminimumkan jumlah dari simpangan kuadrat pada
sumbu vertikal dari setiap titik dari garis regresi tersebut. Metode ini kemudian disebut sebagai
metode kuadrat terkecil biasa (ordinary least-squares-OLS method).” Garis regresi yang
memenuhi metode kuadrat terkecil (least-square method) ini diperlihatkan pada Figur 4-3.
Dalam Figur 4-3, Y 1 dimaksudkan sebagai penerimaan penjualan aktual atau yang
diobservasi sebesar $44 juta dihubungkan dengan pengeluaran iklan sebesar $10 juta pada
tahun pertama data ini dikumpulkan (lihat Tabel 4-2). Nilai Y ^1 (dibaca: Y topi sub 1)
menunjukkan penerimaan penjualan yang diperoleh dari estimasi garis regresi untuk
pengeluaran iklan sebesar $10 juta pada tahun pertama. Simbol e 1 dalam gambar simpangan
pada sumbu vertikal atau galat penerimaan penjualan aktual atau hasil observasi dari
penerimaan penjualan yang diperoleh dari estimasi garis regresi pada tahun pertama. Di mana,
e 1=Y 1−Y^1
(4-2)
Galat tipe ini timbul karena (1) berbagai variabel penjelas yang mempunyai sedikit pengaruh
dan kurang beraturan terhadap Y tidak dimasukkan ke dalam Persamaan 4-1, (2) terdapat
kemungkinan adanya kesalahan pengukuran pada Y, dan (3) perilaku manusia yang acak
membuahkan hasil yang berbeda (katakan, pembelian yang berbeda dari suatu komoditas)
dalam kondisi yang sama.
Karena terdapat 10 titik observasi pada Figur 4-3, kita memiliki 10 buah galat atau
simpangan pada sumbu vertikal. Ini diberi nama e 1 hingga e 10 dalam figur. Garis regresi yang
diperlihatkan pada Figur 4-3 merupakan garis yang paling cocok untuk titik data dalam
pengertian bahwa jumlah hasil kuadrat (secara vertikal) deviasi dari garis yang ada adalah
minimum. Artinya, setiap nilai dari ke-10 e yang ada pertama-tama dikuadratkan kemudian
dijumlahkan. Garis regresi merupakan garis yang jumlah simpangan kuadratnya paling kecil.
Bagaimana nilai a^ (titik potong vertikal) dan b^ (koefisien kemiringan) dari garis regresi yang
mempu meminimumkan jumlah dari simpangan kuadrat sesungguhnya diperoleh, akan dibahas
berikut ini.
Garis regresi yang diperlihatkan pada gambar ini merupakan garis yang paling cocok yang
dapat mewakili titik-titik data dalam arti kata jumlah simpangan kuadrat pada sumbu vertikal dari
titik-titik adalah yang minimum.
Dalam bagian ini kita membahas bagaimana (1) menghitung nilai a (titik potong vertikal) dan
nilai b (koefisien kemiringan) dari garis regresi; (2) mengadakan uji signifikansi dari estimasi-
estimasi parameter; (3) membuat interval keyakinan untuk parameter yang sebenarnya; (4)
menguji kekuatan penjelas secara keseluruhan dari regresi. Sementara semua biasanya
dilakukan dengan komputer, kita akan mulai mengerjakan semua operasi ini secara manual
terlebih dahulu dengan angka-angka yang sederhana dengan tujuan menunjukkan bagaiman
analisis regresi dibuat dan apa saja isinya.
Y^t =a^ + b^ X t
(4-3)
Jumlah dari simpangan kuadrat atau galat ini dapat dituliskan sebagai:
(4-5)
di mana ∑tn=1 adalah jumlah keseluruhan observasi, dari periode waktu t = 1 sampai ke t = n.
Estimasi dari nilai a dan b (yaitu, a^ dan b^ ) diperoleh dari meminimumkan jumlah simpangan
kuadrat (meminimumkan persamaan 4-5) nilai b^ diberikan oleh :
(4-6)
di mana Ý dan X́ adalah rata-rata nilai dari Y t dan X t , nilai a^ tersebut kemudian diperoleh dari
a^ =Ý − b^ X́
(4-7)
Tabel 4-3 menunjukkan perhitungan untuk menentukan nilai a^ dan b^ untuk data iklan-
penjualan pada Tabel 4-2. Dengan mensubstitusi nilai yang dihasilkan dari Tabel 4-3 ke dalam,
Persamaan 4-6, kita memperoleh nilai b^ sebagai berikut:
(4-8)
Nilai a^ dan b^ diperoleh dengan menemukan turunan parsial dari persamaan 4-5
terhadap a^ dan b^ , kemudian menyamakan kedua persamaan normal tersebut dengan nol, dan
menyelesaikannya secara simultan untuk menghasilkan Persamaan 4-6. [Lihat Dominick
Salvatore dan Derrick Reagle, Theory and Problems of Statistics and Econometrics, edisi ke-2
(New York: McGraw-Hill, 2002), Bab 6.]
Lalu dengan mensubtitusi nilai b^ yang diperoleh di atas nilai dan nilai Ý dan X́ yang diperoleh
dari Tabel 4-3 ke dalam Persamaan 4-7, kita memperoleh nilai a^ :
Y^ t =7,60+3,53 X t
(4-8)
Garis regresi ini menunjukkan bahwa pengeluaran iklan sebesar nol (dengan X t =0 ),
^ t ) adalah sebesar $7,60 juta. Dengan iklan sebesar
penerimaan penjualan yang diharapkan (Y
$10 juta pada tahun pertama observasi ( X 1 = $10 juta), Y
^ 1 = $7,60 + $3,53(10) = $42,90 juta.
^
Pada saat yang lain, dengan X 10 = $15 juta, Y
^ 1 = $7,60 + $3,53(15) = $60,55 juta. Dengan
menggambarkan kedua titik terakhir ini (10; 42,90) dan (15; 60,55) dan menggabungkan
keduanya dengan garis lurus, kita menghasilkan garis regresi pada Figur 4-3.
Garis regresi hasil estimasi juga dapat digunakan untuk mengestimasi bahwa
penerimaan penjualan perusahaan dengan mengeluarkan iklan $16 juta akan menjadi $7,60 +
$3,53(16) = $64,08 juta, atau $3,53 juta lebih tinggi dibandingkan dengan pengeluaran iklan
sebesar $15 juta. Perlu diingatkan dalam penggunaan garis regresi untuk mengestimasi
penerimaan penjualan dari perusahaan untuk pengeluaran iklan jauh berbeda dengan yang
digunakan pada saat mengestimasi garis regresi itu sendiri. Akan tetapi, garis regresi
seharusnya hanya dipakai untuk mengestimasi penerimaan penjualan perusahaan yang berasal
dari pengeluaran iklan yang masih termasuk dalam kisaran atau setidaknya masih mendekati
dengan nilai iklan yang dipakai dalam estimasi garis regresi. Jadi, tidak banyak keyakinan yang
dapat diikutsertakan dalam nilai estimasi koefisien a^ , karena ini memberikan penerimaan
penjualan perusahaan pada saat pengeluaran iklan sama dengan nol (jauh dari nilai observasi)
karena hal inilah, kita akan mengonsentrasikan perhatian kita pada nilai b^ , atau koefisien
kemiringan. Nilai b^ mengukur peningkatan dari penerimaan penjualan perusahaan yang
diakibatkan karena adanya peningkatan setiap unit (dalam hal ini setiap $1 juta) dari
pengeluaran iklan perusahaan. Artinya, b^ = △ Y / △ X . Dalam istilah yang kita gunakan pada
Bab 2. b^ mengukur efek marginal terhadap Y (penjualan) dari setiap unit perubahan X (iklan).
t Xt Yt
X t − X́ Y t −Ý ( X ¿ ¿t− X́)( Y t−Ý )¿ ( X ¿ ¿t− X́)2 ¿
Tahun Iklan Penjualan
1 10 44 -2 -6 12 4
2 9 40 -3 -10 30 9
3 11 42 -1 -8 8 1
4 12 46 0 -4 0 0
5 11 48 -1 -2 2 1
6 12 52 0 2 0 0
7 13 54 1 4 4 1
8 13 58 1 8 8 1
9 14 56 2 6 12 4
10 15 60 3 10 30 9
n = 10 ∑ X t=120 ∑ Y t =500
0 0 106 30
∑ Y = 20 Y = 50
Analisis regresi dilandasi oleh beberapa asumsi yang penting. Yaitu bahwa faktor galat
(1) mempunyai distribusi normal, (2) mempunyai rata-rata atau nilai harapan sama dengan nol,
dan (3) mempunyai varians yang konstan dalam setiap periode waktu dan pada semua nilai X ,
serta (4) nilainyan pada suatu periode tertentu tidak tergantung pada nilainya dalam periode
mana pun juga. Asumsi-asumsi ini dibutuhkan untuk menghasilkan estimasi koefisien
kemiringan yang tidak bias dan mampu memenuhi teori probabilitas untuk menguji keandalan
dari estimasi. Bagaimana ini dilakukan akan ditunjukkan berikutnya.
√
2 2
Sb^ =
∑ (Y t −Y^ t ) =¿
( n−k) ∑ ( X t − X́ )
2
√ ∑ et
(n−k ) ∑ ( X t− X́ )
2
¿
(4-9)
Dimana Y t dan X t merupakan sampel observasi aktual dari variabel terikat dan bebas pada
^ t merupakan nilai variabel terikat pada tahunt yang diestimasi dari garis regresi, X́
tahun t , Y
merupakan rata-rata atau nilai yang diharapkan dari variabel bebas, e merupakan faktor galat
^ t , n adalah jumlah observasi atau titik data yang dipakai dalam mengestimasi garis
atau Y t −Y
regresi, dan k adalah jumlah koefisien yang diestimasi dalam regresi. Nilai n−k disebut sebagai
derajat kebebasan (degrees of freedom – df). Karena dalan analisis regresi sederhana
(simple regression analysis) kita mengestimasi dua parameter, a^ dan b^ , maka nilai k adalah 2,
sehingga derajat kebebasan adalah n−2.
Nilai Sb^ dari contoh iklan-penjualan ini dapat dihitung dengan mensubstitusikan nilai-nilai
dari Tabel 4-4 (perpanjangan dari Tabel 4-3) ke dalam Persamaan 4-9. Dalam Tabel 4-4, nilai
Y^ t pada kolom 4 diperoleh dengan mensubstitusi berbagai nilai pengeluaran iklan pada kolom 2
ke dalam Persamaan 4-8. Kolom 5 diperoleh dengan mengurangi nilai pada kolom 4 dari nilai
pada kolom 3, dan kolom 6 diperoleh dengan cara mengkuadratkan nilai pada kolom 5, dan
akhirnya pada kolom 7 diperoleh dari Tabel 4-3.
Maka, nilai Sb^ adalah sama dengan
∑ et 2
Sb^ =
√
( n−k)∑( X ¿ ¿ 1− X́ )
2
=
√ 65,4830
( 10−2 ) (30)
=√ 0,2728=0,52 ¿
Setelah diperoleh nilai Sb^ , berikutnya kita menghitung nilai b^ /S ^b. Ini disebut sebagai nilai
statistik t (t statistic) atau rasio t. Semakin tinggi rasio t, semakin yakin bahwa nilai b yang
benar (tetap tidak diketahui) yang kita cari adalah tidak sama dengan nol (terdapat hubungan
yang signifikan antara iklan dan penjualan). untuk contoh penjualan-iklan kita, diperoleh nilai
b^ 3,53
t= = =6,79
S b^ 0,52
(4-10)
Untuk menghasilkan uji signifikansi (significance test) yang objektif untuk b^ , kita
bandingkan hasil perhitungan rasio t dengan nilai kritis (critical value) dari distribusi t dengan
n−k =10−2=8 df yang diberikan oleh Tabel C-2. Ini disebut sebagai uji t (t test) dari
signifikansi secara statistikal dari koefisien hasil estimasi yang biasanya dilakukan pada tingkat
signifikansi 5 persen. Lalu, turun pada kolom yang bagian atasnya menunjukkan nilai 0,05
(menunjukkan nilai 2,5 persen daerah atau probabilitas dari setiap ujung dari distribusi t , untuk
total 5 persen bagi kedua ujung) pada tabel C-2 sampai kita mendapat df = 8. Ini memberikan
nilai kritis dari t=2,306 untuk uji t dua ujung.
Karena nilai t=6,79 melebihi nilai tabel t=2,306 untuk tingkat signifikansi 5 persen
dengan df = 8, maka kita menolak hipotesis nol bahwa tidak terdapat hubungan antara X (iklan)
an Y (penjualan) serta menerima hipotesis alternatif yang mengatakan adanya hubungan yang
signifikan antara X dan Y. Untuk mengatakan adanya hubungan yang signifikan secara statistik
antara X dan Y pada tingkat 5 persen berari kita 95 persen percaya bahwa hubungan seperti itu
ada. Dengan kata lain, terdapat kurang dari 1 dari 20 kemungkinan (kurang dari 5 persen) itu
adalah salah, atau menerima hipotesis bahwa terdapat hubungan yang signifikan antara X dan
Y, di mana sebenarnya tidak.
b^ ± 2,306( Sb^ )
3,53 2,306 (0,52)
3,53 1,20
Artinya, bahwa kita percata 95 persen nilai b terletak antara 2,33 dan 4,73. Sama halnya, kita
juga dapat mengatakan bahwa kita 99 persen yakin nilai sesunggunya dari b akan terletak
antara 3,53 3,3355 (0,52), atau 1,79 dan 5,27 ( nilai t = 3,355 diperoleh dengan menelusuri
kolom yang bagian atasnya menunjukkan 0,01 pada Tabel C-2 sampai kita mencapai df = 8).
n
Y =∑ (Y t −Y^ t )2
t =1
(4-13)
Artinya, variasi yang tidak dapat dijelaskan atau variasi residual dari Y diperoleh pertama
dengan mengurangkan setiap nilai observasi Y nilai estimasi dari Y ^ , kemudian dikuadratkan
dan dijumlahkan.
Secara singkat, kita peroleh
Variasi total = variasi yang dapat dijelaskan + variasi yang tidak dapat dijelaskan
Pemisahan dari variasi total dari Y tersebut menjadi variasi yang dapat dijelaskan dan variasi
yang tidak dapat dijelaskan dalam Figur 4-4 untuk satu observasi data tertentu dalam contoh
iklan-penjualan.
Figur 4-4 Variasi total yang Bisa Dijelaskan dan yang Tidak Bisa Dijelaskan
Variasi total pada variabel terikat ∑ (Y t ¿−Ý )2 ¿, sama dengan variasi yang dapat dijelaskan,
∑ (Y^ t −Ý )2, ditambah variasi
2
yang tidak dapat dijelaskan atau residual, ∑ (Y t −Y t ) . Untuk
^ t −Ý =53,49−50=3,49 , dan ( Y t −Y^ t )=4,51
observasi X 13, Y = 58, Y t −Ý =58−50=8, Y
( Y^ t =53,49) adalah nilai estimasi dari Y t untuk X =13 pada kolom 4 di Tabel 4-4).
Tabel 4-5 Perhitungan untuk Mengestimasi Nilai Koefisien Determinasi ( R2)
(1) (2) (3) (4) (5) (6) (7) (8)
Tahun Yt Y t −Ý ¿¿¿ Y^ t Y^ t −Ý ( Y^ ¿¿ t−Ý )2 ¿ (Y t −Y^ t )2
1 44 -6 36 42,90 -7,10 50,4100 1,2100
2 40 -10 100 39,37 -10,63 112,9969 0,3969
3 42 -8 64 46,43 -3,57 12,7449 19,6249
4 46 -4 16 49,96 -0,04 0,0016 15,6816
5 48 -2 4 46,43 -3,57 12,7449 2,4649
6 52 2 4 49,96 -0,04 0,0016 4,1616
7 54 4 16 53,49 3,49 12,1810 0,2601
8 58 8 64 53,49 3,49 12,1810 20,3401
9 56 6 36 57,02 7,02 49,2804 1,0404
10 60 10 100 60,55 10,55 111,3025 0,3025
∑ Y t =500 ∑( Y t−Y^ t¿)2 =65,4830
n = 10 ∑( Y ¿¿ t−Ý )2=440 ¿ ∑( Y^ ¿¿ t−Ý )2=373,8430
Y = 50
Sekarang, koefisien determinasi, R2, didefinisikan sebagai rasio antara variasi Y yang
dapat dijelaskan dengan variasi total. Atau data dituliskan
Jika semua titik-titik data jatuh di atas garis regresi (sangat jarang terjadi), semua variasi dari
veriabel terikat (Y ) akan dapat dijelaskan oleh variasi dalam variabel bebas atau penjelas ( X ),
dan R2 akan sama dengan 1 atau 100 persen. Pada ekstrem sebaliknya, jika tidak ada variasi
dari Y yang diterangkan oleh variasi X , maka R2 akan sama dengan nol. Maka, nilai R2 dapat
diasumsikan sebagai nilai antara 0 dan 1.
Ssementara koefisien determinasi juga secara rutin disediakan oleh hasil komputer dari
analisis regresi, sekarang kita akan menunjukkan bagaimana sesungguhnya menghitung R2
dari masalah iklan-penjualan di atas. Perhitungannya ditunjukkan pada Tabel 4-5. Dari bagian
bawah kolom 4, kita melihat variasi total dari Y (penjualan) sebesar $440 juta. Variasi juga
dapat dijelaskan sebesar $373,84 juta, seperti yang ditunjukkan pada bagian bawah pada
kolom 7. Maka dari itu, koefisien determinasi untuk masalah iklan-penjualan adalah:
$ 373,84
R 2= =0,85
$ 440
Ini berarti bahwa 85 persen dari variasi total dalam penjualan perusahaan dipengaruhi oleh
variasi dalam pengeluaran iklan perusaan.
Kolom terakhir pada tabel 4-5 memberikan variasi yang tidak dapat dijelaskan dari Y
(yang dusah disalin dari kolom 6 dalam tabel 4-4). Variasi yang tidak dapat dijelaskan dari Y
untuk contoh iklan-penjualan adalah $65,48 juta. Jumlah variasi yang dapat dijelaksan dan yang
tidak dapat dijelaskan dari Y ( $ 373,84+ $ 65,48=$ 439,32) adalah sama dengan variasi total
dari Y ($ 440), kecuali untuk kesalahan pembulatan.
Dua hal terakhir yang harus diperhatikan terhadap koefisien determinasi. Pertama
bahwa dalam analisis regresi sederhana, akar kuadrat dari koefisien determinasi ( R2 ¿
merupakan (nilai absolut dari) koefisien korelasi (coefficient of correlation), yang dituliskan
sebagai r . Dimana,
r =√ R 2
(4-16)
Ini merupakan ukuran sederhana dari derajat hubungan atau kovarian yang ada antara variabel
X dan Y . Untuk contoh iklan-penjualan,
r =√ R 2=√ 0,85=0,92