Syamsul Hadi 1
ABSTRACT
PENDAHULUAN
Analisis Regresi OLS, sangat banyak dipakai oleh peneliti di berbagai bidang.
Analisis Regresi OLS adalah sebuah analisis yang membahas tentang sebab akibat.
Komponen sebab, biasa disebut dengan variabel bebas, variabel independen, variabel tidak
terikat atau sebutan yang lain dan biasanya dicantumkan dalam model dengan notasi x. Bila
variabel bebas dalam model lebih dari satu, maka notasi x nya diberi indeks sehingga
menjadi x1, x2, x3 sampai dengan xn. Sebutan regresinyapun akan berbeda sesuai dengan
jumlah variabel bebas. Bila variabel bebasnya hanya satu, maka regresinya disebut dengan
regresi sederhana dan kalau variabel bebasnya banyak disebut dengan regresi berganda.
tidak bebas atau sebutan yang lain. Notasi atas variabel dependen ini biasanya adalah y.
regresi ini sehingga fasilitas analisis regresi ini terdapat di semua paket perangkat lunak
statistik yang bersifat umum, seperti SPSS, Eviews, Stata, Statpack maupun SAS. Perangkat
lunak Microsoft Excel tidak mau ketinggalan dan memiliki fasilitas penghitungan regresi
dengan kapasitas variabel independen sebanyak 16 variabel dan data hampir tak terhingga.
Dengan menggunakan fasilitas regresi dalam Microsoft Excel, penulis pernah mencoba
menggunakan 16 (enam belas) variabel independen dan jumlah data sebanyak 1.016.873.
Waktu yang digunakan mengolah data ini juga tidak terlalu lama (di bawah dua menit),
Dengan tersedianya perangkat lunak untuk analisa regresi secara luas dan mudah,
maka peneliti akan dengan mudah menghitung regresi yang semula sangat sulit dan
memakan waktu yang lama. Persoalan yang muncul sekarang adalah penyedia perangkat
keluaran tambahan yang berbeda antara penyedia perangkat lunak yang satu dengan yang
lain. Akibatnya adalah banyak peneliti pemula yang kurang menguasai statistik atau arti
keluaran perangkat lunak melakukan analisis atau interpretasi yang salah. Dalam kasus
PEMANFAATAN REGRESI
Selama ini dalam buku statistik maupun dalam buku panduan perangkat lunak
statistik hanya membahas satu aplikasi atau pemanfaatan saja dari analisa regresi, yaitu
untuk melakukan prediksi. Pada hal dalam praktik banyak dijumpai aplikasi lain yang
menggunakan regresi tetapi sama sekali tidak melakukan prediksi, seperti pada penelitian
memperhitungkan nilai atau besaran koefisiennya. Aplikasi lain adalah tidak melakukan
prediksi maupun mengetahui peran, namun hanya sekedar menghitung besaran saja.
Masing-masing aplikasi ini akan di bahas secara rinci, sehingga bisa diketahui perbedaan
menggunakan aplikasi ini maka peneliti melakukan prakiraan atas nilai variabel dependen
(Ŷ) bila diketahui nilai-nilai variabel independen. Data yang digunakan biasanya bersifat
runut waktu (time series), sehingga bisa diprediksi nilai variabel dependen di waktu-waktu
depan. Data yang digunakan bisa berbasis mingguan, bulanan, triwulanan, semesteran,
tahunan atau dasar waktu yang lain asal konsisten. Dengan menggunakan data runut waktu
atas subyek yang sama, maka peneliti bisa dengan tepat memprediksi nilai variabel
Bila data yang digunakan adalah data kerat lintang (cross section), maka prediksi
yang dilakukan akan memiliki banyak kelemahan. Misal obyek penelitian adalah
kuantitas hasil produksi. Peneliti akan sangat kesulitan dalam mengukur besaran kuantitas
hasil produksi. Untuk bisa mengukur kuantitas, diperlukan keputusan memilih satuan yang
digunakan, karena beragamnya hasil produksi maka akan timbul masalah tersendiri dalam
pemilihannya. Misal peneliti ingin menggunakan satuan liter, tidak semua perusahaan bisa
diukur satuan keluarannya dengan liter; begitupula dengan satuan yang lain. Bila peneliti
ingin lebih spesifik, maka kelompok perusahaan manufaktur dipecah lagi menjadi tiga sub
kelompok, yaitu Industri Dasar dan Kimia, Aneka Industri dan Industri Barang Konsumsi.
Misal peneliti membatasi hanya pada Industri Barang Konsumsi saja, maka masalah masih
rokok, farmasi, kosmetik dan keperluan rumah tangga serta peralatan rumah tangga yang
memiliki satuan keluaran yang sangat berbeda. Dengan demikian sangat sulit bagi peneliti
untuk melakukan prediksi menggunakan regresi yang berbasis data kerat lintang. Bila
masalah ini bisa diatasi, maka permasalahan lain yang muncul adalah prediksi ini untuk
umum atau perusahaan tertentu? Bila prediksi itu untuk umum, maka prediksi itu akan
Manfaat bagi pembaca prediksi juga sangat sedikit, karena hanya memberikan gambaran
secara umum. Bila prediksi ini untuk perusahaan tertentu, maka menjadi sangat naif karena
data perusahaan lain digunakan untuk memprediksi perusahaan tertentu. Berdasar logika
pikir di atas, maka pemanfaatan regresi untuk prediksi hanya tepat bila datanya runut
waktu.
Misal model yang dibentuk oleh peneliti memiliki satu variabel dependen dan tiga
variabel independen dengan jumlah data sebanyak 30 buah. Setelah dilakukan perhitungan,
Regression Statistics
Multiple R 0.9955
R Square 0.9910
Adjusted R Square 0.9900
Standard Error 5.5264
Observations 30
ANOVA
Df SS MS F Significance F
Regression 3 87612.6 29204.2 956.2293 1.03E-26
Residual 26 794.066 30.541
Total 29 88406.67
3
• Nilai intercept = 505,11; berarti apabila X1 sampai dengan X3 sama dengan nol, maka nilai
Y adalah 505,11.
• Nilai 1 sebesar + 1,0628; berarti apabila nilai X1 bertambah 1 satuan (poin), maka nilai Y
2 Penulis menggunakan Microsoft Excell 2007 utuk menghitung regresi. Bila digunakan perangkat
lunak lain, sangat mungkin tampilan keluaran akan berbeda, namun informasi yang disampaikan
lebih-kurang sama.
3 Keluaran bagian ini adalah fokus perhatian peneliti bila regresi digunakan untuk prediksi.
4 Keluaran bagian ini adalah fokus perhatian peneliti bila regresi digunakan untuk membuktikan
• Nilai 3 sebesar - 0,0019; berarti apabila nilai X3 bertambah 1 satuan (poin), maka nilai Y
ditentukan sebesar 5, 7 dan 9; maka nilai Y akan diprediksi sebesar 505,11 + 1,0628 x 5 - 1,0680
Analisis dan aplikasi di atas adalah benar dan fokus perhatian peneliti atas keluaran
perangkat lunak ada pada besarnya nilai . Nilai inilah yang digunakan oleh peneliti untuk
oleh peneliti hanyalah bagian koefisien (Coefficients) saja, sedangkan keluaran yang lain tidak
terlalu diperhatikan atau cenderung diabaikan. Komponen keluaran lain tersebut adalah R
variabel independen menjelaskan perubahan variabel dependen. Dalam kasus di atas, nilai
variabel independen mampu menjelaskan 99% dari perubahan variabel dependen, sehingga
modelnya sangat baik. Demikian pula untuk F test, nilai Significance F sebesar 1.03E-26
variabel dependen, karena nilai Significance F di bawah 5% (Ghozali, 2011; Algifari, 1997).
Penggunaan istilah serempak seperti ini banyak ditemui di buku statistik, namun
penggunaan istilah ini perlu dievaluasi lagi terutama untuk aplikasi peran.
Analisis peneliti tentang R Square, Adjusted R Square, F test dan Significance F, hanya
sampai di batas ini saja. Tidak -atau mungkin belum- pernah ada peneliti yang melakukan
dependen). Akibat dari tindakan ini adalah pembaca laporan bisa menyimpulkan bahwa
hasil perhitungan atas R Square, Adjusted R Square, F test dan Significance F tidak berdampak
pada prediksi nilai Y. Berapapun nilai parameter R Square, Adjusted R Square, F test dan
Significance F tidak berpengaruh pada prediksi nilai Y. Bila simpulan pembaca seperti ini,
maka pertanyaan yang muncul adalah untuk apa parameter di atas dihitung? Jawaban yang
secara implisit terdapat di beberapa buku teks adalah untuk menggambarkan kualitas
prediksi atau kualitas model. Semakin tinggi nilai Adjusted R Square maupun F test, maka
kualitas prediksi akan semakin baik secara kualitatif. Belum pernah ditemui prediksi Y yang
Dengan menggunakan Regresi OLS sebagai alat prediksi seperti ini, maka peneliti
harus memenuhi persyaratan tertentu yang biasa disebut dengan uji asumsi klasik. Hal ini
diperlukan agar pendekatan regresi yang digunakan bisa masuk dalam kriteria BLUE (Best
Linear Unbiased Estimator) (Gujarati, 1995). Pemenuhan persyaratan ini sangat diperlukan,
mengingat regresi OLS ini digunakan sebagai alat prediksi atau estimator. Gujarati (1995)
lebih lanjut menyebutkan ada 11 (sebelas) asumsi yang melingkupi pendekatan regresi,
yaitu:
2. Variabel independen memiliki nilai yang konstan pada setiap kali percobaan.
6. Bila X adalah stokastik maka kesalahan (dan Xnya tidak berhubungan atau
independen.
7. Jumlah observasi harus lebih besar dari jumlah regresor (variabel X).
Tidak semua uji asumsi klasik di atas selalu dibahas dalam buku Statistik maupun
buku Ekonometrika. Ada beberapa penulis buku teks yang hanya menjelaskan tiga uji
asumsi klasik, yaitu multikoliniaritas, homoskedastistas dan otokorelasi (Scroeder dkk, 1986,
Rietveld dan Sunaryanto, 1994, Berry dan Feldman, 1985). Beberapa penulis lain
menambahkan uji normalitas (Algifari, 1997; Gujarati, 1995; Koutsoyanis, 1977). Algifari
(1997) maupun Gujarati (1995) juga membahas bagaimana bila terdapat permasalahan
akibat tidak lolos uji asumsi klasik yang sedang dijalani. Sayangnya, tidak ada -atau
setidaknya sampai saat ini belum ada- buku yang membahas kapan uji asumsi klasik
tertentu wajib dikerjakan, kapan boleh dilewati dan kapan tidak boleh dikerjakan sama
sekali. Dalam kasus tertentu kadang peneliti melakukan pengobatan atas masalah asumsi
Bila peneliti akan menggunakan Regresi OLS ini untuk melakukan prediksi nilai Y,
maka semua komponen asumsi klasik yang berjumlah 11 ini harus terpenuhi. Bila tidak,
maka BLUE tidak akan tercapai. Walaupun demikian, dalam praktiknya, peneliti dalam
kasus tertentu bisa melewati atau tidak memperhatikan uji asumsi klasik tertentu dengan
berbagai alasan.
Asumsi nomor 1 "Regresi memiliki parameter linier" mau tidak mau harus dipenuhi,
karena pendekatan yang digunakan adalah pendekatan linier, sehingga bila data yang
dimiliki tidak memiliki parameter linier, maka data harus dilinierkan dulu. Untuk ini,
peneliti perlu melakukan manipulasi data, seperti manipulasi logaritma, akar atau yang
lain. Hal yang harus diingat adalah peneliti harus sadar bahwa model yang diajukan sudah
sedikit berubah. Bila atas data x1 dilakukan manipulasi log, maka model tidak lagi Y =
peneliti atas hal ini akan sangat fatal akibatnya. Prediksi yang dilakukan peneliti pasti salah
karena nilai x1 harus dianti log terlebih dahulu baru dikalikan . Uji ini bisa dilakukan
dengan mudah karena hampir semua perangkat lunak statistik memiliki fasilitas ini.
Uji asumsi nomor 2 "Memiliki nilai yang konstan pada setiap kali percobaan" bisa
dilewati oleh peneliti bila data yang digunakan tidak berasal dari percobaan. Bila penelitian
yang dilakukan bukan berdasar penelitian percobaan (experiment) (misal menggunakan data
historis), maka uji ini sebenarnya sama sekali tidak boleh dilakukan.
Uji nomor 3 "Rata-rata kesalahan (sama dengan nol" malah sama sekali tidak perlu
dilakukan bila peneliti menggunakan pendekatan kuadrat terkecil (least square) untuk
menghitung regresinya, maka secara otomatis jumlah kesalahan ataupun rata-ratanya akan
sama dengan nol, paling tidak mendekati nol atau nilainya bisa diabaikan. Bila peneliti
menggunakan pendekatan OLS tetapi melakukan uji ini malah lucu, terasa aneh dan
menunjukkan ketidak-tahuan atas alat yang digunakan. Uji ini baru diperlukan bila peneliti
prediktor yang baik. Bila terdapat permasalahan di sini, maka harus dilakukan pengobatan
atau diberi perlakuan tertentu agar permasalahan bisa hilang. Bahasan tentang uji ini
banyak terdapat di buku statistik atau ekonometrika (Algifari, 1997; Gujarati, 1995;
Koutsoyanis, 1977).
Uji asumsi klasik nomor 5 "Tidak ada otokorelasi pada kesalahan (" wajib
dilakukan bila data yang digunakan adalah data runut waktu (time series) atau data yang
ada harus diurutkan dengan pola tertentu dan tidak boleh diubah. Pada data runut waktu,
peneliti tidak boleh mengubah urutan data, mulai dari data tertua sampai dengan data
yang bersifat serial (urutan). Dengan demikian uji ini wajib dilakukan. Bila ternyata ada
permasalahan dengan uji ini, maka peneliti harus melakukan tindakan untuk mengatasinya.
Bila data yang digunakan adalah data kerat lintang, maka uji ini sama sekali tidak boleh
dilakukan. Dalam kasus data kerat lintang, maka peneliti boleh menata data semau sendiri,
sehingga bila ada permasalahan otokorelasi peneliti bisa menata ulang urutan data. Dengan
perubahan urutan data ini maka permasalahan otokorelasi dengan sendirinya akan teratasi
tanpa melakukan pengobatan. Perbedaan urutan data ini tidak akan mengubah nilai
prediksi. Dengan demikian maka melakukan uji otokorelasi pada data kreat lintang adalah
Uji asumsi klasik no 6 ini baru diperlukan bila data yang dipakai dalam penelitian
adalah stokastik. Dalam kasus penelitian bidang manajemen, keuangan maupun akuntansi
uji ini tidak perlu dilakukan, karena data yang dipakai bukan data stokastik.
Asumsi no 7 tidak perlu dilakukan ujinya. Hampir semua perangkat lunak statistik
tidak berjalan bila jumlah data sama dengan jumlah variabel. Tampilan pada Excel adalah
peneliti adalah semakin baik. Sayangnya, bila data yang digunakan lebih sedikit dari jumlah
variabel independen, maka beberapa perangkat lunak seperti Excel maupun SPSS masih
Asumsi no 8 yang menyatakan harus terdapat variabilitas yang cukup pada regresor
sering diabaikan dalam penelitian dan hampir tidak pernah dibahas dalam literatur statistik.
Peneliti biasanya mengasumsikan bahwa asumsi ini sudah terlewati dengan baik.
Variabilitas yang cukup ini bisa didekati dengan besaran standar deviasi, hanya saja tidak
ada standar baku yang bisa digunakan untuk menentukan kecukupan variabilitas.
maksimum - minimum atau nilai rata-rata. Dalam kasus aplikasi regresi untuk prediksi,
variabilitas regresor tidak banyak berdampak pada besaran prediksi. Hal ini disebabkan
Asumsi no 9 ini biasanya dibuktikan tidak secara statistik, tetapi secara kualitatif.
Landasan teori yang diajukan oleh peneliti harus menunjukkan bahwa model penelitian
telah dibuat dengan teliti dan benar. Landasan teori yang diajukan haruslah menjelaskan
bahwa variabel independen benar-benar menjadi sebab atas adanya atau nilai variabel
dependen. Logika sebab-akibat harus diuraikan dengan baik, sehingga asumsi ini bisa
terlewati dengan baik. Kasus yang biasanya terlewat adalah bawa semua variabel
independen menjadi sebab atas terjadinya variabel dependen, namun waktu terjadinya
variabel independen tidak sama (berbarengan), sehingga dampaknya akan sangat berbeda
terhadap variabel dependen. Misal: A, B, C, D dan E mendorong mobil yang mogok. Bila A
sampai E mendorong bersamaan waktu, maka mobil akan maju. Tetapi bila mereka
mendorong tidak bersamaan waktu, maka mobil tidak akan maju. Dengan demikian, maka
uraian dalam landasan teori harus menunjukkan bahwa semua variabel independen
Uji asumsi klasik nomor 10 sifatnya wajib dilakukan. Bila dua variabel independen
mengalami masalah multikolinier, maka sebenarnya dua variabel tersebut adalah identik
atau sama secara statistik. Oleh karena itu salah satu penghapusan salah satu variabel dari
model adalah sebuah solusi yang tepat. Untuk melakukan uji ini, sebaiknya digunakan uji
korelasi antar variabel independen. Penggunaan analisa korelasi ini lebih memberikan
gambaran yang jelas bila terdapat banyak masalah multikolinier. Penggunaan VIF sebagai
dasar eliminasi variabel independen lebih sulit. Misal peneliti memiliki lima variabel
koliniaritas pada variabel C, D dan E; sehingga peneliti harus mengeluarkan satu atau lebih
variabel dari model yang diajukan. Berdasar tabel ini tidak diketahui dengan pasti
bagaimana korelasi riil antara variabel C, D dan E. Untuk mengetahui variabel yang harus
Berdasar pada matriks korelasi pada Tabel 3, diketahui bahwa korelasi tertinggi
terdapat pada variabel C. Variabel ini berkorelasi 0,97 dengan variabel D dan 0,95 dengan
variabel E. Dengan demikian, maka variabel C harus dikeluarkan dari model. Bila hal ini
dilakukan, maka hasilnya ada pada Tabel 4. Pada Tabel 4 ini dapat dilihat bahwa nilai VIF
sudah berada di bawah 10 dan nilai Tolerance di atas 0,1; sehingga busa disimpulkan tidak
Bila peneliti menggunakan model dengan variabel pemoderasi, maka uji multikoli-
nier tidak boleh diterapkan. Bila hal ini tetap dilakukan, maka model yang diajukan tersebut
serta variabel pemoderasi adalah D, serta variabel dependen adalah E. Variabel pemoderasi
mengganggu variabel independen B dan C. Maka model penelitian yang diajukan adalah:
Dengan model regresi seperti ini, maka variabel independen B dan BxD serta C dan CxD
pasti akan berkorelasi tinggi dan terjangkit masalah multikoliniaritas. Bila ternyata tidak,
maka akan sangat lucu, karena mengandung hal yang sama. Bila peneliti melakukan uji
multikoniaritas dan menghilangkan salah satu variabel independen B atau BxD, C atau CxD
maka arah penelitian akan berubah. Bila variabel B dan C yang dihilangkan, maka peneliti
dengan sengaja telah menghilangkan variabel dependen, sehingga judul penelitian juga
harus berubah. Hal yang sama juga akan terjadi kalau peneliti menghilangkan variabel BxD
dan CxD, maka secara implisit peneliti telah menghilangkan variabel pemoderasi.
Hipotesa)
Bila peneliti memanfaatkan analisa regresi ini untuk mengetahui peran masing-
masing variabel independen, maka bagian keluaran yang harus diperhatikan oleh peneliti
dibahas secara khusus sehingga pembaca akan dengan mudah melihatnya. Sebagian buku
statistik membahasnya di bagian tes hipotesa, sehingga pembaca tidak sadar sepenuhnya
Besaran dan yang sangat berperan pada pemanfaatan regresi untuk prediksi
menjadi tidak perlu dilihat lagi atau tidak memiliki peran sama sekali. Misal peneliti
mengambil judul Pengaruh Persepsi Pengalaman Kerja (X1), Kesejahteraan (X2) dan Karier
(X3) terhadap Keinginan untuk naik pangkat (Y), maka di sini jelas bahwa nilai dan sama
Dengan menggunakan keluaran regresi pada Tabel 1 di atas, maka peneliti tidak
mungkin lagi memberikan interpretasi: Nilai intercept = 505,11; berarti apabila X1 sampai
dengan X3 sama dengan nol, maka nilai Y adalah 505,11; ataupun nilai 1 sebesar + 1,062813;
berarti apabila nilai X1 bertambah 1 satuan (poin), maka nilai Y akan naik sebesar 1,062813
satuan. Dalam kasus penelitian persepsi seperti ini, maka nilai X1, X2 maupun X3 tidak
mungkin nilainya dibuat nol. Bila dipaksakan variabel bernilai nol, maka nilai 505,11
sebagai nilai atas Keinginan untuk naik pangkat (Y) di sini sulit diinterpretasikan. Nilai
505,11 ini besar atau kecil? Tidak ada indikator yang pasti. Demikian juga untuk besaran 1,
bagaimana cara menaikkan atau menurunkan persepsi tentang pengalaman kerja. Bila
variabelnya adalah pengalaman kerja yang diukur dengan lama waktu seseorang telah
bekerja, maka pengalaman ini bisa diukur secara pasti dengan satuan tahun, bulan atau
yang lain; tetapi bila persepsi, maka akan sulit sekali menaikkan atau menurunkan presepsi.
Atas hal yang sama, persepsi responden satu mungkin berbeda dengan persepsi responden
lain.
Di sini, hal yang harus memperhatikan oleh peneliti adalah bagaimanakah peran
variabel independen terhadap variabel dependen secara relatif (tidak pasti). Dengan
Adjusted R Square, F, Significance F, t Stat dan P-value atas Intercept dan variabel independen.
Adjusted R Square, F, Significance F, t Stat dan P-value atas Intercept adalah bagian dari uji
model yang harus dilakukan oleh peneliti. Uji model ini harus dilakukan untuk
menunjukkan kepada pembaca bahwa model yang diajukan oleh peneliti memang bagus
jumlah variabel independen. Pada dasarnya, dalam sebuah model yang diajukan, semakin
banyak jumlah variabel independen yang dimasukkan maka R Square akan semakin tinggi.
Oleh karena itu Adjusted R Square inilah yang harus digunakan peneliti untuk menjelaskan
kemampuan menjelaskan sebuah model. Pada dasarnya, semakin tinggi nilai Adjusted R
Square, maka akan semakin baik. Namun, dalam penelitian perilaku, keuangan atau
akuntansi; penyederhanaan pembuatan model kadang sangat besar. Misal dalam kasus
sini, peneliti hanya fokus pada pengumuman pembayaran dividen yang dilakukan oleh
emiten terhadap harga pasar saham, sedangkan variabel yang lain tidak dilihat walaupun
Interpretasi atas nilai Adjusted R Square juga harus diperhatikan peneliti. Dalam
penelitian perilaku, keuangan atau akuntansi biasanya nilai Adjusted R Square berkisar
antara 15% sampai 30%. Bila peneliti menginterpretasikan nilai ini dengan: Model ini
mampu menjelaskan 30% dari perubahan variabel dependen dan 70% lainnya dijelaskan
oleh variabel lain yang tidak masuk dalam model ini, maka penjelasan ini seolah
menunjukkan bahwa model yang diajukan peneliti buruk dan kurang mumpuni.
Interpretasi peneliti seharusnya mengatakan bahwa: Secara riil, hal-hal yang mempengaruhi
variabel dependen sangat banyak, dan penelitian ini hanya mengambil sebagian kecil saja
rata variabel independen adalah 10%. Nilai ini sangat besar bila dibandingkan dengan
jumlah variabel yang secara riil mempengaruhi variabel dependen. Sehingga peneliti bisa
menyimpulkan bahwa pemilihan independen variabel sudah bagus dan model bisa
dianggap baik. Penjelasan seperti ini akan menggeser pengertian pembaca dari 30%
F dan Significance F, di banyak buku statistik terapan (Ghozali, 2011; Alghifari, 1977)
diinterpretasikan atau dijelaskan sebagai uji serempak. Penjelasan lebih lanjut atas uji ini
adalah: Bahwasanya semua variabel independen secara bersama-sama berpengaruh terhadap variabel
dependen. Dalam kasus Regresi OLS digunakan sebagai alat untuk mengetahui peran
variabel independen, istilah serempak di sini agak kurang tepat. Istilah serempak dalam
Kamus Besar Bahasa Indonesia memiliki arti pada saat yang sama dan tiba-tiba atau
tanpa kecuali, berperan atau berpengaruh terhadap variabel dependen. Kata lain dari
pengertian ini adalah bahwa semua variabel independen berpengaruh signifikan terhadap
variabel dependen. Permasalahan yang dihadapi adalah, kadang, tidak semua variabel
hipotesa yang dibangun. Dalam banyak kasus, variabel independen tertentu yang
dimasukkan dalam model oleh peneliti tidak signifikan berpengaruh terhadap variabel
dependen; atau bahkan berlawanan dengan hipotesa yang diajukan -hipotesa yang diajukan
berpengaruh positif ternyata faktanya adalah negatif signifikan. Bila kasusnya seperti ini,
apakah peneliti masih bisa mengatakan bahwa semua variabel independen secara serempak
sebagai tingkat kesalahan model yang harus ditanggung oleh peneliti bila dikatakan bahwa
t Stat dan P-value atas Intercept sangat jarang diperhatikan oleh peneliti. Dalam
banyak kasus, peneliti mengabaikan hal ini. Kalau dilihat pada model regresi yang diajukan
Arti dari model tersebut adalah peneliti berharap melalui landasan teori maupun
hipotesa yang diajukan, bahwa Y hanya dipengaruhi oleh X1, X2, X3 …….. Xn. Bila ternyata
setelah penelitian selesai dan didapatkan Intercept signifikan mempengaruhi Y, maka model
yang signifikan ini bisa dikatakan sebagai diluar kendali peneliti, mengingat bahwa
peneliti telah melakukan telaah pustaka yang cukup guna penyusunan model. yang
signifikan ini menunjukkan bahwa terdapat variabel signifikan lain yang mempengaruhi
variabel dependen, atau dengan kata lain peneliti kurang memasukkan variabel tertentu
yang ternyata penting atau sangat penting. Fenomena ini biasa disebut dengan istilah
missing variable. Hal ini adalah masalah yang biasa dalam penelitian yang menggunakan
model penelitian. Permasalahan akan semakin besar bila hasil regresi menunjukkan bahwa
signifikan, dan X1 sampai Xn tidak signifikan. Bila hal ini sampai terjadi, maka inilah
Tiga indikator pertama ini pada dasarnya adalah indikator atas kualitas model yang
diajukan oleh peneliti. Bila ketiga indikator model di atas bisa masuk ke kategori baik, maka
tidak ada masalah. Bila dari ketiga indikator di atas terdapat indikasi yang kurang baik,
maka fokus perhatian ada pada Significance F sebab indikator ini menunjukkan tingkat
Significance Fnya rendah. Bila signifikan, maka secara matematis bisa dilakukan sedikit
perubahan pada penghitungan, yaitu garis regresinya dilewatkan titik (0,0). Dengan garis
regresi dilewatkan titik (0,0) maka akan secara otomatis tidak ada, sehingga permasalahan
bisa diatasi. Solusi ini bisa dijalankan bila memang model yang diajukan sudah sempurna,
dalam arti hanya variabel yang sudah diajukan itu sajalah yang mempengaruhi variabel
dependen tidak ada yang lain. Bila penentuan model dilakukan dengan pendekatan
penyederhanaan (parsimony), maka pemaksaan garis regresi melalui titik (0,0) sangat tidak
kelemahan penelitian.
Uji asumsi klasik, pada dasarnya hanya diwajibkan bila regresi akan digunakan
sebagai alat memprediksi. Uji ini diperlukan demi didapatnya BLUE (Best Linear Unbiased
Estimator). Aplikasi regresi ini sama sekali tidak untuk memprediksi, sehingga tidak ada
uji asumsi klasik yang tetap harus dilakukan demi tepatnya hasil dan ada beberapa uji yang
Pendekatan yang digunakan di sini adalah pendekatan linier, sehingga uji linieritas
menjadi sesuatu yang wajib dilakukan. Bila ternyata parameter yang ada adalah
kuadratik, parabolik atau yang lain, maka regresi linier baru bisa dijalankan bila
sudah dilakukan manipulasi data sehingga data yang diolah menjadi linier atau
mendekati linier. Bila data yang dimiliki adalah data lancung (spurious) maka
hanya diperlukan bila data yang dipakai adalah data percobaan atau eksperimen.
Bila data yang dipakai bukanlah data hasil eksperimen, maka uji ini tidak perlu
dilakukan.
3. Untuk setiap nilai X, rata-rata kesalahan (sama dengan nol. Uji ini tidak perlu
4. Untuk setiap nilai X, varian kesalahan (konstan atau ada homoskedastistas. Uji ini
heteroskedastistas. Bila masalah ini muncul, maka hasil regresi akan berkurang
Bila peneliti menggunakan perangkat lunak SPSS dan data yang dipakai bukan data
runut waktu, kadang test Durbin-Watson (DW) terklik sehingga secara otomatis
atas keluaran DW, maka secara sadar atau tidak, sebenarnya peneliti berpraduga
akan adanya ketergantungan eror saat (data) ini dengan eror saat (data) sebelumnya.
Padahal, di sisi lain, peneliti menggunakan data kerat lintang atau panel dan dengan
menggunakan data ini maka peneliti bebas untuk melakukan tabulasi data. Dalam
kasus data kerat lintang, maka peneliti boleh mengurutkan data sesuai urutan nama
Mungkinkah eror atas data PT A tergantung atau dipengaruhi eror PT B yang sama
otokorelasi, maka ini adalah sebuah kebetulan. Untuk mengatasi hal ini, maka
peneliti hanya perlu mengubah pola urutan data, maka hasil uji otokorelasinya akan
lolos. Pada dasarnya seorang peneliti melakukan uji, karena ia tidak yakin atas
seuatu hal tertentu. Bila ia yakin atas suatu hal, maka dia tidak mungkin melakukan
sebuah uji. Oleh karena itu peneliti tidak boleh melakukan uji otokorelasi atas data
6. Bila X adalah stokastik maka kesalahan (dan Xnya tidak berhubungan atau
independen. Uji ini tidak perlu dilakukan, karena sangat sulit terlanggar.
7. Jumlah observasi harus lebih besar dari jumlah regresor (variabel X). Asumsi ini
biasanya tidak perlu dilakukan, karena sangat jarang peneliti hanya memiliki sedikit
independen antara 5 sampai 10. Sangat jarang peneliti memiliki lebih dari 10 variabel
independen, namun juga sangat jarang peneliti hanya memiliki data kurang dari 10.
Penelitian yang menggunakan data runut waktu (time series), biasanya hanya
memiliki data yang sedikit. Oleh karena itu, maka variabel independen yang
dimodelkan juga haris deikit saja. Bila jumlah data lebih kecil dari pada atau sama
minimal data (n) sebanyak jumlah variabel independen (k) ditambah 1, namun
Masalah ini berhubungan dengan variabilitas data. Pada banyak buku statistik
asumsi ini jarang sekali dibahas. Tidak ada batasan pasti tentang seberapakah
sebuah data dianggap memiliki variabilitas yang cukup. Dalam banyak kasus,
berapa standar atau nilai baku yang bisa digunakan sebagai dasar penggolongan
Akibat dari kurangnya variabilitas data adalah variabel tersebut akan tidak
yang masuk dalam 5% mahasiswa terpandai, maka data yang didapat akan sangat
homogen atau tidak memiliki variabilitas yang cukup. Akibatnya adalah kepandaian
kuliah.
Penentuan model menjadi hal yang sangat harus diperhatikan oleh peneliti,
diteliti harus diperhatikan dengan baik oleh peneliti. Sangat mungkin bila peneliti
kurang teliti, maka dari 6 variabel independen yang dipilih hanya ada 1 variabel
yang lebih parah adalah bila Significance F sangat rendah, P-value atas juga sangat
rendah, tetapi atas variabel independen sangat tinggi. Kenyataan seperti ini akan
mempersulit peneliti untuk menjelaskan hasil penelitian. Oleh karena itu, peneliti
harus benar-benar yakin atas model yang diajukan dalam penelitiannya, termasuk
digunakan. Statistik hanya bisa melihat angka, tanpa bisa melihat hal yang ada di
pertama adalah bagaimana menghitung Return Saham? Rumus yang biasa dipakai
𝑃𝑡 −𝑃𝑡−1
adalah 𝑅𝑖𝑡 = 𝑃𝑡−1
. Alternatif pemilihan jangka waktu t antara lain harian,
yang berbeda. Bila dipilih tahunan, maka Pt = harga saham tutup tahun ini dan Pt-1 =
harga saham tutup tahun lalu. Bila pendekatan ini yang diambil oleh peneliti, maka
Rit adalah return saham tahun ini. Pembayaran Dividen, di lain pihak, bisa diukur
dengan rasio dividen yang dibayarkan perusahaan (DPR / Dividen Payout Ratio)
pada tahun ini. Dividen, biasanya baru diputuskan setelah dilakukan RUPS yang
mengesahkan Laporan Keuangan tahun ini, dan ini biasanya dilakukan pada tahun
berikutnya (bukan tahun ini). Pertanyaan yang muncul adalah: Mungkinkah ada
kegiatan tahun berikutnya yang bisa mempengaruhi harga saham tahun ini? Atau
Mungkinkah akibat mendahului sebab? Bila peneliti sadar akan hal ini, maka bisa
saja dilakukan penggeseran, yaitu atas variabel Dividen diambil dari data
pembayaran dividen tahun lalu, dan return diambil tahun ini. Bila solusi ini diambil,
maka akan muncul masalah baru, yaitu keputusan pembayaran dividen biasanya
diputuskan sekitar bulan April - Mei, sedangan di lain pihak return dihitung dengan
rentang waktu satu tahun, dari 1 Januari sampai 31 Desember. Pertanyaan yang
muncul adalah mungkinkan kegiatan bulan April berpengaruh pada return bulan
Januari sampai Maret? Bila solusinya adalah menggunakan t harian agar tidak ada
pada Harga Saham setelah dividen dibayarkan, diumumkan atau diputuskan. Bila
berpengaruh sejak beberapa hari sebelum diputuskan sampai beberapa hari setelah
diputuskan. Sebuah informasi tidak mungkin akan bisa berpengaruh dalam waktu
yang sangat lama, karena informasi yang masuk ke pasar modal sangatlah banyak
dan beragam.
Permasalahan lain adalah Aktivitas CSR pelaksanaannya bukan pada saat atau
sekitar RUPS. Aktivitas CSR dilakukan pada tahun lalu dan biasanya sudah
dilaporkan oleh perusahaan setelah aktivitas itu dilakukan dalam bentuk iklan atau
publikasi yang lain. Dampak atas aktivitas ini akan langsung, tidak harus menunggu
adanya RUPS atau terbitnya Laporan Keuangan. Harga saham akan langsung
bereaksi setelah ada laporan aktivitas CSR. Memang benar Dividen berpengaruh
terhadap Harga saham, demikian pula Aktivitas CSR; namun waktunya tidak sama.
Timbul masalah di sini, harga saham yang mana yang diambil dalam penelitian?
Oleh karena itu, dalam penyusunan model peneliti harus yakin bahwa semua
independen variabel terjadi pada waktu yang sama, sehingga bisa diambil waktu
yang sama pula untuk harga sahamnya. Permasalahan ini tidak bisa dideteksi oleh
Uji atas linearitas antar regresor harus dilakukan, karena berhubungan dengan
ketepatan model yang dibangun. Regresor yang saling berkorelasi, pada dasarnya
adalah satu, sehingga tidak ada manfatnya bila dimasukkan dalam model. Adanya
korelasi secara statistik, kadang tidak ada masalah bila secara teori korelasi itu tidak
Uji ini tidak perlu dilakukan bila model yang diajukan oleh peneliti menggunakan
1X1 + 2X2 + 3X2M + . Dalam model ini terlihat bahwa variabel M memoderasi
pengaruh variabel independen X2 terhadap Y. Bila atas model seperti ini dilakukan
uji multikoliliaritas, maka secara otomatis variabel X2 akan berkorelasi tinggi dengan
variabel X2M, karena mengandung unsur yang sama. Walaupun demikian, variabel
lain yang tidak mengandung moderasi tetap harus dilakukan uji multikoliliaritas.
Uji ini ditujukan untuk mengetahui apakah data yang digunakan dalam penelitian
adalah data yang normal. Bila peneliti menggunakan Regresi OLS untuk mengetahui
peran atau pembuktian hipotesa, maka uji ini tidak perlu dilakukan. Dalam kasus
berpengaruh terhadap variabel dependen, berdasarkan data yang ada. Bila uji
normalitas dilakukan dan ternyata tidak lolos (tidak normal), maka peneliti akan
melakukan pengobatan atas data yang ada, sehingga akan didapat data yang normal.
Pemaksaan data menjadi normal ini akan menggeser tujuan penelitian. Misal peneliti
ingin meneliti peran make up terhadap kecantikan seseorang dan sampel yang
diambil sangat luas, mulai dari pedagang kecil di pasar tradisional, pelajar,
mahasiswa sampai pengantin. Dari struktur responden ini, bisa ditebak bahwa data
yang terkumpul pasti bukan data yang normal. Make up pengantin pasti lebih tebal
dan lebih berani dari pada kelompok responden lainnya. Nila peneliti ingin
data pengantin, tetapi data masiswa kuliah atau sejenisnya. Dengan demikian, uji
peneliti melakukan uji ini dan tidak lolos, maka peneliti juga tidak boleh melakukan
pengobatan atau melakukan sesuatu agar tidak seperti itu lagi. Bila usaha
pengobatan dilakukan, maka sama saja dengan mengubah konsep penelitian yang
sedang dijalankan.
Aplikasi regresi ini tidak bertujuan untuk melakukan prediksi variabel dependen di
masa yang akan datang atau pada kondisi tertentu ataupun peran variabel independen
terhadap variabel dependen. Aplikasi ini dilakukan hanya sekedar untuk mengetahui
besarnya nilai saja. Contoh penerapan aplikasi ini adalah penghitungan besaran risiko
saham tertentu. Untuk mengetahui besaran risiko saham, dihitung dengan meregresikan
Rit = + Rmt
Pada kasus seperti ini, maka hal yang diperhatrikan hanyalah besaran nilai saja,
sedangkan yang lain tidak diperhatikan. Semakin besar nilai b, maka semakin tinggi pula
Dengan menggunakan aplikasi seperti ini, maka peneliti tidak ingin mengetahui
besaran Rit atau peran Rmt terhadap Rit. Uji asumsi klasik sama sekali tidak perlu
dipertimbangkan.
Imam Ghozali, 2011. Aplikasi Analisis Multivariate Dengan Program SPSS. Semarang :
BP Universitas Diponegoro