STATISTIKA
BISNIS
Uji Asumsi Klasik dan Uji
Normalitas Data
Fakultas
Ekonomi & Bisnis
Abstract
Program
Studi
Akuntansi
Tatap
Muka
04
Kode MK
Disusun Oleh
84002
Kompetensi
Uji Normalitas
Statistik Bisnis
Nur Azmi Karim SE,M.Si
Uji normalitas adalah untuk melihat apakah nilai residual terdistribusi normal atau tidak.
Model regresi yang baik adalah memiliki nilai residual yang terdistribusi normal. Jadi uji
normalitas bukan dilakukan pada masing-masing variabel tetapi pada nilai residualnya. Sering
terjadi kesalahan yang jamak yaitu bahwa uji normalitas dilakukan pada masing-masing
variabel. Hal ini tidak dilarang tetapi model regresi memerlukan normalitas pada nilai
residualnya bukan pada masing-masing variabel penelitian.
Pengertian normal secara sederhana dapat dianalogikan dengan sebuah kelas. Dalam
kelas siswa yang bodoh sekali dan pandai sekali jumlahnya hanya sedikit dan sebagian besar
berada pada kategori sedang atau rata-rata. Jika kelas tersebut bodoh semua maka tidak
normal, atau sekolah luar biasa. Dan sebaliknya jika suatu kelas banyak yang pandai maka
kelas tersebut tidak normal atau merupakan kelas unggulan. Pengamatan data yang normal
akan memberikan nilai ekstrim rendah dan ekstrim tinggi yang sedikit dan kebanyakan
mengumpul di tengah. Demikian juga nilai rata-rata, modus dan median relatif dekat.
Uji normalitas dapat dilakukan dengan uji histogram, uji normal P Plot, uji Chi Square,
Skewness dan Kurtosis atau uji Kolmogorov Smirnov. Tidak ada metode yang paling baik atau
paling tepat. Tipsnya adalah bahwa pengujian dengan metode grafik sering menimbulkan
perbedaan persepsi di antara beberapa pengamat, sehingga penggunaan uji normalitas dengan
uji statistik bebas dari keragu-raguan, meskipun tidak ada jaminan bahwa pengujian dengan uji
statistik lebih baik dari pada pengujian dengan metode grafik.
Jika residual tidak normal tetapi dekat dengan nilai kritis (misalnya signifikansi
Kolmogorov Smirnov sebesar 0,049) maka dapat dicoba dengan metode lain yang mungkin
memberikan justifikasi normal. Tetapi jika jauh dari nilai normal, maka dapat dilakukan beberapa
langkah yaitu: melakukan transformasi data, melakukan trimming data outliers atau menambah
data observasi. Transformasi dapat dilakukan ke dalam bentuk Logaritma natural, akar kuadrat,
inverse, atau bentuk yang lain tergantung dari bentuk kurva normalnya, apakah condong ke kiri,
ke kanan, mengumpul di tengah atau menyebar ke samping kanan dan kiri.
2. Uji Multikolinearitas
Uji multikolinearitas adalah untuk melihat ada atau tidaknya korelasi yang tinggi antara
variabel-variabel bebas dalam suatu model regresi linear berganda. Jika ada korelasi yang
tinggi di antara variabel-variabel bebasnya, maka hubungan antara variabel bebas terhadap
variabel terikatnya menjadi terganggu. Sebagai ilustrasi, adalah model regresi dengan variabel
bebasnya motivasi, kepemimpinan dan kepuasan kerja dengan variabel terikatnya adalah
1
1
Statistik Bisnis
Nur Azmi Karim SE,M.Si
kinerja. Logika sederhananya adalah bahwa model tersebut untuk mencari pengaruh antara
motivasi, kepemimpinan dan kepuasan kerja terhadap kinerja. Jadi tidak boleh ada korelasi
yang tinggi antara motivasi dengan kepemimpinan, motivasi dengan kepuasan kerja atau antara
kepemimpinan dengan kepuasan kerja.
Alat statistik yang sering dipergunakan untuk menguji gangguan multikolinearitas adalah
dengan variance inflation factor (VIF), korelasi pearson antara variabel-variabel bebas, atau
dengan melihat eigenvalues dan condition index (CI).
Beberapa alternatif cara untuk mengatasi masalah multikolinearitas adalah sebagai
berikut:
1.
Mengganti
atau mengeluarkan
variabel
yang
mempunyai
korelasi
yang
tinggi.
2.
3.
Mentransformasikan data ke dalam bentuk lain, misalnya logaritma natural, akar kuadrat
atau bentuk first difference delta.
3.
Uji Heteroskedastisitas
Uji heteroskedastisitas adalah untuk melihat apakah terdapat ketidaksamaan varians
dari residual satu ke pengamatan ke pengamatan yang lain. Model regresi yang memenuhi
persyaratan adalah di mana terdapat kesamaan varians dari residual satu pengamatan ke
pengamatan yang lain tetap atau disebut homoskedastisitas. Deteksi heteroskedastisitas dapat
dilakukan dengan metode scatter plot dengan memplotkan nilai ZPRED (nilai prediksi) dengan
SRESID (nilai residualnya). Model yang baik didapatkan jika tidak terdapat pola tertentu pada
grafik, seperti mengumpul di tengah, menyempit kemudian melebar atau sebaliknya melebar
kemudian menyempit. Uji statistik yang dapat digunakan adalah uji Glejser, uji Park atau uji
White.
Beberapa alternatif solusi jika model menyalahi asumsi heteroskedastisitas adalah dengan
mentransformasikan ke dalam bentuk logaritma, yang hanya dapat dilakukan jika semua data
bernilai positif. Atau dapat juga dilakukan dengan membagi semua variabel dengan variabel
yang mengalami gangguan heteroskedastisitas.
4.
Uji Autokorelasi
Uji autokorelasi adalah untuk melihat apakah terjadi korelasi antara suatu periode t
dengan periode sebelumnya (t -1). Secara sederhana adalah bahwa analisis regresi adalah
1
1
Statistik Bisnis
Nur Azmi Karim SE,M.Si
untuk melihat pengaruh antara variabel bebas terhadap variabel terikat, jadi tidak boleh ada
korelasi antara observasi dengan data observasi sebelumnya. Sebagai contoh adalah pengaruh
antara tingkat inflasi bulanan terhadap nilai tukar rupiah terhadap dollar. Data tingkat inflasi
pada bulan tertentu, katakanlah bulan Februari, akan dipengaruhi oleh tingkat inflasi bulan
Januari. Berarti terdapat gangguan autokorelasi pada model tersebut. Contoh lain, pengeluaran
rutin dalam suatu rumah tangga. Ketika pada bulan Januari suatu keluarga mengeluarkan
belanja bulanan yang relatif tinggi, maka tanpa ada pengaruh dari apapun, pengeluaran pada
bulan Februari akan rendah. Uji autokorelasi hanya dilakukan pada data time series (runtut
waktu) dan tidak perlu dilakukan pada data cross section seperti pada kuesioner di mana
pengukuran semua variabel dilakukan secara serempak pada saat yang bersamaan. Model
regresi pada penelitian di Bursa Efek Indonesia di mana periodenya lebih dari satu tahun
biasanya memerlukan uji autokorelasi.
Beberapa uji statistik yang sering dipergunakan adalah uji Durbin-Watson, uji dengan Run
Test dan jika data observasi di atas 100 data sebaiknya menggunakan uji Lagrange Multiplier.
Beberapa cara untuk menanggulangi masalah autokorelasi adalah dengan mentransformasikan
data atau bisa juga dengan mengubah model regresi ke dalam bentuk persamaan beda umum
(generalized difference equation). Selain itu juga dapat dilakukan dengan memasukkan variabel
lag dari variabel terikatnya menjadi salah satu variabel bebas, sehingga data observasi menjadi
berkurang 1.
5.
Uji Linearitas
Uji linearitas dipergunakan untuk melihat apakah model yang dibangun mempunyai
hubungan linear atau tidak. Uji ini jarang digunakan pada berbagai penelitian, karena biasanya
model dibentuk berdasarkan telaah teoretis bahwa hubungan antara variabel bebas dengan
variabel terikatnya adalah linear. Hubungan antar variabel yang secara teori bukan merupakan
hubungan linear sebenarnya sudah tidak dapat dianalisis dengan regresi linear, misalnya
masalah elastisitas.
Jika ada hubungan antara dua variabel yang belum diketahui apakah linear atau tidak, uji
linearitas tidak dapat digunakan untuk memberikan adjustment bahwa hubungan tersebut
bersifat linear atau tidak. Uji linearitas digunakan untuk mengkonfirmasikan apakah sifat linear
antara dua variabel yang diidentifikasikan secara teori sesuai atau tidak dengan hasil observasi
yang ada. Uji linearitas dapat menggunakan uji Durbin-Watson, Ramsey Test atau uji Lagrange
Multiplier.
1
1
Statistik Bisnis
Nur Azmi Karim SE,M.Si
1
1
Gaji (juta)
Pengeluaran (juta)
2,5
Statistik Bisnis
Nur Azmi Karim SE,M.Si
2,5
4,5
Jadi misalnya ambil nilai tetap untuk X, yaitu gaji 3 juta maka sampel pertama mempunyai
pengeluaran 2,5 juta. Lalu ambil lagi sampel kedua dengan gaji 3 juta maka pengeluarannya
adalah 2 juta. Demikian seterusnya untuk sampel dengan gaji 4 juta dan 5 juta. Jadi nilai X
dianggap tetap pada sampel yang berulang. (dalam regresi lanjut, dapat diasumsikan bahwa X
tidak stokastik).
Asumsi 3: Zero mean value of disturbance ui
Nilai Y hasil prediksi dengan model regresi tentunya mempunyai kesalahan atau tidak
tepat sama dengan nilai Y pada data. Selisihnya sering disebut dengan disturbance dan sering
disimbolkan dengan u. Nilai ini harus mempunyai rata-rata sama dengan 0 (eksak). Ketika kita
telah mendaptkan garis lurus pada model, maka nilai Y yang sebenarnya bisa berada di atas
atau di bawah garis lurus tersebut, akan tetapi jumlahnya akan seimbang sehingg rata-ratanya
sama dengan 0.
Asumsi 4: Homoscedasticity or equal variance of ui
Homo berarti sama atau equal, scedasticity berarti disperse atau scatter atau ada yang
mengartikan sebaran. Jadi varians dari error atau disturbance haruslah sama pada masingmasing nilai X. Sebagai contoh, ada 3 orang dengan gaji 3 juta sehingga memberikan tiga buah
error dan mempunyai varians. Varians ini harus sama (equal) dengan varians error pada nilai X
yang lain misalnya 4 juta. Demikian seterusnya.
Asumsi 5: No autocorrelation between the disturbances
Asumsi ini masih berkaitan dengan nilai error, yaitu bahwa untuk sembarang 2 buah nilai
X, maka kedua error itu tidak berkorelasi (atau mempunyai korelasi 0). Misalnya error pada X
sebesar 3 juta dengan Y sebesar 2,5 dengan error pada X sebesar 3 juta dengan Y sebesar 2
juta tidak berkorelasi. Pengertian lain adalah misalnya ada persamaan Y = a + b X + u dengan u
adalah error. Jika ada korelasi antara u dengan u-1 (error sebelumnya) maka model akan gagal,
1
1
Statistik Bisnis
Nur Azmi Karim SE,M.Si
karena Y pada model harusnya dipengaruhi oleh X saja, akan dipengaruhi oleh u. Demikian
seterusnya.
Asumsi 6: Zero covariance between ui and Xi
Artinya nilai variabel bebas (Xi) dengan error (ui) tidak berkorelasi. Diasumsikan bahwa Y
adalah dipengaruhi oleh X dan u, sehingga X dan u harus tidak saling berkorelasi. Jika X dan u
berkorelasi, maka tidak mungkin mencari pengaruh masing-masing terhadap Y. Jika X
berkorelasi positif dengan u, maka jika X meningkat u juga meningkat, atau jika X menurun
maka u juga menurun (juga sebaliknya jika berkorelasi negatif). Sehingga sulit untuk
mengisolasi pengaruh X dan u terhadap Y. Asumsi ini sebenarnya akan terpenuhi secara
otomatis jika X merupakan stokastik karena untuk X bernilai tetap, u akan berubah.
Asumsi 7: The number of observations n must be greater than the number of parameters
to be estimated
Asumsi ini sebenarnya tidak asing bagi matematika sederhana. Jika ada dua parameter
yang akan dicari nilainya maka tentunya tidak mungkin diselesaikan dengan satu persamaan
(observasi).
Asumsi 8: Variability in X values
Harus ada variasi nilai dalam variabel X. Jika X nilainya sama untuk semua observasi
maka tentunya tidak dapat diestimasi. Meskipun ini mudah dimengerti namun sering dilupakan.
Asumsi 9: The regression model is correctly specified
Model regresi yang dibangun haruslah benar dalam arti sesuai dengan teori yang telah
dikembangkan. Seperti telah dijelaskan bahwa statistik hanyalah untuk menguji teori atau
fenomena tertentu. Jadi jika menggunakan variabel yang sembarangan (atau tidak berdasarkan
teori tertentu) maka model regresi yang dihasilkan juga patut dipertanyakan.
Asumsi 10: There is no perfect multicollinearity
1
1
Statistik Bisnis
Nur Azmi Karim SE,M.Si
Tidak ada hubungan linear yang tinggi antara variabel-variabel bebas dalam model
regresi. Jadi asumsi ini tentunya tidak bisa diterapkan pada regresi dengan satu variabel bebas
(regresi linear sederhana).
Setelah menyimak uraian di atas, mungkin ada beberapa pertanyaan yang spontan
muncul dalam benak Anda. Misalnya, mengapa uji normalitas residual tidak ada? Tepat sekali,
asumsi normalitas residual (bukan normalitas pada masing-masing variabel) memang
diperlukan akan tetapi itu tidak termasuk dalam uji asumsi klasik. Gujarati (2004:93) menulis
'The assumption that the disturbances ui are normally distributed is not a part of the CLRM.
Jika Anda masih berargumen, bahwa di dalam berbagai penelitian, uji normalitas residual
dimasukkan dalam uji asumsi klasik (CLRM). Kajian tentang normalitas dimasukkan dalam
Classical Normal Linear Regression Model (CNLRM). Jadi masalah penempatannya mau di
mana, kita tidak dapat berkomentar.
Jika Anda simak lebih lanjut, maka dari 10 asumsi dalam CLRM tidak semuanya perlu diuji
karena secara otomatis telah dimasukkan dalam persamaan untuk mengestimasi nilai
konstanta, koefisien atau errornya. Asumsi 2, 3, 6, 7, 8 dan 9 tidak perlu lagi dilakukan
pengujian tersendiri. Asumsi 1 juga sering tidak dilakukan karena terkait dengan asumsi 9, yaitu
bahwa model harus dispesifikasi dengan benar. Asumsi 4, 5 dan 10 yang memerlukan
pengujian tersendiri ditambah dengan pengujian normalitas.
Sumber Bacaan: Gujarati (2004)
1
1
Statistik Bisnis
Nur Azmi Karim SE,M.Si
Daftar Pustaka
1.
2.
3.
4.
1
1
10
Statistik Bisnis
Nur Azmi Karim SE,M.Si