Abstract
______________________________________________________________
Each error rate is assumed to have the same variance, so 𝑌𝑖 response have the same variety
as the distribution of probability for Y has the same variety, it does not depend on the value
of free variable X. ε have the distribution whereas x is not, then Y also has a distribution
corresponding to ε that is 𝑌𝑖 . Assumption of normally distributed errors and homogeneous
impact on the dependent variable (Y) then which is tested normality and homogeneity are
variable Y and independent variable (X) is assumed not random variables. Robustness t test
and f test to violations of normality and homogeneity of data is shown by using simulation
data generation from R program which is not normal and heterogeneous. Data generation t
test and F test is concluded that data remains t distribution and F distribution , as well as
significant p-value.The conclusion was that the t test and F test proved the solidity to
abnormalities and heterogeneity of data.
How to Cite
Sari A.Q, Sukestiyarno Y.L., & Agoestanto A. (2017). Batasan Prasyarat Uji
Normalitas dan Uji Homogenitas pada Model Regresi Linear. Unnes Journal of
Mathematics, 6(2): 168-177.
169
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
harus didistribusikan secara normal. Tapi pengukuran data peneliti harus mengubah
distribusi normal tidak terjadi sesering orang populasi menjadi populasi yang lebih kecil
pikirkan, dan itu bukan tujuan utama. Distribusi (sampel) yang diambil secara acak dari populasi
normal adalah sarana untuk mencapai tujuan , tersebut.
bukan tujuan itu sendiri. Data terdistribusi Disisi lain alat uji yang dipakai yaitu uji
secara normal diperlukan untuk menggunakan t dan uji F cukup kekar (robust) sehingga
sejumlah alat statistik, seperti analisis regresi, uji anggapan kenormalan dan homogenitas tidak
t, uji F atau analisis varians (ANAVA) dan dituntut secara ketat namun cukup agak kasar
masih banyak lagi. Jika seorang praktisi tidak (Sembiring, 2003: 39). Uji t dan uji F
menggunakan alat khusus seperti itu, maka mengasumsikan bahwa nilai residual mengikuti
tidaklah penting apakah data terdistribusi secara distribusi normal. Jika asumsi ini dilanggar
normal. Distribusi menjadi masalah hanya maka uji statistik menjadi tidak valid untuk
ketika praktisi mencapai suatu titik dalam jumlah sampel kecil (Ghozali, 2011: 160).
sebuah proyek di mana mereka ingin Berdasarkan uraian latar belakang di atas, maka
menggunakan alat statistik yang memerlukan penulis tertarik untuk menganalisis sejauhmana
data terdistribusi normal dan mereka tidak tuntutan uji normalitas dan uji homogenitas
memilikinya. pada model regresi linear, serta menunjukkan uji
Dari makna kata, asumsi (assumption) t dan uji F bersifat robust.
berarti a statement accepted true without proof
METODE
(Encarta 97 Encyclopedia) atau something taken for
granted (Random House Webster's Unabridged Pada kegitan ini dilakukan kajian
Dictionary). Kedua makna kata itu tentu berlaku pustaka, yaitu mengkaji permasalahan secara
juga bagi pengertian asumsi statistika. Oleh teoritis berdasarkan sumber-sumber pustaka
karena itu dalam inferensi statistika, data yang yang ada dengan kerangka teoritis. Kerangka
akan dianalisis dianggap memenuhi asumsi- teoritis adalah suatu model yang menerangkan
asumsi yang disyaratkan bagi formula bagaimana hubungan suatu teori dengan
komputasinya. Analisis dapat dilakukan tanpa faktor‐faktor penting yang telah diketahui dalam
harus melakukan pemeriksaan terlebih dahulu suatu masalah tertentu. Selain itu dilakukan pula
terhadap terpenuhi tidaknya asumsi yang studi pustaka, dalam studi pustaka ini digunakan
bersangkutan. Kalaupun ternyata kemudian sumber pustaka yang relevan yang digunakan
bahwa data yang digunakan tidak sesuai dengan untuk mengumpulkan informasi yang diperlukan
asumsi-asumsinya, maka kesimpulan hasil dalam penelitian. Studi pustaka dilakukan
analisisnya tidak selalu invalid. dengan mengumpulkan sumber pustaka yang
Dalam situasi aplikasi, asumsi-asumsi dapat berupa buku, jurnal, makalah dan
bagi distribusi sampling dibuat sebagai dasar sebagainya. Setelah sumber pustaka terkumpul
keputusan pemilihan teknik komputasi tertentu dilanjutkan dengan pengkajian dari sumber
guna pengujian suatu hipotesis. Asumsi ini pustaka tersebut. Pada akhirnya sumber pustaka
jarang atau bahkan tidak pernah benar-benar itu dijadikan landasan untuk menganalisis
diuji terhadap data sampel melainkan langsung permasalahan.
dianggap benar (Hays & Winkler, 1971). Selain teoritis akan dilakukan simulasi
Pertanyaan yang mungkin timbul di pada dua kelompok variabel yang diobservasi.
kalangan pengguna statistika adalah sejauh Simulasi adalah tiruan dari proses dunia nyata
manakah tuntutan uji asumsi dilakukan sebelum atau sistem. Simulasi menyangkut
melakukan uji hipotesis. Berdasarkan uraian di pembangkitan proses serta pengamatan dari
atas maka penulis akan membahas mengenai proses untuk menarik kesimpulan dari sistem
sejauhmana persyaratan uji normalitas dan yang diwakili (Banks, 1998).
homogenitas pada model regresi linear harus Simulasi dilakukan untuk menunjukkan
dipenuhi. robust uji t dan uji F yang akan dilakukan pada
Tujuan utama kegiatan penelitian antara dua kelompok data dengan berbagai macam
lain ialah menemukan prinsip yang dapat kriteria data. Dasar uji t dan uji F
diberlakukan secara umum atau bersifat mengasumsikan nilai residual berdistribusi
universal. Secara ideal teoritik seorang peneliti normal. Mengecek robust uji t dan uji F terhadap
harus meneliti keseluruhan populasi pada data ketidaknormalan data dan heterogenitas varian.
penelitian sehingga generalisasi yang Data yang disimulasikan adalah data tidak
dikemukakan tidak terlalu jauh dengan normal dan tidak homogen hasil bangkitan
kenyataan aslinya. Pada kenyataannya meneliti program R. Data dilakukan uji t dan uji F
populasi keseluruhan sangat tidak praktis, dapat dengan bantuan program SPSS. Hasil output
memakan waktu lama atau bahkan tidak SPSS dicatat kemudian dilakukan pengambilan
mungkin, sehingga sebelum dilakukan kesimpulan dari data yang telah tersedia.
170
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
171
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
172
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
𝑣2
Peubah acak ini mempunyai rataan , 𝑣2 > 2 analisis tetap dilanjutkan, ada resiko hasil
𝑣2 /2
2𝑣22 (𝑣1 +𝑣2 −2)
penelitian yang diperoleh tidak menggambarkan
dan variansi , 𝑣2 > 4. keadaan yang sebenarnya.
𝑣1 (𝑣2 −2)2 (𝑣2 −4)
(𝑈1 /𝑣1 )/(𝑈2 /𝑣2 ) juga mempunyai Analisis regresi perlu dilakukan uji
distribusi F, tapi derajat kebebasannya 𝑣1 dan normalitas karena persyaratan awal agar dapat
𝑣2 , lambang 𝐹𝑣2,𝑉1 . Jadi 𝐹𝑣1,𝑉2 = 1/𝐹𝑣2,𝑉1 . Bila menilai kebaikan suatu persamaan regresi adalah
normalitas error. Uji normalitas diperlukan
𝑣1 = 1 maka 𝐹1,𝑉2 = 𝑡𝑣22 .
untuk menjawab pertanyaan apakah syarat
Jadi distribusi-t adalah hal khusus dari
sampel yang representatif terpenuhi atau tidak,
distribusi-F, yaitu bila derajat kebebasan F pada
sehingga hasil penelitian dapat digeneralisasi
pembilang 1.
pada populasi atau dapat mewakili populasi
Misalkan 𝑌11 , 𝑌12 , … , 𝑌1𝑛1 dan (Hadi, 2001).
𝑌21 , 𝑌22 , … , 𝑌2𝑛2 dua sampel acak berukuran 𝑛1 Jika sebuah data mempunyai sebaran
dan 𝑛2 yang saling bebas, masing-masing berasal yang tidak normal, perlakuan yang mungkin
dari populasi 𝑁(𝜇1 , 𝜎1 2 ) dan 𝑁(𝜇2 , 𝜎2 2 ). Maka dilakukan agar data menjadi normal dapat
peubah acak dilakukan dengan berbagai macam cara.
𝑆12 /𝜎1 2 Beberapa cara tersebut diantaranya adalah
𝐹=
𝑆22 /𝜎2 2
menambahkan jumlah data pada variabel
mempunyai distribusi F dengan derajat dependen (Y), menghilangkan data yang
kebebasan 𝑛1 − 1 dan 𝑛2 − 1 bila dianggap menjadi penyebab ketidaknormalan
1
𝑆1 = ∑(𝑌1𝑖 − 𝑌̅1 )2 , 𝑌̅1 = ∑ 𝑌1𝑖 /𝑛1 data (data outlier), dilakukan transformasi data.
𝑛1 −1
dan Homogenitas
1
𝑆2 = ∑(𝑌2𝑖 − 𝑌̅2 )2 , 𝑌̅2 = ∑ 𝑌2𝑖 /𝑛2 . Salah satu asumsi penting dari model
𝑛2 −1
regresi linear klasik adalah varian error 𝜀𝑖 pada
Setiap suku galat 𝜀𝑖 diasumsikan setiap nilai – nilai variabel bebas adalah sama
mempunyai ragam yang sama 𝜎 2 , oleh (konstan), asumsi ini disebut juga sebagai asumsi
karenanya respons 𝑌𝑖 mempunyai ragam yang homoskedastisitas atau homogenitas varian yang
sama pula. Karena ε mempunyai distribusi, disimbolkan dengan: (𝜀𝑖 ) = 𝜎 2 , 𝑖 = 1,2, … , 𝑛.
sedangkan x tidak, maka Y juga mempunyai Karena salah satu asumsi dasar regresi linear
distribusi yang sesuai dengan ε yaitu 𝑌𝑖 adalah homogenitas error maka pengujian
berdistribusi 𝑁(𝛽0 + 𝛽1 𝑥𝑖 𝜎 2 ). Pemisalan bahwa homogenitas data sangat penting dilakukan pada
𝑣𝑎𝑟 (𝜀𝑖 ), 𝑣𝑎𝑟(𝑌𝑖 ), sama dengan 𝜎 2 untuk setiap i, setiap pengolahan data. Jika pada normalitas
berarti variansinya tidak berubah pada setiap yang dilakukan uji adalah gabungan data antara
data sampel. Karena asumsi galat berdistribusi variabel Y dan variabel X maka begitu pula
normal berdampak pada variabel dependen (Y) dengan uji homogenitas yang diuji adalah
maka yang diuji normalitas adalah variabel Y gabungan data variabel Y dan variabel X.
dan variabel independen (X) diasumsikan bukan Adanya heterokedastisitas sama sekali
variabel acak (Sukestiyarno, 2013: 69). bukan berarti suatu model regresi adalah lemah.
Model regresi 𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 Pengira kuadrat terkecil tetap tak bias dan
mengasumsikan bahwa sebaran peluang bagi Y konsisten, tetapi tidak efisien (variansi
mempunyai ragam yang sama 𝜎 2 , tidak membesar). Dampak dari membesarnya variansi
tergantung pada nilai peubah bebas X. Karena ε adalah (Setiawan dan Kusrini, 2010)
mempunyai distribusi, sedangkan x tidak, maka 1. Pengujian parameter regresi dengan statistik
Y juga mempunyai distribusi yang sesuai dengan uji t menjadi tidak valid.
ε yaitu 𝑌𝑖 . Karena asumsi galat berdistribusi 𝐻0 : 𝛽𝑗 = 0
normal dan homogen berdampak pada variabel 𝐻1 : 𝛽𝑗 ≠ 0
̂𝑗
dependen (Y) maka yang diuji normalitas dan 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝛽
akan mengecil jika 𝑠(𝛽̂𝑗 ) besar,
̂𝑗 )
homogenitas adalah variabel Y dan variabel 𝑠(𝛽
independen (X) diasumsikan bukan variabel sehingga cenderung untuk tidak menolak 𝐻0 .
acak. 2. Selang kepercayaan (perkiraan selang) untuk
Ketika asumsi normalitas tidak dipenuhi parameter regresi cenderung melebar.
oleh data, maka analisis regresi akan 𝑃[𝛽̂𝑗 − 𝑡𝛼/2 . 𝑠(𝛽̂𝑗 ) ≤ 𝛽̂𝑗 ≤ 𝛽̂𝑗 + 𝑡𝛼/2 . 𝑠(𝛽̂𝑗 )] =
memberikan hasil yang meleset dari yang 1 − 𝛼 akan melebar jika 𝑠(𝛽̂𝑗 ) besar. Dengan
sebenarnya. Hal itu bisa saja terjadi karena melebarnya selang kepercayaan, hasil
banyak kejadian yang diluar kebiasaan, misalnya perkiraan yang diperoleh menjadi tidak dapat
data ekstrim, data yang diurutkan, data dipercaya.
mengikuti distribusi selain distribusi normal dan
masih banyak penyebab-penyebab lainnya. Jika
173
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
174
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
Dapat dikatakan bahwa, jika (𝑋𝑖 − 𝑋̅)2 sesuai dengan ε yaitu 𝑌𝑖 . Karena asumsi galat
dan 𝑘𝑖 berkorelasi positif atau mempunyai berdistribusi normal berdampak pada variabel
hubungan variabel yang positif dan jika dependen (Y) maka yang diuji normalitas dan
komponen yang kedua dari persamaan diatas homogenitas adalah variabel Y dan variabel
lebih besar daripada satu atau dapat dituliskan: independen (X) diasumsikan bukan variabel
∑𝑛𝑖=1 𝑘𝑖 (𝑋𝑖 − 𝑋̅)2 acak.
( 𝑛 )>1
∑𝑖=1(𝑋𝑖 − 𝑋̅)2 Simulasi uji t dan uji F
Maka Var(𝑏1 ) dengan asumsi Menunjukkan robust uji t dan uji F
heteroskedastisitas akan lebih besar daripada salah satunya dengan melakukan simulasi yang
𝑉𝑎𝑟(𝑏1 ) dengan asumsi homoskedastisitas. akan dilakukan pada dua kelompok data dengan
Sebagai akibatnya, standar error dari 𝑏1 terlalu berbagai macam kriteria data. Dasar bahwa uji t
rendah (underestimated). Sebagaimana diketahui dan uji F mengasumsikan nilai residual
bahwa standart error ini memiliki peran dalam berdistribusi normal. Mengecek robust uji t dan
pembentukan nilai t hitung yang berkaitan akan uji F terhadap ketidaknormalan data dan
menjadi terlalu tinggi (overestimated) yang heterogenitas varian, kondisi yang
mungkin selanjutnya menghasilkan kesimpulan dioperasionalkan adalah data yang dibangkitkan
bahwa dalam kasus spesifik 𝑏1 adalah dari program R dengan kriteria tidak normal dan
kelihatannya signifikan, walaupun sebenarnya tidak homogen. Data dilakukan uji t dan uji F
tidak signifikan. Oleh karena itu jika asumsi dengan bantuan program SPSS.
homoskedastisitas tidak dipenuhi maka hasil uji t Kriteria yang akan digunakan untuk
dan uji F tidak menentu (Setiawan dan Kusrini, menentukan robust uji t dan uji F adalah nilai
2010: 107). p. Nilai p menggambarkan taraf kesalahan yang
Selain uji signifikan tidak dapat tepat, paling kecil dimana hipotesis nol ditolak.
diterapkan, batas-batas kepercayaan juga tidak Hipotesis nol yang sedang diuji kebenarannya
dapat diterapkan. Artinya jika varian penaksir menyatakan bahwa sebuah koefisien regresi
model tidak memenuhi asumsi adalah sama dengan nol. Nilai p mengukur
homoskedastisitas, maka inferensi dan prediksi probabilitas Tipe Kesalahan I, probabilitas
mengenai koefisien-koefisien sampel akan keliru. kesalahan menolak hipotesis nol karena
Dalam analisis model regresi linear kenyataan hipotesis itu benar.
apabila semua asumsi model regresi linear klasik Berikut adalah tabel output hasil
terpenuhi kecuali asumsi homoskedastisitas yang simulasi yang dilakukan pada data bangkitan
berarti adanya heteroskedastisitas, maka program R dan dilakukan pada program SPSS.
estimator dari paramater yang diperoleh masih
tetap tak bias dan konsisten tetapi estimatornya Tabel 1. Nilai signifikan dari Uji t dan Uji F
tidak efisien, baik untuk sampel kecil maupun
sampel besar (Ghozali, 2011: 160). Uji F Uji t
Berdasarkan hasil penelitian dan No Data n
nilai F sig. F nilai t sig. t
pengkajian beberapa literatur diperoleh hasil
bahwa uji normalitas dan uji homogenitas sangat 1 𝑎1 𝑎2 30 0,252 0,620 0,312 0,757
penting dilakukan dalam setiap proses 2 𝑏1 𝑏2 30 1,018 0,322 - 0,225 0,824
penelitian. Hal itu disebabkan karena regresi
linear normal klasik mengasumsi dalam model 3 𝑐1 𝑐2 30 1,285 0,267 - 0,252 0,803
𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀, 𝑖 = 1,2, … , 𝑛 bahwa tiap 𝜀𝑖 4 𝑥1 𝑥2 50 0,153 0,698 - 0,798 0,429
didistribusikan secara normal dan varians
5 𝑦1 𝑦2 50 1,796 0,187 0,296 0,768
𝐸(𝜀𝑖2 ) = 𝜎 2 .
Uji normalitas dan uji homogenitas 6 𝑧1 𝑧2 50 0,174 0,678 - 0,221 0,826
menjadi sangat penting dipenuhi karena pada
asumsi awal suatu persamaan regresi linear Hasil di atas merupakan perhitungan uji
dikatakan baik jika error/galat regresi t dan uji F dua kelompok data dengan beberapa
berdistribusi normal dan homogen. Setiap suku kriteria data. Kriteria yang digunakan untuk
galat 𝜀𝑖 diasumsikan mempunyai ragam yang menilai robust uji t dan uji F adalah jika hasil
sama 𝜎 2 oleh karenanya, respons 𝑌𝑖 mempunyai nilai p lebih besar dari 0,05 maka uji t dan uji F
ragam yang sama pula. Model regresi 𝑌𝑖 = 𝛽0 + dalam kondisi ini akan cenderung terlalu sering
𝛽1 𝑥𝑖 + 𝜀𝑖 mengasumsikan bahwa sebaran menghasilkan nilai yang signifikan dari yang
peluang bagi Y mempunyai ragam yang sama seharusnya.
𝜎 2 , tidak tergantung pada nilai peubah bebas X. Hasil yang diperoleh tentu saja tidak
Karena ε mempunyai distribusi, sedangkan x bisa diharapkan exact, misalnya harus 0.05. Jika
tidak, maka Y juga mempunyai distribusi yang sedikit lebih besar atau sedikit lebih kecil, maka
175
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
176
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)
177