Anda di halaman 1dari 10

g

UJM 6(2) (2017)


Unnes Journal of Mathematics
http://journal.unnes.ac.id/sju/index.php/ujm

BATASAN PRASYARAT UJI NORMALITAS DAN UJI HOMOGENITAS PADA


MODEL REGRESI LINEAR

Atmira Qurnia Sari, Y.L. Sukestiyarno, Arief Agoestanto

Jurusan Matematika, FMIPA, Universitas Negeri Semarang, Indonesia


Gedung D7 Lt.1, Kampus Sekaran Gunungpati, Semarang 50299

Info Artikel Abstrak


_______________________ ______________________________________________________________
Sejarah Artikel: Setiap suku galat diasumsikan mempunyai ragam yang sama, sehingga respons Yi
Diterima Agustus 2016 mempunyai ragam yang sama karena sebaran peluang bagi Y mempunyai ragam
Disetujui September 2016 yang sama, tidak tergantung pada nilai peubah bebas X. ε mempunyai distribusi
Dipublikasikan Nopember 2017 sedangkan x tidak, Y juga mempunyai distribusi yang sesuai dengan ε yaitu Yi.
_______________________ Asumsi galat berdistribusi normal dan homogen berdampak pada variabel
Keywords: dependen (Y) maka yang diuji normalitas dan homogenitas adalah variabel Y dan
Model Linear; variabel independen (X) diasumsikan bukan variabel acak. Kekekaran uji t dan uji
Uji Normalitas; F terhadap pelanggaran normalitas dan homogenitas data ditunjukkan melalui
Uji Homogenitas; simulasi data bangkitan dari program R dengan kriteria tidak normal dan
Uji ; heterogen. Data dilakukan uji t dan uji F sehingga diperoleh simpulan data tetap
Uji F. berditribusi t dan berdistribusi F serta nilai p signifikan. Diperoleh simpulan uji t
_____________________________ dan uji F terbukti kekar terhadap ketidaknormalan dan heterogenitas data.

Abstract
______________________________________________________________
Each error rate is assumed to have the same variance, so 𝑌𝑖 response have the same variety
as the distribution of probability for Y has the same variety, it does not depend on the value
of free variable X. ε have the distribution whereas x is not, then Y also has a distribution
corresponding to ε that is 𝑌𝑖 . Assumption of normally distributed errors and homogeneous
impact on the dependent variable (Y) then which is tested normality and homogeneity are
variable Y and independent variable (X) is assumed not random variables. Robustness t test
and f test to violations of normality and homogeneity of data is shown by using simulation
data generation from R program which is not normal and heterogeneous. Data generation t
test and F test is concluded that data remains t distribution and F distribution , as well as
significant p-value.The conclusion was that the t test and F test proved the solidity to
abnormalities and heterogeneity of data.

How to Cite

Sari A.Q, Sukestiyarno Y.L., & Agoestanto A. (2017). Batasan Prasyarat Uji
Normalitas dan Uji Homogenitas pada Model Regresi Linear. Unnes Journal of
Mathematics, 6(2): 168-177.

© 2017 Universitas Negeri Semarang



Alamat korespondensi: p-ISSN 2252-6943
E-mail: atmira.qurnia@yahoo.co.id e- ISSN 2460-5859
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

PENDAHULUAN lebih variabel bebas/prediktor yang diberi simbol


Matematika merupakan ilmu yang X jika hanya ada satu prediktor dan 𝑋1 , 𝑋2
mempunyai peranan penting untuk menunjang sampai dengan 𝑋𝑘 , jika terdapat lebih dari satu
ilmu-ilmu lainnya. Dalam perkembangannya prediktor (Crammer & Howitt, 2006:139).
kajian matematika terbagi menjadi dua arah Istilah regresi diperkenalkan oleh sir
yakni murni dan terapan. Matematika murni Francis Galton dalam penemuannya yang ditulis
yang mengkaji tentang seluk beluk matematika dalam artikel yang berjudul Family Likeness in
serta memecahkan kasus-kasus dalam Stature (Proceedings of Royal Society, London, vol.
matematika. Salah satu cabang dari matematika 40,1886) (Supranto, 2005: 35). Kekhawatiran
terapan adalah statistika. Dunia penelitian atau bahwa data sampel tidak terdistribusi mengikuti
riset dimanapun dilakukan, tidak akan terlepas model data populasi yang diasumsikan atau
dari masalah statistika. tidak memenuhi kondisi yang disyaratkan bagi
Dalam statistik inferensial untuk penggunaan teknik komputasi tertentu
menguji hipotesis, peneliti banyak menggunakan menyebabkan banyak peneliti sosial pemakai
statistik parametris. Statistik parametris ini lebih statistika melakukan lebih dahulu pengujian
banyak digunakan untuk menganalisis data yang asumsi sebelum melakukan uji hipotesis.
berbentuk interval dan rasio dengan dilandasi Pada hampir semua skripsi S1, thesis
beberapa persyaratan tertentu misalnya data S2, dan bahkan disertasi S3 dapat kita temui
variabel yang akan dianalisis nilai residual harus laporan hasil berbagai uji asumsi yang dilakukan
berdistribusi normal (Sugiyono, 2004: 8). sebelum pengujian hipotesisnya sehingga
Statistika mempunyai peranan penting terdapat kesan kuat sekali bahwa uji asumsi
dalam memecahkan masalah yang terjadi pada merupakan prasyarat dan bagian yang tak
bidang ilmu lainnya. Pada statistik parametrik terpisahkan yang mendahului analisis data
terdapat teknik komputasi untuk pengambilan penelitian. Pada tes parametrik klasik untuk
keputusan yang didasarkan pada model memperoleh hasil yang akurat, asumsi yang
distribusi yang diketahui, sehingga mendasari mereka (misalnya, normalitas dan
penggunaanya dilandasi oleh berlakunya asumsi homoskedastisitas) harus dipenuhi. Asumsi ini
bahwa kesesuaian data sampel dengan model jarang bertemu ketika menganalisis data real.
distribusi yang bersangkutan (data-model fit). Penggunaan metode parametrik klasik dengan
Dalam menggolah data, peneliti akan asumsi melanggar dapat menjadikan hasil yang
selalu berkepentingan menentukan hubungan tidak akurat. Hal itu dapat menyebabkan
atau pengaruh antara dua atau lebih peubah. kesalahan substantif untuk interpretasi data.
Analisis regresi linear dipergunakan untuk Kepanikan terjadi apabila hasil uji
menelaah hubungan antara dua variabel atau asumsi ternyata tidak sesuai dengan harapan.
lebih, terutama untuk menelusuri pola hubungan Berbagai reaksi timbul mulai dari reaksi wajar
yang modelnya belum diketahui dengan berupa usaha untuk menggunakan alternatif
sempurna, atau untuk mengetahui bagaimana model uji yang lebih cocok dengan data,
variasi dari beberapa variabel bebas (prediktor X transformasi data agar sesuai dengan model yang
atau independent variable) mempengaruhi diinginkan, sampai pada usaha-usaha
variabel terikat (respon Y atau dependent memanipulasi data agar tampak memenuhi
variable) dalam suatu fenomena yang kompleks. asumsi yang diinginkan. Sayangnya seringkali
Jika X1,X2,…,Xi adalah variabel-variabel hal itu dilakukan tanpa pemahaman yang cukup
independen dan Y adalah variabel dependen, mengenai permasalahan yang sedang dihadapi
maka terdapat hubungan fungsional antara X sehingga ada peneliti yang melakukan 'trimming'
dan Y, di mana variasi dari X akan diiringi pula atau pemangkasan terhadap subjek yang
oleh variasi dari Y. Secara matematika dianggapnya sebagai 'outliers' agar datanya
hubungan di atas dapat dijabarkan sebagai terdistribusi mengikuti model regresi linear, dan
berikut. ada pula praktisi yang mecoba menggunakan
𝑌 = 𝑓(𝑋1 , 𝑋2 , … , 𝑋𝑖 , 𝑒) model matematis yang terlalu kompleks bagi
di mana Y adalah variabel terikat, X tujuan penelitiannya sehingga malah menjadikan
adalah variabel bebas dan e adalah variabel kesimpulan analisisnya sulit dipahami oleh
residual (disturbance term) (Walpole, 1995). pembaca awam.
Regresi linear mempunyai persamaan Asumsi bahwa sampel diambil secara
yang disebut sebagai persamaan regresi. random dan bahwa distribusi populasi adalah
Persamaan regresi mengekspresikan hubungan normal merupakan dua contoh asumsi yang
linear antara variabel tergantung/variabel merupakan formalitas dalam analisis. Beberapa
kriteria yang diberi simbol Y dan salah satu atau orang percaya bahwa semua data yang
dikumpulkan dan digunakan untuk analisis

169
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

harus didistribusikan secara normal. Tapi pengukuran data peneliti harus mengubah
distribusi normal tidak terjadi sesering orang populasi menjadi populasi yang lebih kecil
pikirkan, dan itu bukan tujuan utama. Distribusi (sampel) yang diambil secara acak dari populasi
normal adalah sarana untuk mencapai tujuan , tersebut.
bukan tujuan itu sendiri. Data terdistribusi Disisi lain alat uji yang dipakai yaitu uji
secara normal diperlukan untuk menggunakan t dan uji F cukup kekar (robust) sehingga
sejumlah alat statistik, seperti analisis regresi, uji anggapan kenormalan dan homogenitas tidak
t, uji F atau analisis varians (ANAVA) dan dituntut secara ketat namun cukup agak kasar
masih banyak lagi. Jika seorang praktisi tidak (Sembiring, 2003: 39). Uji t dan uji F
menggunakan alat khusus seperti itu, maka mengasumsikan bahwa nilai residual mengikuti
tidaklah penting apakah data terdistribusi secara distribusi normal. Jika asumsi ini dilanggar
normal. Distribusi menjadi masalah hanya maka uji statistik menjadi tidak valid untuk
ketika praktisi mencapai suatu titik dalam jumlah sampel kecil (Ghozali, 2011: 160).
sebuah proyek di mana mereka ingin Berdasarkan uraian latar belakang di atas, maka
menggunakan alat statistik yang memerlukan penulis tertarik untuk menganalisis sejauhmana
data terdistribusi normal dan mereka tidak tuntutan uji normalitas dan uji homogenitas
memilikinya. pada model regresi linear, serta menunjukkan uji
Dari makna kata, asumsi (assumption) t dan uji F bersifat robust.
berarti a statement accepted true without proof
METODE
(Encarta 97 Encyclopedia) atau something taken for
granted (Random House Webster's Unabridged Pada kegitan ini dilakukan kajian
Dictionary). Kedua makna kata itu tentu berlaku pustaka, yaitu mengkaji permasalahan secara
juga bagi pengertian asumsi statistika. Oleh teoritis berdasarkan sumber-sumber pustaka
karena itu dalam inferensi statistika, data yang yang ada dengan kerangka teoritis. Kerangka
akan dianalisis dianggap memenuhi asumsi- teoritis adalah suatu model yang menerangkan
asumsi yang disyaratkan bagi formula bagaimana hubungan suatu teori dengan
komputasinya. Analisis dapat dilakukan tanpa faktor‐faktor penting yang telah diketahui dalam
harus melakukan pemeriksaan terlebih dahulu suatu masalah tertentu. Selain itu dilakukan pula
terhadap terpenuhi tidaknya asumsi yang studi pustaka, dalam studi pustaka ini digunakan
bersangkutan. Kalaupun ternyata kemudian sumber pustaka yang relevan yang digunakan
bahwa data yang digunakan tidak sesuai dengan untuk mengumpulkan informasi yang diperlukan
asumsi-asumsinya, maka kesimpulan hasil dalam penelitian. Studi pustaka dilakukan
analisisnya tidak selalu invalid. dengan mengumpulkan sumber pustaka yang
Dalam situasi aplikasi, asumsi-asumsi dapat berupa buku, jurnal, makalah dan
bagi distribusi sampling dibuat sebagai dasar sebagainya. Setelah sumber pustaka terkumpul
keputusan pemilihan teknik komputasi tertentu dilanjutkan dengan pengkajian dari sumber
guna pengujian suatu hipotesis. Asumsi ini pustaka tersebut. Pada akhirnya sumber pustaka
jarang atau bahkan tidak pernah benar-benar itu dijadikan landasan untuk menganalisis
diuji terhadap data sampel melainkan langsung permasalahan.
dianggap benar (Hays & Winkler, 1971). Selain teoritis akan dilakukan simulasi
Pertanyaan yang mungkin timbul di pada dua kelompok variabel yang diobservasi.
kalangan pengguna statistika adalah sejauh Simulasi adalah tiruan dari proses dunia nyata
manakah tuntutan uji asumsi dilakukan sebelum atau sistem. Simulasi menyangkut
melakukan uji hipotesis. Berdasarkan uraian di pembangkitan proses serta pengamatan dari
atas maka penulis akan membahas mengenai proses untuk menarik kesimpulan dari sistem
sejauhmana persyaratan uji normalitas dan yang diwakili (Banks, 1998).
homogenitas pada model regresi linear harus Simulasi dilakukan untuk menunjukkan
dipenuhi. robust uji t dan uji F yang akan dilakukan pada
Tujuan utama kegiatan penelitian antara dua kelompok data dengan berbagai macam
lain ialah menemukan prinsip yang dapat kriteria data. Dasar uji t dan uji F
diberlakukan secara umum atau bersifat mengasumsikan nilai residual berdistribusi
universal. Secara ideal teoritik seorang peneliti normal. Mengecek robust uji t dan uji F terhadap
harus meneliti keseluruhan populasi pada data ketidaknormalan data dan heterogenitas varian.
penelitian sehingga generalisasi yang Data yang disimulasikan adalah data tidak
dikemukakan tidak terlalu jauh dengan normal dan tidak homogen hasil bangkitan
kenyataan aslinya. Pada kenyataannya meneliti program R. Data dilakukan uji t dan uji F
populasi keseluruhan sangat tidak praktis, dapat dengan bantuan program SPSS. Hasil output
memakan waktu lama atau bahkan tidak SPSS dicatat kemudian dilakukan pengambilan
mungkin, sehingga sebelum dilakukan kesimpulan dari data yang telah tersedia.

170
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

Adapun langkah-langkah yang Asumsi 𝜀𝑖 merupakan suatu peubah


dilakukan dalam tahap simulasi adalah: acak, dengan nilai tengah nol dan ragam 𝜎 2
1. Menetukan kondisi yang digunakan untuk secara ringkas bisa dinyatakan sebagai
menguji robustness dari uji t dan uji F. 𝜀𝑖 ~ 𝑁(0, 𝜎 2 )
2. Menentukan besarnya n sampel yang hendak Dimana ~ berarti “didistribusikan
dilibatkan. Misalnya dipilih n = 30, 50 dst. sebagai” dan dimana N berarti “distribusi
Untuk melihat dampak dari uji t dan uji F normal”, unsur dalam tanda kurung menyatakan
untuk besar sampel yang berbeda. dua parameter distribusi normal, yaitu rata-rata
3. Menentukan besarnya effect size yang dan varians (Drapper and Smith, 1992: 21).
hendak dilihat untuk mengamati power dari Agar dapat menilai kebaikan suatu
uji t dan uji F. Misalnya effect size = 1 persamaan regresi maka data sampel diharap
standard deviasi. memenuhi beberapa asumsi, yaitu data sampel
4. Untuk setiap data yang diperoleh, lakukan uji berasal dari suatu populasi berdistribusi normal
t dan uji F kemudian catat apakah p<0,05 dengan rataan 𝜇𝑖 dan variansi 𝜎 2 (Sembiring,
atau tidak. 2003: 37). Hal ini mengartikan bahwa peubah
5. Nilai p>0,05 menunjukkan data yang acak 𝑌𝑖 berdistribusi 𝑁(𝜇𝑖 , 𝜎 2 ) untuk setiap 𝑖.
diperoleh konsisten dengan hipotesis nol. Lambang 𝑌𝑖 menyatakan peubah acak sedangkan
Kondisi yang dioperasionalkan dalam 𝑦𝑖 hanyalah salah satu dari sekian banyak
simulasi yaitu data yang dibangkitkan dari nilainya yang diambil secara acak. Untuk setiap
program R dengan kriteria berikut ini : 𝑥𝑖 distribusi 𝑌𝑖 normal, tepatnya:
1. data kedua kelompok tidak normal dan 1
1 𝑦𝑖 −𝜇𝑖
− ( 𝜎 )
2

heterogen varian serta besar n sama untuk 𝑝(𝑦𝑖 |𝑥𝑖 ) =


√2𝜋𝜎
𝑒𝑘𝑠𝑝 2 , −∞ < 𝑦𝑖 < +∞.
kedua kelompok, macam kelompoknya
adalah: Lambang 𝑝(𝑦|𝑥) menyatakan fungsi
a. 𝑦1 : generating data untuk kelompok 1 padat 𝑦 bila diketahui 𝑥. Jadi pada suatu 𝑥𝑖 akan
b. 𝑦2 : generating data untuk kelompok 2 diambil satu atau lebih sampel dari populasi
(mean 2 = 2*sd, sd2 = 3 sd1) yang berdistribusi normal 𝑁(𝜇𝑖 , 𝜎 2 ), sehingga
2. Data kedua kelompok tidak normal dan persamaannya menjadi
heterogen varian serta besar n berbeda searah 𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 , 𝑖 = 1,2, … , 𝑛
dengan varian untuk kedua kelompok, Dalam persamaan di atas 𝛽0 dan 𝛽1
macam kelompoknya adalah: menyatakan parameter populasi yang
a. 𝑥1 : generating data untuk kelompok 1 merupakan tetapan, tetapi tidak diketahui
b. 𝑥2 : generating data untuk kelompok 2 besarannya dan 𝜀𝑖 merupakan galat acak yang
(mean 2 = 2*sd, sd2 = 3 sd1) berdistribusi 𝑁(0, 𝜎 2 ). Setiap suku galat 𝜀𝑖
3. data kedua kelompok tidak normal dan diasumsikan mempunyai ragam yang sama 𝜎 2
heterogen varian serta besar n berbeda searah oleh karenanya, respons 𝑌𝑖 mempunyai ragam
dengan varian untuk kedua kelompok, yang sama pula
macam kelompoknya adalah: 2 {𝑌𝑖 } = 2
a. 𝑥1 : generating data untuk kelompok 1 karena, berdasarkan sifat variansi, kita
b. 𝑥2 : generating data untuk kelompok 2 memperoleh
(mean 2 = 2*sd, sd2 = 3 sd1) 2 {0 + 1 𝑋𝑖 + 𝑖 } = 2 {𝑖 } = 2
Data yang telah dibangkitkan kemudian
Jadi, model regresi 𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 +
dilakukan uji t dan uji F dengan menggunakan
𝜀𝑖 , 𝑖 = 1,2, … , 𝑛 mengasumsikan bahwa sebaran
bantuan program SPSS. Diperoleh output nilai t,
peluang bagi Y mempunyai ragam yang sama
nilai F, dan nilai signifikan dari masing-masing
uji tersebut. 2 , tidak tergantung pada nilai peubah bebas X.
Untuk memudahkan permasalahan, seterusnya
HASIL DAN PEMBAHASAN dianggap 𝑋𝑖 tidak mempunyai distribusi. Pada
Normalitas prakteknya nilai 𝑋𝑖 sering berada di bawah
Regresi linear normal klasik pengendalian peneliti, artinya nilainya data
mengasumsi dalam model 𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀, ditentukan oleh peneliti. Karena itu penamaan
𝑖 = 1,2, … , 𝑛 bahwa tiap 𝜀𝑖 didistribusikan secara peubah bebas untuk X merupakan kesalahan
normal dengan rata-rata 𝐸(𝜀𝑖 ) = 0 dan varians karena X tidaklah berubah secara bebas namun
𝐸(𝜀𝑖2 ) = 𝜎 2 dan 𝐶𝑜𝑣 (𝜀𝑖 , 𝜀𝑗 ), 𝐸(𝜀𝑖 , 𝜀𝑗 ) = 0 untuk X bebas dari distribusi karena X diasumsikan
𝑖 ≠ 𝑗 , 𝜀𝑖 dan 𝜀𝑗 tidak berkorelasi, 𝑖 ≠ 𝑗 dan bebas tetap (fixed) artinya X tidak mempunyai
(independent) sehingga 𝑐𝑜𝑣(𝜀𝑖 , 𝜀𝑗 ) = 0 jadi disribusi.
𝐸(𝑌𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖 , 𝐸(𝑌𝑖 ) = 𝜎 2 dan 𝑌𝑖 dan 𝑌𝑗 , Karena 𝜀 mempunyai distribusi,
𝑖 ≠ 𝑗, tidak berkorelasi . sedangkan 𝑥 tidak, maka 𝑌 juga mempunyai
distribusi yang sesuai dengan 𝜀 yaitu

171
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

𝑌𝑖 berdistribusi 𝑁(𝛽0 + 𝛽1 𝑥𝑖 𝜎 2 ). maka 𝑃{𝜒10 2


≥ 𝜒 2 (10; 𝛼 = 0,05)} dipenuhi jika
Pemisalan bahwa 𝑣𝑎𝑟 (𝜀𝑖 ), 𝑣𝑎𝑟(𝑌𝑖 ), sama 𝜒 2 (10;
𝛼 = 0,05) = 18,31. Bila 𝑌1 , 𝑌2 , … , 𝑌𝑛
dengan 𝜎 2 untuk setiap 𝑖, berarti variansinya saling bebas dan masing – masing 𝑁(𝜇 − 𝜎 2 )
tidak berubah pada setiap data sampel. maka
Anggapan ini sangat penting untuk tujuan ∑(𝑌𝑖 − 𝜇)2 /𝜎 2 berdistribusi 𝜒𝑛2
pengujian hipotesis. Tetapi anggapan 𝐸(𝜀𝑖 ) = 0, Bila
jadi 𝐸(𝑌𝑖 ) = 𝜇𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 , untuk setiap 𝑖, 𝑆2 =
1
∑(𝑌𝑖 − 𝑌̅)2
𝑛−1
tidaklah begitu penting karena dapat selalu
maka (𝑛 − 1)𝑆 2 /𝜎 2 berdistribusi 𝜒𝑛−1 2
.
dijadikan seperti itu dengan translasi. ̅
Begitu pula (𝑌 − 𝜇) /(𝜎 /𝑛) berdistribusi
2 2
Bila 𝑌 berdistribusi normal dengan rataan
𝜒12 . Suatu teorema yang banyak penggunaannya
𝜇 dan simpangan baku 𝜎, maka 𝑎𝑌 + 𝑏 juga
dalam statistika menyatakan bahwa kedua
berdistribusi normal dengan rataan 𝑎𝜇 + 𝑏 dan
peubah acak (𝑛 − 1) 𝑆 2 /𝜎 2 dan (𝑌̅ − 𝜇)2 /(𝜎 2 /𝑛)
simpangan baku 𝑎𝜎, untuk 𝑎 dan 𝑏 tetapan
saling bebas.
sembarang. Bila 𝑌1 dan 𝑌2 dua peubah yang
Bila 𝑍 suatu peubah acak 𝑁(0,1) dan 𝑈
berdistribusi normal, masing – masing 𝑁(𝜇1 , 𝜎12 )
berdistribusi 𝜒𝑣2 dan keduanya saling bebas,
dan 𝑁(𝜇2 , 𝜎22 ), dan 𝜌 koefisien korelasi antara 𝑌1
maka
dan 𝑌2 , maka funfsi pada gabungan 𝑌1 dan 𝑌2 𝑍
adalah 𝑇=
√𝑈/𝑣
𝑓(𝑦1 , 𝑦2 ) =
1 1
𝑒𝑘𝑠𝑝 [− 𝑄(𝑦1 , 𝑦2 )] Dikatakan mempunyai distribusi-t dengan
2
2𝜋𝜎1 𝜎2 √1−𝜌 2
derajat kebebasan 𝑣 lambang 𝑡𝑣 . Distribusi-t
untuk sangat mirip dengan distribusi normal,
1 𝑦1 −𝜇1 2 𝑦2 −𝜇2 2
𝑄(𝑦1 , 𝑦2 ) = [( ) +( ) − setangkup terhadap rataannya. Rataannya selalu
1−𝜌2 𝜎1 𝜎2
(𝑦1 −𝜇1 )(𝑦2 −𝜇2 )
nol dan variansinya 𝑣/(𝑣 − 2), 𝑣 > 2 ,
2𝜌
𝜎1 𝜎2
] variansinya tergantung pada derajat kebebasan.
Bila 𝑌1 dan 𝑌2 bebas satu sama lain, maka Tabel t diberikan di Lampiran 2 Bila 𝑌1 , 𝑌2 , … , 𝑌𝑛
𝜌 = 0 dan bentuk fungsi padat gabungan di atas saling bebas dan masing – masing 𝑁(𝜇 − 𝜎 2 )
menjadi sangat sederhana maka
𝑌̅ −𝜇
𝑓(𝑦1 , 𝑦2 ) = 𝑇=
𝑆/√𝑛
1 1 𝑦1 −𝜇1 2 1 1 𝑦2 −𝜇2 2
𝑒𝑘𝑠𝑝 [− ( ) ] 𝑒𝑘𝑠𝑝 [− ( ) ] berdistribusi-t dengan derajat kebebasan 𝑛 − 1.
√2𝜋𝜎1 2 𝜎1 √2𝜋𝜎2 2 𝜎2
Bila 𝑛 → ∞ maka 𝑡𝑛 → 𝑁(0,1). Misalkan
𝑓(𝑦1 , 𝑦2 ) = 𝑓(𝑦1 ). 𝑓(𝑦2 )
𝑌11 , 𝑌12 , … , 𝑌1𝑛1 bebas satu sama lain dan
Dalam hal normal, pengertian tidak
berkorelasi dan bebas adalah identik. Umumnya berdistribusi 𝑁(𝜇1 , 𝜎 2 ). Juga misalkan
korelasi yang nol tidak mengakibatkan 𝑌21 , 𝑌22 , … , 𝑌2𝑛2 saling bebas dan saling bebas
kebebasan, tetapi dua peubah yang saling bebas pula dari peubahnya, masing-masing
mempunyai korelasi nol. berdistribusi 𝑁(𝜇2 , 𝜎 2 ).
Bila 𝑌1 , 𝑌2 , … , 𝑌𝑛 peubah acak yang saling Misalkan selanjutnya
bebas masing – masing berdistribusi normal 𝑆 2 = [(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22 ]/(𝑛1 + 𝑛2 − 2)
dengan rataan 𝜇1 , 𝜇2 , … , 𝜇𝑛 dan simpangan baku dengan
𝜎1 , 𝜎2 , … , 𝜎𝑛 maka peubah acak 𝑆12 = ∑𝑖 (𝑌1𝑖 − 𝑌̅1 )2 /(𝑛1 − 1)
𝑌 = 𝑎1 𝑌1 + 𝑎2 𝑌2 + ⋯ + 𝑎𝑛 𝑌𝑛 dan
juga berdistribusi normal dengan rataan 𝑆22 = ∑𝑖 (𝑌2𝑖 − 𝑌̅2 )2 /(𝑛2 − 1)
𝜇𝑦 = 𝑎1 𝜇1 + 𝑎2 𝜇2 + ⋯ + 𝑎𝑛 𝜇𝑛 maka
dan variansi (𝑛1 + 𝑛2 − 2)𝑆 2 /𝜎^2
𝜎𝑦2 = 𝑎12 𝜎12 + 𝑎22 𝜎22 + ⋯ + 𝑎𝑛2 𝜎𝑛2 berdistribusi 𝜒𝑛21+𝑛2−2 dan bebas dari 𝑌̅1 dan 𝑌̅2 ,
1 sehingga
Khususnya bila 𝑎1 = 𝑎2 = ⋯ = 𝑎𝑛 = (𝑌̅1 −𝑌̅2 )−(𝜇1 −𝜇2 )
𝑛
dan 𝑌1 , 𝑌2 , … , 𝑌𝑛 berdistribusi normal yang sama 𝑇= 1 1
√𝑆 2 (𝑛 +𝑛 )
yaitu 𝑁(𝜇, 𝜎 2 ), maka 1 2
berdistribusi-t dengan derajat kebebasan yaitu
𝑌̅ = (𝑌1 + 𝑌2 + ⋯ + 𝑌𝑛 )/𝑛
Juga berdistribusi normal dengan rataan 𝑛1 + 𝑛2 − 2.
Bila 𝑈1 dan 𝑈2 peubah yang saling bebas
𝜇𝑦̅ = 𝜇 dan variansi 𝜎𝑦̅2 = 𝜎 2 /𝑛.
dan berdistribusi khi-kuadrat dengan derajat
Bila 𝑌1 , 𝑌2 , … , 𝑌𝑛 saling bebas dan masing-
kebebasan masing-masing 𝑣1 dan 𝑣2 maka
masing berdistribusi 𝑁(0,1), maka (𝑌12 + 𝑌22 + 𝑈 /𝑣
⋯ + 𝑌𝑛2 ) mempunyai distribusi khi-kuadrat 𝐹= 1 1
𝑈2 /𝑣2
dengan derajat kebebasan 𝑣 = 𝑛 lambang 𝜒𝑣2 . Dikatakan mempunyai distribusi-F dengan
Distribusi 𝜒𝑣2 ini mempunyai rataan 𝑣 dan derajat kebebasan 𝑣1 dan 𝑣2 , lambang 𝐹𝑣1 ,𝑣2 .
variansi 2𝑣. Misal untuk 𝑣 = 10 dan 𝛼 = 5%,

172
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

𝑣2
Peubah acak ini mempunyai rataan , 𝑣2 > 2 analisis tetap dilanjutkan, ada resiko hasil
𝑣2 /2
2𝑣22 (𝑣1 +𝑣2 −2)
penelitian yang diperoleh tidak menggambarkan
dan variansi , 𝑣2 > 4. keadaan yang sebenarnya.
𝑣1 (𝑣2 −2)2 (𝑣2 −4)
(𝑈1 /𝑣1 )/(𝑈2 /𝑣2 ) juga mempunyai Analisis regresi perlu dilakukan uji
distribusi F, tapi derajat kebebasannya 𝑣1 dan normalitas karena persyaratan awal agar dapat
𝑣2 , lambang 𝐹𝑣2,𝑉1 . Jadi 𝐹𝑣1,𝑉2 = 1/𝐹𝑣2,𝑉1 . Bila menilai kebaikan suatu persamaan regresi adalah
normalitas error. Uji normalitas diperlukan
𝑣1 = 1 maka 𝐹1,𝑉2 = 𝑡𝑣22 .
untuk menjawab pertanyaan apakah syarat
Jadi distribusi-t adalah hal khusus dari
sampel yang representatif terpenuhi atau tidak,
distribusi-F, yaitu bila derajat kebebasan F pada
sehingga hasil penelitian dapat digeneralisasi
pembilang 1.
pada populasi atau dapat mewakili populasi
Misalkan 𝑌11 , 𝑌12 , … , 𝑌1𝑛1 dan (Hadi, 2001).
𝑌21 , 𝑌22 , … , 𝑌2𝑛2 dua sampel acak berukuran 𝑛1 Jika sebuah data mempunyai sebaran
dan 𝑛2 yang saling bebas, masing-masing berasal yang tidak normal, perlakuan yang mungkin
dari populasi 𝑁(𝜇1 , 𝜎1 2 ) dan 𝑁(𝜇2 , 𝜎2 2 ). Maka dilakukan agar data menjadi normal dapat
peubah acak dilakukan dengan berbagai macam cara.
𝑆12 /𝜎1 2 Beberapa cara tersebut diantaranya adalah
𝐹=
𝑆22 /𝜎2 2
menambahkan jumlah data pada variabel
mempunyai distribusi F dengan derajat dependen (Y), menghilangkan data yang
kebebasan 𝑛1 − 1 dan 𝑛2 − 1 bila dianggap menjadi penyebab ketidaknormalan
1
𝑆1 = ∑(𝑌1𝑖 − 𝑌̅1 )2 , 𝑌̅1 = ∑ 𝑌1𝑖 /𝑛1 data (data outlier), dilakukan transformasi data.
𝑛1 −1
dan Homogenitas
1
𝑆2 = ∑(𝑌2𝑖 − 𝑌̅2 )2 , 𝑌̅2 = ∑ 𝑌2𝑖 /𝑛2 . Salah satu asumsi penting dari model
𝑛2 −1
regresi linear klasik adalah varian error 𝜀𝑖 pada
Setiap suku galat 𝜀𝑖 diasumsikan setiap nilai – nilai variabel bebas adalah sama
mempunyai ragam yang sama 𝜎 2 , oleh (konstan), asumsi ini disebut juga sebagai asumsi
karenanya respons 𝑌𝑖 mempunyai ragam yang homoskedastisitas atau homogenitas varian yang
sama pula. Karena ε mempunyai distribusi, disimbolkan dengan: (𝜀𝑖 ) = 𝜎 2 , 𝑖 = 1,2, … , 𝑛.
sedangkan x tidak, maka Y juga mempunyai Karena salah satu asumsi dasar regresi linear
distribusi yang sesuai dengan ε yaitu 𝑌𝑖 adalah homogenitas error maka pengujian
berdistribusi 𝑁(𝛽0 + 𝛽1 𝑥𝑖 𝜎 2 ). Pemisalan bahwa homogenitas data sangat penting dilakukan pada
𝑣𝑎𝑟 (𝜀𝑖 ), 𝑣𝑎𝑟(𝑌𝑖 ), sama dengan 𝜎 2 untuk setiap i, setiap pengolahan data. Jika pada normalitas
berarti variansinya tidak berubah pada setiap yang dilakukan uji adalah gabungan data antara
data sampel. Karena asumsi galat berdistribusi variabel Y dan variabel X maka begitu pula
normal berdampak pada variabel dependen (Y) dengan uji homogenitas yang diuji adalah
maka yang diuji normalitas adalah variabel Y gabungan data variabel Y dan variabel X.
dan variabel independen (X) diasumsikan bukan Adanya heterokedastisitas sama sekali
variabel acak (Sukestiyarno, 2013: 69). bukan berarti suatu model regresi adalah lemah.
Model regresi 𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀𝑖 Pengira kuadrat terkecil tetap tak bias dan
mengasumsikan bahwa sebaran peluang bagi Y konsisten, tetapi tidak efisien (variansi
mempunyai ragam yang sama 𝜎 2 , tidak membesar). Dampak dari membesarnya variansi
tergantung pada nilai peubah bebas X. Karena ε adalah (Setiawan dan Kusrini, 2010)
mempunyai distribusi, sedangkan x tidak, maka 1. Pengujian parameter regresi dengan statistik
Y juga mempunyai distribusi yang sesuai dengan uji t menjadi tidak valid.
ε yaitu 𝑌𝑖 . Karena asumsi galat berdistribusi 𝐻0 : 𝛽𝑗 = 0
normal dan homogen berdampak pada variabel 𝐻1 : 𝛽𝑗 ≠ 0
̂𝑗
dependen (Y) maka yang diuji normalitas dan 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =
𝛽
akan mengecil jika 𝑠(𝛽̂𝑗 ) besar,
̂𝑗 )
homogenitas adalah variabel Y dan variabel 𝑠(𝛽

independen (X) diasumsikan bukan variabel sehingga cenderung untuk tidak menolak 𝐻0 .
acak. 2. Selang kepercayaan (perkiraan selang) untuk
Ketika asumsi normalitas tidak dipenuhi parameter regresi cenderung melebar.
oleh data, maka analisis regresi akan 𝑃[𝛽̂𝑗 − 𝑡𝛼/2 . 𝑠(𝛽̂𝑗 ) ≤ 𝛽̂𝑗 ≤ 𝛽̂𝑗 + 𝑡𝛼/2 . 𝑠(𝛽̂𝑗 )] =
memberikan hasil yang meleset dari yang 1 − 𝛼 akan melebar jika 𝑠(𝛽̂𝑗 ) besar. Dengan
sebenarnya. Hal itu bisa saja terjadi karena melebarnya selang kepercayaan, hasil
banyak kejadian yang diluar kebiasaan, misalnya perkiraan yang diperoleh menjadi tidak dapat
data ekstrim, data yang diurutkan, data dipercaya.
mengikuti distribusi selain distribusi normal dan
masih banyak penyebab-penyebab lainnya. Jika

173
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

Apabila asumsi homogenitas tidak 1


𝐸[𝑏0 ] = 𝛽0 + ∑𝑛𝑖=1 𝐸[𝜀𝑖 ] − 𝑋̅ ∑𝑛𝑖=1 𝑘𝑖 𝐸[𝜀𝑖 ]
𝑛
dipenuhi dalam analisis regresi linear, maka
𝐸[𝑏0 ] = 𝛽0
didapatkan keadaan bahwa varian tidak bersifat
Dapat disimpulkan bahwa sifat
konstan disebut heteroskedastisitas atau
ketidakbiasan tidak tergantung pada varian galat.
disimbolkan
Jika dalam model regresi ada heteroskedastisitas,
𝑉𝑎𝑟(𝜀𝑖 ) = 𝜎𝑖2 , 𝑖 = 1,2, … , 𝑛. maka kita tetap memperoleh nilai parameter
Dalam kenyataannya, asumsi yang tidak bias karena sebagai penduga tidak
homoskedastisitas dari kesalahan pengganggu ε bias tidak memerlukan asumsi bahwa varian
mungkin tidak bisa dipenuhi, dengan kata lain galat harus konstan.
varian dari kesalahan pengganggu bersifat 2. Varian penduga yang diperoleh akan menjadi
heteroskedastisitas, yaitu 𝐸(𝜀𝑖2 ) = 𝜎𝑖2 . Hal ini tidak efisien, artinya penduga tersebut tidak
dapat dipahami jika diperhitungkan faktor– memiliki varian terkecil diantara penduga –
faktor yang menjadi penyebab adanya kesalahan penduga tidak bias lainnya. Dengan asumsi
pengganggu ε dalam model regresi. Faktor adanya homoskedastisitas, maka :
kesalahan pengganggu ε dimasukkan ke dalam 𝑉𝑎𝑟[𝑏1 ] = 𝐸[(𝑏1 − 𝛽1 )2 ]
model untuk dapat memperhitungkan 𝑉𝑎𝑟[𝑏1 ] = 𝐸[(𝛽1 + ∑𝑁 2
𝐼=1 𝑘𝑖 𝜀𝑖 − 𝛽1 ) ]
kesalahan–kesalahan yang mungkin terjadi 𝑁
𝑉𝑎𝑟[𝑏1 ] = 𝐸[(∑𝐼=1 𝑘𝑖 𝜀𝑖 ) ] 2
dalam pengukuran dan kesalahan karena
𝑉𝑎𝑟[𝑏1 ] = 𝐸[𝑘12 𝜀12 + 𝑘22 𝜀22 + ⋯ + 𝑘𝑛2 𝜀𝑛2 +
mengabaikan variabel–variabel tertentu. Dengan
2𝑘1 𝑘2 𝜀1 𝜀2 + ⋯ + 2𝑘𝑛−1 𝑘𝑛 𝜀𝑛−1 𝜀𝑛 ]
memperhatikan kedua perhitungan itu, maka
𝑉𝑎𝑟[𝑏1 ] = 𝐸[𝑘12 𝜀12 + 𝑘22 𝜀22 + ⋯ + 𝑘𝑛2 𝜀𝑛2 ] +
terdapat alasan untuk memperkirakan bahwa
𝐸[2𝑘1 𝑘2 𝜀1 𝜀2 + ⋯ + 2𝑘𝑛−1 𝑘𝑛 𝜀𝑛−1 𝜀𝑛 ]
varian ε bervariasi secara sistematis dengan
variabel bebas X. 𝑉𝑎𝑟[𝑏1 ] = 𝐸[∑𝑛𝑖=1 𝑘𝑖2 𝜀𝑖2 ] + 2𝐸[∑ 𝑘𝑖 𝑘𝑗 𝜀𝑖 𝜀𝑗 ]
Konsekuensi dari pelanggaran asumsi 𝑉𝑎𝑟[𝑏1 ] = 𝑘𝑖2 𝐸[𝜀𝑖2 ] + 2 ∑ 𝑘𝑖 𝑘𝑗 𝐸(𝜀𝑖 𝜀𝑗 )
homoskedastisitas adalah sebagai berikut: Karena 𝐸(𝜀𝑖 𝜀𝑗 ) = 0, dan 𝐸[𝜀𝑖2 ] = σ2
1. Penduga (estimator) yang diperoleh tetap Sehingga diperoleh :
memenuhi persyaratan tidak bias. 𝑣𝑎𝑟[𝑏1 ] = 𝜎 2 ∑𝑛𝑖=1 𝑘𝑖2 (*)
∑𝑛 ̅ ̅
𝑖=1(𝑋𝑖 −𝑋 )(𝑌𝑖 −𝑌 ) Apabila dengan adanya asumsi
Diberikan estimator 𝑏1 = [ ∑𝑛 ̅ 2
]
𝑖=1(𝑋𝑖 −𝑋 ) heteroskedastisitas maka :
(𝑋𝑖 −𝑋̅ )
Anggaplah bahwa : 𝑘𝑖 = 𝑣𝑎𝑟[𝑏1 ] = 𝜎 2 ∑𝑛𝑖=1 𝑘𝑖2
∑𝑛 (𝑋𝑖 −𝑋̅)2
𝑖=1 𝜎2
Sehingga : 𝑣𝑎𝑟[𝑏1 ] = ∑𝑛 ̅ 2
(**)
𝑖=1 𝑖 −𝑋 )
(𝑋
𝑏1 = ∑𝑛𝑖=1 𝑘𝑖 𝑦𝑖 Walaupun 𝛽1 dikatakan adalah
𝑏1 = ∑𝑛𝑖=1 𝑘𝑖 (𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 ) unbiased, tetapi tidak efisien karena varian –
𝑏1 = 𝛽0 ∑𝑛𝑖=1 𝑘𝑖 + 𝛽1 ∑𝑛𝑖=1 𝑘𝑖 𝑋𝑖 + ∑𝑛𝑖=1 𝑘𝑖 𝜀𝑖 variannya lebih besar daripada yang diperlukan.
Dengan diketahui bahwa : Untuk melihat penggunaan persamaan (*) dan
∑𝑛𝑖=1 𝑘𝑖 = 0 dan (**), diuraikan sebagai berikut:
𝑛 𝑛
∑𝑛𝑖=1 𝑥𝑖2 Misalnya, dinyatakan bahwa varian
∑ 𝑘𝑖 𝑋𝑖 = ∑ 𝑘𝑖 (𝑥𝑖 + 𝑋̅) = 𝑛 2 = 1 dengan asumsi heteroskedastisitas proporsional
∑𝑖=1 𝑥𝑖
𝑖=1 𝑖=1 terhadap 𝑘𝑖 dan 𝜎2 maka faktor
Dengan demikian proporsionalitasnya dinyatakan dengan
𝑏1 = 𝛽1 + ∑𝑛𝑖=1 𝑘𝑖 𝜀𝑖
persamaan: 𝜎𝑖2 = 𝑘𝑖 𝜎 2
Sehingga diperoleh :
Dengan mensubstitusikan nilai 𝜎𝑖2 ke
𝐸[𝑏1 ] = 𝛽1 + ∑𝑛𝑖=1 𝑘𝑖 𝐸[𝜀𝑖 ]
dalam persamaan (**), diperoleh:
𝐸[𝑏1 ] = 𝛽1
𝑣𝑎𝑟[𝑏1 ] = 𝑘𝑖 𝜎 2 ∑𝑛𝑖=1 𝑘𝑖2
Demikian juga untuk estimator parameter 2
(𝑋𝑖 −𝑋̅ )
𝛽0 yaitu 𝑏0 . 𝑣𝑎𝑟[𝑏1 ] = 𝑘𝑖 𝜎 2 ∑𝑛𝑖=1 (∑𝑛 2 )
̅
𝑖=1(𝑋𝑖 −𝑋)
Diberikan estimator 𝑏0 = 𝑌̅ − 𝑏1 𝑋̅ 𝜎 2 ∑𝑛 ̅ 2
𝑖=1 𝑘𝑖 (𝑋𝑖 −𝑋)
1
𝑏0 = (∑𝑛𝑖=1 𝑌𝑖 − 𝑏1 ∑𝑛𝑖=1 𝑋𝑖 ) 𝑣𝑎𝑟[𝑏1 ] = ∑𝑛 (𝑋 ̅ )2 ∑𝑛 (𝑋𝑖 −𝑋̅ )2
𝑛 𝑖=1 𝑖 −𝑋 𝑖=1
substitusikan 𝑏1 ke dalam persamaan di 𝜎2 ∑𝑛 ̅ 2
𝑖=1 𝑘𝑖 (𝑋𝑖 −𝑋)
𝑣𝑎𝑟[𝑏1 ] = (∑𝑛 ̅ 2
)( ∑𝑛 (𝑋𝑖 −𝑋̅)2
)
atas, maka : 𝑖=1(𝑋𝑖 −𝑋) 𝑖=1
1 ∑𝑛 ̅
𝑖=1 𝑌𝑖 (𝑋𝑖 −𝑋 ) 𝑛
Sehingga diperoleh :
𝑏0 = (∑𝑛𝑖=1 𝑌𝑖 − ∑𝑛 (𝑋𝑖 −𝑋̅)2
∑𝑖=1 𝑋𝑖 ) 𝑣𝑎𝑟[𝑏1 ]
𝑛 𝑖=1
1
𝑏0 = ∑𝑛𝑖=1 ( − ∑𝑛𝑖=1 𝑋𝑖 𝑘𝑖 ) 𝑌𝑖 = (𝑣𝑎𝑟[𝑏1 ] 𝑑𝑒𝑛𝑔𝑎𝑛 𝑎𝑠𝑢𝑚𝑠𝑖 ℎ𝑜𝑚𝑜𝑠𝑘𝑒𝑑𝑎𝑠𝑡𝑖𝑠𝑖𝑡𝑎𝑠)
𝑛
1 ∑𝑛 ̅ 2
𝑖=1 𝑘𝑖 (𝑋𝑖 −𝑋)
𝑏0 = ∑𝑛𝑖=1 ( − ∑𝑛𝑖=1 𝑋𝑖 𝑘𝑖 ) (𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 ) ( )
𝑛 ∑𝑛 (𝑋𝑖 −𝑋̅)2
𝑖=1
1
𝑏0 = 𝛽0 + ∑𝑛𝑖=1 𝜀𝑖 − 𝑋̅ ∑𝑛𝑖=1 𝑘𝑖 𝜀𝑖
𝑛
Sehingga akan diperoleh :

174
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

Dapat dikatakan bahwa, jika (𝑋𝑖 − 𝑋̅)2 sesuai dengan ε yaitu 𝑌𝑖 . Karena asumsi galat
dan 𝑘𝑖 berkorelasi positif atau mempunyai berdistribusi normal berdampak pada variabel
hubungan variabel yang positif dan jika dependen (Y) maka yang diuji normalitas dan
komponen yang kedua dari persamaan diatas homogenitas adalah variabel Y dan variabel
lebih besar daripada satu atau dapat dituliskan: independen (X) diasumsikan bukan variabel
∑𝑛𝑖=1 𝑘𝑖 (𝑋𝑖 − 𝑋̅)2 acak.
( 𝑛 )>1
∑𝑖=1(𝑋𝑖 − 𝑋̅)2 Simulasi uji t dan uji F
Maka Var(𝑏1 ) dengan asumsi Menunjukkan robust uji t dan uji F
heteroskedastisitas akan lebih besar daripada salah satunya dengan melakukan simulasi yang
𝑉𝑎𝑟(𝑏1 ) dengan asumsi homoskedastisitas. akan dilakukan pada dua kelompok data dengan
Sebagai akibatnya, standar error dari 𝑏1 terlalu berbagai macam kriteria data. Dasar bahwa uji t
rendah (underestimated). Sebagaimana diketahui dan uji F mengasumsikan nilai residual
bahwa standart error ini memiliki peran dalam berdistribusi normal. Mengecek robust uji t dan
pembentukan nilai t hitung yang berkaitan akan uji F terhadap ketidaknormalan data dan
menjadi terlalu tinggi (overestimated) yang heterogenitas varian, kondisi yang
mungkin selanjutnya menghasilkan kesimpulan dioperasionalkan adalah data yang dibangkitkan
bahwa dalam kasus spesifik 𝑏1 adalah dari program R dengan kriteria tidak normal dan
kelihatannya signifikan, walaupun sebenarnya tidak homogen. Data dilakukan uji t dan uji F
tidak signifikan. Oleh karena itu jika asumsi dengan bantuan program SPSS.
homoskedastisitas tidak dipenuhi maka hasil uji t Kriteria yang akan digunakan untuk
dan uji F tidak menentu (Setiawan dan Kusrini, menentukan robust uji t dan uji F adalah nilai
2010: 107). p. Nilai p menggambarkan taraf kesalahan yang
Selain uji signifikan tidak dapat tepat, paling kecil dimana hipotesis nol ditolak.
diterapkan, batas-batas kepercayaan juga tidak Hipotesis nol yang sedang diuji kebenarannya
dapat diterapkan. Artinya jika varian penaksir menyatakan bahwa sebuah koefisien regresi
model tidak memenuhi asumsi adalah sama dengan nol. Nilai p mengukur
homoskedastisitas, maka inferensi dan prediksi probabilitas Tipe Kesalahan I, probabilitas
mengenai koefisien-koefisien sampel akan keliru. kesalahan menolak hipotesis nol karena
Dalam analisis model regresi linear kenyataan hipotesis itu benar.
apabila semua asumsi model regresi linear klasik Berikut adalah tabel output hasil
terpenuhi kecuali asumsi homoskedastisitas yang simulasi yang dilakukan pada data bangkitan
berarti adanya heteroskedastisitas, maka program R dan dilakukan pada program SPSS.
estimator dari paramater yang diperoleh masih
tetap tak bias dan konsisten tetapi estimatornya Tabel 1. Nilai signifikan dari Uji t dan Uji F
tidak efisien, baik untuk sampel kecil maupun
sampel besar (Ghozali, 2011: 160). Uji F Uji t
Berdasarkan hasil penelitian dan No Data n
nilai F sig. F nilai t sig. t
pengkajian beberapa literatur diperoleh hasil
bahwa uji normalitas dan uji homogenitas sangat 1 𝑎1 𝑎2 30 0,252 0,620 0,312 0,757
penting dilakukan dalam setiap proses 2 𝑏1 𝑏2 30 1,018 0,322 - 0,225 0,824
penelitian. Hal itu disebabkan karena regresi
linear normal klasik mengasumsi dalam model 3 𝑐1 𝑐2 30 1,285 0,267 - 0,252 0,803
𝑌𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝜀, 𝑖 = 1,2, … , 𝑛 bahwa tiap 𝜀𝑖 4 𝑥1 𝑥2 50 0,153 0,698 - 0,798 0,429
didistribusikan secara normal dan varians
5 𝑦1 𝑦2 50 1,796 0,187 0,296 0,768
𝐸(𝜀𝑖2 ) = 𝜎 2 .
Uji normalitas dan uji homogenitas 6 𝑧1 𝑧2 50 0,174 0,678 - 0,221 0,826
menjadi sangat penting dipenuhi karena pada
asumsi awal suatu persamaan regresi linear Hasil di atas merupakan perhitungan uji
dikatakan baik jika error/galat regresi t dan uji F dua kelompok data dengan beberapa
berdistribusi normal dan homogen. Setiap suku kriteria data. Kriteria yang digunakan untuk
galat 𝜀𝑖 diasumsikan mempunyai ragam yang menilai robust uji t dan uji F adalah jika hasil
sama 𝜎 2 oleh karenanya, respons 𝑌𝑖 mempunyai nilai p lebih besar dari 0,05 maka uji t dan uji F
ragam yang sama pula. Model regresi 𝑌𝑖 = 𝛽0 + dalam kondisi ini akan cenderung terlalu sering
𝛽1 𝑥𝑖 + 𝜀𝑖 mengasumsikan bahwa sebaran menghasilkan nilai yang signifikan dari yang
peluang bagi Y mempunyai ragam yang sama seharusnya.
𝜎 2 , tidak tergantung pada nilai peubah bebas X. Hasil yang diperoleh tentu saja tidak
Karena ε mempunyai distribusi, sedangkan x bisa diharapkan exact, misalnya harus 0.05. Jika
tidak, maka Y juga mempunyai distribusi yang sedikit lebih besar atau sedikit lebih kecil, maka

175
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

penyimpangan tersebut dapat diabaikan. SIMPULAN DAN SARAN


Misalnya 0.0502 maka ini tidak perlu dianggap Berdasarkan hasil penelitian dan
menyimpang dari 0.05. Dari data di atas banyak pembahasan yang telah dilakukan, maka dapat
yang menghasilkan nilai p lebih dari 0,05. Nilai- diambil kesimpulan setiap penelitian yang
p yang besar menunjukkan bahwa data yang menggunakan regresi linear perlu diuji asumsi
diperoleh konsisten dengan hipotesis nol. normalitas dan homoskedastisitas. Normalitas
Untuk menunjukkan kekekaran uji t dan dan homogenitas diasumsikan pada error data.
uji f terhadap pelanggaran normalitas dan Jika semua asumsi klasik terpenuhi kecuali
homogenitas data dengan menggunakan normalitas maka data model regresi dapat
simulasi data. Data yang digunakan adalah dikatakan tidak valid dengan jumlah sampel
bangkitan dengan bantuan program R. Data yang ada, namun penduga yang diperoleh masih
yang dibangkitkan adalah dua kelompok data bisa terdistribusi secara normal karena
dengan kriteria kedua kelompok tidak normal pelanggaran asumsi tersebut tidaklah terlalu
dan heterogen varian. Tahap simulasinya yaitu serius akibatnya dalam analisis regresi. Jika
data bangkitan dilakukan uji t dan uji F semua asumsi klasik terpenuhi kecuali
diperoleh nilai t, nilai F serta diperoleh nilai p homogenitas data maka penduga yang diperoleh
dari masing-masing uji. tetap tak bias dan konsisten, tetapi tidak efisien
Berdasarkan nilai t, uji hipotesis yang yang artinya penduga tersebut tidak memiliki
dilakukan pada uji t adalah : varian terkecil diantara penduga – penduga tidak
𝐻0 : data berdistribusi t bias lainnya baik untuk sampel kecil maupun
𝐻1 : data tidak berdistribusi t sampel besar. Pada dasarnya asumsi normalitas
Terima 𝐻0 jika t hitung < t tabel, dan homogenitas dilakukan pada error data yang
sebaliknya tolak 𝐻0 jika t hitung > t tabel. Nilai t merupakan dasar ukuran kebaikan model linear
tabel untuk jumlah data 30 dan 50 adalah 2,048 maka uji normalitas dan uji homogenitas data
dan 2,011. Dari output nilai t untuk data 𝑎1 𝑎2 sangat penting dilakukan pada setiap penelitian.
nilai t 0,312 < 2,048, 𝑏1 𝑏2 nilai t -0,225 < 2,048, Dalam pengujian parameter regresi
𝑐1 𝑐2 nilai t -0,252 < 2,048, nilai t -0,798 < 2,011, terdapat dua pengujian yang dilakukan untuk
𝑦1 𝑦2 nilai t 0,296 < 2,011, 𝑧1 𝑧2 nilai t -0,221 < mengetahui signifikansi dari variabel bebas yaitu
2,011. Diperoleh simpulan nilai t hitung < t pengujian secara individu atau uji t dan
tabel maka terima 𝐻0 , yang artinya data pengujian secara serentak atau uji f. Pengujian
berdistribusi t. secara individu atau uji t dan pengujian secara
Berdasarkan nilai F, uji hipotesis yang serentak atau uji f telah terbukti robust dengan
dilakukan pada uji F adalah : menunjukkan simulasi uji t dan uji F yang
𝐻0 : data berdistribusi F dilakukan terhadap data bangkitan melalui
𝐻1 : data tidak berdistribusi F program R. Telah dibuktikan dalam simulasi
Terima 𝐻0 jika F hitung < F tabel, yakni data yang tidak normal dan tidak
sebaliknya tolak 𝐻0 jika F hitung > F tabel. Nilai homogen setelah dilakukan uji t dan uji F tetap
F tabel untuk jumlah data 30 dan 50 adalah berditribusi t dan berdistribusi F serta nilai p uji t
4,195 dan 4,042. Dari output nilai F untuk data dan uji F dalam simulasi yang dilakukan ke
𝑎1 𝑎2 nilai F 0,252 < 4,195, 𝑏1 𝑏2 nilai F 1,018 < dalam beberapa tipe data diperoleh nilai p lebih
4,195, 𝑐1 𝑐2 nilai F 1,285 < 4,195, 𝑥1 𝑥2 nilai F dari 0,05. Nilai-p yang tinggi (>0,05)
0,153 < 4,042, 𝑦1 𝑦2 nilai F 1,796 < 4,042, 𝑧1 𝑧2 menandakan bahwa sebuah koefisien tidak
nilai F 0,174 < 4,042. Diperoleh simpulan nilai berbeda secara signifikan dari nol atau data yang
F hitung < F tabel maka terima 𝐻0 , yang artinya diperoleh konsisten dengan hipotesis nol. Maka
data berdistribusi F. diperoleh kesimpulan bahwa uji t dan uji F
Terlihat pada output SPSS signifikan terbukti kekar terhadap ketidaknormalan dan
yang di dapat adalah nilai p dari semua data homogenitas data.
simulasi tersebut memperoleh nilai p>0,05 Berdasarkan hasil penelitian maka saran
menunjukkan data yang diperoleh konsisten yang dapat disampaikan adalah pada pengkajian
dengan hipotesis nol. Dari tabel output simulasi pada asumsi model regresi linear klasik (Classical
diperoleh nilai t dan nilai F signifikan, sehingga Linear Regression Model) lain seperti autokorelasi
data yang tidak normal dan tidak homogen dan multikolinearitas dengan menggunakan
setelah dilakukan uji t dan uji F tetap berditribusi metode yang lain, dari pembahasan dan simulasi
t dan berdistribusi F. Dari pembahasan di atas, uji t menggunakan kriteria nilai-p yang telah
diperoleh kesimpulan bahwa uji t dan uji F dijabarkan diperoleh simpulan bahwa uji t
terbukti kekar terhadap ketidaknormalan dan terbukti robust dengan melakukan simulasi data
homogenitas data. bangkitan menggunakan program R, oleh sebab
itu ada baiknya dilakukan penelitian
menggunakan kriteria lain selain kriteria niali-p.

176
A.Q. Sari et al. / UNNES Journal of Mathematics 6(2) (2017)

Dalam penelitian ini telah dilakukan penelitian


robust uji t dengan simulasi data menggunakan
program R, maka perlu dilakukan penelitian
lebih lanjut terhadap uji f apakah terbukti robust
atau tidak dengan program lainnya.
DAFTAR PUSTAKA
Banks, J. 1998. Hand Book of Simulation:
Aplication, Methodology, Advances,
Aplications and Practices. John and Willey
Sons.
Cramer, D. & Howitt, D. 2006. The Sage
Dictionary of Statistics. London: Sage
Publication.
Drapper. N.R. & Smith. 1992. Analisis Regresi
Terapan. Edisi Kedua. Jakarta: PT
Gramedia Pustaka.
Ghozali, I. 2011. Aplikasi Analisis Multivariate
dengan program IBM SPSS 19. Edisi
kelima. Semarang: Universitas
Diponeoro.
Hadi, S. 2001. Statistik. Cetakan ke-5.
Yogyakarta: Andi Yogyakarta.
Hays. W.L. & Winkler, R.L. 1971. Statistics-
Probability, Inference, and Decision. New
York: Holt, Rinehart and Winston Inc.
Setiawan & Kusrini, D.E. 2010. Ekonometrika.
Yogyakarta: ANDI.
Sembiring, R.K. 2003. Analisis Regresi. Edisi
Kedua. Bandung: ITB Bandung.
Sugiyono. 2004. Metode Penelitian Bisnis.
Alfabeta. Bandung.
Sukestiyarno. 2013. Olah Data Penelitian
Berbantuan SPSS. Cetakan Keempat.
Semarang. Universitas Negeri
Semarang.
Supranto, J. 2005. Ekonometri (1st ed). Bogor:
Ghalia Indonesia.
Walpole, R.E. & Myers, R.H. 1995. Ilmu peluang
dan statistika untuk insinyur dan ilmuwan.
Edisi ke-4. ITB. Bandung.

177

Anda mungkin juga menyukai