LANDASAN TEORI
Statistik nonparametrik disebut juga statistik bebas sebaran. Statistik nonparametrik tidak
mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik dapat digunakan pada
data yang memiliki sebaran normal atau tidak. Statistik nonparametrik biasanya digunakan untuk
melakukan analisis pada data nominal atau ordinal.
Metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan
mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistik parametrik, terutama
yang berkaitan dengan distribusi normal. Nama lain yang sering digunakan untuk statistik
nonparametrik adalah statistik bebas distribusi.
Dalam banyak hal, pengamatan-pengamatan yang akan dikaji tidak selalu memenuhi
asumsi-asumsi yang mendasari uji-uji parametrik sehingga kerap kali dibutuhkan teknik-teknik
inferensial dengan validitas yang tidak bergantung pada asumsi-asumsi yang kaku. Dalam hal
ini, teknik-teknik dalam regresi nonparametrik memenuhi kebutuhan ini karena tetap valid
walaupun tidak diperlukan pemenuhan asumsi kenormalan galat dan hanya berlandaskan asumsiasumsi yang sangat umum. Penggunaan regresi nonparametrik dilandasi pada asumsi :
a. contoh yang diambil bersifat acak dan kontinu .
b. regresi (Y|X) bersifat linier.
c. semua nilai Xi saling bebas.
d. data diasumsikan tidak berdistribusi normal.
Contoh regresi non parametrik adalah uji tanda (sign test), uji jenjang bertanda wilcoxon,
metode theil, metode deret fourier, uji chi square dan lain-lain.
Data interval yaitu data yang diukur dengan jarak diantara dua titik pada skala yang
sudah diketahui.
2.
Data rasio yaitu data yang diukur dengan dengan suatu proporsi.
Data kualitatif adalah data yang tidak dapat diukur dalam skala numerik. Namun dalam
statistik semua data harus dalam bentuk angka, maka data kualitatif umumnya dikuantifikasi agar
dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasifikasi data dalam bentuk kategori.
Data kualitatif dapat dibedaka menjadi:
1. Data nominal yaitu data yang dinyatakan dalam bentuk kategori.
2. Data ordinal yaitu data yang dinyatakan dalam bentuk kategori, namun posisi data
tidak sama derajatnya karena dinyatakan dalam skala peringkat.
f ( x, y )
dy . Dimana m adalah
f ( x)
fungsi yang tidak diketahui. untuk mendapatkan dan menggunakan bobot yang sesuai.
m h ( x) =
n
i =1
n
1
K
i =1
( x X i )Yi
h
(x X i )
2. Priestley-chao
3. Gasser-Mller kernel
Dimana S i =
(xi 1 + xi )
2
Pada [5], [6] menjelaskan fungsi kernel, dinotasikan K(t) merupakan suatu fungsi yang pada
pemanfaatannya diberlakukan pada setiap titik data. Fungsi ini mempunyai tiga sifat, yaitu :
a. K(t) 0 untuk semua t
b.
K(t) = 1
Kriteria pemilihan fungsi kernel yang baik berdasarkan pada resiko kernel minimum
yang dapat diperoleh dari kernel optimal atau kernel-kernel dengan variansi minimum. Berikut
diberikan 7 macam fungsi kernel:
1. Gaussian
( x X )2
K ( x, X ) = exp
2 2
=5
Gambar 1. Grafik Gaussian
2. Norm
K , ( x, X ) =
x X
= 2, = 2,5
Gambar 2. Grafik Norm
3. Quadratic
K ,
2
(
x X)
( x, X ) =
= 5, = 5
Gambar 3. Grafik Quadratic
4. Muti Quadratic
( x X )2
2
K ( x, X ) =
+
2
= 0,5, = 4, = 5
Gambar 4. Grafik Multi Quadratic
5. Spline
,ifx = X
K ( x, X ) = ( x X )2 ( x X )
ln + ,otherwise
1
2
Gambar 5. Grafik Spline
= , = 250
6. Epanechnikov
3 1 ( x X2 )2 ,if
4
K ( x, X ) =
0,otherwise
x X
1
=5
Gambar 6. Grafik Epanechnikov
7. Tri-cube
1 x X 3 ,if
K ( x, X ) =
0,otherwise
x X
1
=5
Gambar 7. Grafik Tri-cube
Memilih bandwidth yang sesuai (parameter smoothing) adalah bagian penting dari regresi
nonparametrik. Untuk mendapatkan bandwidth yang tepat maka harus ditemukan keseimbangan
antara varians dan bias. Formula untuk bias asimtotik dan varians dari prediksi saat
menggunakan estimasi Nadaraya-Watson (2).
Telah diketahui secara umum, bahwa permasalahan utama pada kernel smoothing bukan
terletak pada pemilihan kernel tetapi pada pemilihan bandwidth. Pemilihan bandwidth optimum
lebih ditekankan pada penyeimbangan antara bias dan varians. Satu perumusan masalah yang
dapat memperlihatkan hubungan antara bias dan varians adalah mean square error MSE karena
itu dengan meminimumkan MSE maka permasalah antara bias dan varians di atas dapat
diminimumkan juga.
MSE =
1 n
( y y ) 2
n i =1
(3)
Bandwidth dari kernel adalah parameter bebas yang menunjukkan pengaruh yang kuat
pada perkiraan yang dihasilkan. Untuk menggambarkan efeknya, lihat gambar dibawah ini
disimulasikan dari pengambilan sampel acak yang berdistribusi normal standar.
2.5 Solver
Solver merupakan salah satu perangkat tambahan (add-ins) yang digunakan untuk memecahkan
kasus yang rumit yang terdapat dalam program aplikasi Microsoft Excel. Perangkat solver
memungkinkan dalam menghitung nilai yang dibutuhkan untuk mencapai hasil yang terdapat
pada satu sel atau sederetan sel (range). Dengan kata lain, solver dapat menangani masalah yang
melibatkan banyak sel variabel dan membantu mencari kombinasi variabel untuk meminimalkan
atau memaksimalkan nilai satu sel target. Solver memungkinkan untuk mendefinisikan sendiri
suatu batasan atau kendala yang harus dipenuhi agar pemecahan masalah dianggap benar.
Solver merupakan perangkat atau vasilitas tambahan (add-ins) yang belum tentu ada pada
program excel setelah menginstal Microsoft office. Perangkat ini dapat diperiksa pada grup
analisis dalam ribbon data seperti diperlihatkan pada gambar berikut ini.