Regresi Nonparametrik
1 x
Kh (x) ¿ K , untuk -∞ < x < ∞, h > 0
h h
Serta memenuhi :
(i) K(x) ≥ 0, utuk semua x
∞
(ii) ∫ K ( x ) dx=1
−∞
∞
2 2
(iii) ∫ x K ( x ) dx=σ >0
−∞
(iv) ∫ x K ( x ) dx=0
−∞
1 1
√2 π ( 2
7. Kernel Gaussian : K(x) = (−x ) ) -∞ < x < ∞
2
3. Regresi Kernel
Regresi kernel adalah teknik statistika nonparametrik untuk mengestimasi fungsi
regresi m(x) pada model regresi nonparametrik y1 = m(xi) + εi . Nadaraya dan Watson
pada tahun 1964 mendefinisikan estimator regresi kernel sehingga disebut estimator
Nadaraya-Watson.
n
1
∑ K ( x−x i ) yi
n i=1 h
^ ( x )=
m n
1
∑ K ( x−x i )
n i=1 h
n
m
^ ( x ) = ∑ wh i ( x ) y i
i=1
Dengan :
1 x−x i x −xi
K( ) K( )
h h h
w hi ( x )= n = n
1 x−x i x−x i
∑ K( ) ∑( )
h i=1 h i=1 h
4. Pemilihan Bandwith Ordinal
Bandwidth (h) adalah parameter pemulus (smoothing) yang berfungsi untuk
mengontrol kemulusan dari kurva yang diestimasi. Bandwidth yang terlalu kecil akan
menghasilkan kurva yang under-smoothing yaitu sangat kasar dan sangat fluktuatif,
dan sebaliknya bandwidth yang terlalu lebar akan menghasilkan kurva yang over-
smoothing yaitu sangat mulus, tetapi tidak sesuai dengan pola data (Hardle, 1994).
Oleh karena itu perlu dipilih bandwidth yang optimal. Salah satu metode untuk
mendapatkan h optimal adalah dengan menggunakan kriteria Generalized Cross
Validation (GCV), yang didefinisikan sebagai berikut:
MSE
GCV = 2
1
( n
tr ( I −H ( h ) ) )
n
1
Dengan MSE= ∑ ¿ ¿ . kebaikan suatu estimator dapat dilihat dari tingkat
n i=1
kesalahannya. Semakin kecil tingkat kesalahannya semakin baik estimasinya.
Menurut, kriteria untuk menentukan estimator terbaik dalam model regresi
nonparametrik, antara lain:
∑ ¿ e t ∨¿
MAD= t =1 y i∨ ¿ ¿ ¿
=∑ ¿ y− ^
n t=1 n