Regnonpar

BAB II
LANDASAN TEORI
2.1 Regresi Non-Parametrik
Statistik nonparametrik disebut juga statistik bebas sebaran. Statistik nonparametrik tidak
mensyaratkan bentuk sebaran parameter populasi. Statistik nonparametrik dapat digunakan pada
data yang memiliki sebaran normal atau tidak. Statistik nonparametrik biasanya digunakan untuk
melakukan analisis pada data nominal atau ordinal.
Metode statistik nonparametrik merupakan metode statistik yang dapat digunakan dengan
mengabaikan asumsi-asumsi yang melandasi penggunaan metode statistik parametrik, terutama
yang berkaitan dengan distribusi normal. Nama lain yang sering digunakan untuk statistik
nonparametrik adalah statistik bebas distribusi.
Analisa regresi adalah Analisis statistik yang mempelajari bagaimana membangun

sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan suatu
fenomena alami atas dasar fenomena yang lain. Analisa regresi merupakan salah satu teknik
statistik yang digunakan secara luas dalam ilmu pengetahuan terapan. Regresi di samping
digunakan untuk mengetahui bentuk hubungan antar peubah regresi, juga dapat dipergunakan
untuk peramalan.
Dalam banyak hal, pengamatan-pengamatan yang akan dikaji tidak selalu memenuhi
asumsi-asumsi yang mendasari uji-uji parametrik sehingga kerap kali dibutuhkan teknik-teknik
inferensial dengan validitas yang tidak bergantung pada asumsi-asumsi yang kaku. Dalam hal
ini, teknik-teknik dalam regresi nonparametrik memenuhi kebutuhan ini karena tetap valid
Universitas Sumatera Utara
walaupun tidak diperlukan pemenuhan asumsi kenormalan galat dan hanya berlandaskan asumsiasumsi yang sangat umum. Penggunaan regresi nonparametrik dilandasi pada asumsi :
a. contoh yang diambil bersifat acak dan kontinu .
b. regresi (Y|X) bersifat linier.
c. semua nilai Xi saling bebas.
d. data diasumsikan tidak berdistribusi normal.
Contoh regresi non parametrik adalah uji tanda (sign test), uji jenjang bertanda wilcoxon,
metode theil, metode deret fourier, uji chi square dan lain-lain.
Perbandingan statistik nonparametrik dan statistik parametrik. Kekurangan dan kelebihan

setiap pemilihan prosedur pengujian data, apakah itu menggunakan nonparametrik atau
parametrik memiliki kelebihan dan kekurangan masing-masing. Berikut adalah kelebihan dan
kekurangan masing-masing prosedur :
Kelebihan statistik nonparametrik dibandingkan dengan statistik parametrik ialah :

1. Asumsi yang digunakan minimum sehingga mengurangi kesalahan penggunaan.
2. Perhitungan dapat dilakukan dengan cepat dan mudah.
3. Konsep dan metode nonparametrik mudah dipahami bahkan oleh seseorang dengan
kemampuan matematik yang minim.
4. Dapat diterapkan pada skala peubah kualitatif (nominal dan ordinal).
Kekurangan statistik nonparametrik dibandingkan dengan statistik parametrik ialah :
1. Bila digunakan pada data yang dapat diuji menggunakan statistika parametrik maka hasil
pengujian menggunakan statistik nonparametrik menyebabkan pemborosan informasi.
2. Pekerjaan hitung-menghitung (aritmetik) karena memerlukan ketelitian terkadang
menjemukan.
Prosedur nonparametrik digunakan sebaiknya :
1. Bila hipotesis yang diuji tidak melibatkan suatu parameter populasi.
2. Bila data telah diukur menggunakan skala nominal atau ordinal.

3. Bila asumsi-asumsi yang diperlukan pada suatu prosedur pengujian parametrik tidak
terpenuhi.
4. Bila penghitungan harus dilakukan secara manual.
Menurut jenisnya data terdiri dari data kualitatif dan kuantitatif. Data kuantitatif adalah
data yang diukur dalam suatu skala numerik (angka). Data kuantitatif dapat dibedakan
menjadi:
1.
Data interval yaitu data yang diukur dengan jarak diantara dua titik pada skala yang
sudah diketahui.
2.
Data rasio yaitu data yang diukur dengan dengan suatu proporsi.
Data kualitatif adalah data yang tidak dapat diukur dalam skala numerik. Namun dalam
statistik semua data harus dalam bentuk angka, maka data kualitatif umumnya dikuantifikasi agar
dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasifikasi data dalam bentuk kategori.
Data kualitatif dapat dibedaka menjadi:
1. Data nominal yaitu data yang dinyatakan dalam bentuk kategori.
2. Data ordinal yaitu data yang dinyatakan dalam bentuk kategori, namun posisi data
tidak sama derajatnya karena dinyatakan dalam skala peringkat.
2.2 Regresi Kernel

Regresi kernel adalah teknik non-parametrik dalam statistik untuk memperkirakan
ekspektasi bersyarat dari variabel acak. Tujuannya adalah untuk menemukan hubungan nonlinear antara sepasang variabel acak X dan Y, untuk mendapatkan dan menggunakan bobot yang
sesuai.
Dalam setiap regresi nonparametrik, harapan bersyarat dari variabel Y relatif terhadap
variabel X dapat ditulis E(Y|X) = m(X) atau E(Y|X = x) = y
f ( x, y )
dy . Dimana m adalah
f ( x)
fungsi yang tidak diketahui. untuk mendapatkan dan menggunakan bobot yang sesuai.
Untuk mengestimasi m sebagai rata-rata tertimbang secara lokal, menggunakan kernel

sebagai fungsi pembobotan. Penaksir Nadaraya-Watson (2):
Ada tiga macam estimasi kernel yaitu:
1. Nadaraya-watson
m h ( x) =
n
i =1
n
1
K
i =1
( x X i )Yi
h
(x X i )
2. Priestley-chao
3. Gasser-Mller kernel
Dimana S i =
(xi 1 + xi )
2
2.3 Fungsi Kernel
Pada [5], [6] menjelaskan fungsi kernel, dinotasikan K(t) merupakan suatu fungsi yang pada
pemanfaatannya diberlakukan pada setiap titik data. Fungsi ini mempunyai tiga sifat, yaitu :
a. K(t) 0 untuk semua t
b.
K(t) = 1
c. K(-t) = K(t) untuk semua t (sifat simetri)
Kriteria pemilihan fungsi kernel yang baik berdasarkan pada resiko kernel minimum
yang dapat diperoleh dari kernel optimal atau kernel-kernel dengan variansi minimum. Berikut
diberikan 7 macam fungsi kernel:
1. Gaussian
( x X )2
K ( x, X ) = exp
2 2
=5
Gambar 1. Grafik Gaussian
2. Norm
K , ( x, X ) =
x X
= 2, = 2,5
Gambar 2. Grafik Norm
3. Quadratic
K ,
2
(
x X)
( x, X ) =
= 5, = 5
Gambar 3. Grafik Quadratic
4. Muti Quadratic
( x X )2
2
K ( x, X ) =
+
2
= 0,5, = 4, = 5
Gambar 4. Grafik Multi Quadratic
5. Spline
,ifx = X
K ( x, X ) = ( x X )2 ( x X )
ln + ,otherwise
1
2
Gambar 5. Grafik Spline
= , = 250
6. Epanechnikov
3 1 ( x X2 )2 ,if
4
K ( x, X ) =
0,otherwise
x X
1

=5
Gambar 6. Grafik Epanechnikov
7. Tri-cube
1 x X 3 ,if

K ( x, X ) =
0,otherwise
x X
1

=5
Gambar 7. Grafik Tri-cube
2.4 Pemilihan Bandwidth
Memilih bandwidth yang sesuai (parameter smoothing) adalah bagian penting dari regresi
nonparametrik. Untuk mendapatkan bandwidth yang tepat maka harus ditemukan keseimbangan
antara varians dan bias. Formula untuk bias asimtotik dan varians dari prediksi saat
menggunakan estimasi Nadaraya-Watson (2).
Telah diketahui secara umum, bahwa permasalahan utama pada kernel smoothing bukan
terletak pada pemilihan kernel tetapi pada pemilihan bandwidth. Pemilihan bandwidth optimum
lebih ditekankan pada penyeimbangan antara bias dan varians. Satu perumusan masalah yang
dapat memperlihatkan hubungan antara bias dan varians adalah mean square error MSE karena
itu dengan meminimumkan MSE maka permasalah antara bias dan varians di atas dapat
diminimumkan juga.
MSE =
1 n
( y y ) 2
n i =1
(3)
Bandwidth dari kernel adalah parameter bebas yang menunjukkan pengaruh yang kuat
pada perkiraan yang dihasilkan. Untuk menggambarkan efeknya, lihat gambar dibawah ini
disimulasikan dari pengambilan sampel acak yang berdistribusi normal standar.
Gambar 8. Contoh kurva bandwith

Kurva abu-abu menyatakan kepadatan normal dengan mean 0 dan varians 1. Sebagai
perbandingan, kurva merah undersmoothed (tidak mulus) karena mengandung terlalu banyak
data palsu yang timbul dari menggunakan bandwidth h = 0,05 yang terlalu kecil. Kurva hijau
oversmoothed (terlalu mulus) karena menggunakan bandwidth h = 2 mengaburkan banyak
struktur yang mendasarinya. Kurva hitam dianggap optimal karena mendekati data sebenarnya.
Kriteria optimalitas yang paling umum digunakan untuk pemilihan parameter ini adalah
kesalahan kuadrat rata-rata. Jika bandwidth tidak tetap tetapi bervariasi tergantung pada estimasi
atau sampel, ini menghasilkan metode yang sangat kuat yang dikenal sebagai estimasi kernel
bandwidth yang adaptif.
2.5 Solver
Solver merupakan salah satu perangkat tambahan (add-ins) yang digunakan untuk memecahkan
kasus yang rumit yang terdapat dalam program aplikasi Microsoft Excel. Perangkat solver
memungkinkan dalam menghitung nilai yang dibutuhkan untuk mencapai hasil yang terdapat
pada satu sel atau sederetan sel (range). Dengan kata lain, solver dapat menangani masalah yang
melibatkan banyak sel variabel dan membantu mencari kombinasi variabel untuk meminimalkan
atau memaksimalkan nilai satu sel target. Solver memungkinkan untuk mendefinisikan sendiri
suatu batasan atau kendala yang harus dipenuhi agar pemecahan masalah dianggap benar.
Solver merupakan perangkat atau vasilitas tambahan (add-ins) yang belum tentu ada pada
program excel setelah menginstal Microsoft office. Perangkat ini dapat diperiksa pada grup
analisis dalam ribbon data seperti diperlihatkan pada gambar berikut ini.
Gambar 9. Posisi perangkat solver

Regnonpar

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Regnonpar

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB II

2.1 Regresi Non-Parametrik

Analisa regresi adalah Analisis statistik yang mempelajari bagaimana membangun

Universitas Sumatera Utara

Perbandingan statistik nonparametrik dan statistik parametrik. Kekurangan dan kelebihan

Kelebihan statistik nonparametrik dibandingkan dengan statistik parametrik ialah :

Universitas Sumatera Utara

2. Bila data telah diukur menggunakan skala nominal atau ordinal.

2.2 Regresi Kernel

Universitas Sumatera Utara

Untuk mengestimasi m sebagai rata-rata tertimbang secara lokal, menggunakan kernel

2.3 Fungsi Kernel

Universitas Sumatera Utara

c. K(-t) = K(t) untuk semua t (sifat simetri)

Universitas Sumatera Utara

Universitas Sumatera Utara

Universitas Sumatera Utara

2.4 Pemilihan Bandwidth

Universitas Sumatera Utara

Gambar 8. Contoh kurva bandwith

Universitas Sumatera Utara

Gambar 9. Posisi perangkat solver

Universitas Sumatera Utara

Anda mungkin juga menyukai