Anda di halaman 1dari 9

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

ARTIKEL DI PERS

Neurocomputing 70 (2007) 2861–2869


www.elsevier.com/locate/neucom

Metodologi untuk prediksi jangka panjang deret waktu


Antti Sorjamaa, Jin Hao, Nima Reyhani, Yongnan Ji, Amaury Lendasse-
Universitas Teknologi Helsinki, Pusat Penelitian Informatika Adaptif, PO Box 5400, 02015 Espoo, Finlandia

Tersedia online 21 Mei 2007

Abstrak

Dalam makalah ini, metodologi global untuk prediksi jangka panjang deret waktu diusulkan. Metodologi ini menggabungkan strategi prediksi
langsung dan kriteria pemilihan input yang canggih:k-metode pendekatan tetangga terdekat (k-NN), informasi timbal balik (MI) dan estimasi
kebisingan nonparametrik (NNE). Sebuah strategi seleksi input global yang menggabungkan seleksi maju, eliminasi mundur (atau pemangkasan)
dan seleksi maju-mundur diperkenalkan. Metodologi ini digunakan untuk mengoptimalkan tiga kriteria pemilihan input (k-NN, MI dan NNE).
Metodologi ini berhasil diterapkan pada tolok ukur kehidupan nyata: set data Beban Listrik Polandia. r2007 Elsevier BV Semua hak dilindungi
undang-undang.

Kata kunci:Prediksi deret waktu; Pilihan masukan;k-Tetangga terdekat; Informasi bersama; Estimasi kebisingan nonparametrik; Prediksi rekursif; Prediksi
langsung; Kotak terkecil mendukung mesin vektor

1. Perkenalan ketidakpastian yang timbul dari berbagai sumber, misalnya,


akumulasi kesalahan dan kurangnya informasi[21]. Dalam
Peramalan deret waktu merupakan tantangan di banyak bidang. Di tulisan ini, dua varian strategi prediksi, yaitu prediksi langsung
bidang keuangan, para ahli memperkirakan kursus bursa atau indeks dan rekursif dipelajari dan dibandingkan. Makalah ini
pasar saham; spesialis pemrosesan data memperkirakan aliran menggambarkan bahwa strategi prediksi langsung
informasi di jaringan mereka; produsen listrik memperkirakan beban memberikan hasil yang lebih baik daripada strategi rekursif.
hari berikutnya. Poin umum dari masalah mereka adalah sebagai Dalam makalah ini, metodologi global untuk melakukan
berikut: bagaimana seseorang dapat menganalisis dan menggunakan prediksi langsung disajikan. Ini mencakup strategi pemilihan
masa lalu untuk memprediksi masa depan? input dan kriteria pemilihan input. Sebuah strategi seleksi
Banyak teknik yang ada untuk perkiraan proses yang input global yang menggabungkan seleksi maju, eliminasi
mendasari deret waktu: metode linier seperti ARX, ARMA, dll. mundur dan seleksi maju-mundur diperkenalkan. Ditunjukkan
[11], dan yang nonlinier seperti jaringan saraf tiruan[21]. bahwa strategi pemilihan ini merupakan alternatif yang baik
Secara umum, metode ini mencoba membangun model untuk pencarian lengkap, yang mengalami beban komputasi
proses. Model tersebut kemudian digunakan pada nilai yang terlalu besar.
terakhir dari deret tersebut untuk memprediksi nilai masa Tiga kriteria pemilihan input yang berbeda disajikan
depan. Kesulitan umum untuk semua metode adalah untuk perbandingan set input:k-kriteria pemilihan input
penentuan informasi yang cukup dan diperlukan untuk berdasarkan tetangga terdekat (k-NN), informasi timbal
prediksi yang akurat. balik (MI) dan estimasi kebisingan nonparametrik (NNE).
Tantangan baru di bidang prediksi deret waktu adalah prediksi Set input yang optimal adalah yang mengoptimalkan salah
jangka panjang: beberapa langkah ke depan harus diprediksi. satu dari tiga kriteria; misalnya, set input yang optimal
Prediksi jangka panjang harus menghadapi pertumbuhan dapat didefinisikan sebagai yang memaksimalkan MI
antara input dan output.
Makalah ini menunjukkan bahwa semua kriteria yang disajikan (
- Penulis yang sesuai.
k-NN, MI dan NNE) memberikan pilihan input yang baik. Juga
Alamat email:antti.sorjamaa@hut.fi (A.Sorjamaa),
jhao@cis.hut.fi (J. Hao),nreyhani@cis.hut.fi (N. Reyhani),
ditunjukkan secara eksperimental bahwa metodologi global yang
yji@cis.hut.fi (Y.Ji),pinjaman@cis.hut.fi,amaury.lendasse@hut.fi diperkenalkan memberikan prediksi yang akurat dengan ketiga
(A. Lendasse). kriteria yang disajikan.

0925-2312/$ - lihat masalah depanr2007 Elsevier BV Semua hak dilindungi undang-


undang. doi:10.1016/j.neucom.2006.06.015
ARTIKEL DI PERS
2862 A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869

Dalam makalah ini, mesin vektor pendukung kuadrat terkecil Tapi ketikaHmelebihiM,semua input adalah nilai
(LS-SVM) digunakan sebagai model nonlinier untuk menghindari prediksi. Penggunaan nilai prediksi sebagai input
masalah minima lokal.[19]. memperburuk akurasi prediksi.
Bagian 2 menyajikan strategi prediksi untuk prediksi
jangka panjang dari deret waktu. Dalam Bagian 3 2.2. Strategi prediksi langsung
metodologi global diperkenalkan. Bagian 3.1 menyajikan
strategi pemilihan input dan Bagian 3.2 kriteria pemilihan Strategi lain untuk prediksi jangka panjang adalah strategi
input. Akhirnya, model prediksi LS-SVM diringkas secara langsung. UntukH-prediksi langkah ke depan, modelnya
singkat di Bagian 4 dan hasil eksperimen ditampilkan di adalah
Bagian 5 menggunakan tolok ukur kehidupan nyata:
kumpulan data beban listrik Polandia. ŷtthh¼ fhdkamut;kamut-1; . . . ;kamutMth1THdengan 1phpH. (3)
Strategi ini memperkirakanHmodel langsung antara
2. Prediksi deret waktu regressor (yang tidak mengandung nilai prediksi) danH
keluaran. Kesalahan dalam nilai prediksi tidak
Masalah prediksi deret waktu adalah prediksi nilai masa diakumulasikan dalam prediksi berikutnya. Ketika semua
depan berdasarkan nilai sebelumnya dan nilai deret waktu nilai, daritth1untuktthH, perlu diprediksi,Hmodel yang
saat ini (lihat Persamaan (1)). Nilai sebelumnya dan nilai berbeda harus dibangun. Strategi langsung meningkatkan
saat ini dari deret waktu digunakan sebagai input untuk kompleksitas prediksi, tetapi hasil yang lebih akurat dapat
model prediksi. Prediksi satu langkah ke depan diperlukan dicapai seperti yang diilustrasikan dalam Bagian 5.
secara umum dan disebut sebagai prediksi jangka pendek.
Tetapi ketika prediksi multi-langkah ke depan diperlukan, 3. Metodologi
itu disebut masalah prediksi jangka panjang.
Berbeda dengan prediksi time series jangka pendek, Dalam percobaan, strategi prediksi langsung digunakan. Hmodel
prediksi jangka panjang biasanya dihadapkan pada harus dibangun seperti yang ditunjukkan pada Persamaan. (3). Untuk
ketidakpastian yang berkembang yang timbul dari setiap model, tiga kriteria pemilihan input yang berbeda disajikan:
berbagai sumber. Misalnya, akumulasi kesalahan dan
kurangnya informasi membuat prediksi lebih sulit. Dalam
- meminimalkank-NN estimasi kesalahan generalisasi tanpa-
prediksi jangka panjang, melakukan prediksi beberapa
satu-keluar,
langkah ke depan, ada beberapa alternatif untuk
- memaksimalkan MI antara input dan output,
membangun model. Pada bagian berikut, dua varian
strategi prediksi diperkenalkan dan dibandingkan: strategi
- meminimalkan NNE.
prediksi langsung dan rekursif.

Untuk mengoptimalkan salah satu kriteria, strategi


2.1. Strategi prediksi rekursif
pemilihan input global yang menggabungkan pemilihan
maju, eliminasi mundur dan pemilihan maju-mundur
Untuk memprediksi beberapa langkah ke depan nilai-nilai deret waktu,
disajikan pada Bagian 3.1.
strategi rekursif tampaknya menjadi metode yang paling intuitif dan
Estimasi MI dan NNE menuntut pilihan
sederhana. Ini menggunakan nilai prediksi sebagai data yang diketahui
hyperparameters. Definisi dan arti penting dari
untuk memprediksi yang berikutnya. Secara lebih rinci, model dapat
hyperparameter dijelaskan lebih dalam di Bagian 3.2.2
dibangun dengan terlebih dahulu membuat prediksi satu langkah ke depan:
dan 3.2.3. Dalam makalah ini, yang paling memadai
ŷtth1¼ f1dkamut;kamut-1; . . . ;kamutMth1TH, (1) nilai hyperparameter dipilih dengan meminimalkan
Kesalahan LOO disediakan olehk-NN pendekatan disajikan dalam
di manaMmenunjukkan input angka. Regresor model didefinisikan
Bagian 3.2.
sebagai vektor input: kamut;kamut-1; . . . ;kamutMth1. Dimungkinkan
Untuk menghindari minima lokal dalam fase pelatihan
juga untuk menggunakan variabel eksogen sebagai input dalam
model nonlinier (fkdalam Persamaan. (3)), LS-SVM
regressor, tetapi variabel tersebut tidak dipertimbangkan di sini
digunakan. LS-SVM disajikan di Bagian 4.
untuk menyederhanakan notasi. Namun demikian, metodologi
global yang disajikan juga dapat digunakan dengan variabel
eksogen. 3.1. Strategi pemilihan masukan
Untuk memprediksi nilai berikutnya, model yang sama digunakan:
Pemilihan input adalah tahap pra-pemrosesan yang
ŷtth2¼ f1ðŷtth1;kamut;kamut-1; . . . ;kamutMth2TH. (2)
penting untuk menjamin akurasi, efisiensi, dan skalabilitas
Dalam Persamaan. (2), nilai prediksitth1digunakan sebagai yang tinggi[7]dalam masalah seperti pembelajaran mesin,
pengganti nilai sebenarnya, yang tidak diketahui. Kemudian, untuk terutama ketika jumlah pengamatan relatif kecil
H-prediksi selangkah lebih maju,tth2untuktthHdiprediksi secara dibandingkan dengan jumlah input. Ini telah menjadi
iteratif. Jadi, ketika panjang regresiMlebih besar dariH,Ada M -H subjek di banyak domain aplikasi seperti pengenalan pola
data nyata dalam regressor untuk memprediksiHlangkah ke. [14], proses identifikasi[15], pemodelan deret waktu[20]dan
ARTIKEL DI PERS
A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869 2863

ekonometrika[13]. Masalah yang terjadi akibat pemilihan variabel Sebaliknya, metode filter jauh lebih cepat karena
input yang kurang baik adalah: prosedurnya lebih sederhana. Dalam makalah ini, karena
waktu komputasi yang lama dari metode wrapper, tidak
realistis untuk membandingkan metode wrapper dan filter
- Jika dimensi input terlalu besar, masalah 'kutukan untuk masalah pemilihan input yang dipelajari.
dimensi'[20]mungkin terjadi. Selain itu, kompleksitas Pada bagian berikut, diskusi difokuskan pada metode
komputasi dan kebutuhan memori dari model filter. Metode filter memilih satu set input dengan
pembelajaran meningkat. Masukan tambahan yang mengoptimalkan kriteria di atas kombinasi input yang
tidak terkait menyebabkan model yang buruk berbeda. Kriteria menghitung ketergantungan antara
(kurangnya generalisasi). setiap kombinasi input dan output menggunakan
- Memahami model yang kompleks (terlalu banyak input) lebih prediktabilitas, korelasi, informasi timbal balik atau
sulit daripada model sederhana (lebih sedikit input), yang dapat statistik lainnya. Berbagai alternatif kriteria ini ada.
memberikan kinerja bagus yang sebanding. Makalah ini menggunakan tiga metode berdasarkan
kriteria yang berbeda:k-NN, MI dan NN. Berikut ini, MI
diambil sebagai contoh untuk menjelaskan strategi
Biasanya, metode pemilihan input dapat dibagi menjadi dua
pemilihan input global. Untuk dua kriteria pemilihan input
kelas besar: fifiltermetode danpembungkusmetode, lihat
lainnya, prosedurnya serupa.
Gambar 1.
Dalam hal metode filter, subset input terbaik dipilih
sebuah prioritashanya berdasarkan kumpulan data. Subset 3.1.1. Pencarian lengkap
input dipilih oleh kriteria evaluasi, yang mengukur Algoritma optimal adalah menghitung MI antara
hubungan setiap subset variabel input dengan output. semua kemungkinan kombinasi input dan output,
Dalam literatur, banyak metode pengukuran filter dengan misalnya 2M-1 kombinasi input diuji (Madalah jumlah
sifat yang berbeda[2]ada: metrik jarak, ukuran variabel input). Kemudian, yang memberikan MI
ketergantungan, skor berdasarkan teori informasi, . . . , dll. maksimum dipilih. Dalam kasus prediksi jangka panjang
Dalam kasus metode pembungkus, subset input terbaik dari deret waktu, Mbiasanya lebih besar dari 15,
dipilih sesuai dengan kriteria, yang secara langsung sehingga prosedur pencarian yang lengkap menjadi
ditentukan dari algoritma pembelajaran. Metode wrapper terlalu memakan waktu. Oleh karena itu, digunakan
mencari subset input yang baik dengan menggunakan strategi seleksi input global yang menggabungkan
model pembelajaran itu sendiri sebagai bagian dari fungsi seleksi maju, eliminasi mundur, dan seleksi maju-
evaluasi. Fungsi evaluasi ini juga digunakan untuk mundur. Seleksi maju, eliminasi mundur, dan seleksi
menginduksi model pembelajaran akhir. maju-mundur dirangkum dalam bagian berikut.
Membandingkan dua jenis strategi pemilihan input ini,
metode pembungkus memecahkan masalah sebenarnya. 3.1.2. Pilihan maju
Tetapi ini berpotensi sangat memakan waktu, karena Dalam metode ini, mulai dari himpunan kosongSdari variabel
algoritme pamungkas harus dimasukkan dalam fungsi biaya. input yang dipilih, input terbaik yang tersedia ditambahkan ke set
Oleh karena itu, ribuan evaluasi dilakukan saat mencari subset Ssatu per satu, sampai sebesarSadalahM.Misalkan kita memiliki
terbaik. Misalnya, jika 15 variabel input dipertimbangkan dan satu set inputXsaya;saya¼ 1; 2; . . . ;Mdan keluaranY,algoritma
jika strategi seleksi ke depan (diperkenalkan pada Bagian 3.1.2) diringkas dalamGambar 2..
digunakan, maka 15d15th1=2¼ 120 himpunan bagian yang Dalam pemilihan maju, hanyaMdMth1=2 set input yang
berbeda harus diuji. Dalam praktiknya, lebih dari 15 input berbeda dievaluasi. Ini jauh lebih sedikit daripada jumlah
realistis untuk masalah prediksi deret waktu dan waktu set input yang dievaluasi dengan pencarian lengkap. Di sisi
komputasi dengan demikian meningkat secara dramatis. lain, optimalitas tidak dijamin. Set yang dipilih mungkin
bukan yang optimal global.

Gambar 1. Dua pendekatan pemilihan subset variabel input. (a) Metode


filter, (b) metode pembungkus. Gambar 2. Strategi pemilihan ke depan.
ARTIKEL DI PERS
2864 A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869

3.1.3. Penghapusan mundur atau pemangkasan pilihan. Dari kumpulan input kandidat dari keempat
Eliminasi mundur, juga disebut pemangkasan[12]prosedur, metode pemilihan, salah satu yang mengoptimalkan
adalah kebalikan dari proses seleksi maju. Dalam strategi ini, kriteria yang dipilih (k-NN, MI atau NNE) dipilih.
input yang dipilih ditetapkanSdiinisialisasi untuk memuat Strategi gabungan ini tidak menjamin pemilihan set
semua variabel input. Kemudian, variabel input yang input terbaik yang akan diperoleh dengan strategi
eliminasinya memaksimalkan MI dihapus dari himpunanSsatu pencarian lengkap. Namun demikian, pemilihan input
per satu, sampai sebesarSadalah 1. ditingkatkan dan jumlah subset yang diuji jauh berkurang
Pada dasarnya, eliminasi mundur adalah prosedur yang sama dibandingkan dengan strategi pencarian lengkap.
dengan pemilihan maju yang disajikan pada bagian sebelumnya,
tetapi dibalik. Ini mengevaluasi jumlah set input yang sama
3.2. Kriteria pemilihan masukan
dengan pemilihan maju,MdMth1=2. Juga, pembatasan yang sama
ada, optimalitas tidak dijamin.
3.2.1. k-Tetangga terdekat
Ituk-Metode aproksimasi NN adalah metode yang
3.1.4. Pilihan maju-mundur sangat sederhana dan kuat. Ini telah digunakan dalam
Baik metode seleksi maju dan eliminasi mundur mengalami banyak aplikasi yang berbeda, terutama untuk tugas
pencarian yang tidak lengkap. Algoritma seleksi maju-mundur klasifikasi[3]. Ide utama di balikk-NN adalah bahwa
menggabungkan kedua metode. Ini menawarkan fleksibilitas untuk sampel dengan input yang sama memiliki nilai output
mempertimbangkan kembali variabel input yang sebelumnya dibuang yang serupa. Tetangga terdekat dipilih, menurut jarak
dandan sebaliknya,untuk membuang variabel input yang dipilih Euclidean, dan nilai output yang sesuai digunakan untuk
sebelumnya. Itu bisa dimulai dari set input awal apa pun, termasuk set mendapatkan perkiraan output yang diinginkan. Dalam
input kosong, penuh atau diinisialisasi secara acak. tulisan ini, estimasi output dihitung hanya dengan rata-
Mari kita misalkan satu set inputXsaya,saya¼ 1; 2; . . . ;M rata output dari tetangga terdekat:
dan keluaranY,prosedur Seleksi maju-mundur Pk
dirangkum dalamGambar 3. j¼1kamujd
ŷsaya¼ sayaTH, (4)
Perlu dicatat bahwa hasil seleksi tergantung pada inisialisasi k
set input. Dalam tulisan ini, dua opsi dipertimbangkan. Salah dimanasayamewakili perkiraan (perkiraan) dari output,kamuj
satunya adalah memulai dari set kosong dan yang lainnya dsayaTHadalah keluaran darijtetangga terdekat sampelxsaya
memulai dari set lengkap. dankmenunjukkan jumlah tetangga yang digunakan.
Jumlah set input yang akan dievaluasi bervariasi dan Jarak antar sampel dipengaruhi oleh pemilihan input.
tergantung pada inisialisasi set input, kriteria Kemudian, tetangga terdekat dan perkiraan output
penghentian dan sifat masalah. Namun, tidak dijamin bergantung pada pemilihan input.
bahwa dalam semua kasus, metode pemilihan ini
menemukan set input optimal global. Ituk-NN adalah metode nonparametrik dan hanyak,
jumlah tetangga, harus ditentukan. pemilihan darikdapat
3.1.5. Strategi seleksi global dilakukan dengan banyak teknik pemilihan struktur model
Untuk memilih set input terbaik, kami mengusulkan untuk yang berbeda, misalnyak-lipat validasi silang
menggunakan keempat metode pemilihan: seleksi maju, [9], tinggalkan-satu-keluar[9], Bootstrap[5]dan Bootstrap 632[6].
eliminasi mundur, seleksi maju-mundur yang diinisialisasi Metode ini memperkirakan kesalahan generalisasi yang diperoleh
dengan set input kosong dan seleksi maju-mundur yang untuk setiap nilaik.yang dipilihkadalah salah satu yang meminimalkan
diinisialisasi dengan set input lengkap. Keempat metode kesalahan generalisasi.
seleksi cepat dilakukan, tetapi tidak selalu konvergen ke set Di[16]semua metode, leave-one-out dan Bootstraps,
input yang sama, karena minima lokal. Oleh karena itu, perlu pilih set input yang sama. Selain itu, jumlah tetangga
untuk menggunakan semuanya agar lebih optimal lebih efisien dipilih oleh Bootstraps
[16]. Juga telah ditunjukkan bahwak-NN sendiri adalah perkiraan
yang baik untuk deret waktu[16]. Namun dalam makalah ini,k-NN
tidak digunakan sebagai aproksimator, tetapi sebagai alat untuk
memilih set input.

3.2.2. Informasi bersama


MI dapat digunakan untuk mengevaluasi ketergantungan
antara variabel acak. MI antara dua variabel, katakanlah,Xdan
kamumenjadi jumlah informasi yang diperoleh dariXdi
hadapankamudandan sebaliknya.Dalam masalah prediksi
deret waktu, jikakamuadalah keluaran danXadalah bagian dari
variabel input, MI antaraXdankamuadalah salah satu kriteria
Gambar 3. Strategi seleksi maju-mundur. untuk mengukur ketergantungan antara input
ARTIKEL DI PERS
A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869 2865

(regresor) dan keluaran. Jadi, subset inputX,yang memberikan DiberikanNpasangan input-output:dxsaya;kamusaya2RM R,itu
MI maksimum, dipilih untuk memprediksi outputY. hubungan antaraxsayadankamusayadapat dinyatakan sebagai
Definisi MI berasal dari entropi dalam teori informasi.
Untuk variabel acak kontinu (skalar atau vektor), kamusaya¼ fdxsayaÞþ rsaya, (10)
misalkanmX;Y;mXdanmkamumewakili fungsi kepadatan di manafadalah fungsi yang tidak diketahui danradalah kebisingan. GT
probabilitas bersama dan dua fungsi kepadatan memperkirakan varians kebisinganr.
marginal dari variabel. entropi dariXdidefinisikan oleh GT berguna untuk mengevaluasi korelasi nonlinier
Shannon[1]sebagai
antara dua variabel acak, yaitu pasangan input dan output.
Z1
GT telah diperkenalkan untuk pemilihan model tetapi
HdX- mXdxTHcatatanmXdxTHdx,
(5) juga untuk pemilihan input: kumpulan input yang meminimalkan
-1
GT adalah salah satu yang dipilih. Memang, menurut GT,
di mana log adalah logaritma natural dan kemudian, informasi
set input yang dipilih adalah yang mewakili hubungan
tersebut diukur dalam satuan natural.
antara input dan output dengan cara yang paling
Ketidakpastian yang tersisa dariXdiukur dengan
deterministik.
entropi bersyarat sebagai
Z1 GT didasarkan pada hipotesis yang berasal dari
kontinuitas fungsi regresi. Jika dua titikxdanx0dekat di
HdXjkamu- mkamudkamuTH

Z-1 ruang input, kontinuitas fungsi regresi menyiratkan


1 outputfdxTHdanfdx0THakan cukup dekat di ruang
mXdxjkamu¼ kamuTHcatatanmXdxjkamu¼ kamuTHdxdy.d6TH
output. Atau, jika nilai output yang sesuai tidak dekat di
-1
ruang output, ini karena pengaruh noise.
Entropi sendi didefinisikan sebagai
Z1
Dua versi untuk mengevaluasi GT disarankan. Yang pertama
HdX; kamu- mX;Ydx; kamuTHcatatanmX;Ydx; kamuTHdxdy. (7)
-1
mengevaluasi nilaig; sdalam meningkatkan set ukuran data.
Kemudian hasil untuk pasangan parameter tertentu diperoleh
MI antar variabelXdankamudidefinisikan sebagai[4]
dengan merata-ratakan hasil dari semua ukuran yang
MIdX; kamuÞ ¼ HdkamuTH-HdkamujXTH ditetapkan. Versi baru atau yang disempurnakan menetapkan
¼ HdXÞþ HdkamuTH- HdX; kamuTH. d8TH estimasi berdasarkank-Perbedaan NN bukannya meningkatkan
jumlah titik data secara bertahap. Untuk membedakank
Dari Persamaan. (5) hingga (8), MI dihitung sebagai
digunakan dalam konteks NNE dari konvensionalkdik-NN,
Z1
mX;Y m dx; kamuTH jumlah tetangga terdekat dilambangkan denganp.
(9)
X;Y
MIdX; kamuÞ ¼ dx; kamuTHcatatan
X
dxdy. Mari kita tunjukkanptetangga terdekat dari titikxsayadi set
-1 mdxTHmkamudkamuTH

fx1; . . . ;xNgolehxpdsayaTH. Kemudian variabel berikut,


Untuk menghitung MI, hanya estimasi fungsi kepadatan gNdansNdidefinisikan sebagai
probabilitasmX;Y;mXdanmkamudiperlukan.
Dalam makalah ini, MIdX; kamuTHdiperkirakan dengank- 1X N
2,
Pendekatan NN disajikan dalam[10]. Untuk membedakan gNdpÞ ¼ jkamupdsayaTH-kamusayaj d11TH
2N
jumlah tetangga yang digunakan di MI dan yang digunakan saya¼1

dik-NN, jumlah tetangga dilambangkan denganakuuntuk 1X N


2,
sNdpÞ ¼ jxpdsayaTH-xsayaj d12TH
estimasi MI. 2N saya¼1
Kebaruan inil-Penaksir MI berbasis NN terdiri dari
kemampuannya untuk memperkirakan MI antara dua variabel dari di manaj:jmenunjukkan metrik Euclidean dankamupdsayaTH
ruang dimensi apa pun. Kemudian, estimasi MI tergantung pada adalah keluaran darixpdsayaTH. Untuk dipilih dengan benarp[
nilai yang telah ditentukanl. 8], suku konstan model regresi linier antara pasangan dgNd
Di[10], disarankan untuk menggunakan nilai kisaran menengahaku¼ pTH;sNdpÞÞ menentukan estimasi varians kebisingan.
6. Tetapi telah ditunjukkan bahwa ketika diterapkan pada masalah Untuk bukti konvergensi GT, lihat[8].
prediksi deret waktu,akuperlu disetel untuk kumpulan data yang GT mengasumsikan keberadaan turunan pertama dan
berbeda dan dimensi data yang berbeda untuk mendapatkan kinerja kedua dari fungsi regresi. Mari kita tunjukkan
yang lebih baik. Seperti yang dijelaskan di Bagian 3, untuk memilih
-- M - - M
input berdasarkanl-Penaksir NN MI, optimalakudipilih menggunakank- qf q2f
NN dan tinggalkan-satu-keluar.
rfdxÞ ¼ ; HFdxÞ ¼ , (13)
qxdsayaTH qxdsayaTHqxdjTH
saya¼1 aku j¼1

3.2.3. Penaksir kebisingan nonparametrik menggunakan uji di manaxsayadanxjadalahsayath danjkomponen darix,


gamma Uji Gamma (GT) adalah teknik untuk memperkirakan masing-masing.Madalah jumlah variabel. GT
varians dari noise, atau mean square error (MSE), yang dapat membutuhkan keduanyajHFdxjdanjrfdxjdibatasi.
dicapai tanpa overfitting.[8]. Evaluasi NNE dilakukan dengan Kedua kondisi ini bersifat umum dan biasanya dipenuhi
menggunakan estimasi GT yang diperkenalkan oleh dalam masalah-masalah praktis. GT tidak memerlukan
Stefansson in[17]. asumsi lain pada properti kelancaran regresi
ARTIKEL DI PERS
2866 A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869

fungsi. Akibatnya, metode ini mampu menangani fungsi 1.4


regresi dari berbagai tingkat kekasaran.
Asumsi kedua adalah tentang distribusi kebisingan: 1.2

EFfrg0 dan EFfr2gvarfgHai1, d14TH


1
EFfr3gHai1 dan EFfr4gHai1, d15TH

0.8
di manaEffrgadalah fungsi kepadatan kebisingan.
Selanjutnya, diperlukan variabel noise yang independen
dan terdistribusi secara identik. Dalam kasus derau 0 200 400 600 800 1000
heterogen, GT memberikan rata-rata varian derau yang
diekstraksi dari keseluruhan dataset.
Gambar 4. Kumpulan pembelajaran dari kumpulan data Beban Listrik Polandia.
Seperti dibahas di atas (lihat Persamaan (11)), GT tergantung pada
jumlahpdigunakan untuk mengevaluasi regresi. Disarankan untuk
menggunakan nilai mid-rangep¼ 10[8]. Namun, ketika diterapkan pada
masalah prediksi deret waktu,pperlu disetel untuk setiap set data dan 5.2. Hasil
untuk setiap set variabel untuk mendapatkan kinerja yang lebih baik.
Seperti yang dijelaskan di Bagian 3, untuk memilih input yang optimalp Ukuran regressor maksimum diatur ke 15 sesuai dengan
dipilih menggunakank-NN dan tinggalkan-satu-keluar. [16]. Regresor dua minggu cukup besar untuk menangkap
dinamika utama rangkaian waktu beban listrik. Input yang
dipilih berdasarkan ketiga metode ditunjukkan pada Tabel 1.
4. Model nonlinier
Misalnya, input yang dipilih oleh MI untuk prediksi satu
langkah di depan adalaht, t -6 dant -7. Maka model prediksinya
Dalam makalah ini, LS-SVM digunakan sebagai model nonlinier[19],
adalah
yang didefinisikan dalam ruang bobot primalnya dengan[22,18]

ŷ ¼ HaiTjdxÞþ b, (16) kamudtth1Þ ¼ f1dkamudtTH;kamudt -6TH;kamudt -7. (20)


di manajdxTHadalah fungsi, yang memetakan ruang input ke DariTabel 1, juga dapat dilihat bahwa jarak waktu antara waktu
dalam ruang fitur berdimensi lebih tinggi,xadalah vektor input. target dan beberapa input yang dipilih adalah konstan di seluruh
Haidanbadalah parameter model. Masalah optimasi dapat cakrawala prediksi. Misalnya masukant -6 digunakan untuk
dirumuskan sebagai memprediksitth1, masukant -5 digunakan untuk memprediksitth2,
1XN masukant -4 digunakan untuk memprediksitth3, dll. Ini
1
minJdHai;eÞ ¼ Hai Hai thg
T esaya
2, (17) faktanya adalah karena dinamika mingguan deret waktu.
2 2
Jumlah input yang dipilih olehk-NN bervariasi dari 2
Hai;menjadi
saya¼1

hingga 9 dan rata-rata adalah 7 (dari maksimum 15 input).


tunduk padakamusaya¼ xTjdxsayaÞþ bthesaya; saya¼ 1; . . . ;N, (18) Ini menunjukkan bahwa modelnya jarang dan kutukan
dan solusinya adalah dimensi berkurang.
Ketersebaran juga memungkinkan interpretasi fisik dari
XN input yang dipilih. Misalnya, untuk prediksi satu langkah ke
hdxÞ ¼ sebuahsayaKdx; xsayaÞþ b. (19)
depan, input yang dipilih olehk-NN adalaht, t -5,t -6, t -7 dan
saya¼1

t -13. Artinya, untuk memprediksi beban hari berikutnya,


Dalam persamaan di atas,sayamengacu pada indeks sampel misalkan Selasa, kita perlu menggunakan beban Senin (hari
dan Kdx; xsayaTHadalah fungsi kernel yang didefinisikan ini); Rabu, Selasa, Senin minggu sebelumnya dan Selasa 2
sebagai produk titik antarajdxTHTdanjdxTH.Metode pelatihan minggu sebelumnya. Beban hari ini diperlukan, karena
untuk estimasiHaidanbparameter dapat ditemukan di[22]. merupakan pengukuran yang paling mutakhir. Senin,
Selasa dan Rabu minggu sebelumnya diperlukan untuk
5. Eksperimen memperkirakan tren beban listrik selama hari Selasa.
Selasa 2 minggu sebelumnya diperlukan untuk menangani
5.1. Himpunan data perubahan spesifik hari dalam beban listrik.

Satu seri waktu digunakan sebagai contoh. Kumpulan LS-SVM digunakan untuk membandingkan kinerja.
data tersebut disebut Beban Listrik Polandia, dan Validasi silang 10 kali lipat[9]prosedur untuk tujuan
mewakili dua periode beban listrik harian Polandia pemilihan struktur model telah diterapkan.
selama sekitar 1500 hari pada 1990-an[23]. Variasi MSE prediksi langsung pada set tes, berdasarkan tiga
musim semi-sinusoidal terlihat jelas dari dataset. metode pemilihan input digambarGambar 5.
1000 nilai pertama digunakan untuk pelatihan, dan data sisanya Semua kriteria pemilihan masukan (k-NN, MI dan GT) memberikan
untuk pengujian. Bagian pembelajaran dari dataset ditunjukkan masukan yang baik dan sangat mirip. Input yang dipilih juga
dalamGambar 4. memberikan prediksi dengan kesalahan serupa. Dari ketiganya
ARTIKEL DI PERS
A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869 2867

Tabel 1
Input yang dipilih untuk set data beban listrik Polandia

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

0 x x x x x x x x x x x x

n n n n n n n n n n n n n n n

-1 x x x x x x

n n n n n n n n

-2 x x x x x

n n n n n n n n

-3 x x x x

n n n n n n n

-4 x x

n n n n n n n n

-5 x x

n n n n n n n n

-6 x x x

n n n n n n n n n

-7 x x

n n n

-8 x x x x

n n n

-9 x x

n n n n

- 10 x x

n n n

- 11 x x x

n n n n n

- 12 x x

n n n

- 13 x x x x x

n n n

- 14 x x x x x x x x

n n n n n n

Angka-angka di baris pertama dan kolom pertama masing-masing mewakili langkah waktu dan indeks regressor. SimbolXadalah untuk input yang dipilih MI, O mewakili hasil pemilihan
NNE,Dadalah untukk-NN hasil yang dipilih.
ARTIKEL DI PERS
2868 A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869

metode,k-NN adalah yang tercepat dan oleh karena itu harus lebih 0,85
disukai.
MSE prediksi langsung dan rekursif pada set tes 0.8
berdasarkank-Kriteria pemilihan input NN ditunjukkan
0,75
pada Gambar 6.
DariGambar 6dapat dilihat, bahwa strategi prediksi langsung 0,7
memberikan kesalahan yang lebih kecil daripada yang rekursif.
Perbedaan kesalahan meningkat seiring dengan meningkatnya 0,65
cakrawala prediksi. Kesalahan strategi langsung adalah linier 2 4 6 8 10 12 14
sehubungan dengan cakrawala prediksi. Ini tidak berlaku untuk
strategi rekursif.
Gambar 7. Hasil prediksik-Metode NN untuk data Beban Listrik
Lima belas prediksi langkah waktu dari metode prediksi Polandia: garis solid untuk nilai sebenarnya dan garis solid dengan
langsung berdasarkank-Metode pemilihan input NN diberikan tanda mewakili hasil prediksi.
dalamGambar 7.
DiGambar 7dapat dilihat bahwa prediksi jangka panjang 6. Kesimpulan
telah menangkap perilaku intrinsik deret waktu.
Hasil kami sesuai dengan intuisi dan model yang digunakan Makalah ini menyajikan metodologi global untuk prediksi
oleh perusahaan listrik kehidupan nyata dalam estimasi jangka panjang dari deret waktu. Ini menggambarkan
konsumsi listrik mereka. bahwa strategi prediksi langsung memberikan hasil yang
Hasil serupa telah diperoleh pada tolok ukur deret waktu lebih baik daripada yang rekursif. Di sisi lain, strategi
lainnya. Strategi prediksi langsung selalu memberikan prediksi prediksi langsung mengalikan beban komputasi dengan
yang akurat. Selanjutnya, metodologi global yang diperkenalkan jumlah langkah prediksi yang dibutuhkan. Untuk mengatasi
dalam makalah ini memberikan model prediksi jangka panjang peningkatan beban komputasi, strategi pemilihan input
yang jarang dan akurat yang dapat dengan mudah ditafsirkan. global yang cepat dan andal telah diperkenalkan.
Telah ditunjukkan bahwak-NN, kriteria MI dan NNE
memberikan pilihan input yang baik. Juga ditunjukkan bahwa
x 10-3
6 strategi pemilihan input global yang menggabungkan
pemilihan maju, eliminasi mundur dan pemilihan maju-
mundur adalah alternatif yang baik untuk pencarian lengkap,
4 yang menderita beban komputasi yang terlalu besar.
Ituk-Kriteria pemilihan NN adalah yang tercepat, karena
pemilihan hyperparameter tidak diperlukan. Ini membuat k-NN
2
kira-kira 10 kali lebih cepat dari MI dan 20 kali lebih cepat dari
NNE.
0 Penggunaan LS-SVM, yang tidak mengalami masalah
0 5 10 15 minima lokal, memungkinkan perbandingan yang andal.
Metodologi ini telah berhasil diterapkan pada tolok ukur
kehidupan nyata. Jarangnya model yang dipilih
Gbr. 5. MSE dari metode yang berbeda pada set uji data Beban Listrik
Polandia: garis putus-putus dengan tanda sesuai dengan input yang dipilih memungkinkan interpretasi fisik langsung.
MI, garis padat untuk input yang dipilih NNE, dan garis padat dengan sesuai
tanda Dalam pekerjaan lebih lanjut, upaya harus dilakukan
dengank-NN input yang dipilih. untuk mengurangi beban komputasi dari kriteria
pemilihan input. Alternatif untuk maju, mundur dan
strategi seleksi maju mundur harus dieksplorasi juga.
0,04
Referensi
0,03
[1] R. Battiti, Menggunakan informasi bersama untuk memilih fitur dalam
pembelajaran jaring saraf terawasi, IEEE Trans. Jaringan Syaraf 50
0,02
(1994) 537–550.
[2] M. Ben-Bassat, Pengenalan pola dan pengurangan dimensi, dalam:
0,01 Handbook of Statistics, vol. II, 1982, hlm. 773–910.
[3] C. Bishop, Neural Networks for Pattern Recognition, Oxford
0 University Press, Oxford, 1995.
0 5 10 15 [4] T. Cover, J. Thomas, Elemen Teori Informasi, Wiley, New York, 1991.

[5] B. Efron, R. Tibshirani, Sebuah Pengantar Bootstrap, Chapman &


Gbr. 6. MSE dari prediksi langsung dan rekursif untuk set uji data Hall, London, 1993.
Beban Listrik Polandia: garis padat mewakili kesalahan prediksi [6] B. Efron, RJ Tibshirani, Perbaikan pada validasi silang: the
langsung dan garis putus-putus untuk kesalahan prediksi rekursif. . 632+ metode bootstrap, J. Am. Statistik. Asosiasi 92 (1997) 548–560.
ARTIKEL DI PERS
A. Sorjamaa dkk. / Neurocomputing 70 (2007) 2861–2869 2869

[7] J. Han, M. Kamber, Data Mining: Konsep dan Teknik, Morgan Jin Haolahir di Cina pada tahun 1980. Beliau
Kaufmann, San Francisco, 2001. memperoleh gelar sarjana dari Universitas Teknologi
[8] AJ Jones, Alat baru dalam pemodelan dan prediksi non-linear, Beijing pada tahun 2003 dan gelar master dari
Comput. Mengelola. Sci. 1 (2004) 109–149. Universitas Teknologi Helsinki pada tahun 2005. Judul
[9] R. Kohavi, Sebuah studi validasi silang dan bootstrap untuk estimasi tesis masternya adalah ''Pemilihan Input
akurasi dan pemilihan model, dalam: Prosiding Konferensi Gabungan Menggunakan Informasi Bersama—Aplikasi untuk
Internasional ke-14 tentang Kecerdasan Buatan, vol. 2, 1995. Prediksi Deret Waktu' '. Dia adalah penulis atau rekan
[10] A. Kraskov, H. Stgbauer, P. Grassberger, Memperkirakan informasi penulis lima makalah ilmiah di jurnal internasional,
bersama, Phys. Wahyu 69 (2004) 066138. buku atau komunikasi ke konferensi dengan komite
[11] L. Ljung, Teori Identifikasi Sistem untuk Pengguna, Prentice-Hall, peninjau. Dia sekarang bekerja di
Englewood Cliffs, NJ, 1987. Departemen Telekomunikasi dan Jaringan Samsung Electronics di
[12] G. Manzini, Pencarian perimeter dalam memori terbatas, Comput. Matematika. Korea.
aplikasi 32 (1996) 37–45.
[13] R. Meiri, J. Zahavi, Menggunakan anil simulasi untuk mengoptimalkan Nima Reyhanilahir di bagian utara Iran (Persia)
masalah pemilihan fitur dalam aplikasi pemasaran, Eur. J.Oper. pada tahun 1979. Ia memperoleh gelar sarjana
Res. 171 (2006) 842–858. dari Universitas Isfahan. Selama studi sarjana,
[14] E. Rasek, Sebuah kontribusi untuk masalah seleksi fitur dengan ia bekerja di Pusat Penelitian Telekomunikasi
fungsi kesamaan dalam pengenalan pola, Pengenalan Pola 3 Iran. Ia menerima gelar master dari Universitas
(1971) 31-36. Teknologi Helsinki, Finlandia. Dia adalah penulis
[15] Q. Shen, R. Jensen, Memilih fitur informatif dengan himpunan fuzzy- atau rekan penulis tujuh makalah ilmiah di
kasar dan penerapannya untuk pemantauan sistem yang kompleks, jurnal internasional, buku atau komunikasi ke
Pengenalan Pola 37 (2004) 1351–1363. konferensi dengan komite peninjau. Sekarang,
[16] A. Sorjamaa, N. Reyhani, A. Lendasse, Input dan pemilihan struktur dia adalah seorang Ph.D. mahasiswa di HUT
untukk-nn pendekatan, dalam: J. Cabestany, A. Prieto, FS Hernandez dan bidang penelitiannya adalah Estimasi Kebisingan.
(Eds.), Catatan Kuliah di Ilmu Komputer, vol. 3512, hlm. 985–991.
Kecerdasan Komputasi dan Sistem Bioinspired: Konferensi Kerja
Yongnan Jilahir pada tahun 1981 di Daqing, di bagian
Internasional ke-8 tentang Jaringan Syaraf Tiruan, IWANN 2005,
utara Cina. Beliau menerima gelar sarjana dari Harbin
Barcelona, Spanyol, Springer, Berlin/Heidelberg, 2005.
Institute of Technology pada tahun 2003, China. Pada
[17] A. Stefansson, N. Koncar, AJ Jones, Catatan tentang uji gamma,
tahun 2005, beliau menerima gelar master dari
Neural Comput. aplikasi 5 (3) (1997) 131–133.
Helsinki University of Technology, Finlandia. Judul
[18] JAK Suykens, JD Brabanter, L. Lukas, J. Vandewalle, kuadrat terkecil
skripsinya adalah ''Least Squares Support Vector
tertimbang mendukung mesin vektor: ketahanan dan pendekatan
Machines for Time Series Prediction''. Dia adalah
jarang, Neurocomputing 48 (2002) 85-105.
penulis atau rekan penulis empat makalah ilmiah di
[19] JAK Suykens, TV Gestel, JD Brabanter, BD Moor, J. Vandewalle, Least
jurnal internasional, buku atau komunikasi untuk
Squares Support Vector Machines, World Scientific, Singapore,
memberikan
2002.
dengan komite peninjau. Dia saat ini adalah Ph.D. mahasiswa di HUT,
[20] M. Verleysen, D. Francois, Kutukan dimensi dalam data mining dan
mengerjakan algoritme pembelajaran mesin untuk data kemometrik.
prediksi deret waktu, dalam: J. Cabestany, A. Prieto, FS Hernandez
(Eds.), Catatan Kuliah di Ilmu Komputer, vol. 3512, hlm. 758–770.
Pembicaraan yang Diundang dalam Kecerdasan Komputasi dan Sistem Amaury Lendasselahir pada tahun 1972 di Belgia.
Bioinspired: Konferensi Kerja Internasional ke-8 tentang Jaringan Syaraf Ia menerima gelar MS di bidang teknik mesin dari
Tiruan, IWANN 2005, Barcelona, Spanyol, Springer, Berlin/Heidelberg, Université catholique de Louvain (Belgia) pada
2005. tahun 1996, MS dalam kendali pada tahun 1997
[21] A. Weigend, N. Gershenfeld, Prediksi Seri Kali: Meramalkan Masa dan Ph.D. pada tahun 2003 dari Universitas yang
Depan dan Memahami Masa Lalu, Addison-Wesley, Reading, MA, sama. Pada tahun 2003, ia menjadi peneliti
1994. postdoctoral di Computational Neurodynamics Lab
[22] Tersedia darihhttp://www.esat.kuleuven.ac.be/sista/lssvmlab/saya. di University of Memphis. Sejak 2004, ia adalah
[23]hhttp://www.cis.hut.fi/projects/tsp/?page=Timeseriessaya. peneliti senior di Pusat Penelitian Informatika
Adaptif di Universitas Helsinki
Antti Sorjamaalahir pada tahun 1980 di sebuah kota Teknologi di Finlandia. Dia memimpin Grup Prediksi Time Series. Dia
kecil di utara Finlandia. Ia menerima gelar master dari adalah penulis atau rekan penulis 64 makalah ilmiah di jurnal
Universitas Teknologi Helsinki pada tahun 2005. Tesis internasional, buku atau komunikasi ke konferensi dengan komite
Masternya berjudul ''Strategi untuk Prediksi Jangka peninjau. Penelitiannya meliputi prediksi deret waktu, kemometrik,
Panjang Deret Waktu Menggunakan Model Lokal''. pemilihan variabel, estimasi varians noise, penentuan nilai yang hilang
Saat ini, ia melanjutkan sebagai Ph.D. mahasiswa di dalam basis data temporal, aproksimasi nonlinier dalam masalah
HUT. Dia adalah penulis atau rekan penulis enam keuangan, jaringan saraf fungsional dan klasifikasi.
makalah ilmiah di jurnal internasional, buku atau
komunikasi ke konferensi dengan komite peninjau.
Topik penelitiannya adalah
masalah nilai yang hilang dalam database temporal.

Anda mungkin juga menyukai