Anda di halaman 1dari 9

back propagation biasanya awalnya dipilih sebagai nilai-nilai yang acak.

Pilihan nilai awal penting karena dapat menyebabkan semakin terperangkap dalam optimums lokal. Baru yang diusulkan algoritma adalah bahwa itu menginisialisasi bobot menggunakan wavelets dan kekelompokan konsep. Jaringan saraf tertentu yang digunakan dalam artikel adalah jaringan WPMLP, yang memanfaatkan wavelets sebagai metode ekstraksi fitur. Masukan adalah garis mengetuk penundaan yang diikuti oleh wavelet dekomposisi dan MLP. Propagasi hirarkis dan counter clustering algoritma yang digunakan untuk jaringan saraf berat inisialisasi. Jumlah kelompok dipilih jumlah neuron di lapisan tersembunyi WP-MLP. Di [Bar07], review disajikan prediksi seri waktu dengan diri - mengatur peta (SOMs). SOM adalah jenis jaringan saraf tanpa pengawasan dan tidak sangat luas digunakan dalam waktu seri prediksi. Ini adalah berbeda dengan MLP dan radial dasar fungsi (RBF) jaringan saraf, yang diawasi arsitektur dan sangat populer di waktu seri prediksi. Ide utama di SOM adalah untuk proyek ruang terus-menerus dimensi tinggi ke ruang diskrit dimensi yang lebih rendah. Penulis catatan keuntungan sebagai berikut SOMs dibandingkan dengan MLP dan RBF:

Arsitektur berkembang sederhana. pendekatan lokal fungsi % u2022. SOMs menghasilkan output dengan operasi matematika pada ruang lokal, yang memungkinkan pemahaman yang lebih baik dari proses yang mendasari.

% u2022 tidak perlu prespecify jumlah prototipe dan, karenanya, jumlah neuron.

4.4.2 Aplikasi Clustering di Time Series peramalan Metode yang menarik kelompok duniawi pola tumpang tindih geser windows time series dijelaskan di [Gev99]. Berbeda dengan NN tradisional dan autoregressive metode, model prediksi dibuat untuk setiap terpisah cluster, di mana cluster terdiri dari satu set pola duniawi. Top-down kabur clustering teknik hirarkis digunakan, di mana pola duniawi ditugaskan untuk kelompok menggunakan tingkat keanggotaan. Model prediksi dibuat untuk setiap cluster

menggunakan set anggota yang memiliki tingkat maksimum keanggotaan cluster. Akhirnya prediksi nilai u2019s % sampel baru dilakukan dengan mencampur prediksi model yang berlaku terakhir sampel menggunakan dengan tingkat keanggotaan untuk kumpulan kabur ada sebagai berat dalam hasil prediksi. Pasal lain yang memanfaatkan clustering sebagai sarana untuk melakukan waktu seri peramalan adalah sfe04. Khusus, sebuah alogaritma clustering hibrida adalah diusulkan dalam pasal yang menciptakan data kelompok, di mana data dalam setiap cluster digambarkan oleh sama hubungan linier. Alogaritma clustering yang memanfaatkan koefisien korelasi waktu seri untuk menemukan yang paling penting tertinggal waktu seri. Kemudian, vektor data yang terbentuk dari versi peforma. Kelompok tersebut adalah initialized menggunakan k-means, di mana jumlah kelompok ditentukan oleh pengguna. Untuk setiap cluster, sebuah model linear rekgresi dikembangkan dan data ditugaskan untuk sekelompok berdasarkan jarak mereka dari sesuai hyperplane. Alogaritma itu kembali prediksi nilai untuk setiap cluster. Sebuah alogaritma, pengenalan pola berdasarkan clustering k-means, digunakan untuk memilih sekelompok dan yang sesuai perkiraan nilai sebagai final output. Hasil percobaan pada tiga berbagai set data dipamerkan pengurangan dalam memprediksi 9 %, kesalahan sendiri

dibandingkan dengan metode lain, termasuk seorang model autoregressive, sebuah arima model, dan jaringan saraf.

4.4.3 karakterisasi dan prediksi kompleks seri waktu peristiwa menggunakan time-delayed embedding Dalam pov03, penulis mengatasi masalah menantang menemukan peristiwa dalam waktu seri, kompleks seperti kacau waktu seri. Dalam artikel, acara yang didefinisikan sebagai suatu kejadian penting dalam waktu seri, di mana penting adalah context-dependent. Metode yang diusulkan mencari sebuah pola optimal dengan mendefinisikan karakteristik fungsi untuk model konsep eventness. Kemudian, pencarian untuk sebesar-besarnya pola dilakukan dengan bantuan dari sebuah alogaritma genetik dalam sebuah direkonstruksi ruang fase menggunakan time-delayed embedding. Sebuah serakah mencari digunakan untuk menemukan sebuah optimal koleksi pola temporal kelompok. Metode ini juga

dapat digunakan untuk peristiwa prediksi. Khusus, dalam artikel, alogaritma yang diusulkan digunakan untuk memprediksi melepaskan logam tetesan dari seorang tukang las. Untuk merekonstruksi ruang fase dari waktu seri sinyal, kita perlu memilih waktu penundaan dan menentukan suatu embedding dimensi. Secara keseluruhan, langkah alogaritma itu dalam pov03 adalah sebagai berikut: 1. Fase pelatihan: Mendefinisikan sebuah acara karakterisasi fungsi dan fungsi objektif dan merumuskan masalah seperti masalah optimasi dibatasi. Contoh fungsi karakterisasi ( ( )) ( ) ( )

yang memungkinkan satu prediksi. Fungsi objektif akan digunakan untuk memesan duniawi pola kelompok sesuai dengan kemampuan mereka untuk statistik membedakan antara peristiwa dan nonevents. Menetapkan waktu penundaan & amp; # 964; dan menentukan suatu embedding dimensi. Penundaan itu mengatur waktu 1 dalam pasal. Dimensi dari embedding ruang, yang juga panjang sementara pola, ditentukan sebagai dime = 2m + 1, di mana m adalah negara asli dimensi ruang. Definisi ini berasal dari Takens % u2019 teorema [Tak80], yang menyatakan bahwa jika dimensi embedding diberikan oleh persamaan di atas, maka tahap kembali ruang perbedaan topologi setara dengan ruang negara asli. Dalam artikel, DimE dipilih menjadi 2. Terungkap waktu seri di direkonstruksi ruang; yang, setiap pasangan poin berurutan 2-d menghasilkan ruang fase titik. Membentuk ditambah ruang fase, dengan menambahkan dimensi tambahan dari karakteristik fungsi. Mencari untuk sebesar-besarnya koleksi pola temporal kelompok. Mengevaluasi pelatihan hasil dan ulangi tahap jika diperlukan.

2. Tahap pengujian:

Menanamkan waktu seri digunakan untuk pengujian ke dalam ruang fase. Mengidentifikasi / memprediksi peristiwa, menggunakan optimal koleksi pola temporal kelompok. Mengevaluasi tahap pengujian hasil.

Alogaritma yang diusulkan adalah dibandingkan melawan time-delay jaringan saraf dan c4.5. Sebagai hasil percobaan menunjukkan, alogaritma yang diusulkan outperformed dua lainnya metode dalam fase pengetesan.

4.5 Bibliografi tambahan Referensi yang populer di rekgresi, analisa data secara umum, dan waktu seri peramalan adalah alb06. Dua buku tentang subjek analisis regresi yang [Gel06] dan [Men03]. Statistik buku dengan informasi yang berguna mengenai topik yang dibahas dalam bab adalah [Fie09] dan [Gla05]. Ada sejumlah besar buku meneliti topik analisis time series dan peramalan secara rinci, seperti [Abr83], [Box94], [Bro02], [Cha96], [Del98], [Mak83], [Shu06], dan [Yaf00]. Sebuah buku yang membahas menarik isu mengembangkan pandangan jauh ke depan di hari ini ekonomi pengetahuan u2019s % adalah [Tsou04]. Tambahan metode untuk time series peramalan menggunakan jaringan saraf dapat ditemukan di [Abb05], [Jan04], dan [Zha02]. [Jun08a], metode hibrida genetik NN adalah disajikan yang menggunakan jaringan saraf untuk waktu seri peramalan, di mana parameter dan struktur NN adalah menantikan menggunakan strategi evolusi dan prosedur serakah adaptif pencarian. Juga, di [Jun08b], metode hibrida yang disebut ANGGUR, digunakan untuk waktu seri peramalan, yang merupakan kombinasi acak pencarian adaptif prosedur dan konsep-konsep evolusi. Metode hibrida jaringan saraf lainnya dibahas di [Wen02] dan [Kon04]. Beberapa dari mereka akan juga dibahas dalam Bab 7, diterapkan untuk keuangan seri peramalan. Mengenai algoritma genetik, dalam [Luq07] algoritma evolusi

digambarkan yang menggunakan pendekatan Michigan, di mana time series peramalan solusi adalah berdasarkan jumlah penduduk bukan individu paling pas. Algoritma memungkinkan evolusi umum perilaku, tetapi jarang situasi juga

diizinkan dan tidak dibuang sebagai kebisingan. Dengan cara ini, algoritma memiliki keuntungan dari mengambil ke rekening waktu setempat seri perilaku. Di [Nun05], sistem kekebalan tubuh buatan (AIS) teknik, yang secara tradisional digunakan dalam anomali deteksi, diperluas dengan waktu seri peramalan. Di [Pop03], waktu seri peramalan dilakukan menggunakan analisis komponen independen, yang merupakan perpanjangan dari analisis komponen utama. Secara khusus, peramalan dilakukan di domain independen komponen dan kemudian berubah kembali ke waktu domain. Di [Pop06], otokorelasi digunakan untuk memahami serangkaian waktu untuk memilih algoritma terbaik untuk preprocess itu, seperti memilih algoritma untuk penghapusan musiman. Di [Cam07], dukungan vektor mesin digunakan untuk waktu seri prediksi, di mana dinamika nonlinier menentukan urutan model, yang merupakan jumlah sampel masa lalu yang diperlukan untuk memprediksi masa depan nilai time series. Di [Han06], time series peramalan metode yang diusulkan yang mengeksploitasi fakta bahwa sebagian besar waktu seri, seperti keuangan, yang dikendalikan oleh hukum makroskopik dan mikroskopis. Yang diusulkan algoritma terurai time series menjadi lebih sederhana yang berbeda kelancaran dan kemudian sampel mereka dalam mode multiscale. Setiap waktu sederhana seri adalah model dan diproses secara terpisah dan hasil terintegrasi pada akhir. Di [Zha08], penulis mengusulkan sebuah metode untuk meramalkan nonlinier dan non-Gaussian time series. Metode menggunakan model jaringan saraf radial dasar fungsi (RBF) dan itu membuat asumsi bahwa pengukuran kebisingan model Markov tersembunyi (HMM). Algoritma peramalan didasarkan pada RBF-HMM model dikombinasikan dengan metode Monte Carlo berurutan. Di [Kim08], sebuah metode yang diusulkan untuk meramalkan jumlah permintaan video on demand menggunakan time series model data permintaan video. Hal ini berguna dalam memilih yang video untuk men-cache didasarkan pada popularitas permintaan mereka. Dalam [Ban08], sebuah metode untuk memprediksi nonstationary atau kacau time series digambarkan. Metode memanfaatkan data preprocessing berdasarkan analisis korelasi dan beberapa prediksi kabur. Untuk meningkatkan keakuratan prediksi, kesalahan prosedur kompensasi digunakan berdasarkan

analisis korelasi. Di [Che08], penulis mengatasi masalah jangka panjang waktu seri peramalan, yang penting bagi banyak daerah seperti iklim prediksi dan pertumbuhan perkotaan perencanaan. Sebagai penulis catatan, karena sejumlah besar data historis yang akan dibutuhkan untuk mengembangkan jangka panjang ramalan, metode alternatif adalah dengan menggunakan metode diawasi di mana pengamatan masa lalu (yang dapat dari data simulasi) digunakan untuk memprediksi masa depan nilai. Gagasan baru dalam artikel mereka adalah bahwa mereka menggunakan cara yang semi-supervised berdasarkan HMM regresi. Karena mungkin ada inkonsistensi antara sejarah dan simulasi data, para penulis juga mengembangkan metode kalibrasi data. Efisiensi metode ditunjukkan pada berbagai data set. Di [Oh03], campuran model lokal linier digunakan untuk melakukan waktu seri prediksi. Sebagai penulis catatan, daya tarik ide terletak dalam bahwa model lokal linier memiliki performa yang lebih baik dan fleksibilitas. Dalam metode ini, hanya negara-negara di dekatnya digunakan untuk melakukan pemetaan nonlinier. Selain itu, kepala Component analisis digunakan untuk memilih parameter sistem prediksi.

Bagian 5 Penemuan pola temporalis

Sementara pola penemuan berkaitan dengan penemuan duniawi pola menarik dalam time series atau urutan waktu, di mana bunga ditentukan oleh domain dan aplikasi. Berikut adalah beberapa contoh duniawi pola menarik:

Pelanggan yang membeli laptop di komputer perusahaan % u2019s situs dalam transaksi, sering membeli printer dari situs yang sama pada transaksi kemudian. Ini adalah contoh dari urutan sering.

Pasien yang berada di obat x untuk lebih dari satu bulan, kadang-kadang mulai menderita sakit kepala parah setelah satu bulan. Ini adalah aturan Asosiasi duniawi, tetapi juga berpotensi kausal aturan.

Situs web jumlah hit memiliki puncak tajam di sekitar tengah hari dan 7% u20138 malam dan lembah dalam antara 1 pagi dan 6 pagi Ini adalah waktu seri pola.

Ada sejumlah besar pekerjaan dalam literatur untuk menemukan pola-pola duniawi minat dalam urutan database dan waktu seri database. Dalam urutan database, masalahnya biasanya diperiksa di bawah tiga kerangka: urutan pertambangan (atau sering berurutan pola penemuan), Asosiasi duniawi aturan penemuan, dan sering episode penemuan. Dua istilah biasanya merujuk ke discovery berurutan pola dalam urutan tunggal data, sementara istilah pertama biasanya merujuk pada penemuan berurutan pola dalam beberapa urutan data yang disimpan dalam database transaksional. Atau, istilah intertransaction pola penemuan dapat digunakan untuk merujuk hasil dari urutan pertambangan, dan istilah intra-transaksi pola penemuan dapat digunakan untuk menggambarkan hasil dari Asosiasi aturan penemuan. Dalam waktu seri, sejumlah besar pekerjaan telah dilakukan di bidangbidang berikut:

Streaming pola penemuan, data karena aplikasi di berbagai bidang seperti data keuangan analisis dan pengawasan keamanan. Motif dan anomali penemuan, karena mereka meningkatkan utilitas dalam berbagai memantau. aplikasi, seperti bioinformatika dan jaringan komputer

Bab ini disusun sebagai berikut: kerangka kerja tiga pola-pola yang sering dalam urutan yang dibahas dalam bagian 5.1 (urutan pertambangan), bagian 5.2 (episode sering penemuan), dan bagian 5.3 (Asosiasi duniawi aturan penemuan). Dalam Bab 5.4 kita membahas pola penemuan dalam waktu seri, di mana tertentu penekanan pada penemuan motif dan anomali. Bagian 5,5 membahas berbagai metode untuk penemuan pola dalam aliran data, sementara bagian 5.6 menyajikan teknik pertambangan duniawi pola dalam multimedia. Akhirnya, tambahan bibliografi dibahas dalam bagian 5,7.

5.1 Mining berurutan 5.1.1 alogaritma apriori dan its ekstensi untuk berurutan pertambangan

Urutan adalah memerintahkan waktu daftar objek, di mana setiap objek terdiri dari itemset, dengan itemset terdiri dari semua item yang muncul (atau membeli) bersama-sama dalam sebuah transaksi (atau sesi). Perhatikan bahwa urutan item dalam itemset tidak masalah. Database urutan terdiri dari tuples, di mana setiap tupel terdiri dari id pelanggan, id transaksi, dan itemset. Tujuan dari urutan pertambangan adalah untuk menemukan sering urutan yang melebihi ambang batas yang ditentukan pengguna dukungan. Perhatikan bahwa dukungan dari urutan persentase tuples dalam database yang berisi urutan. Contoh dari urutan {(ABD), (CDA)}, di mana item ABD menunjukkan item yang dibeli dalam transaksi pertama pelanggan dan CDA menunjukkan item yang dibeli dalam transaksi kemudian pelanggan sama. Contoh database transaksional ditunjukkan dalam tabel 5.1.

Tabel 5.1 menunjukkan urutan transaksi yang berbeda pelanggan selama kunjungan mereka ke situs Web. Sebagai contoh, pelanggan 3 mengunjungi situs Web dua kali, di mana ia membeli item f dalam transaksi pertama dan item CG

dalam transaksi kedua. Mengenai penahanan urutan, urutan (AB) (CG) adalah bagian dari urutan transaksi pelanggan 1, 2, dan 4, tetapi bukan dari pelanggan 3. Contoh lain adalah (A) (CG), yang merupakan subsequence urutan transaksi pelanggan 1, 2, dan 4. Apriori algoritma ini pertama kali diusulkan oleh Armstrong di [Agr93], untuk penemuan sering itemsets. Itu adalah algoritma yang paling banyak digunakan untuk penemuan itemsets sering dan Asosiasi aturan. Konsep utama dari algoritma Apriori adalah sebagai berikut:

Anda mungkin juga menyukai