Proses Stokastik Dan ACF Distance Cluster

2.
2 Proses Stokastik
Proses stokastik didefinisikan sebagai kumpulan variabel acak yang diatur dalam waktu dan
didefinisikan sebagai satu set poin yang mungkin diskrit atau kontinu. Variabel acak pada
waktu t dengan 𝑋(𝑡) jika waktu kontinu atau dengan 𝑋𝑡 jika waktu diskrit. Proses stokastik
kontinu dijelaskan sebagai {𝑋(𝑡), −∞< t < ∞ } sedangkan proses stokastik diskrit
digambarkan sebagai {𝑋𝑡 , t = ..., -2, -1, 0, 1, 2, ...}.
Sebagian besar masalah statistik berkaitan dengan memperkirakan sifat-sifat sebuah populasi
dari sampel. Sifat-sifat sampel biasanya ditentukan oleh peneliti, termasuk ukuran sampel dan
apakah keacakan dimasukkan ke dalam proses seleksi. Dalam analisis deret waktu ada situasi
yang berbeda dalam urutan pengamatan ditentukan oleh waktu. Meskipun dimungkinkan untuk
meningkatkan ukuran sampel dengan memvariasikan panjangnya dari deret waktu yang
diamati, akan ada satu hasil dari proses dan pengamatan tunggal pada variabel acak pada waktu
t. Namun demikian, kita mungkin menganggap deret waktu yang diamati hanya sebagai salah
satu contoh rangkaian waktu tak terbatas seri yang mungkin diamati. Himpunan tak hingga dari
deret waktu disebut ensemble. Setiap anggota ensemble adalah realisasi yang mungkin dari
stokastik proses. Deret waktu yang diamati dapat dianggap sebagai salah satu realisasi yang
mungkin dari proses stokastik dan dilambangkan dengan {𝑥(𝑡), −∞< t < ∞} jika waktu
kontinu atau {𝑥𝑡 , t = 0, 1, 2, …T} jika waktu diskrit. Analisis deret waktu adalah dasarnya
berkaitan dengan mengevaluasi sifat-sifat model probabilitas yang mendasari dari deret waktu
yang diamati ini. Berikut ini, kami akan bekerja dengan deret waktu terutama diskrit yang
merupakan realisasi dari stokastik diskrit proses.
Banyak model untuk proses stokastik dinyatakan dengan aljabar ekspresi yang
menghubungkan variabel acak pada waktu t dengan nilai masa lalu dari proses, bersama-sama
dengan nilai-nilai dari proses error yang tidak dapat diamati. Dari satu model seperti itu
kita mungkin dapat menentukan distribusi bersama dari 𝑋𝑡1 , 𝑋𝑡2 , … , 𝑋𝑡𝑘 untuk himpunan apa
saja pada waktu 𝑡1 , 𝑡2 , … , 𝑡𝑘 dan setiap nilai k. Cara sederhana untuk menggambarkan stokastik
proses adalah untuk memeriksa saat-saat proses, terutama yang pertama dan momen kedua,
yaitu mean dan fungsi autokovarians.
𝜇𝑡 = 𝐸(𝑋𝑡 )
𝛾𝑡1 ,𝑡2 = 𝐸[(𝑋𝑡1 − 𝜇𝑡 )(𝑋𝑡2 − 𝜇𝑡 )]
Varians adalah kasus khusus dari fungsi autokovarians ketika 𝑡1 = 𝑡2 itu adalah,
𝜎𝑡2 = 𝐸[𝑋𝑡 − 𝜇𝑡 )2 ]
Kelas penting dari proses stokastik adalah yang stasioner. Deret waktu dikatakan stasioner jika
distribusi gabungan dari 𝑋𝑡1 , 𝑋𝑡2 , … , 𝑋𝑡𝑘 sama dengan𝑋𝑡1 +𝜏 , 𝑋𝑡2 +𝜏 , … , 𝑋𝑡𝑘 +𝜏 , untuk semua
𝑡1 , 𝑡2 , … , 𝑡𝑘 . Dengan kata lain, menggeser asal waktu dengan jumlah tidak berpengaruh pada
distribusi bersama yang karena itu harus bergantung hanya pada interval antara 𝑡1 , 𝑡2 , … , 𝑡𝑘 .
Definisi ini berlaku untuk setiap nilai k. Khususnya, jika k = 1, stasioneritas kuat menyiratkan
bahwa distribusi 𝑋𝑡 adalah sama untuk semua t, asalkan dua momen pertama berhingga dan
keduanya konstan, yaitu 𝜇𝑡 = 𝜇 dan 𝜎𝑡2 = 𝜎Jika k = 2, distribusi gabungan dari 𝑋𝑡1 dan 𝑋𝑡2
hanya bergantung pada perbedaan waktu 𝑡1 − 𝑡2 = 𝜏 yang disebut lag. Jadi autokovarians
fungsi yang hanya bergantung pada 𝑡1 − 𝑡2 dapat ditulis sebagai
𝛾𝜏 = 𝐶𝑂𝑉 (𝑋𝑡 , 𝑋𝑡+𝜏 ) = 𝐸[(𝑋𝑡 − 𝜇)(𝑋𝑡+𝜏 − 𝜇)]
Dalam praktiknya seringkali berguna untuk mendefinisikan stasioneritas dengan cara yang
tidak terlalu dibatasi dari yang dijelaskan di atas. Suatu proses disebut stasioner orde kedua
atau stasioner lemah jika meannya konstan dan fungsi autokovariansnya hanya bergantung
pada lag. Tidak ada persyaratan yang ditempatkan pada momen yang lebih tinggi dari yang
urutan kedua. Definisi yang lebih lemah ini umumnya akan digunakan sebanyak-banyaknya
sifat-sifat proses stasioner hanya bergantung pada struktur proses seperti yang ditentukan oleh
momen pertama dan kedua. Satu kelas penting proses di mana hal ini benar adalah kelas proses
normal di mana distribusi bersama 𝑋𝑡1 , 𝑋𝑡2 , … , 𝑋𝑡𝑘 adalah multivariat normal untuk
semua 𝑡1 , 𝑡2 , … , 𝑡𝑘 . Distribusi normal multivariat sepenuhnya ditandai dengan momen pertama
dan kedua, dan karenanya aritas stasiun orde kedua menyiratkan stasioneritas kuat untuk proses
normal. Namun 𝜇 dan 𝛾𝜏 mungkin tidak cukup menggambarkan proses stasioner yang jauh dari
normalitas.
Ukuran koefisien autokovarians tergantung pada unit di mana 𝑋𝑡 diukur. Jadi untuk tujuan
interpretatif, akan sangat membantu untuk membakukan fungsi autokovarians untuk
menghasilkan fungsi autokorelasi yang didefinisikan oleh
𝛾𝜏
𝜌𝜏 =
𝛾0
di mana 𝛾0 = 𝜎 2 = 𝐸[𝑋𝑡 − 𝜇 )2 ] adalah varians dari proses. mengukur korelasi antara
𝑋𝑡 dan𝑋𝑡+𝜏 . Fungsi autokovarians dan autokorelasi adalah fungsi genap itu adalah,
𝛾𝜏 = 𝛾−𝜏
dan
𝜌𝜏 = 𝜌−𝜏
Rekan sampel, yaitu deret waktu yang diamati dari autokovarians dan koefisien autokorelasi,
masing-masing adalah
𝑇−𝑘
1
𝛾̂𝜏 = 𝑐𝑘 = ∑(𝑥𝑡 − 𝑥̅ )(𝑥𝑡+𝑘 − 𝑥̅ )
𝑇
𝑘−1
dan
𝑐𝑘
𝜌̂𝜏 = 𝑟𝑘 =
𝑐0
dimana
𝑇−1
1
𝑐0 = ∑ (𝑥𝑡 − 𝑥̅ 2 )
𝑇
𝑡−1
𝑐0 adalah varians dari deret waktu. Telah terbukti bahwa autokovarians penduga 𝑐𝑘 bias, yaitu,
𝐸𝑐𝑘 ≠ 𝛾𝑘
tapi biasnya order 1/T . Namun, itu tidak bias asimtotik, yaitu
lim 𝐸𝑐𝑘 = 𝛾𝑘
𝑇→∞
6.2 Fitur domain waktu - Autokorelasi dan autokorelasi parsial

6.2.1 Metode pengelompokan yang tajam
Galeano dan Peña (2000) memperkenalkan metrik untuk deret waktu berdasarkan perkiraan
ACF. Diberikan deret waktu {𝑥𝑡 , t =1, 2, ...T}, misalkan 𝜌̂𝑥𝑟 = (𝜌̂1 ,…, 𝜌̂𝑅 ) adalah fungsi
autokorelasi yang diestimasi dari deret waktu 𝑥𝑡 hingga lag R sedemikian rupa sehingga 𝜌̂𝑖 ≅
0 untuk i >R. Jarak antara dua deret waktu 𝑥𝑡 dan 𝑦𝑡 dapat ditentukan oleh
𝑑𝐴𝐶𝐹 (𝑥𝑡 , 𝑦𝑡 ) = √(𝜌̂𝑥𝑟 − 𝜌̂𝑦𝑟 )′ Ω (𝜌̂𝑥𝑟 − 𝜌̂𝑦𝑟 ) (6.1)
Keterangan :
Ω : Beberapa matriks bobot
Caiado dkk. (2006) menerapkan tiga cara yang mungkin untuk menghitung jarak dengan
menggunakan Sampel Autocorrelation Function (ACF). Yang pertama menggunakan
pembobotan seragam (ACFU), yaitu, Ω = I di mana I adalah matriks identitas, dan ekuivalen
dengan jarak Euclidean antara autocorrelation coefficient. Yang kedua menggunakan
peluruhan geometrik (ACFG), yaitu Ω = 𝐷, di mana D adalah matriks diagonal dengan bobot
geometris pada diagonal utama. Yang ketiga menggunakan jarak Mahalanobis antara
autocorrelation (ACFM), yaitu Ω = 𝑀−1 , di mana 𝑀−1 adalah matriks kovarians sampel
autocorrelation coefficient yang diberikan oleh rumus truncated bartlett’s (Brockwell dan
Davis, 1991, hlm. 221-222 ).
Sangat mudah untuk menunjukkan bahwa metrik berbasis ACF ini memenuhi standar sifat
jarak. Dalam studi simulasi Monte Carlo. Caiado dkk. (2006) menunjukkan bahwa metrik
berdasarkan autocorrelation coefficient dapat berkinerja cukup baik dalam pengelompokan
deret waktu. Alonso dan Maharaj (2006) pengantar menghasilkan prosedur pengujian hipotesis
untuk perbandingan waktu stasioner deret berdasarkan jarak Euclidean antara autocorrelation.
Ukuran jarak autokorelasi lainnya, berdasarkan Kullback-Leibler informasi (KLD),
didefinisikan oleh
|𝐿 |
𝑑𝐾𝐿𝐷 (𝑥𝑡 , 𝑦𝑡 ) = 𝑡𝑟𝐿𝑥 𝐿−1 𝑥
𝑦 ) − 𝑙𝑜𝑔 |𝐿 | − 𝑇 (6.2)
𝑦
Keterangan:
𝐿𝑥 : Matriks autokorelasi 𝑅 × 𝑅 dari deret waktu 𝑥𝑡 dibuat pada R lag yang berurutan
𝐿𝑦 : Matriks autokorelasi 𝑅 × 𝑅 dari deret waktu 𝑦𝑡 dibuat pada R lag yang berurutan.
Karena 𝑑𝐾𝐿𝐷 (𝑥𝑡 , 𝑦𝑡 ) ≠ 𝑑𝐾𝐿𝐷 (𝑦𝑡 , 𝑥𝑡 ), jarak simetris atau jarak kuasi dapat didefinisikan sebagai
1 1
𝑑𝐾𝐿𝐽 (𝑥𝑡 , 𝑦𝑡 ) = 𝑑𝐾𝐿𝐷 (𝑥𝑡 , 𝑦𝑡 ) + 𝑑𝐾𝐿𝐷 (𝑦𝑡 , 𝑥𝑡 ) (6.3)
2 2
yang juga memenuhi semua sifat biasa metrik kecuali pertidaksamaan segitiga.
Caiado dkk. (2006) juga memperkenalkan ukuran jarak berdasarkan estimasi Partial
Autocorrelation Function (PACF) 𝜙̂𝑥𝑟 = (𝜙̂1 , … , 𝜙̂𝑅 ) dan pada fungsi estimasi invers
autokorelasi (IACF). Metrik PACF antara deret waktu 𝑥𝑡 dan 𝑦𝑡 ditentukan oleh
𝑑𝑃𝐴𝐶𝐹 (𝑥𝑡 , 𝑦𝑡 ) = √(𝜙̂𝑥𝑟 − 𝜙̂𝑦𝑟 )′ Ω (𝜙̂𝑥𝑟 − 𝜙̂𝑦𝑟 ) (6.4)
Keterangan:
𝜙̂ : Vektor dari sampel PACF

Ω : Beberapa matriks bobot.
Jarak antara invers autokorelasi deret waktu 𝑥𝑡 dan 𝑦𝑡 ditentukan oleh
(𝐼) (𝐼) (𝐼) (𝐼)

𝑑𝐼𝐴𝐶𝐹 (𝑥𝑡 , 𝑦𝑡 ) = √𝜌̂𝑥𝑟 − 𝜌̂𝑦𝑟 )′ Ω (𝜌̂𝑥𝑟 − 𝜌̂𝑦𝑟 ) (6.5)
Keterangan:
(𝐼)
𝜌̂𝑥𝑟 : invers ACF pada data time series 𝑥𝑡
(𝐼)
𝜌̂𝑦𝑟 : invers ACF pada data time series 𝑦𝑡
Pada invers ACF dapat menggunakan bobot seragam atau bobot menurun dengan lag
autokorelasi seperti pada jarak berbasis ACF.

Proses Stokastik Dan ACF Distance Cluster

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Proses Stokastik Dan ACF Distance Cluster

Diunggah oleh

Hak Cipta:

Format Tersedia

2.

𝛾𝑡1 ,𝑡2 = 𝐸[(𝑋𝑡1 − 𝜇𝑡 )(𝑋𝑡2 − 𝜇𝑡 )]

6.2 Fitur domain waktu - Autokorelasi dan autokorelasi parsial

𝑑𝐴𝐶𝐹 (𝑥𝑡 , 𝑦𝑡 ) = √(𝜌̂𝑥𝑟 − 𝜌̂𝑦𝑟 )′ Ω (𝜌̂𝑥𝑟 − 𝜌̂𝑦𝑟 ) (6.1)

𝑑𝑃𝐴𝐶𝐹 (𝑥𝑡 , 𝑦𝑡 ) = √(𝜙̂𝑥𝑟 − 𝜙̂𝑦𝑟 )′ Ω (𝜙̂𝑥𝑟 − 𝜙̂𝑦𝑟 ) (6.4)

𝜙̂ : Vektor dari sampel PACF

(𝐼) (𝐼) (𝐼) (𝐼)

Anda mungkin juga menyukai