Extreme Value Theory (EVT)

EXTREME VALUE THEORY (EVT)
TEOREMA NILAI EKSTRIM
dissarahmayani@gmail.com
PENDAHULUAN
 Extreme value theory (EVT) merupakan salah satu metode statistika

yang digunakan untuk mempelajari perilaku nilai ekstrim yang
dapat menentukan probabilitas nilai-nilai ekstrimnya serta
dapat meramalkan terjadinya kejadian ekstrim pada data
heavy tail yang tidak dapat dilakukan dengan pendekatan
tradisional lainnya
 Metode ini berfokus pada perilaku ekor (tail) suatu distribusi untuk
dapat menentukan probabilitas nilai-nilai ekstrimnya.
PENDEKATAN UNTUK MENGIDENTIFIKASI NILAI EKSTRIM
Block Maxima (BM) Peaks Over Threshold (POT)

 Mengikuti distribusi Generalized  Mengikuti distribusi Generalized
Extreme Value (GEV) Pareto Distribution (GPD)
 Dilakukan dengan mengambil nilai  POT lebih sesuai untuk data ekstrim
maksimum dalam sau periode dependen (Jaruskova dan Hanek,
2006).
 Dilakukan dengan mengambil nilai-
nilai yang melewati suatu nilai
threshold
PEAKS OVER THRESHOLD
 Keenam data tersebut merupakan nilai

ekstrim yang akan digunakan untuk
analisis selanjutnya
 Semakin tinggi nilai threshold maka
data ekstrim akan semakin mengikuti
distribusi General Pareto (Generalized
Pareto Distribution / GPD)
PEAKS OVER THRESHOLD
 Probability density function (PDF) dari  Cumulative Distribution Function

GPD : (CDF) dari GPD :
PENENTUAN NILAI THRESHOLD PADA POT
1. Metode Mean Residual Life Plot

(MRLP) 3. Metode Persentase
1) Mengurutkan data dari yang terbesar
hingga terkecil
2) Menghitung 10% dari jumlah data (k)
2. Sample Mean Excess Function k = 10% x N
(SMEF)
N = jumlah data
3) Menentukan nilai threshold (u) yaitu
threshold yang berada pada data urutan
ke- (k+1)
Berdasarkan Coles-Davidson, data yang berada pada threshold adalah sekitar 10%
dari keseluruhan data yang sudah diurutkan dari yang terbesar sampai terkecil.
PLOT AUTOCORRELATION FUNCTION (ACF)
 Plot ACF merupakan salah satu cara yang digunakan untuk mengetahui
adanya data ekstrim yang dependen selain dengan melihat plot dari data
itu sendiri.
 Apabila nilai ACF kurang dari batas bawah atau lebih dari batas atas fungsi
autocorrelation, maka dapat dikatakan bahwa data bersifat dependen.
Dependensi yang dimaksud adalah terjadi dependensi antar waktu pada setiap triwulan
sehingga pada triwulan yang sama pada periode selanjutnya cenderung memiliki pola yang
sama.
(pada periode tertentu memiliki pola yang sama)  curah hujan dipengaruhi oleh waktu
ESTIMASI PARAMETER GENERALIZED PARETO DISTRIBUTION
(GPD)
UJI KESESUAIAN DISTRIBUSI
 Pemeriksaan distribusi dilakukan dengan uji Kolmogorov-Smirnov.

 Pengujian ini dilakukan dengan menyesuaikan fungsi distribusi empiris
(berdasarkan sampel) Fn(x) dengan distribusi teoritis tertentu (sesuai yang
dihipotesiskan) Fo(x).
EXTREME OF DEPENDENT
 Data yang dependen (non stasioner) mengindikasikan jika data tersebut

membentuk suatu pola tertentu.
 Pola yang terbentuk dapat berupa pola siklik, tren naik, maupun tren
turun.
 Cara mengatasi data ekstrim yang dependen:
1) Mentransformasi data kemudian menentukan model parameter
distribusinya
2) Melakukan declustering pada data
However, the frequency of extremes has been changing and is likely to continue changing in
the future (Milly et al. 2008; IPCC2007). Therefore, concepts and models that can account
for nonstationary analysis of climatic and hydrologic extremes are needed (e.g., Cooley
2013; Salas and Obeysekera 2013; Parey et al. 2010).
METODE DECLUSTERING (PENDEKATAN RUN-
DECLUSTERING)
1) Menentukan threshold (u) sehingga nilai-nilai yang melebihi u dianggap

sebagai peristiwa ekstrim dan menentukan nilai r (run length).
2) Menentukan cluster. Cluster dimulai ketika threshold (u) terlampaui untuk
pertama kalinya dan berakhir setelah paling sedikit r pengamatan
berturut-turut berada di bawah threshold.
3) Mengekstrak nilai maksimum cluster dan melanjutkan mengidentifikasi
cluster berikutnya (menggunakan langkah 2). Prosedur berhenti bila data
habis.
EXTREMAL INDEX
 Metode declustering bekerja dengan menentukan suatu threshold (u) kemudian

pembentukan cluster hingga sejumlah r pengamatan berada di bawah threshold.
 Nilai r yang terlalu rendah menyebabkan data sulit menjadi independent.
 Nilai r yang terlalu tinggi menyebabkan data ekstrim yang diperoleh sedikit
sehingga menghasilkan varians yang besar.
 Untuk mengestimasi r (run length) yang optimal dapat menggunakan extremal
index.
 Extremal index merupakan suatu indikator untuk mengukur berapa banyak
cluster yang terbentuk sehingga data menjadi independent.
EXTREMAL INDEX
 Metode dalam mengestimasi extremal index:

RETURN LEVEL
 Salah satu yang menjadi penting dalam interpretasi model extreme value
adalah return level
 Return level merupakan nilai maksimum yang dilampaui satu kali dalam
jangka waktu tertentu
 Sebelum menentukan nilai return level, terlebih dahulu harus diketahui nilai
parameter distribusi EVT yang dipilih dengan syarat urutan data harus
independent
 Kenyataannya, seringkali ditemukan data ekstrim yang dependen, akibatnya
diperoleh nilai return level yang tidak sesuai.
 Untuk mengatasi hal tersebut, maka dependensi dapat diatasi dengan
metode Declustering.
RETURN LEVEL
 Persamaan return level untuk GPD :

NON-STATIONARY EXTREME VALUE ANALYSIS
dissarahmayani@gmail.com
NON-STATIONARY EXTREME VALUE ANALYSIS (NEVA)
 Dengan asumsi non-stasioner, NEVA memberikan 3 metode berbeda untuk

estimasi return level
a. Standard return level (biasanya digunakan pada kasus hidrologi)
b. Constant threshold dengan probablitas waktu yang berbeda-beda
c. Effective return level
A unique feature of NEVA is that it offers the associated posterior probability intervals and
uncertainty bounds for the return level estimates under non-stationarity. These features
make NEVA a practical and attractive tool for users from across different fields, especially
climatology and hydrology, to analyze extremes under both stationary and non-stationary
assumptions.
NON-STATIONARY EXTREME VALUE ANALYSIS (NEVA)
 For a non-stationary process, the parameters of the underlying distribution

function are time dependent and hence, the properties of the distribution
would vary with time. In NEVA, the location parameter is assumed to be a
linear function of time to account for non-stationarity (Eq. 2)
 NEVA detects the presence of trends and non-stationarity in extremes in
historical data using the Mann-Kendall trend test (Kendall 1976; Mann
1945) at the user’s choice of significance level. The default significance level
is α=0.05, which is widely used in hydrological research (Zhang et al. 2004).
 NEVA can provide non-stationary return periods based on a time varying
exceedance probability
NON-STATIONARITY POT ANALYSIS
 An important assumption of the classical EV theory refers to the stationarity of

the model, which implies that the model parameters do not change over time
 However, climatic series are known to be non-stationary, and hence many
studies have been devoted to analysing the occurrence of temporal trends and
cycles, including the frequency and severity of extreme events (Smith, 1989; Karl
et al., 1995; Karl and Knight, 1998; Groisman et al., 1999).
 NSEV (Non-Stationary Extreme Value) methods allow analysis of the time
dependence of extreme precipitation within the EV theory context, enabling
estimation of the time evolution of the most extreme precipitation events.
 Most applications of the NSEV theory, however, have been based on block maxima data,
in which only the n highest observations are retained at regular time intervals.
 There has been criticism of the waste of useful information when the block maxima
approach is applied to datasets containing data in addition to the maxima (Coles, 2001;
Beguer´ıa, 2005).
 As an alternative, the peaks-over-threshold (POT) approach is based on sampling all
observations exceeding a given threshold value, and fitting the resulting data series to the
exponential or the GP distributions (Cunnane, 1973; Madsen and Rosbjerg, 1997).
DAFTAR PUSTAKA
Malika, Rosna. (2014). Declustering Peaks Over Threshold Pada Data Curah Hujan
Ekstrim Dependen di Sentra Produksi Padi di Jawa Timur. Tugas Akhir S1:
Departemen Statistika, Institut Teknologi Sepuluh Nopember.
Kurniawati, Yuli. (2014). Analisis Data Ekstrim Dependen (Non Stationary) Pada
kasus Curah Hujan Ekstrim di Jawa Timur Dengan Pendekatan Peaks Over
Threshold. Tugas Akhir S1: Departemen Statistika, Institut Teknologi Sepuluh
Nopember.
REFERENSI LAIN
Gilli, M., Kellezi, E. (2003). An Application of Extreme Value Theory for Measuring
Risk. Elsevier Science.
Coles, S. (2001). An Introduction to Statistical Modelling of Extreme Values. London:
Spinger-Verlag

Extreme Value Theory (EVT)

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Extreme Value Theory (EVT)

Diunggah oleh

Hak Cipta:

Format Tersedia

EXTREME VALUE THEORY (EVT)

TEOREMA NILAI EKSTRIM

 Extreme value theory (EVT) merupakan salah satu metode statistika

Block Maxima (BM) Peaks Over Threshold (POT)

 Keenam data tersebut merupakan nilai

 Probability density function (PDF) dari  Cumulative Distribution Function

1. Metode Mean Residual Life Plot

 Pemeriksaan distribusi dilakukan dengan uji Kolmogorov-Smirnov.

 Data yang dependen (non stasioner) mengindikasikan jika data tersebut

1) Menentukan threshold (u) sehingga nilai-nilai yang melebihi u dianggap

 Metode declustering bekerja dengan menentukan suatu threshold (u) kemudian

 Metode dalam mengestimasi extremal index:

 Persamaan return level untuk GPD :

 Dengan asumsi non-stasioner, NEVA memberikan 3 metode berbeda untuk

 For a non-stationary process, the parameters of the underlying distribution

 An important assumption of the classical EV theory refers to the stationarity of

Anda mungkin juga menyukai