Bagan Kendali T2 Hotelling Dengan Data Tidak Normal Multivariat Menggunakan Copula Bivariat
Bagan Kendali T2 Hotelling Dengan Data Tidak Normal Multivariat Menggunakan Copula Bivariat
ABSTRAK
2
Bagan kendali T Hotelling memerlukan asumsi data berdistribusi normal
multivariat namun kenyataanya asumsi tersebut sering tidak terpenuhi. Hal ini
mengakibatkan pembentukan bagan kendali T2 Hotelling tidak dapat dilakukan. Metode
Copula diusulkan untuk menyelesaikan masalah ketidaknormalan pada data. Copula
adalah metode yang dapat menemukan model bersama dari variabel acak bivariat atau
multivariat dengan cara mentransformasi data ke [0,1]. Dua tipe copula digunakan
dalam penelitian ini yakni Copula Clayton dan Copula Gumbel. Penelitian ini
menggunakan data simulasi yang dibangkitkan dengan software R yang berdistribusi
gamma. Berdasarkan hasil penelitian menunjukkan bahwa data berada dalam keadaan
tidak terkendali dan berdasarkan ARL 𝛽 diperoleh bahwa data model Copula Frank
lebih sensitif dideteksi pada proses tidak terkendali atau out of control.
1. Pendahuluan
Pengendalian kualitas statistik atau Statistical Quality Control (SQC) adalah
sekumpulan perangkat statistik yang berguna untuk mengontrol agar proses produksi
berjalan dengan stabil dan meningkatkan kemampuan produksi melalui pengurangan
variasi hasil produksi. Bagan kendali merupakan salah satu aplikasi yang paling dikenal
dalam Statistical Proses Control (SPC) yang merupakan alat statistik dan alat
perancangan visual untuk mendeteksi pergeseran pada proses produksi. Bagan kendali
terbagi menjadi dua yakni, bagan kendali univariat dan multivariat. Bagan kendali
univariat adalah alat untuk memonitor kualitas dari proses karakteristik tunggal namun
seiring dengan berjalannya waktu diera modern ini kebanyakan proses monitor telah
memiliki lebih dari satu karakteristik kualitas. Untuk mendeteksi proses karakteristik
multivariat diperlukan bagan kendali multivariat, adapun jenis bagan kendali
multivariat, yakni bagan kendali multivariate cumulative sum (MCUSUM),
multivariate exponentially weighted moving average (MEWMA), dan bagan kendali T2
Hotelling.
Bagan kendali multivariat merupakan prosedur yang berdasarkan pada aspek
karakteristik berdistribusi normal namun dalam kenyataannya telah banyak proses tidak
normal. Selain itu, kekurangan bagan kendali multivariat adalah tidak mampu
menemukan fungsi distribusi bersama dan Copula dapat mengatasi hal tersebut
(Kuvattana, dkk, 2015).
Copula merupakan fungsi distribusi multivariat bersama menjadi marginal satu
dimensi yang mentransformasi variabel ke dalam domain [0,1]. Hal tersebut dapat
menaksir distribusi bersama pada hasil nonlinear dan menjelaskan struktur variabel
dependen melalui distribusi bersama dengan menghapuskan efek marginal univariat
(Sklar, 1959).
Telah banyak penelitian dalam pengembangan Copula pada bagan kendali. Beberapa
penelitian diantaranya adalah Copula berdasarkan pada ZIP Bivariat Bagan Kendali
(Fatahi, dkk, 2012), Copula Markov Cusum Chart (Dokouhaki dan Noorassana, 2013),
Perbandingan Penampilan Copula Bivariat pada Bagan Kendali MCUSUM dan
MEMWA (Kuvattana, dkk, 2015), dan Bagan Kendali. Bivariat dengan Copula (Lestari,
2014). Berdasarkan uraian tersebut maka pada penelitian ini akan dikaji mengenai
bagan kendali T2 Hotteling dengan karakteristik bivariat ketika observasi tidak
berdistribusi normal dan berkorelasi dengan menggunakan pendekatan Copula bivariat
(Copula Clayton dan Copula Gumbel).
dengan,
𝑇𝑖2 = vektor yang mengandung nilai statistik Hotelling untuk pengamatan ke-𝑖,
𝑋𝑖 = vektor yang mengandung nilai dari setiap peubah ke-𝑖 berukuran 1 × 𝑝
𝑋̅ = rata-rata dari variabel 𝑋
𝑆 −1 = invers matriks varians kovarians berukuran 𝑝 × 𝑝
Batas kendali pada observasi individual dapat dihitung dengan rumus statistik
sebagai berikut (Montgomery,2005):
𝑝(𝑚 + 1)(𝑚 − 1)
𝑈𝐶𝐿 = 𝐹𝛼, 𝑝, 𝑚 − 𝑝
𝑚2 − 𝑚𝑝
𝐿𝐶𝐿 = 0
3. Korelasi Pearson
Selain data harus normal, asumsi lain yang harus terpenuhi untuk bekerja pada
bagan kendali multiariat adalah data harus berkorelasi. Korelasi menunjukkan keeratan
hubungan linier antara dua peubah dengan koefisien korelasi 𝜌 diduga dengan
persamaan berikut:
∑𝑛 ̅)
𝑖=1(𝑥𝑖 −𝑥̅ )(𝑦𝑖 −𝑦
𝜌𝑥𝑦 =
√∑𝑛 2 𝑛 ̅)2
𝑖=1(𝑥𝑖 −𝑥̅ ) ∑𝑖=1(𝑦𝑖 −𝑦
di mana
𝜌 = Koefisien korelasi antar peubah X dan Y
𝑛 = Ukuran
𝑥𝑖 = Nilai ke-i peubah X
𝑦𝑖 = Nilai ke-i peubah Y
𝑥̅ = Rata-rata peubah X
𝑦̅ = Rata-rata peubah Y
dengan:
K = Banyaknya pasangan konkordan
D = Banyaknya pasangan diskordan
n = Banyaknya sampel
Tolak 𝐻0 jika |𝜏| > 𝜏𝛼/2(𝑛) atau nilai signifikan p-value < 𝛼 sehingga dapat
disimpulkan bahwa terdapat korelasi antar peubah dan sebaliknya terima 𝐻0 jika |𝜏| <
𝜏𝛼/2(𝑛) atau p-value > 𝛼 artinya tidak terdapat korelasi antar peubah.
c) Tentukan nilai jarak mahalanobis atau kuadrat general setiap titik pengamatan
dengan vektor rata-ratanya 𝑑𝑖2 = (𝑋𝑖 − 𝑋̅)𝑡 𝑆 −1 (𝑋𝑖 − 𝑋̅).
2 2 2 2
d) Urutkan nilai 𝑑𝑖2 dari kecil ke besar: 𝑑(1) ≤ 𝑑(2) ≤ 𝑑(3) ≤ ⋯ ≤ 𝑑(𝑛) .
𝑖−1⁄2
e) Tentukan nilai 𝑝𝑖 = .
𝑛
𝑞
𝑖
f) Tentukan nilai 𝑞𝑖 sedemikian hingga ∫−∞ 𝑓(𝜒 2 )𝑑 𝜒 2 = 𝑝𝑖 atau 𝑞𝑖,𝑝 (𝑝𝑖 ) =
dengan
𝑚𝑖𝑗 = (𝑥𝑖 − 𝑥̅ )𝑇 𝑆 −1 (𝑥𝑖 − 𝑥̅ )
1
𝑆= ∑𝑛𝑗=1(𝑥𝑗 − 𝑥̅ ) (𝑥𝑗 − 𝑥̅ )𝑇
𝑛
𝑝 = banyaknya variabel
Jika sampel berasal dari distribusi normal multivariat statistik uji untuk skewness
(𝑛/6)𝛾̂1,𝑝 mendekati distribusi 𝜒 2 dengan 𝑝(𝑝 + 1)(𝑝 + 2)/6 derajat kebebasan.
Dengan cara yang sama, statistik uji untuk kurtosis 𝛾̂2,𝑝 , mendekati dsitribusi normal
dengan mean 𝑝(𝑝 + 2) dan variansi 8𝑝(𝑝 + 2)/𝑛. Atau pengambilan keputusan dapat
dilakukan dengan nilai p-value. Jika skewness dan kurtosis memiliki nilai p-value > 𝛼
skewness dan kurtosis dapat disimpulkan bahwa sampel berdistribusi nomal multivariat
dan sebaliknya (Korkmaz, dkk, 2016).
Dimana I merupakan fungsi indikator bernilai satu jika 𝑋𝑖(𝑗) ≤ 𝑥 dan selainnya bernilai
nol begitupun dengan 𝑌𝑖(𝑗) ≤ 𝑦.
Transformasi data ke domain [0,1] dengan membuat rank untuk setiap variabel
acak sebagai berikut:
𝑅1(𝑗) 𝑅2(𝑗) 𝑅𝑝(𝑗)
( ),( ),…,( ),1 ≤ 𝑗 ≤ 𝑛
𝑛+1 𝑛+1 𝑛+1
dengan 𝑅1(𝑗) , 𝑅2(𝑗) ,…, 𝑅𝑝(𝑗) adalah peringkat data 𝑋𝑖(𝑗) ke-i, i=1,2,…n.
= 4𝐸[𝐶(𝑢1 , 𝑢2 )] − 1.
9. Copula Archimedean
Copula Archimedean merupakan salah satu keluarga dari Copula yang paling
banyak digunakan dalam kasus bivariat. Pertama kali diperkenalkan oleh Ling pada
tahun 1965 namun ditemukan pertama kali oleh Sklar dan Schweizer pada tahun 1961.
Copula Archimedean terdiri dari Copula Clayton, Gumbel, dan Frank (Nelsen, 2006).
Terdapat φ: [0,1] →[0,∞] yang bersifat kontinu dan monoton turun sedemikian
sehingga φ(1) = 0 dan φ(0) = ∞. Maka fungsi Copula Archimedean dapat dituliskan
sebagai berikut (Ratih,2011):
𝐶(𝑢1 , 𝑢2 ) = 𝜑 −1 {𝜑(𝑢1 ) + 𝜑(𝑢2 )} (1.7)
dengan:
𝜑(𝑢1 ) = fungsi generator Copula Archimedean 𝑢1
𝜑(𝑢2 ) = fungsi generator Copula Archimedean 𝑢2
𝜑 −1 = invers dari ∅ 𝑑imana ∅−1 : [0, ∞] → [0,1].
Copula Archimedean yang paling banyak digunakan dalam kasus bivariat adalah
Copula Clayton, Copula Frank dan Copula Gumbel.
dengan:
𝜑(𝑡) = fungsi generator dari keluarga Copula Archimedean
𝜑′(𝑡) = turunan fungsi generator dari keluarga Copula Archimedean
Melalui persamaan (1.8) akan diperoleh nilai estimasi parameter jenis Copula
Archimedean dengan memasukkan fungsi generator masing-masing jenis Copula
Archimedean.
dengan fungsi generator pada persamaan (1.9) akan menghasilkan fungsi distribusi
Copula dari fungsi densitas Copula Clayton sebagai berikut:
1
𝐶(𝑢1 , 𝑢2 ) = (𝑢1 −𝜃 + 𝑢2 −𝜃 − 1)𝜃
Misalkan 𝛼 merupakan P (suatu titik diluar kendali), maka perumusan untuk ARL
dalam keadaan terkontrol adalah :
1
𝐴𝑅𝐿0 =
𝛼
Sedangkan perumusan untuk ARL dalam keadaan di luar kendali ( 𝐴𝑅𝐿1 ) adalah :
P (suatu titik di luar kendali) = 1 – P (suatu titik dalam kendali)
=1–𝛽
Sehingga diperoleh :
1
𝐴𝑅𝐿1 =
1−𝛽
(𝑖) (𝑖)
𝑅1 dan 𝑅2 adalah rank varibael acak X dan Y. Langkah selanjutnya yakni estimasi
parameter Copula.
Subtitusi nilai Tau Kendall ke persamaan (1.14) diperoleh nilai parameter Copula
Gumbel 𝜃 = 3,23.
1
= 𝑒𝑥𝑝 {−[(− ln 𝑢1 )3.23 + (− ln 𝑢2 )3.23 ]3.23 }
Uji Distribusi Normal Multivariat Data Model Copula Clayton dan Gumbel
Data model Copula Clayton diperolah nilai skewness 𝛾̂1,𝑝 = 0.5891402 dan
untuk kurtosis 𝛾̂2,𝑝 = 6.84096 . Diperoleh 𝑝 − 𝑣𝑎𝑙𝑢𝑒 skewness = 0.2074066 dan
𝑝 − 𝑣𝑎𝑙𝑢𝑒 kurtosis = 0.2617623 kedua nilai 𝑝 − 𝑣𝑎𝑙𝑢𝑒 lebih besar dari 𝛼 = 0.05
maka terima H0, disimpulkan bahwa data model Copula Clayton berdistribusi normal
multivariat.
Data model Copula Gumbel diperolah nilai skewness 𝛾̂1,𝑝 = 0.1701074 dan
untuk kurtosis 𝛾̂2,𝑝 = 9.206744 . Diperoleh 𝑝 − 𝑣𝑎𝑙𝑢𝑒 skewness = 0.2426354dan
𝑝 − 𝑣𝑎𝑙𝑢𝑒 kurtosis = 0.7639329 kedua nilai 𝑝 − 𝑣𝑎𝑙𝑢𝑒 lebih besar dari 𝛼 = 0.05
maka terima H0, disimpulkan bahwa data model Copula Gumbel berdistribusi normal
multivariat.
Nilai ARL
0.8
0.7
0.6
0.5
ARL 0.4 Calyton
0.3 Gumbel
0.2
0.1
0
1 2 3 4
Kesimpulan
Data model Copula Gumbel dari data simulasi distribusi gamma lebih sensitif
untuk dideteksi pada proses out of control atau dideteksi pada kondisi yang tidak
terkendali pada bagan kendali T2 Hotellingk.
Saran
Untuk menerapkan jenis Copula lain pada suatu bagan kendali.
Daftar Pustaka
Dokouhaki, P. Noorossana, R. (2013). A copula Markov CUSUM chart for
monitoring the bivariate auro-correlated binary observation. Quality and
Reliability Engineering International 29:911-919.
Fatahi, A.A. Noorossana, R. Dokouhaki, P. Moghaddam, B.F. (2012). Copula-
based bivariate ZIP control chart for monitoring rare events.
Communications in Statistics Theory and Methods 41:2699-2716.
Genest, C. dan Neslehova, J. (2010). Copulas: Introduction to the Theory and
Implementation in R with Application in Finance and Insurance. Universite Laval
dan McGill University.
Iriawan, N dan Astuti, S.P. (2006). Mengolah Data Statistik dengan Mundah
Menggunakan Minitab 14. Yogyakarta: Penerbit ANDI.
Johnson, R.A., dan Wichern, D.W. (2007). Applied Multivariate Statistical Analysis.
New Jersey: Prentice Hall.
Korkmaz, S., Goksuluk, D., and Zararsiz, G. (2016). MVN: An R Package for Assesing
Multivariate Normality. Department Biostatistics Faculty of Medicine Hacettepe
University. Ankara. Turkey.
Lestari, T.E. (2014). Bagan Kendali Bivariat dengan Copula. Tesis Program Studi
Magister Matematika ITB. Bandung : ITB.
Montgomery, D.C. (2005). Design and analysis of experiments, 6th edition, John Wiley
& Sons, Inc.
M.,Asri, M., Annisa, Saleh, M. (2015). Perbandingan Peta Kendali Atribut Dalam
Pengendalian Kualitas Produk di PT Arika Kharisma Agung. Program Studi
Statistika, Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetahuan
Alam. Universitas Hasanuddin. Makassar.
Nelsen, R.B. (2006). An Introduction to Copula. 2nd ed. New York: Springer.
Putri, R., dan Zulakmal. (2009). Optimasi Multi Tujuan dengan Peta Kendali Mutu T2
Buatan. Artikel Ilmiah Penelitian Dosen Muda.
Ratih, I.D. (2011). Gaussian Copula Marginal Regression. Magister Jurusan Statistika
FMIPA ITS. Surabaya : ITS.
Ristiani, Y. F. (2006). Pemodelan Dependensi Distribusi Variabel Non Gaussian
Menggunakan Copula. Program Studi Statistika, Jurusan Matematika, Fakultas
Matematika dan Ilmu Pengetahuan Alam. Universitas Hasanuddin. Makassar.
Syahrir, I. (2011). Estimasi Parameter Copula dan Aplikasinya pada Klimatologi. Tesis
Jurusan Statistika FMIPA ITS. Surabaya : ITS.
Yan, J. (2007). Enjoy the joy of copula: with a pakage copula. Journal of Statistical
Software 21:1-21