Anda di halaman 1dari 25

PLOT QUANTIL - QUANTIL

M12 - 16 April 2019


2 Istilah kuantil = istilah persentil
Misal : jika ditetapkan nilai kuantil 0.67 untuk suatu
kumpulan data, maka hal ini berarti ada 0.67 bagian
data yang nilainya lebih kecil dari nilai kuantil dan 0.33
bagian lainnya memiliki nilai yang lebih tinggi. Nilai kuantil
ini dilambangkan dengan Q (0.67)
Penetapan nilai kuantil dapat dilakukan jika data
yang kita miliki telah diurutkan dari kecil-besar.
Untuk suatu kumpulan data yi, i = 1, … n setelah
diurutkan akan menghasilkan kumpulan baru yaitu
y(i) dengan penunjuk (i) adalah nomor urut
besarnya data tersebut dan setiap y(i) adalah nilai
kuantil i/n
3 Dalam praktek kita definisikan kuantil sebagai berikut:
Q (pi) = y(i) untuk i = 1, …, n
pi = (1-0.5)/n
Alasan pemilihan pi = (1-0.5)/n
Seandainya n = 10 dan digunakan i/n maka Q (0.25) akan
berada di antara urutan ke-2 dan ke-3 yang menyebabkan
tidak ada satu nilai pengamatan pun yang dapat membagi
data tersebut menjadi dua yaitu 0.25 bagian di bawah dan
0.75 bagian atasnya
Kalau kita menggunakan (i-0.5)/n maka Q(0.25) = y(3)
dianggap setengahnya berada di bagian bawah dan
setengahnya lagi bagian atas sehingga tercapai pembagian
0.25 dan 0.75
ingat bahwa Q (0.25) tidak lain adalah kuartil 1
4 Plot kuantil adalah plot antara nilai y(i) dengan fraksi pi.
Plot ini lebih terperinci dibandingkan dengan plot
kotak kuantil karena seluruh pengamatan ditampilkan
dalam plot.
Tujuan :
Memeriksa kesesuaian pola sebaran data terhadap pola
sebaran teoritik  membandingkan antara kuantil yang
didasarkan pada data (kuantil empirik) dengan kuantil dari
sebaran tertentu (kuantil teoritik) melalui plot kuantil-kuantil
atau plot Q-Q.
Pola sebaran teoritik yang banyak melandasi
5 analisis data adalah Sebaran Normal
Fungsi peluang sebaran normal:
f
0.8  ( x   )2
1
f ( x)  e 2 2

 2
0.6

Bentuk Sebaran Normal ditentukan


oleh dua paramaternya :
0.4
- rata-rata () dan ragam (2)

0.2
-1-
--  2 --

x
-2 -1 0 1 4 6
f
BENTUK SEBARAN
6 NORMAL BAKU YANG
0.3413 MEMILIKI
 = 0 DAN =1

0.1360
--  --

0.0213

-3 -2 -1 0 1 2 3 x

Catatan :
• titik -1 dan +1  titik belok
• luas daerah antara titik belok = 2 (0.3413) = 0.6826
Fungsi F(z) dikenal sebagai fungsi sebaran
7 Normal Kumulatif. Kaitannya dengan Kuantil
dapat dilihat di bawah ini :
Q (0.0014) = -3
Q (0.0227) = -2
Q (0.9773) = 2
Q (0.9986) = 3
Sehingga secara umum dapat dirumuskan
dengan :
F {Q (pi) }= pi dan Q (pi) = F-1 (pi)
di mana F-1 adalah kebalikan fungsi F dan pi = (i-
0.5)/n. pi dalam fungsi sebaran kumulatif berarti
peluang.
untuk menghitung luas di bawah kurva normal baku
melalui tabel.
Prosedur Pemeriksaan Kenormalan Data
8
dengan Plot Q-Q
Urutkan data menjadi, y(1), …, y(i), …, y(n)
 dengan y(1) sebagai nilai y pada urutan terkecil
y(i) sebagai nilai y pada urutan ke-i
y(n) sebagai nilai y yang terbesar
 Untuk setiap y(i) ditetapkan nilai pi = (i-0.5)/n. Plot antara y(i)
dengan pi adalah plot kuantil empirik.
 Untuk setiap pi, kita tetapkan F-1(pi) = Q (pi) dengan
bantuan tabel sebaran normal baku. Nilai Q (pi) adalah
kuantil Normal Baku. Plot antara Q (pi) dan pi adalah plot
kuantil teoritik
 Selanjutnya buat plot antara y(i) dengan Q (pi) yang
merupakan plot kuantil-kuantil
Urutan y(i) pi = (i-0.5)/n Q (pi)

9
 Contoh data : 1 3.79 0.025 -1.960
2 3.80 0.075 -1.440
3 3.97 0.125 -1.150
3.97 4.68 5.08 5.14 4.76
4 4.12 0.175 -0.935
4.42 5.44 4.15 5.49 5.67
5 4.15 0.225 -0.755
4.12 5.47 5.04 6.02 6.21 6 4.22 0.275 -0.598
3.79 5.13 3.80 5.89 4.22 7 4.42 0.325 -0.454
8 4.68 0.375 -0.319
9 4.76 0.425 -0.189
10 5.04 0.475 -0.063
11 5.08 0.525 0.063
12 5.13 0.575 0.189
13 5.14 0.625 0.319
14 5.44 0.675 0.454
15 5.47 0.725 0.598
16 5.49 0.775 0.755
17 5.67 0.825 0.935
18 5.89 0.875 1.150
19 6.02 0.925 1.440
20 6.21 0.975 1.960
PLOT DATA
10

6.5
6
5.5
5

Y (i)
4.5
4
3.5
3
0 5 10 15 20 25
Urutan

Pola pencaran titik-titik dalam plot membentuk


garis lurus menjadi petunjuk bahwa sebaran data
dapat didekati oleh pola sebaran normal
PLOT KUANTIL EMPIRIK
11
6.5

5.5

data, y(i) 4.5

3.5
0 0.2 0.4 0.6 0.8 1 1.2
fraksi, pi

Pola pencaran titik-titik dalam plot cenderung tidak


membentuk garis lurus karena titik-titik sebelah kiri
maupun kanan cenderung menjauh dari pola garis lurus
PLOT KUANTIL TEORITIK
12

2.000

1.000

Q (pi)
0.000

-1.000

-2.000
0 0.2 0.4 0.6 0.8 1 1.2
peluang, pi

Pola pencaran titik-titik dalam plot cenderung tidak


membentuk garis lurus karena titik-titik sebelah kiri
maupun kanan cenderung menjauh dari pola garis lurus
dan membentuk pola sigmoid
PLOT KUANTIL- KUANTIL
13
6.5

5.5

data, y(i) 4.5

3.5
-3.000 -2.000 -1.000 0.000 1.000 2.000 3.000
Q (pi) , kuantil normal baku

Merupakan plot antara kuantil kuantil empirik dengan


teoritik yang merupakan plot antara nilai-nilai pada
sumbu Y kedua kuantil tersebut
 Jika sebaran teoritik dapat merupakan pendekatan
14 dari pola sebaran data yang kita miliki, maka
kuantil empirik tersebut akan memiliki kemiripan
dengan kuantil yang didasarkan pada sebaran
tertentu dan titik-titik dalam plot akan berkisar di
seputar garis y = x. Garis ini menjadi patokan dalam
memeriksa kesesuaian pola sebaran data apabila
data tersebut telah dibakukan sebelumnya.
 Seandainya data belum dibakukan maka garis
patokan adalah y =  + x atau
y(i) =  +  Q(pi)
15 Catatan:
Meskipun sebenarnya sebaran data dapat
didekati oleh pola sebaran teoritik tertentu,
namun keragaman yang terkandung dalam
data akan menyebabkan adanya
penyimpangan dari pola garis lurus.
Setiap plot kuantil-kuantil hanya memeriksa pola
sebaran dari satu peubah saja, sedangkan pola
hubungan yang terjadi antara satu peubah
dengan peubah lain tidak terdeteksi dalam plot
ini.
Plot Q-Q ini umumnya digunakan dalam
memeriksa pola dari sisaan setelah dilakukan
analisis data.
16 PLOT KENORMALAN

1
0.9
0.8
0.7
pi 0.6
0.5
0.4
0.3
0.2
0.1
0
3 4 5 6 7
Y (i)
17 Penerapan selain sebaran Normal
 Waktu yang ditempuh sampai terjadinya sesuatu, dalam
statistika dikenal sebagai masa-hidup (lifetime, survival time
atau failure time). Beberapa pola sebaran yang umum
dipakai untuk memodelkan pengamatan masa hidup
antara lain adalah eksponensial, Weibull atau log normal.
 Fungsi peluang Eksponensial adalah :
f (t) =  exp (-t) , untuk t > 0 dan  > 0
 Sedangkan fungsi peluang Weibull adalah
f (t) =  (t) -1 exp (-t) , untuk t > 0 dan  > 0 dan  > 0
 Sehingga kali parameter  = 1 fungsi peluang Weibull ini
menjadi fungsi peluang eksponensial.
Urutan Y(i) Pi -ln (1-pi)
DATA
1 10 0.017241 0.017392
2 14 0.051724 0.053110 90 10 60 186 61
18 3 20 0.086207 0.090151
118
49
25
14
156
24
310
56
76
20
4 23 0.120690 0.128617 26 44 23 62 130
5 24 0.155172 0.168623 79 84 44 59 29
6 25 0.189655 0.210295 208 70 101 208
7 26 0.224138 0.253781
8 29 0.258621 0.299243
9 44 0.293103 0.346871 Data merupakan hasil
10 44 0.327586 0.396881 pengamatan terhadap waktu
11 49 0.362069 0.449525 terjadinya kerusakan pada alat
12 56 0.396552 0.505095 penyejuk (AC) dalam sebuah
13 59 0.431034 0.563935 pesawat terbang Boeing 720.
14 60 0.465517 0.626456
Pengamatan didasarkan pada 29
15 61 0.500000 0.693147
16 62 0.534483 0.764606 kali kegagalan yang terjadi
17 70 0.568966 0.841567 berturut-turut. Pengamatan
18 76 0.603448 0.924949 pertama adalah waktu (jam)
19 79 0.637931 1.015921 antara saat mulai berfungsi
20 84 0.672414 1.116004 hingga terjadi kegagalan
21 90 0.706897 1.227230
pertama, dst.
22 101 0.741379 1.352393
23 118 0.775862 1.495494 Ingin diperiksa apakah data
24 130 0.810345 1.662548
tersebut merupakan kejadian
25 156 0.844828 1.863218
26 186 0.879310 2.114533
bebas atau dapat dimodelkan
27 208 0.913793 2.451005 oleh fungsi peluang eksponensial?
28 208 0.948276 2.961831
29 310 0.982759 4.060443
PLOT KUANTIL-KUANTIL
19
420

280

data, y(i) 140

0
0.00 0.50 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50
kuantil eksponensial, -ln (1-pi)

Pola dalam plot Q-Q secara keseluruhan tidak menunjukkan adanya


keanehan. kalaupun ada hal ini mungkin disebabkan oleh adanya
pembulatan-pembulatan yang terjadi dalam penyusunan plot sehingga
terlihat adanya beberapa titik yang mengumpul pada satu barisan.
 Fungsi peluang Weibull adalah model parametrik
20 yang cukup populer untuk memodelkan
pengamatan tentang lama waktu munculnya
tumor.
 Oleh karena fungsi eksponensial merupakan bentuk
khusus dari fungsi Weibull dengan b=1 dan
keduanya dapat dipakai untuk menerangkan
perilaku data masa-hidup maka kita dapat
memeriksa kesesuaian model dari suatu data
tertentu dengan patokan salah satu dari kedua
fungsi tersebut.
21
 Sebagai ilustrasi, kita akan melihat data tentang
lama waktu munculnya tumor pada tikus-tikus
percobaan. Sejumlah tikus betina diberi zat
Carcinogen pada hari ke-nol, kemudian dipelihara
selama 60 hari dengan pemberian “retynil acetate”
untuk mengurangi kemungkinan tumor. Pada hari
ke-60 tikus-tikus yang masih bebas tumor dibagi
menjadi dua grup secara acak, grup yang
pertama tetap menerima perlakuan retinoid dan
grup kedua tanpa perlakuan lagi, percobaan ini
dihentikan pada hari ke-182. Selama masa
percobaan dilakukan pengamatan terhadap
perkembangan tumor baik jumlah maupun masa
terjadinya.
Urutan Y(i) pi -ln (1-pi) ln Y(i) ln {-ln (1-pi)}
1 63 0.02 0.02020 4.14313 -3.90194 DATA
22 2 63 0.06 0.06188 4.14313 -2.78263 63 88 91 71 95
3 63 0.1 0.10536 4.14313 -2.25037 71 77 88 63 81
4 68 0.14 0.15082 4.21951 -1.89165 68 77 81 68 112
5 68 0.18 0.19845 4.21951 -1.61721 88 68 140 152 81
6 68 0.22 0.24846 4.21951 -1.39247 88 77 112 63 84
7 71 0.26 0.30111 4.26268 -1.20030
8 71 0.3 0.35667 4.26268 -1.03093
9 77 0.34 0.41552 4.34381 -0.87824 Data berikut
10 77 0.38 0.47804 4.34381 -0.73807 berasal dari 25
11 77 0.42 0.54473 4.34381 -0.60747 ekor tikus yang
12 81 0.46 0.61619 4.39445 -0.48421
termasuk grup
13 81 0.5 0.69315 4.39445 -0.36651
14 81 0.54 0.77653 4.39445 -0.25292 tanpa perlakuan
15 84 0.58 0.86750 4.43082 -0.14214 dan hanya tentang
16 88 0.62 0.96758 4.47734 -0.03295 waktu (dalam hari)
17 88 0.66 1.07881 4.47734 0.07586
munculnya tumor
18 88 0.7 1.20397 4.47734 0.18563
19 88 0.74 1.34707 4.47734 0.29793 yang pertama
20 91 0.78 1.51413 4.51086 0.41484
21 95 0.82 1.71480 4.55388 0.53930
22 112 0.86 1.96611 4.71850 0.67606
23 112 0.9 2.30259 4.71850 0.83403
24 140 0.94 2.81341 4.94164 1.03440
25 152 0.98 3.91202 5.02388 1.36405
PLOT Q-Q UNTUK MODEL EKSPONENSIAL
23
PLOT KUANTIL-KUANTIL (-ln (1-Pi))

160

140

120
data, y(i)

100

80

60

40
0.00 1.00 2.00 3.00 4.00 5.00
-ln (1-pi)
PLOT Q-Q UNTUK MODEL WEIBULL
24

PLOT ANTARA [ln Y(i)] dgn [ln {-ln (1-pi)}]

5.20

4.80
ln Y(i)

4.40

4.00
- 4.0 - 3.5 - 3.0 - 2.5 - 2.0 - 1. 5 - 1. 0 - 0.5 0.0 0.5 1. 0 1. 5 2.0 2.5 3.0 3.5

ln {-ln (1-pi)}
25

KESIMPULAN :

Dengan patokan garis lurus yang terbentuk,


nampak bahwa fungsi peluang eksponensial
lebih cocok bagi data ini dibandingkan
dengan model Weibull.
Meskipun demikian kita harus hati-hati
karena proses penetapan model yang terbaik
memerlukan analisis yang lebih lanjut.

Anda mungkin juga menyukai