Anda di halaman 1dari 38

BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA.

2009/2010

STATISTIKA II (UM1742)
Urip Haryoko, MSi. Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ah.MG. Setyadipratikto,

Pendahuluan

Pendahuluan

Pendahuluan

Pendahuluan

Pendahuluan

Sasaran : Siswa memahami analisis time series


Materi
Analisis eksplorasi data 1. 2. 3. 4.

Sub
Ukuran-ukuran summari data numerik Eksplorasi data dengan grafis, Eksplorasi data berpasangan, Eksplorasi data berdimensi lebih dari dua

Pertemuan
1-2

Clustering Uji Hipotesis Analsis Time Series

1. Cara pengelompokan 2. Aplikasi clustering untuk ZOM 1. Significant level, 2. Metoda uji hipotesis 1. 2. 3. 4. 5. 1. 2. 3. 4. 5. Moving average, Fungsi autokorelasi dan auto korelasi parsial, Auto regresi, Analisis trend, Analisis harmonik Regresi linier sederhana, Regresi linier berganda, Autoregressive Forecasting (AR), Autoregressive Moving Average (ARMA), Autoregressive Integrated Moving Average (ARIMA),

3 4-6 8-10

Forecasting

11-14

1. UKURAN-UKURAN SUMMARY UKURANDATA NUMERIK


 Latar Belakang
 Robustness and Resistance  Quantile

 Ukuran summary
 Lokasi (pemusatan)  Penyebaran  Simetris

1.1. Robustness and Resistance


Sifat-sifat yang penting dalam metode Exploratory Data Analysis (EDA) adalah robust (ketegaran) dan resistant (tahan). Robustness dan resistance adalah dua aspek ketidaksensitifitasan terhadap data. Metoda robust tidak perlu harus optimal dalam beberapa hal, namun mempunyai performa yang baik dalam hal yang lain. Misalkan statistik rata-2 sampel x-rata = 7xi / n adalah statistik yang terbaik untuk mengukur pemusatan data, jika diketahui bahwa data tersebut mengikuti distribusi Gauss. Namun jika data tersebut tidak mengikuti distribusi Gauss (misal : jika ada data ekstrim kejadian hujan), maka rata-rata sampel akan memperoleh nilai yang misleading. Sebaliknya, metodametoda robust secara umum tidak sensitif terhadap asumsi tentang data secara keseluruhan. Metoda resisten adalah dipengaruhi oleh sejumlah kecil outlier atau data aneh. Hasil dari metoda resistant hanya sedikit berubah jika sebagian kecil data diubah nilainya, meskipun perubahan itu secara drastis. Rata-rata sampel tidak mempunyai sifat resistant terhadap ukuran pemusatan data.

1.1. Robustness and Resistance


Misalkan data {11, 12, 13, 14, 15, 16, 17, 18 ,19). Rata-rata sampelnya adalah 15. Namun jika datanya diubah menjadi {11, 12, 13, 14, 15, 16, 17, 18 ,91), maka rata-ratanya menjadi 23. Ukuran-ukuran yang resistant dari pemusatan sekumpulan data hanya sedikit berubah atau bahkan tidak berubah sama sekali dengan mengganti angka 19 menjadi 91. Median resistant terhadap nilai ekstrim Rata-2 tidak resistant terhadap nilai ekstrim

1.2. QUANTILE
     Quantile qp (0<p<1) qp = q0,5 = median q0,25, q0,5, q0,75 quartile q0,1, q0,2,.q0,9 deciles q0,01, q0,02, q0,03,q0,99 percentile

1.2. QUANTILE
q0,5 = median = x([n+1]/2) ... n ganjil = {x(n/2) + x([n/2]+1)}/2 n genap Contoh : Jika terdapat 9 data (n=9), nilai median adalah q0,5 = x(5). Quartil bawah adalah q0,25 = x(3), quartil atas adalah q0,75 = x(7)

1.3. Ukuran Pemusatan


 Ukuran pemusatan yang robust dan resistant adalah ukuran median  Trimean = (q0,25+2q0,5+q0,75)/4
(Rata(Rata-rata tertimbang dari median dan quartil. Trimean merupakan ukuran resistant)

1.4. Ukuran penyebaran (spread)


 Ukuran penyebaran (spread atau dispersion atau scale) yang umum, sederhana, robust dan resistant adalah interquartile range (jarak antar kuartil) IQR. IQR = q0,75 q0,25  Ukuran penyebaran yang konvensional : standard deviation

 Koefisien Variasi : KV = (simpangan baku/rata)*100%  Median Absolute Deviation (MAD) MAD = median|xi q0,5|

1.5. Kesimetrisan
 Skewness coefficient (koefisien kemiringan) [ 1/(n-1 ] 7 (xi xrata)3 b1 = ---------------------------s3

1.5. Kesimetrisan
 Kurtosis coefficient (koefisien keruncingan) [ 1/(n-1 ] 7 (xi xrata)4 b2 = ---------------------------s4

2. Eksplorasi data dengan grafis


     Stem and Leaf Display Boxplots Schematic plot Histogram Distribusi Frekuensi Kumulatif

2.1. Eksplorasi data dengan grafis  Stem and Leaf Display (diagram dahan daun)
2 8 19 02 20 224688

(10) 21 2244666668 13 22 00022224466 2 23 22

2.2. Eksplorasi data dengan grafis


 Boxplot (Box and Whiskers Plot)
Boxplot of T-Bdg

maksimum
23

Whiskers
22

Q1 Q2 BOX

T- B d g

21

Q3

20

Whiskers
19

minimum

2.3. Eksplorasi data dengan grafis


 Schematic plot Upper outer fence = q0,75 + 3 IQR Upper inner fence = q0,75 + 3 IQR/2 Lower inner fence = q0,25 - 3 IQR/2 Lower outer fence = q0,25 - 3 IQR
Boxplot of T-Bdg2
30

25

T-Bdg2

20

15

10

2.3. Eksplorasi data dengan grafis (schematic plot)


Boxplot of T-Bdg2; T-Jkt2
35

30

25 Data 20 15 10 T-Bdg2 T-Jkt2

2.4. Eksplorasi data dengan grafis


 Histogram
FREKUENSI BAGI HASIL 229 TANAMAN KEDELAI RICHLAND
45 40 35 FREKUENSI 30 25 20 15 10 5 0 3 8 13 18 23 28 33 38 43 48 53 58 63 68 HASIL (GR/TANAMAN)

2.5. Eksplorasi data dengan grafis


 Distribusi Frekuensi Kumulatif
DISTRIBUSI FREKUENSI KUMULATIF USIA 150 WANITA PESERTA PROGRAM KB
150 120 JUMLAH ( ORG ) 90 60 30 0 < 15 JUMLAH ( PERSEN ) 80% 60% 40% 20% 0% < 15

DISTRIBUSI FREKUENSI KUMULATIF USIA 150 WANITA PESERTA PROGRAM KB


100%

< 20

< 25

< 30

< 35

< 40

< 45

USIA ( TH )

< 20

< 25

< 30

< 35

< 40

< 45

USIA ( TH )

2.5. Eksplorasi data dengan grafis


 Distribusi Frekuensi Kumulatif
FREKUENSI HARI HUJAN BULANAN DI KARANGKATES - MALANG
100% 90% 80%
JUMLAH KEJADIAN 26-31 HR 21-25 HR 16-20 HR

70% 60% 50% 40% 30% 20% 10% 0% 1 2 3 4 5 6 7 8 9 10 11 12 BULAN

11-15 HR 6-10 HR 0-5 HR

Tugas mandiri / PR :
  Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung Lakukan eksplorasi data sbb :
1. Summary data (pemusatan, penyebaran dan (pemusatan, kesimetrisan) kesimetrisan) 2. Eksplorasi data dengan grafis

Berikan analisis singkat AS MUCH AS POSSIBLE

BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010

STATISTIKA II (UM1742)

3. Eksplorasi data berpasangan


    Scatterplots Pearson Correlation Rank Correlation Serial Correlation

3.1. Scatterplot Diagram


Scatterplot of Suhu_rata2 vs RH_rata2 Staklim Pondok Betung
30

29

Suhu_rata2

28

27

26

25 65 70 75 80 RH_rata2 85 90

3.2. Pearson Correlation


Analisis Korelasi : menyelidiki ada tidaknya hubungan dua peubah atau lebih Koefisien korelasi : untuk mengukur tingginya derajad hubungan Korelasi linier : hubungan peubah acak X dan Y yang membentuk garis lurus Arah hubungan eubah dapat bernilai positif atau negatif Koefisien korelasi populasi :

Koefisien korelasi sampel :

DATA IKLIM STAKLIM PONDOK BETUNG kode_stasiun


96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733 96733

Tahun
1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 1995 1996 1996 1996 1996 1996 1996 1996

Bulan
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7

Hujan
394.5 217.4 289.2 154.1 189.2 328.0 95.9 0.0 303.4 243.8 189.5 174.0 270.8 482.4 277.9 291.3 68.3 55.0 36.0

HH
26 25 26 15 15 16 9 0 11 19 24 16 18 21 15 19 10 9 8

Suhu_rata2 Suhu_max Suhu_min RH_min RH_max RH_rata2


26.6 26.6 26.6 27.5 27.7 27.2 27.3 27.5 27.4 27.4 26.7 26.7 26.2 26.2 26.6 27.2 27.9 27.7 27.7 33 39 34 34.2 34.2 34.4 33.7 35.4 35.2 34.2 33.6 34.1 34.8 32.4 34 35.2 35 35.2 35 22.2 22.6 22.5 23 22.8 22.6 22 22 19.6 22 22.4 22.5 21.6 22.2 21.3 22.5 22.5 20.2 20.4 59 56 50 47 51 49 41 38 34 50 56 53 58 66 54 44 43 45 41 100 100 100 98 98 98 99 95 92 100 99 98 99 100 100 100 97 98 95 85 84 85 80 81 82 78 71 75 80 85 82 85 88 86 84 78 79 76

Scatterplot of Suhu_rata2 vs RH_rata2 Staklim Pondok Betung

X : suhu rata-rata Y : RH rata-rata rxy : - 0,53 Hubungan antara X dan Y negatif Jika X naik maka Y turun

30

29

Suhu_rata2

28

27

26

25 65 70 75 80 RH_rata2 85 90

3.3. Rank Correlation


 Korelasi antar peubah yang disusun berurut (rank)  rrank = 1- [6 7 di2] / [n(n2-1)] 1-

3.4. Serial Correlation


 Korelasi untuk data time series  Korelasi antara data ke-t dengan data ke ket- k  Misal : korelasi antara curah hujan bulan berjalan dengan curah hujan sebelumnya (ryt yt-1) atau r1 (k=1 atau lag =1) yt-

3.4. Serial Correlation


DATA IKLIM STAKLIM PONDOK BETUNG

(ryt yt-1) = =0.37 yt-

kode_stasiun Tahun Bulan 96733 1995 1 96733 1995 2 96733 1995 3 96733 1995 4 96733 1995 5 96733 1995 6 96733 1995 7 96733 1995 8 96733 1995 9 96733 1995 10 96733 1995 11 96733 1995 12 96733 1996 1 96733 1996 2 96733 1996 3 96733 1996 4 96733 1996 5 96733 1996 6 96733 1996 7

t 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Hujan ke-t 394.5 217.4 289.2 154.1 189.2 328.0 95.9 0.0 303.4 243.8 189.5 174.0 270.8 482.4 277.9 291.3 68.3 55.0 36.0

Hujan ke-(t-1) 394.5 217.4 289.2 154.1 189.2 328.0 95.9 0.0 303.4 243.8 189.5 174.0 270.8 482.4 277.9 291.3 68.3 55.0

4. Eksplorasi data berdimensi lebih dari dua  Correlation Matrix  Scatterplot Matrix  Correlation Map

4.1. Correlation Matrix


Sabang -0.156 -0.135 -0.094 -0.285 0.047 0.242 0.180 0.356 0.030 Aceh -0.088 -0.026 0.295 0.294 0.387 0.118 -0.243 0.341 Bengkulu Jambi Medan Meulaboh P

Aceh Bengkulu Jambi Medan Meulaboh Padang nino dmi monsun

0.709 -0.016 0.267 0.287 -0.432 -0.435 -0.014

-0.065 0.118 0.198 -0.421 -0.538 0.042

0.330 0.250 0.000 -0.122 -0.246

0.504 -0.092 -0.108 -0.016

4.2. Scatter Plot Matrix


Matrix Plot of Sabang, Aceh, Bengkulu, Jambi, Medan, Meulaboh, ...
-60 0 60 -80 0 80 -100 0 100 -1 0 1 -1 0 1
200 100

Sabang
60 0 -60

Aceh
200

Bengkulu
100 0 -100

0 -200

Jambi
100 0

Medan
-100 100 0 -100

Meulaboh
200 0

Padang
-200 1 0 -1 2

nino

dmi
1 0 -1

0 -2

monsun

100

200

-200

200

-100

100

-200

200

-2

4.3. Correlation Map :


Peta yang menggabarkan hubungan antara dua peubah

Tugas
  Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung Lakukan eksplorasi data sbb :
1. Summary data (pemusatan, penyebaran dan (pemusatan, kesimetrisan) kesimetrisan) 2. Eksplorasi data dengan grafik 3. Eksplorasi data berpasangan (korelasi) korelasi)

Berikan analisis singkat AS MUCH AS POSSIBLE

Anda mungkin juga menyukai