Fakultas Teknik
Departemen Teknik Sipil dan Lingkungan
ANALISIS FREKUENSI
Statistika dan Probabilitas
Regresi Linear
2
y = f(x)
pertama, x,
3 2 dengan 4
variabel
4 4 kedua, y, yang 2
merupakan
5 3.5 fungsi variabel
pertama, y = 0
6 6
f(x). 0 1 2 3 4 5 6 7
7 5.5 X
http://istiarto.staff.ugm.ac.id Analisis Frekuensi 18-Oct-16
Regresi Linear
3
7
6
5
4
Y
3 data
Kurva regresi merepresentasikan
2 pola hubungan (tren, perilaku) regresi
1 variabel y terhadap x.
0
0 1 2 3 4 5 6 7 8
X
q Situasi
q Bagaimana kalau kita ingin mengetahui perilaku salah satu variabel itu sendiri?
q Misalnya: ingin mempelajari pola sebaran data X (X tentu saja adalah variabel
random)
Tahun Temperatur [C] Tahun Temperatur [C] Tahun Temperatur [C] Tahun Temperatur [C]
35
34
Temperatur [oC]
33
32
31
30
29
28
1971 1974 1977 1980 1983 1986 1989 1992 1995 1998 2001 2004 2007 2010
Tahun
q Pertanyaan
q Apa nama instrumen untuk mengukur temperatur udara?
q Dapatkah kalian menceritakan cara data tersebut diperoleh?
q Dapatkah kalian mendeskripsikan data tersebut secara statistis?
q Bandingkan presentasi data dalam bentuk tabel dan grafik; yang manakah
yang lebih baik?
12 12 ( x ) 2
(
pX ( x) = 2 2
) e
+
luas = p ( x) dx = 1
X
X
3 2 + +2 +3 +
(2 )
2 2 1 2 (t ) 2
prob (X x ) = PX (x ) = p X (t ) d t = e dt
0
+
http://istiarto.staff.ugm.ac.id Analisis Frekuensi 18-Oct-16
Distribusi Normal Standar
11
X
ZX =
pdf
0
3 2 + +2 +3 + X
3 2 1 0 1 2 3 + Z
0.35
0.3
Frekuensi relatif
0.25
0.2
0.15
0.1
0.05
0
28 - 29 29 - 30 30 - 31 31 - 32 32 - 33 33 - 34 34 - 35
Temperatur [C]
0.35
0.3
Frekuensi relatif
0.25
0.2
0.15
0.1
0.05
0
28 - 29 29 - 30 30 - 31 31 - 32 32 - 33 33 - 34 34 - 35
Temperatur [C]
% 30 31.5 ( % 29 31.5 (
= FT (30) FT (29) = FZ ' * FZ ' *
frek. relatif & 1.4 ) & 1.4 )
(dist. normal) = FZ (1.0714) FZ (1.7857)
= 0.1420 0.0371 baca di tabel distribusi normal standar
= 0.1049
q Cara lain untuk memperkirakan frekuensi relatif dalam suatu interval klas
fT (ti ) = ti pT (ti )
dz p Z ( zi )
pT (ti ) = p Z ( zi ) =
dt sT
0.35
0.3 PDF Distribusi Normal
Frekuensi relatif
0.25
0.2 Kurva data
0.15
0.1
0.05
0
28 - 29 29 - 30 30 - 31 31 - 32 32 - 33 33 - 34 34 - 35
Temperatur [C]
1.2
0.8
0.6
0.4
0.2
0
28 - 29 29 - 30 30 - 31 31 - 32 32 - 33 33 - 34 34 - 35
Temperatur [C]
q Kurva CDF
q Berupa garis lengkung.
q Ada satu cara tertentu yang memungkinkan kurva CDF berupa garis lurus, yaitu dengan
melakukan transformasi koordinat.
n Ordinat: magnitud data.
n Skala biasa.
n Absis: probabilitas, PX(x) atau kadang dituliskan pula dengan notasi prob(X < x).
n Skala dibuat sedemikian hingga kurva CDF distribusi normal berupa garis lurus.
q Pada tempo doeloe, kertas grafik seperti di atas dibuat dulu priori sebelum pemplotan data.
n Kertas grafik seperti itu dikenal dengan nama kertas probabilitas.
n Pemplotan (penggambaran) data dilakukan pada kertas probabilitas tersebut.
q Pada saat ini, langkah automatisasi dengan program aplikasi komputer dapat dilakukan
sehingga kertas probabilitas dibuat bersama-sama dengan pemplotan data.
absis adalah probabilitas, prob(X < x) atau PX(x) frekuensi relatif kumulatif
skala dibuat sedemikian hingga CDF berupa garis lurus
q Data temperatur udara harian maksimum adalah time series data, data runtut
waktu.
q Memperhatikan prosedur pemplotan data temperatur udara harian maksimum,
yaitu data diurutkan, maka:
q diartikan bahwa data adalah seri data independent sehingga urut data terhadap
waktu boleh tidak diperhatikan,
q data diurutkan dari kecil ke besar dan percentile rank setiap titik data dianggap
merupakan nilai pendekatan probabilitas, prob(T < t).
q Arti notasi prob(T < t) = a
q probabilitas temperatur udara kurang daripada tC adalah a
q contoh: prob(T < 32C) = 0.64
q Dengan mencermati plot data temperatur dan garis CDF distribusi normal,
tampak bahwa sebaran data temperatur tersebut mendekati CDF distribusi
normal.
q Artinya, data temperatur udara harian maksimum tahunan tersebut berdistribusi
normal.
q Kesesuaian antara sebaran data dengan CDF distribusi normal perlu diuji
q Dikenal dengan istilah best fit test.
q Jenis uji, yang lazim dilakukan di bidang hidrologi, adalah uji Smirnov-Kolmogorov
dan uji chi-kuadrat.
q Kedua jenis cara menguji kesesuaian tersebut akan dibahas pada kuliah Hidrologi.
q Pada kuliah Hidrologi, akan dikenalkan pula beberapa jenis distribusi teoretis selain
distribusi normal.
q Rapikan hitungan dan plot data temperatur udara harian maksimum tahunan
tersebut.
q Unduh data debit aliran dari weblog saya dan lakukan analisis frekuensi
dengan langkah kerja seperti yang telah dibahas pada kuliah ini.
q http://istiarto.staff.ugm.ac.id/index.php/kuliah/kuliah-sarjana-s1/statistika-dan-
probabilitas/
q Nama fail: Data debit puncak Sungai XYZ.xlsx
q Tugas/PR dikumpulkan di ruang saya atau di Sekretariat MTPBA.
q Saran
q Selain menghitung dan menyajikan data, berilah deskripsi tentang data dan
interpretasi Saudara tentang data tersebut.
Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s) Tahun ke- Debit (m3/s)
1 473 12 470 23 1110 34 687 45 843 56 871
2 544 13 663 24 717 35 801 46 450 57 705
3 872 14 809 25 961 36 323 47 284 58 777
4 657 15 800 26 925 37 431 48 460 59 442
5 915 16 523 27 341 38 770 49 804 60 206
6 535 17 580 28 690 39 536 50 550 61 850
7 678 18 672 29 734 40 708 51 729 62 829
8 700 19 115 30 991 41 894 52 712 63 887
9 669 20 461 31 792 42 626 53 468 64 602
10 347 21 524 32 626 43 1120 54 841 65 403
11 580 22 943 33 937 44 440 55 613 66 505
Data debit di atas berasal dari data debit rerata harian selama 66 tahun, yang kemudian dicuplik nilai maksimum pada
setiap tahun.
1200
1000
Debit [m3/s]
800
600
400
200
0
0 10 20 30 40 50 60 70
Tahun ke-