STATISTIK DASAR
(UNTUK KLIMATOLOGI)
Oleh : Drs. Soetamto, Msi, Ir. Antoyo Setyadipratikto
I.
PENDAHULUAN Ilmu statistik adalah ilmu yang berhubungan dengan metode untuk pengumpulan data,
penyajian, analisa serta penarikan kesimpulannnya. Karena klimatologi berhubungan dengan data-data yang telah terjadi ( historical data ) , agar data-data ini menghasilkan informasi yang lebih jelas digunakan ilmu statistik. Metoda statistik ini dapat dibedakan menjadi 2, yaitu : Statistik deskriptif ( descriptive statistics ) yang juga disebut statistik deduktif ( deductive statistics ), yaitu statistik yang hanya menggambarkan dan menganalisa data yang ada tanpa menarik kesimpulan atau tujuan lain lebih lanjut. Penyajian datanya dapat dalam bentuk tabel, grafik dan sebagainya. Statistik induktif ( inductive statistics ) atau statistik inferens ( statistical inference ) , yaitu statistik yang bertujuan untuk menganalisis karakteristik menarik kesimpulankesimpulan dari hasil deskriptifnya, lebih jauh statistik induktif ini berhubungan dengan peramalan ( forecasting ). II. VARIABEL DALAM STATISTIK Variabel dalam statistik adalah set dari nilai yang sering juga disebut domain. Notasi variabel adalah huruf besar, seperti : A, B, X, Y dsb. Jika variabel hanya berisi satu nilai disebut konstanta. Varaiabel dalam statistik dapat dibedakan menjadi 2, yaitu :
temasuk
- Data curah hujan ( mm ,1 desimal ) : 0, 2.4, 36.4, 0, 87.9, ........ - Suhu udara ( Celcius ) - Tekanan udara ( mb ) : -3.4, ; 1011.5, 2,7, 11.2, -1.2, 17.4 ....... 1013.2 , 1010.9 .............
yang anggotanya
B = Himpunan Bulat.
Contoh : - Data curah hujan ( mm , 0 desimal ) : 0, 2, 36, 0, 88, ............. - Hari hujan - Data banyaknya siklon tropis - Jumlah penduduk : 5, 7, 0, 4, ...................... : 2, 3, 5, 7, 3, .................. : 1023, 789, 2134, .........
Data hari hujan , siklon tropis dan jumlah penduduk tidak dimungkinkan kontinyu, karena tidak ada data : 1,2 , 2,6, 787,2 untuk hari hujan, siklon tropis maupun jumlah penduduk.
III. DISTRIBUSI FREKWENSI Distribusi frekwensi dapat diartikan sebagai pengelompokkan data kedalam kategorikategori atau kelas-kelas. Banyaknya data yang berada dalam kelas masing-masing disebut frekwensi. Distribusi frekwensi ini dimaksudkan untuk lebih mudah menganalisis data dimaksud. III.1 JENIS DISTRIBUSI FREKWENSI Distribusi frekwensi dapat dibedakan menjadi data bernilai tunggal. Contoh : Data curah hujan (mm) : 0, 16, 4, 5, 15, 0, 11, 6, 12, 7, 12, 34, 19, 18, 17, 21, 10, 27, 6, 10, 10, 23, 17, 27, 6, 16, 21, 11, 12, 22, 16. :
12 13 14 15 16 17 18
18 19 21 22 23 27 34 Jumlah
1 1 2 1 1 2 1 31
23 24 26 27 28 30 31
Tabel 1. Frekwensi tunggal b. Distribusi frekwensi data yang dikelompokkan ( interval ). Distribusi frekwensi data yang dikelompokkan ini digunakan untuk data yang banyak sekali dengan nilai-nilai yang sangat veriatif. Karena distribusi frekwensi data yang dikelompokkan ini paling sering digunakan, maka istilah distribusi frekwensi sering ditujukan untuk distribusi frekwensi data yang dikelompokkan ini. Pengelompkan nilai-nilainya sangat tergantung pada kondisi data serta keperluannya, namun secara umum ada teori yang telah diturunkan oleh H.A. Sturges, sebagai berikut : Menentukan jumlah kelas :
k = 1 + 3.322 log n
k = banyaknya kelas. n = banyaknya data.
.......1
Contoh : lihat data hujan diatas. n = banyaknya data = 31, maka banyaknya kelas : k = 1 + 3.322 log 31 = 1 + 4.95 = 1 + 5 = 6 Menentukan jarak kelas ( range ) : 4
................ 2
........................................................ 3 i = interval kelas. R= range kelas , k = jumlah kelas. Contoh : lihat data hujan diatas. R = 34, k = 6, maka : . i = 34 / 6 = 5,666 . Karena i umumnya diambil harga bulat, maka i = 5, atau i = 6 Umumnya untuk kelaziman interval kelas diambil nilai 5, atau kelipatannya. Jika diambil interval kelas = 5, maka distribusi dari data diatas sebagai berikut :
No 1 2 3 4 5 6 7
Frekwensi 3 5 8 8 4 2 1 31
Frekwensi kumulatif 3 8 16 24 28 30 31
Tabel 2. Frekwensi data yang dikelompokkan. c. Distribusi frekwensi lainnya hanya berkaitan dengan teknik penyajiannya, seperti : Distribusi Frekwensi Relatif , Distribusi Frekwensi Kumulatif. Karena kedua distribusi diatas kurang banyak digunakan dalam klimatologi maka tidak dibahas dalam tulisan ini.
III.2. GRAFIK DISTRIBUSI FREKWENSI Teknik penyajian distribusi frekwensi dalam bentuk grafik, diantaranya : Histogram frekwensi, poligon frekwensi serta ogive. Contoh-contoh grafik berdasar data tabel 2, yaitu : - Histogram (Gambar 3a ) , pada histogram, batas balok ( bar ) adalah tepi kelas. Tepi kelas ke 1 = (4 + 5) / 2 = 4.5 Tepi kelas ke 2 = (9 + 10) / 2 = 9.5 dan seterusnya Catatan : tepi kelas ada 2, yaitu tepi kelas atas dan tepi kelas bawah, tepi kelas atas interfal kelas ke 1 merupakan tepi kelas bawah interval kelas ke 2.
Gambar 3a. Grafik histogram. - Poligon (Gambar 3b ) , pada poligon batas nilai ditetapkan dari nilai tengah kelas. Nilai tengah kelas ke 1 = ( 0 + 4 ) / 2 = 2 Nilai tengah kelas ke 2 = ( 5 + 9 ) / 2 = 7 dan seterusnya.
Teori ini diturunkan berdasar data-data empiris di alam umumnnya berkecenderungan memusat ke sebuah nilai. Nilai nilai inilah yang ditetapkn sebagai ukuran tendensi memusat ( measure of central tendency ). Ukuran tendensi pusat yang sering digunakan dalam statistik, diantaranya : Rata rata hitung ( mean ). Nilai tengah ( median ). Nilai yang paling sering muncul ( mode ). Selain ini ada ukuran tendensi pusat untuk tujuan-tujuan khusus, seperti : rata- rata ukur dan rata-rata harmonis. IV. 1. RATA RATA HITUNG Rata rata hitung ( mean ) dengan notasi , mempunyai formula :
...................................................................... 4
................ 5
fi = frekwensi kelas ke i
k = jumlah kelas n = banyaknya data i = 1, 2, 3, .................................. , k
= 1 / 31 ( 2x3 + 7x5 + 12x8 + 17x8 + 22x4 + 27x2 + 32x1 ) = 14,419 IV. 2. NILAI TENGAH ( MEDIAN ) Median adalah nilai yang membagi distribusi frekwensi menjadi 2 bagian yang sama. Notasi median Md. Karena median membagi seluruh data menjadi 2 sama banyak, maka sebelum menentukan median seluruh data harus diurutkan mulai dari kecil hingga yang besar. Kemudian letak median dihitung berdasar formula :
a. Median data yang tidak dikelompokkan: - jika jumlah data ganjil, letak median ditentukan berdasar formula : 9
.................................. 6
Contoh : lihat data hujan. 1. Jika jumlah data ganjil Data setelah diurutkan menjadi : 0, 0, 4, 5, 6, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16, 17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34. n = Jumlah data = 31 ganjil, maka : K1 = letak median = ( 31 +1 ) /2 = 16 Jadi median = data yang terletak pada urutan ke 16. Md = 12
Data setelah diurutkan menjadi : 0, 0, 4, 5, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16, 17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34. n = Jumlah data = 30 genap, maka : K1 = ( 30 ) / 2 = 15 ; K2 = ( 32 ) / 2 = 16 Jadi median = ( data ke 15 + data ke 16 ) / 2. Md = (12 + 15 ) = 13.5 b. Median data yang dikelompokkan Formula median untuk data yang dikelompokkan, adalah :
................................ 8 Md = Median. B n f = Tepi kelas bawah dari interval dimana median terletak. = Jumlah data. = Frekwensi kumulatif yang bersesuaian dengan tepi kelas dalam interval dimana median terletak. f m = Frekwensi kumulatif yang bersesuaian dengan tepi kelas atas dalam i interval dimana median terletak. = Interval kelas.
11
Median = 9.5 +
[ ( 15.5 -8 ) / ( 16 8 ) ] x 5 =
Gambar 4. Contoh perhitungan median data yang dikelompokkan. IV.3. MODUS Modus adalah nilai yang paling sering muncul, atau frekwensi terbanyak. Jika set data hanya mempunyai satu modus disebut unimodal, jika mempunyai 2 modus disebut bimodal, sedang jika mempunyai modus lebih dari 2 disebut multimodal. a. Modus data yang tidak dikelompokkan. Menentukan modus data yang tidak dikelompokkan sangatlah mudah, yaitu dengan melihat frekwensi terbesarnya. Contoh : lihat data tabel 1. Modus 1 = 6 Modus 2 = 10 Modus 3 = 12 Modus 4 = 16
1 = Slisih frekwensi kelas modus terletak dengan kelas sebelumnya. 2 = Slisih frekwensi kelas modus terletak dengan kelas sesudahnya.
i
.
= Interval kelas.
Jika data hanya memiliki satu modus, contoh perhitungannya sebagai berikut :
Gambar 5. Contoh perhitungan modus data yang dikelompokkan. Modus 1 = 9.5 + [3 / ( 3 + 4 ) ] x 5 = 9.5 + 2.1428 = 11.6428
Dispersi adalah sebaran data, parameter parameter yang digunakan untuk mengukur sebaran data, diantaranya : V. 1. RANGE Range ialah jarak data, dengan formula selisih data maksimum dengan minimum. Contoh : dari tabel 1. Range = 34 0 = 34 V. 2. VARIASI ( VARIANCE ) DAN SIMPANGAN BAKU ( STANDARD DEVIATION ) Pengukuran dispersi yang paling sering digunakan dalam statistik adalah, varians dan deviasi stndar. Ukuran sebaran ini dihitung dari nilai rata-rata hitung. Formula varians dan deviasi standar, sebagai berikut :
a. Varians dan Standar Deviasi untuk data yang tidak dikelompokkan : Untuk n > 100
14
= jumlah data
Xi = data ke i
; i
= 1, 2, 3, .....................n
Pada umumnya saat ini perhitungan varians dan standar deviasi dilakukan melalui Program-program yang tersedia di komputer. Contoh : lihat data tabel 1. Dari perhitungan didapat : Varians =......
15
..........................13.a
= jumlah data ;
fi = jumlah frekwensi ke i
Standar Deviasi = .............. VI. ANALISA BIVARIAT Salah satu analisis yang sering dilakukan dalam klimatologi adalah analisa hubungan anatara 2 variabel ( bivariat ). Analisis ini dapat dilakukan melalui berbagai cara, diantaranya : SCATER PLOT ANALISIS 16
Analisis ini dilakukan dengan cara memplot kedua variabel dalam satu grafik, dan hasilnya dianalisis sebagai berikut :
17
KORELASI PEARSON Jika scater plot korelasi yang didapat lebih bersifat kualitatif, maka untuk mendapatkan gambaran kuantitatifnya.
Salah satu metoda untuk menganalisis tingkat hubungan antara 2 variabel, iyalah korelasi Pearson, yang formulanya :
18
antara dua variabel dapat dilihat dari besarnya nilai r tanpa melihat tandanya , sbb :
v v v v v v v
lemah
makin kuat
kuat
r negatif ( > 0 ) , berarti hubungan terbalik : jika Y naik X turun , dan jika
Y turun X naik.
r positif ( > 0 ) , berarti hubungan sebanding : jika Y naik X naik , dan jika
jika Y turun X turun.
19
Daftar Pustaka : 1. 2. Anto Dajan ( 1986 ). Pengantar Metode Statistik, Jilid I. LP3ES, Jakarta. Allen L. Edwards ( 1966 ). Statistical Methods for the Behavioral Sciences. Holt, Rinehart and Winston, New York. 3. Albert E. Waugh ( 1952 ). Element of Statistical Method, third edition. McGraw Hill Book Company, New York. 4. David G. Kleinbaum, Lawrence L. Kupper ( 1978 ) . Applied Regression Analysis and Other Multivariate Method, Duxbury Press, Massachusetts. 5. Frederick K. Lutgens , Edward J. Tarbuck ( 1998 ). The Atmosphere : 07458. 6. Takahashi , Syunji., 2002. : Statistical Methode for Long Range Forecast, Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada : Workshop on Climate System Monitoring, Diagnosis and Prediction in the AsiaPacifik Region., Tokyo. 7. Takano, Kiyoharu., 2002. : Probabilistic Forecast, Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada : Workshop on Climate System Monitoring, Diagnosis and Prediction in the AsiaPacifik., Region, Tokyo. 8. Tomoaki, Ose., 2002. : Dynamical Longe Range Forecast, Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada : Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia Pacifik Region, Tokyo. An
Introduction to Meteorology. Prenticed - Hall, Inc. Upper Saddle River, New Jersey
9. Wilks, Daniel.S., 1995 : Statistical Methods in the Atmospheric Sciences, Academic Press, San Diego. 20