Dasar Statistik

MATERI KULIAH AKADEMI METEOROLOGI KLIMATOLOGI & GEOFISIKA
STATISTIK DASAR
(UNTUK KLIMATOLOGI)
Oleh : Drs. Soetamto, Msi, Ir. Antoyo Setyadipratikto
I.
PENDAHULUAN Ilmu statistik adalah ilmu yang berhubungan dengan metode untuk pengumpulan data,
penyajian, analisa serta penarikan kesimpulannnya. Karena klimatologi berhubungan dengan data-data yang telah terjadi ( historical data ) , agar data-data ini menghasilkan informasi yang lebih jelas digunakan ilmu statistik. Metoda statistik ini dapat dibedakan menjadi 2, yaitu : Statistik deskriptif ( descriptive statistics ) yang juga disebut statistik deduktif ( deductive statistics ), yaitu statistik yang hanya menggambarkan dan menganalisa data yang ada tanpa menarik kesimpulan atau tujuan lain lebih lanjut. Penyajian datanya dapat dalam bentuk tabel, grafik dan sebagainya. Statistik induktif ( inductive statistics ) atau statistik inferens ( statistical inference ) , yaitu statistik yang bertujuan untuk menganalisis karakteristik menarik kesimpulankesimpulan dari hasil deskriptifnya, lebih jauh statistik induktif ini berhubungan dengan peramalan ( forecasting ). II. VARIABEL DALAM STATISTIK Variabel dalam statistik adalah set dari nilai yang sering juga disebut domain. Notasi variabel adalah huruf besar, seperti : A, B, X, Y dsb. Jika variabel hanya berisi satu nilai disebut konstanta. Varaiabel dalam statistik dapat dibedakan menjadi 2, yaitu :
Variabel kontinyu, yaitu variabel
yang anggotanya bilangan real
temasuk
didalamnya bilangan-bilangan ratio. ( Gambar . 1 ).
Gambar 1. Garis bilangan variabel kontinyu X. Contoh :
R = Himpunan bilangan Real.
- Data curah hujan ( mm ,1 desimal ) : 0, 2.4, 36.4, 0, 87.9, ........ - Suhu udara ( Celcius ) - Tekanan udara ( mb ) : -3.4, ; 1011.5, 2,7, 11.2, -1.2, 17.4 ....... 1013.2 , 1010.9 .............
Variabel diskrit, yaitu variabel ( Gambar . 2 ).
yang anggotanya
hanya bilangan bulat
Gambar 2. Garis bilangan variabel diskrit X.
B = Himpunan Bulat.
Contoh : - Data curah hujan ( mm , 0 desimal ) : 0, 2, 36, 0, 88, ............. - Hari hujan - Data banyaknya siklon tropis - Jumlah penduduk : 5, 7, 0, 4, ...................... : 2, 3, 5, 7, 3, .................. : 1023, 789, 2134, .........
Catatan : data curah hujan dimungkinkan continyu atau diskrit.
Data hari hujan , siklon tropis dan jumlah penduduk tidak dimungkinkan kontinyu, karena tidak ada data : 1,2 , 2,6, 787,2 untuk hari hujan, siklon tropis maupun jumlah penduduk.
III. DISTRIBUSI FREKWENSI Distribusi frekwensi dapat diartikan sebagai pengelompokkan data kedalam kategorikategori atau kelas-kelas. Banyaknya data yang berada dalam kelas masing-masing disebut frekwensi. Distribusi frekwensi ini dimaksudkan untuk lebih mudah menganalisis data dimaksud. III.1 JENIS DISTRIBUSI FREKWENSI Distribusi frekwensi dapat dibedakan menjadi data bernilai tunggal. Contoh : Data curah hujan (mm) : 0, 16, 4, 5, 15, 0, 11, 6, 12, 7, 12, 34, 19, 18, 17, 21, 10, 27, 6, 10, 10, 23, 17, 27, 6, 16, 21, 11, 12, 22, 16. :
a. Distribusi frekwensi tunggal : jika kategori atau kelas untuk mendistribusikan
Distribusi frekwensi tunggalnya : No. 1 2 3 4 5 6 7 8 9 10 11 Nilai 0 4 5 6 7 10 11 12 15 16 17 Frekwensi 2 1 1 3 1 3 2 3 1 3 2 3 Frekwensi kumulatitf 2 3 4 7 8 11 13 16 17 20 22
12 13 14 15 16 17 18
18 19 21 22 23 27 34 Jumlah
1 1 2 1 1 2 1 31
23 24 26 27 28 30 31
Tabel 1. Frekwensi tunggal b. Distribusi frekwensi data yang dikelompokkan ( interval ). Distribusi frekwensi data yang dikelompokkan ini digunakan untuk data yang banyak sekali dengan nilai-nilai yang sangat veriatif. Karena distribusi frekwensi data yang dikelompokkan ini paling sering digunakan, maka istilah distribusi frekwensi sering ditujukan untuk distribusi frekwensi data yang dikelompokkan ini. Pengelompkan nilai-nilainya sangat tergantung pada kondisi data serta keperluannya, namun secara umum ada teori yang telah diturunkan oleh H.A. Sturges, sebagai berikut : Menentukan jumlah kelas :
k = 1 + 3.322 log n
k = banyaknya kelas. n = banyaknya data.
.......1
Contoh : lihat data hujan diatas. n = banyaknya data = 31, maka banyaknya kelas : k = 1 + 3.322 log 31 = 1 + 4.95 = 1 + 5 = 6 Menentukan jarak kelas ( range ) : 4
R = nilai maksimum nilai minimum

R = jarak kelas. Contoh : lihat data hujan diatas.
................ 2
Nilai maksimum = 34, nilai minimum = 0, maka : . R = 34 0 = 34
Menentukan interval kelas :
........................................................ 3 i = interval kelas. R= range kelas , k = jumlah kelas. Contoh : lihat data hujan diatas. R = 34, k = 6, maka : . i = 34 / 6 = 5,666 . Karena i umumnya diambil harga bulat, maka i = 5, atau i = 6 Umumnya untuk kelaziman interval kelas diambil nilai 5, atau kelipatannya. Jika diambil interval kelas = 5, maka distribusi dari data diatas sebagai berikut :
Distribusi frekwensi data yang dikelompokkan : 5
No 1 2 3 4 5 6 7
Kelas 0-4 59 10 14 15 19 20 24 25 29 30 - 34 Jumlah
Frekwensi 3 5 8 8 4 2 1 31
Frekwensi kumulatif 3 8 16 24 28 30 31
Tabel 2. Frekwensi data yang dikelompokkan. c. Distribusi frekwensi lainnya hanya berkaitan dengan teknik penyajiannya, seperti : Distribusi Frekwensi Relatif , Distribusi Frekwensi Kumulatif. Karena kedua distribusi diatas kurang banyak digunakan dalam klimatologi maka tidak dibahas dalam tulisan ini.
III.2. GRAFIK DISTRIBUSI FREKWENSI Teknik penyajian distribusi frekwensi dalam bentuk grafik, diantaranya : Histogram frekwensi, poligon frekwensi serta ogive. Contoh-contoh grafik berdasar data tabel 2, yaitu : - Histogram (Gambar 3a ) , pada histogram, batas balok ( bar ) adalah tepi kelas. Tepi kelas ke 1 = (4 + 5) / 2 = 4.5 Tepi kelas ke 2 = (9 + 10) / 2 = 9.5 dan seterusnya Catatan : tepi kelas ada 2, yaitu tepi kelas atas dan tepi kelas bawah, tepi kelas atas interfal kelas ke 1 merupakan tepi kelas bawah interval kelas ke 2.
Gambar 3a. Grafik histogram. - Poligon (Gambar 3b ) , pada poligon batas nilai ditetapkan dari nilai tengah kelas. Nilai tengah kelas ke 1 = ( 0 + 4 ) / 2 = 2 Nilai tengah kelas ke 2 = ( 5 + 9 ) / 2 = 7 dan seterusnya.
Gambar 3b. Grafik poligon.
IV. TEORI KECENDERUNGAN MEMUSAT ( TENDENCY CENTRAL )
Teori ini diturunkan berdasar data-data empiris di alam umumnnya berkecenderungan memusat ke sebuah nilai. Nilai nilai inilah yang ditetapkn sebagai ukuran tendensi memusat ( measure of central tendency ). Ukuran tendensi pusat yang sering digunakan dalam statistik, diantaranya : Rata rata hitung ( mean ). Nilai tengah ( median ). Nilai yang paling sering muncul ( mode ). Selain ini ada ukuran tendensi pusat untuk tujuan-tujuan khusus, seperti : rata- rata ukur dan rata-rata harmonis. IV. 1. RATA RATA HITUNG Rata rata hitung ( mean ) dengan notasi , mempunyai formula :
a. Rata rata hitung data yang tidak dikelompokkan :
...................................................................... 4
= rata rata hitung n = banyaknya data i = 1, 2, 3, .................................. , n
Contoh : lihat dat tabel. 1 = 1 / 31 ( 0 + 16 + 4 + 5 + 15 + ...................... + 16 ) = 1 / 31 x ( 431 ) = 13,9032
b. Rata rata hitung data yang dikelompokkan : 8
................ 5
= rata rata hitung mi = nilai tengah interval ke i
fi = frekwensi kelas ke i
k = jumlah kelas n = banyaknya data i = 1, 2, 3, .................................. , k
Contoh : lihat data tabel. 2
= 1 / 31 ( 2x3 + 7x5 + 12x8 + 17x8 + 22x4 + 27x2 + 32x1 ) = 14,419 IV. 2. NILAI TENGAH ( MEDIAN ) Median adalah nilai yang membagi distribusi frekwensi menjadi 2 bagian yang sama. Notasi median Md. Karena median membagi seluruh data menjadi 2 sama banyak, maka sebelum menentukan median seluruh data harus diurutkan mulai dari kecil hingga yang besar. Kemudian letak median dihitung berdasar formula :
a. Median data yang tidak dikelompokkan: - jika jumlah data ganjil, letak median ditentukan berdasar formula : 9
.................................. 6
- jika jumlah data ganjil, letak median ditentukan berdasar formula :
............................. 7 K1 , K2 = letak median n Md = jumlah data = Median
Contoh : lihat data hujan. 1. Jika jumlah data ganjil Data setelah diurutkan menjadi : 0, 0, 4, 5, 6, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16, 17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34. n = Jumlah data = 31 ganjil, maka : K1 = letak median = ( 31 +1 ) /2 = 16 Jadi median = data yang terletak pada urutan ke 16. Md = 12
1. Jika jumlah data genap ( data hujan dikurangi 1, yaitu data ke 5 ( 6 ). 10
Data setelah diurutkan menjadi : 0, 0, 4, 5, 6, 6, 7, 10, 10, 10, 11, 11, 12, 12, 12, 15, 16, 16, 16, 17, 17, 18, 19, 21, 21, 22, 23, 27, 27, 34. n = Jumlah data = 30 genap, maka : K1 = ( 30 ) / 2 = 15 ; K2 = ( 32 ) / 2 = 16 Jadi median = ( data ke 15 + data ke 16 ) / 2. Md = (12 + 15 ) = 13.5 b. Median data yang dikelompokkan Formula median untuk data yang dikelompokkan, adalah :
................................ 8 Md = Median. B n f = Tepi kelas bawah dari interval dimana median terletak. = Jumlah data. = Frekwensi kumulatif yang bersesuaian dengan tepi kelas dalam interval dimana median terletak. f m = Frekwensi kumulatif yang bersesuaian dengan tepi kelas atas dalam i interval dimana median terletak. = Interval kelas.
Contoh : dari data tabel 2
11
Median = 9.5 +
[ ( 15.5 -8 ) / ( 16 8 ) ] x 5 =
9.5 + 4.6875 = 14.1875.
Gambar 4. Contoh perhitungan median data yang dikelompokkan. IV.3. MODUS Modus adalah nilai yang paling sering muncul, atau frekwensi terbanyak. Jika set data hanya mempunyai satu modus disebut unimodal, jika mempunyai 2 modus disebut bimodal, sedang jika mempunyai modus lebih dari 2 disebut multimodal. a. Modus data yang tidak dikelompokkan. Menentukan modus data yang tidak dikelompokkan sangatlah mudah, yaitu dengan melihat frekwensi terbesarnya. Contoh : lihat data tabel 1. Modus 1 = 6 Modus 2 = 10 Modus 3 = 12 Modus 4 = 16
b. Modus data yang dikelompokkan. 12
..................................... 9 Mo = Modus B = Tepi bawah kelas dimana kelas modus terletak.
1 = Slisih frekwensi kelas modus terletak dengan kelas sebelumnya. 2 = Slisih frekwensi kelas modus terletak dengan kelas sesudahnya.
i
.
= Interval kelas.
Jika data hanya memiliki satu modus, contoh perhitungannya sebagai berikut :
Gambar 5. Contoh perhitungan modus data yang dikelompokkan. Modus 1 = 9.5 + [3 / ( 3 + 4 ) ] x 5 = 9.5 + 2.1428 = 11.6428
V. SEBARAN DATA ( DISPERSI ) 13
Dispersi adalah sebaran data, parameter parameter yang digunakan untuk mengukur sebaran data, diantaranya : V. 1. RANGE Range ialah jarak data, dengan formula selisih data maksimum dengan minimum. Contoh : dari tabel 1. Range = 34 0 = 34 V. 2. VARIASI ( VARIANCE ) DAN SIMPANGAN BAKU ( STANDARD DEVIATION ) Pengukuran dispersi yang paling sering digunakan dalam statistik adalah, varians dan deviasi stndar. Ukuran sebaran ini dihitung dari nilai rata-rata hitung. Formula varians dan deviasi standar, sebagai berikut :
a. Varians dan Standar Deviasi untuk data yang tidak dikelompokkan : Untuk n > 100
................................ 11.a Untuk n < 100
...................................11.b Untuk n > 100
14
.................................. 12.a Untuk n < 100
12.b. S2 = Varians ; S = Deviasi Standar = rata-rata hitung ;
= jumlah data
Xi = data ke i
; i
= 1, 2, 3, .....................n
Pada umumnya saat ini perhitungan varians dan standar deviasi dilakukan melalui Program-program yang tersedia di komputer. Contoh : lihat data tabel 1. Dari perhitungan didapat : Varians =......
Standar Deviasi = ..............
b. Varians dan Standar Deviasi untuk data yang dikelompokkan :
15
..........................13.a
......................... 13.b S2 = Varians ; S = Deviasi Standar = rata-rata hitung ;
= jumlah data ;
Xi = titik tengah kelas ke i i = 1, 2, 3, .....................n
fi = jumlah frekwensi ke i
Contoh : lihat data tabel 2. Dari perhitungan didapat : Varians =......
Standar Deviasi = .............. VI. ANALISA BIVARIAT Salah satu analisis yang sering dilakukan dalam klimatologi adalah analisa hubungan anatara 2 variabel ( bivariat ). Analisis ini dapat dilakukan melalui berbagai cara, diantaranya : SCATER PLOT ANALISIS 16
Analisis ini dilakukan dengan cara memplot kedua variabel dalam satu grafik, dan hasilnya dianalisis sebagai berikut :
Gambar 6a. Variabel 1 berhubungan Linear dengan variabel 2 ( korelasi positif ).
Gambar 6b. Variabel 1 berhubungan linear dengan variabel 2 ( korelasi negatif ).
Gambar 7a. Variabel 1 berhubungan Tidak Linear (kuadrat ) dengan variabel 2.
Gambar 7b. Variabel 1 berhubungan tidak linear (kuadrat) dengan variabel 2.
17
Gambar 8. Tidak ada hubungan antara variabel 1 dengan variabel 2.
KORELASI PEARSON Jika scater plot korelasi yang didapat lebih bersifat kualitatif, maka untuk mendapatkan gambaran kuantitatifnya.
Salah satu metoda untuk menganalisis tingkat hubungan antara 2 variabel, iyalah korelasi Pearson, yang formulanya :
.. 14. r = korelasi Pearson n = jumlah data Xi = variabel pertama ke i Yi = variabel kedua ke i
18
Nilai r adalah berkisar antara
-1 hingga +1, tingkat kuat / tidaknya hubungan
antara dua variabel dapat dilihat dari besarnya nilai r tanpa melihat tandanya , sbb :
r = 0 .. tidak ada hubungan

. .
v v v v v v v
lemah
r = 0,5 .. ada hubungan sedang

. .
makin kuat
r = 1,0 .hubungan sempurna

Sifat hubungan ditentukan oleh tanda r , sbb :
kuat
r negatif ( > 0 ) , berarti hubungan terbalik : jika Y naik X turun , dan jika
Y turun X naik.
r positif ( > 0 ) , berarti hubungan sebanding : jika Y naik X naik , dan jika
jika Y turun X turun.
19
Daftar Pustaka : 1. 2. Anto Dajan ( 1986 ). Pengantar Metode Statistik, Jilid I. LP3ES, Jakarta. Allen L. Edwards ( 1966 ). Statistical Methods for the Behavioral Sciences. Holt, Rinehart and Winston, New York. 3. Albert E. Waugh ( 1952 ). Element of Statistical Method, third edition. McGraw Hill Book Company, New York. 4. David G. Kleinbaum, Lawrence L. Kupper ( 1978 ) . Applied Regression Analysis and Other Multivariate Method, Duxbury Press, Massachusetts. 5. Frederick K. Lutgens , Edward J. Tarbuck ( 1998 ). The Atmosphere : 07458. 6. Takahashi , Syunji., 2002. : Statistical Methode for Long Range Forecast, Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada : Workshop on Climate System Monitoring, Diagnosis and Prediction in the AsiaPacifik Region., Tokyo. 7. Takano, Kiyoharu., 2002. : Probabilistic Forecast, Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada : Workshop on Climate System Monitoring, Diagnosis and Prediction in the AsiaPacifik., Region, Tokyo. 8. Tomoaki, Ose., 2002. : Dynamical Longe Range Forecast, Climate Prediction Division, Japan Meteorological Agency, Bahan Presentasi pada : Workshop on Climate System Monitoring, Diagnosis and Prediction in the Asia Pacifik Region, Tokyo. An
Introduction to Meteorology. Prenticed - Hall, Inc. Upper Saddle River, New Jersey
9. Wilks, Daniel.S., 1995 : Statistical Methods in the Atmospheric Sciences, Academic Press, San Diego. 20

Dasar Statistik

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Dasar Statistik

Diunggah oleh

Hak Cipta:

Format Tersedia

MATERI KULIAH AKADEMI METEOROLOGI KLIMATOLOGI & GEOFISIKA

Variabel kontinyu, yaitu variabel

yang anggotanya bilangan real

didalamnya bilangan-bilangan ratio. ( Gambar . 1 ).

Gambar 1. Garis bilangan variabel kontinyu X. Contoh :

R = Himpunan bilangan Real.

Variabel diskrit, yaitu variabel ( Gambar . 2 ).

hanya bilangan bulat

Gambar 2. Garis bilangan variabel diskrit X.

Catatan : data curah hujan dimungkinkan continyu atau diskrit.

a. Distribusi frekwensi tunggal : jika kategori atau kelas untuk mendistribusikan

Distribusi frekwensi tunggalnya : No. 1 2 3 4 5 6 7 8 9 10 11 Nilai 0 4 5 6 7 10 11 12 15 16 17 Frekwensi 2 1 1 3 1 3 2 3 1 3 2 3 Frekwensi kumulatitf 2 3 4 7 8 11 13 16 17 20 22

R = nilai maksimum nilai minimum

Nilai maksimum = 34, nilai minimum = 0, maka : . R = 34 0 = 34

Menentukan interval kelas :

Distribusi frekwensi data yang dikelompokkan : 5

Kelas 0-4 59 10 14 15 19 20 24 25 29 30 - 34 Jumlah

Gambar 3b. Grafik poligon.

IV. TEORI KECENDERUNGAN MEMUSAT ( TENDENCY CENTRAL )

a. Rata rata hitung data yang tidak dikelompokkan :

= rata rata hitung n = banyaknya data i = 1, 2, 3, .................................. , n

Contoh : lihat dat tabel. 1 = 1 / 31 ( 0 + 16 + 4 + 5 + 15 + ...................... + 16 ) = 1 / 31 x ( 431 ) = 13,9032

b. Rata rata hitung data yang dikelompokkan : 8

= rata rata hitung mi = nilai tengah interval ke i

Contoh : lihat data tabel. 2

- jika jumlah data ganjil, letak median ditentukan berdasar formula :

............................. 7 K1 , K2 = letak median n Md = jumlah data = Median

1. Jika jumlah data genap ( data hujan dikurangi 1, yaitu data ke 5 ( 6 ). 10

Contoh : dari data tabel 2

9.5 + 4.6875 = 14.1875.

b. Modus data yang dikelompokkan. 12

..................................... 9 Mo = Modus B = Tepi bawah kelas dimana kelas modus terletak.

V. SEBARAN DATA ( DISPERSI ) 13

................................ 11.a Untuk n < 100

...................................11.b Untuk n > 100

.................................. 12.a Untuk n < 100

12.b. S2 = Varians ; S = Deviasi Standar = rata-rata hitung ;

Standar Deviasi = ..............

b. Varians dan Standar Deviasi untuk data yang dikelompokkan :

......................... 13.b S2 = Varians ; S = Deviasi Standar = rata-rata hitung ;

Xi = titik tengah kelas ke i i = 1, 2, 3, .....................n

Contoh : lihat data tabel 2. Dari perhitungan didapat : Varians =......

Gambar 6a. Variabel 1 berhubungan Linear dengan variabel 2 ( korelasi positif ).

Gambar 6b. Variabel 1 berhubungan linear dengan variabel 2 ( korelasi negatif ).

Gambar 7a. Variabel 1 berhubungan Tidak Linear (kuadrat ) dengan variabel 2.

Gambar 7b. Variabel 1 berhubungan tidak linear (kuadrat) dengan variabel 2.

Gambar 8. Tidak ada hubungan antara variabel 1 dengan variabel 2.

.. 14. r = korelasi Pearson n = jumlah data Xi = variabel pertama ke i Yi = variabel kedua ke i

Nilai r adalah berkisar antara

-1 hingga +1, tingkat kuat / tidaknya hubungan

r = 0 .. tidak ada hubungan

r = 0,5 .. ada hubungan sedang

r = 1,0 .hubungan sempurna

Anda mungkin juga menyukai