STATISTIKA
Asisten:
Umar Abdurrahman
12914008
Dosen:
2018
Praktikum Metode Analisis Data Oseanografi (OS3102)
Modul II - Statistika
I. Tujuan Praktikum
1. Menyajikan data Oseanografi
2. Memahami metode dan tujuan penyajian data secara statistik
Statistika adalah ilmu yang berkaitan dengan cara pengumpulan, pengolahan, analisis, dan
penarikan kesimpulan atas data (Mukhaiyar, 2012). Beberapa ukuran data yang secara umum
digunakan khususnya dalam bidang keilmuan oseanografi adalah :
1. Mean
Rata-rata adalah suatu bilangan yang mewakili sekumpulan data. Secara umum jenis rata-rata
yang digunakan adalah arithmetic mean (AM) dihitung dengan cara nilai jumlah sampel dibagi
dengan jumlah (http://www.sengpielaudio.com/calculator-geommean.htm).
∑𝑛𝑖=1 𝑥𝑖
𝑥̅ =
𝑛
Kovarian merupakan hubungan linier antara beberapa variabel atau ukuran korelasi antara dua
(atau lebih) variabel acak. Kovariansi antara dua peubah acak menunjukkan sifat asosiasi
(hubungan) antara keduanya. Persamaannya adalah:
Kovariansi
1
Praktikum Metode Analisis Data Oseanografi (OS3102)
Modul II - Statistika
𝑛
1
cov(𝑥, 𝑦) = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑛−1
𝑖=1
Korelasi adalah bentuk normalisasi dari kovarian. Kovarian tidak memiliki batas maksimal dan
minimal karena bergantung pada data yang ada, sementara korelasi sudah dinormalisasi,
sehingga membantu untuk membuat derajat hubungan antar variabel.
Korelasi
cov(𝑥, 𝑦) ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
corr(𝑥, 𝑦) = =
𝜎𝑥 𝜎𝑦 √∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2
3. Variansi dan Standar Deviasi
Oleh karena itu, solusi agar nilainya tidak menjadi 0 adalah dengan mengkuadratkan setiap
pengurangan nilai data dan rata-rata kelompok data tersebut, selanjutnya dilakukan
penjumlahan. Hasil penjumlahan kuadrat (sum of squares) tersebut akan selalu bernilai positif.
Nilai varian diperoleh dari pembagian hasil penjumlahan kuadrat (sum of squares) dengan
ukuran data (n).
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠2 =
𝑛
Namun begitu, dalam penerapannya, nilai varian tersebut bias untuk menduga varian populasi.
Dengan menggunakan rumus tersebut, nilai varian populasi lebih besar dari varian sampel.
Oleh karena itu, agar tidak bias dalam menduga varian populasi, maka n sebagai pembagi
penjumlahan kuadrat (sum of squares) diganti dengan n-1 (derajat bebas) agar nilai varian
sampel mendekati varian populasi. Oleh karena itu rumus varian sampel menjadi:
2
Praktikum Metode Analisis Data Oseanografi (OS3102)
Modul II - Statistika
2
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2
𝑠 =
𝑛−1
Nilai varian yang dihasilkan merupakan nilai yang berbentuk kuadrat. Misalkan satuan nilai
rata-rata adalah gram, maka nilai varian adalah gram kuadrat. Untuk menyeragamkan nilai
satuannya maka varian diakarkuadratkan sehingga hasilnya adalah standar deviasi (simpangan
baku).
4. Bias
Penyimpangan atau kesalahan yang dapat timbul dalam suatu penelitian disebut bias. Bias
adalah perbedaan antara hasil sesungguhnya dalam populasi dengan hasil semua sampel yang
berasal dari populasi tersebut. Bias dapat juga didefinisikan sebagai parameter statistic dimana
hasil yang diharapkan berbeda dengan nilai yang diperkirakan.
RMSE adalah metode alternatif untuk mengevaluasi teknik peramalan yang digunakan, untuk
mengukur tingkat akurasi hasil prakiraan suatu model. RMSE merupakan nilai rata-rata dari
jumlah kuadrat kesalahan, juga dapat menyatakan ukuran besarnya kesalahan yang dihasilkan
oleh suatu model prakiraan. Nilai RMSE rendah menunjukkan bahwa variasi nilai yang
dihasilkan oleh suatu model prakiraan mendekati variasi nilai obeservasinya (Makridakis, S.,
dkk, 1982). RMSE secara tidak langsung akan mewakili standar deviasi dari sampel data yang
digunakan untuk estimasi dan dalam hal ini dapat disebut sebagai kesalahan prediksi
(Hyndman, dkk., 2006). Dengan kata lain RMSE memberitahu bagaimana data terkonsentrasi
di sekitar garis best of fit (http://www.statisticshowto.com/rmse/).
3
Praktikum Metode Analisis Data Oseanografi (OS3102)
Modul II - Statistika
RMSE
∑𝑛𝑖=1(𝑥2,𝑖 − 𝑥1,𝑖 )2
RMSE = √
𝑛
Normalisasi RMSE bertujuan untuk membandingkan data antara dataset dengan skala yang
berbeda. Meskipun tidak ada cara normalisasi yang konsisten dalam literature, yang digunakan
secara umum adalah mean atau range dari dataset tersebut (CIRP, 2015). Seringkali ditampilkan
dalam bentuk persentase, dengan nilai rendah mengindikasikan variansi residual yang kecil.
NRMSE
RMSE RMSE
NRMSE = 𝑥 atau NRMSE =
𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛 𝑥̅
Selain didapatkan dari ukuran-ukuran data tersebut, informasi berdasarkan data-data yang ada
dapat diperoleh dan disajikan dalam bentuk grafik.
4
Praktikum Metode Analisis Data Oseanografi (OS3102)
Modul II - Statistika
1. Histogram
Pada bidang statistik, histogram adalah tampilan grafis dari tabulasi frekuensi yang
digambarkan dengan grafis batangan sebagai manifestasi data binning. Tiap tampilan batang
menunjukkan proporsi frekuensi pada masing-masing deret kategori yang berdampingan
(en:adjacent) dengan interval yang tidak tumpang tindih (en:non-overlapping).
2. Scatterplot
Sebuah scatter plot (juga disebut scatterplot, scatter graph, scatter chart, scattergram, atau
scatter diagram) (Jarrel, 1994) adalah sejenis plot atau diagram matematis dengan
menggunakan koordinat Cartesian untuk menampilkan nilai biasanya dua variabel untuk satu
set data. Jika titik diberi kode warna, satu variabel tambahan dapat ditampilkan. Data
ditampilkan sebagai kumpulan titik, masing-masing memiliki nilai satu variabel yang
menentukan posisi pada sumbu horizontal dan nilai variabel lainnya yang menentukan posisi
pada sumbu vertical (Cleveland, 1993).
3. Plot Horisontal
IV. Metodologi
Data yang digunakan dalam praktikum ini adalah :
1. Data Observasi SST, Subsurface Temperature, dan Angin (monthly) yang didownload
dari
http://www.pmel.noaa.gov/tao/drupal/disdel/
2. Data Satelit menggunakan data dari
http://coastwatch.pfeg.noaa.gov/erddap/info/index.html?page=1&itemsPerPage=1000
5
Praktikum Metode Analisis Data Oseanografi (OS3102)
Modul II - Statistika
Data Observasi dan Satelit untuk SST, Subsurface Temperature, dan Angin dengan pembagian
sebagai berikut :
1. Kelompok I : (0o, 155o E); (0o, 170o W); (0o, 95o W) tahun 2006-2008
2. Kelompok II : (0o, 165o E); (0o, 170o W); (0o, 140o W) tahun 2009-2011
3. Kelompok III : (0o, 156o E); (0o, 140o W); (0o, 110o W) tahun 2009-2011
4. Kelompok IV : (0o, 180o W); (0o, 155o W); (0o, 125o W) tahun 2014-2016
5. Kelompok V : (0o, 165o E); (0o, 170o W); (0o, 125o W) tahun 2014-2016
Tugas Praktikum
1. Tugas 1 : Lakukan perbandingan antara data satelit terhadap data observasi dengan
menghitung korelasi, kovariansi, bias, variansi, standar deviasi, RMSE, dan NRMSE
2. Tugas 2 : Sajikan perbandingan data dalam scatter plot dan bias data dalam
histogram (bagi dalam 5 kelas)
3. Tugas 3 : Lakukan perbandingan melalui korelasi antara besar kecepatan angin
permukaan dan temperatur terhadap kedalaman di setiap titik
4. Tugas 4 : Plot profil temperatur terhadap kedalaman perataan musiman
5. Tugas 5 : Plot horisontal untuk SST dan besarnya kecepatan angin terhadap waktu
lakukan perataan musiman
6. Tugas 6 : Plot timeseries tinggi gelombang signifikan, histogram tinggi gelombang
signifikan, dan Bivariate Diagram (tinggi gelombang signifikan dan periode gelombang
signifikan)
Lakukan analisis dari hasil yang didapat. Hubungkan dengan fenomena yang terjadi dan yang
relevan pada daerah kajian.
6
Praktikum Metode Analisis Data Oseanografi (OS3102)
Modul II - Statistika
Daftar Pustaka
Cleveland, William (1993). Visualizing data. Murray Hill, N.J. Summit, N.J: At & T Bell
Laboratories Published by Hobart Press. ISBN 978-0963488404.
Hyndman, Rob J.; Koehler, Anne B. (2006). "Another look at measures of forecast accuracy".
International Journal of Forecasting. 22 (4): 679–688. doi:10.1016/j.ijforecast.2006.03.001.
Jarrell, Stephen B. (1994). Basic Statistics (Special pre-publication ed.). Dubuque, Iowa: Wm. C.
Brown Pub. p. 492. ISBN 0-697-21595-4.
Makridakis, S. dkk., 1982, The Accuracy of Extrapolative (Time Series Methods): Results of a
Forecasting Competition, Journal of Forecasting, Vol. 1, No. 2, pp. 111-153
Mukhaiyar, U., 2012, Pengantar dan Statistika Deskriptif, Presentasi Kuliah MA2081 Statistika
Dasar, Bandung : Institut Teknologi Bandung
Sunaringati, L. dkk., 2017, Modul II Metode Analisis Data Oseanografi (OS3102) Statistika,
Program Studi Oseanografi, Institut Teknologi Bandung, Bandung