Anda di halaman 1dari 2

Nama: Miftakhul Jannah (24010314120051)

Nisa Ulfa Saida (24010314120032)


Nauli Isnaeni (24010314120047)
Tugas: Ringkasan Jurnal dengan tema Machine Learning pada Big Data
Judul Jurnal : Weather Forecasting in Sudan Using Maching Learning Schemes
Journal of Network and Innovative Computing
ISSN 2160-2174 Volume 2 (2014) pp. 309-317
© MIR Labs, www.mirlabs.net/jnic/index.html

A. Latar belakang masalah


Sejak zaman kuno, prakiraan cuaca telah menjadi salah satu hal yang paling menarik
dan menantang. Salah satu bidang penting dari peramalan cuaca adalah prediksi curah
hujan yang penting bagi rencana produksi pangan dan pengelolaan sumber daya air.
Sudan adalah negara agraris dan sebagian besar ekonominya tergantung pada pertanian.
Curah hujan memainkan peran penting dalam pertanian. Demikian prediksi curah hujan
menjadi faktor yang signifikan di negara-negara pertanian seperti Sudan. Berbagai
macam metode perkiraan curah hujan dikerjakan dalam peramalan cuaca.
Pada dasarnya, ada dua pendekatan untuk memprediksi curah hujan. Metode
empiris dan metode dinamis. Metode empiris didasarkan pada analisis data historis dari
curah hujan dan hubungannya dengan berbagai variabel atmosfer dan kelautan atas
berbagai bagian dunia. pendekatan empiris yang paling banyak digunakan untuk
prediksi iklim adalah regresi, jaringan syaraf tiruan, logika fuzzy dan metode kelompok
penanganan data.Dalam pendekatan dinamis, prediksi yang dihasilkan oleh model fisik
berdasarkan sistem persamaan yang memprediksi evolusi dari sistem iklim global
dalam menanggapi paraf kondisi atmosfer. Pendekatan dinamis diimplementasikan
dengan menggunakan metode curah hujan peramalan numeric.
Para ilmuwan telah mencoba untuk meramalkan karakteristik meteorologi
menggunakan metode data set yang besar. Beberapa dari mereka lebih akurat daripada
yang lain. Akhir-akhir ini, ada telah ditemukan bahwa data mining, metode yang
dikembangkan baru-baru ini, dapat berhasil diterapkan dalam domain ini. Data mining
adalah tentang pemecahan masalah dengan menganalisis data yang sudah ada dalam
database. Data mining didefinisikan sebagai proses menemukan pola dalam data.
Proses ini harus otomatis atau (lebih biasanya) semi-otomatis. Pola yang ditemukan
harus mempunyai arti dan memberikan keuntungan , biasanya keuntungan ekonomi.
Data yang disajikan dalam jumlah besar.

B. Tujuan/pertanyaan penelitian
Tujuan peneliatian yang diketahui dari jurnal Weather Forecasting in Sudan
Using Maching Learning Schemes adalah meramalkan cuaca di Negara Sudan.

C. Metode yang diusulkan


Metode yang diusulkan adalah Maching Learning Schemes yang meliputi
Gaussian Processes, Linear Regression, Multilayer Perceptron, IBk, KStar, Additive
Regression, Bagging, Random SubSpace, Regression by Discretization, Decision
Table, M5Rules, M5P, REPTree, dan UserClassifier.
D. Implementasi/ekperimen
Data meteorologi yang digunakan dalam penelitian ini telah didapatkan dari
Biro Pusat Statistik, Sudan selama 13 tahun, 2000-2012 dari 24 stasiun meteorologi
seluruh wilayah. Stasiun ini adalah: (Khartoum, Dongola, Atbara, Abu Hamad, Karima,
Wadi Halfa, Wad Medani, El Deweim, Kassala, Port Sudan, El Gadarif, Elobied, El
Nihood, Kadugli, Nyala, Elgeneina, El Fashir, Kosti, El damazen, New Halfa,
Babanusa, Rashad, Abu Naam, Sinnar). Dataset memiliki delapan (8) atribut yang
mengandung rata-rata bulanan, jenis dan deskripsi. Eksperimen dilakukan dalam
beberapa langkah, yaitu:
1. Melakukan transformasi data. Data dari 24 stasiun tersebut ditransformasi menjadi
bentuk yang appropriate dengan data mining.
2. Melakukan pemrosesan data. Data yang bersifat noise dibersihkan dan mengisi nilai
yang masih kosong dan menghapus data yang tidak relevan.
3. Melakukan Seleksi Data. Pada tahap ini, data yang telah diproses dipilih data yang
relevan dengan analisis penelitian dan meninggalkan semua data lainnya.
4. Menspesifikasi pengklasifikasi dasar (base classifier). Untuk menseleksi algoritma
yang sesuai yang menghasilkan model terbaik untuk prediksi curah hujan yaitu
dengan performa metrics yang digunakan , diantaranya:
a. koefisien korelasi: ini mengukur korelasi statistik antara nilai prediksi dan
aktual.
b. Mean Absolute Error : Nilai dihitung dengan mengambil rata-rata dari
perbedaan kuadrat antara setiap nilai yang dihitung (diprediksi) dan nilai yang
benar yang sesuai (yang sebenarnya).
5. Dengan asumsi bahwa output aktual adalah, output yang diharapkan adalah:
a. The Root mean-squared Error

Berdasarkan hasil eksperimen, diketahui bahwa algoritma KStar memiliki


koefisien korelasi maksimum 0.8901, Algoritma M5P berada diurutan kedua
setelah algoritma KStar 0.8863; the minimum root mean squared error 0.2285
dan the third lower mean absolute error 0.1091.

E. Kesimpulan
14 basis algoritma yang mempertimbangkan tanggal, Suhu Minimum,
Kelembaban dan arah angin sebagai prediktor untuk curah hujan, dan semuanya telah
mengadopsi Supplied test set sebagai pilihan tes. Semua koefisien korelasi dari
pengklasifikasi dasar lebih besar dari 0,8. Dalam penelitian ini, peneliti hanya
menggunakan tujuh prediktor untuk prediksi curah hujan, jika digunakan beberapa faktor
iklim yang lebih seperti tekanan atmosfer, suhu permukaan laut, dll, dapat diperoleh
prediksi yang lebih akurat. Juga jika metode Ensemble telah diterapkan hasilnya mungkin
meningkat.

Anda mungkin juga menyukai