Anda di halaman 1dari 7

Dioptimalkan ANN-ABC untuk Prediksi Badai Petir

Abstrak - Peramalan cuaca yang tidak akurat menimbulkan bahaya bagi penerbangan, yang
meningkatkan kebutuhan untuk membangun model prediksi yang baik. Artificial Neural Network
(ANN) adalah salah satu teknik perhitungan evolusioner yang digunakan untuk proses klasifikasi, yang
telah terbukti efisiensinya untuk masalah klasifikasi. Metode pelatihan JST yang diimplementasikan
adalah backpropagation yang digunakan bersama dengan metode optimasi. Algoritma Artificial Bee
Colony (ABC) digunakan dalam beberapa masalah optimasi, termasuk optimalisasi bobot synaptic dari
JST. Dalam penelitian ini, kami menyajikan penggunaan ABC sebagai algoritma optimasi untuk bobot
setiap sambungan antara neuron JST dalam model yang kita sebut ANN-ABC. Penelitian ini
mengusulkan model prediksi badai yang menggunakan ANN-ABC dan mengambil data nyata dari Lake
Charles Airport (LCH) sebagai studi kasus. Model yang diusulkan dievaluasi menggunakan metrik yang
berbeda, dan dibandingkan dengan pengklasifikasi lain yang terkenal. Untuk mengevaluasi kesesuaian
model yang kami hasilkan dan membandingkan tiga fungsi kebugaran untuk proses ABC; Akurasi, AUC,
dan F-measure. Hasilnya menunjukkan bahwa ANNABC / Accuracy mendapat deteksi terbaik dari hari-
hari normal. Di mana ANNABC / AUC mendapat pendeteksian terbaik dari badai petir.

I. PENDAHULUAN

Tantangan utama untuk perencanaan penerbangan yang efisien dan manajemen lalu lintas udara
adalah peramalan cuaca yang akurat yang menimbulkan bahaya bagi penerbangan [2]. Cuaca
merupakan faktor utama dalam 23% dari semua kecelakaan penerbangan [8]. Juga, satu alasan
penting yang menyebabkan pendaratan darurat, kecelakaan pesawat dan keterlambatan dalam
penerbangan adalah badai petir. Badai petir berdampak buruk pada manusia dan infrastruktur. Di
Amerika Serikat, petir adalah penyebab utama ketiga kematian terkait badai. Diperkirakan 24.000
kematian dan 240.000 cedera di seluruh dunia disebabkan oleh petir [7]. Berdasarkan rata-rata
peristiwa badai badai selama periode 1985 hingga 2014, setiap peristiwa menyebabkan lebih dari satu
miliar dolar AS kerusakan [7].

Badai petir atau konvektif disebabkan oleh awan cumulonimbus yang menghasilkan debit listrik yang
dikenal sebagai petir, dan biasanya menghasilkan hujan, angin, dan hujan es [7].

Stasiun cuaca memiliki jutaan catatan data yang diperoleh setiap hari, yang merupakan masalah data
besar, informasi sebelumnya yang direkam dalam Metar dan SYNOP (Observasi permukaan Synoptic)
file data bandara Lake Charles (KLCH) akan membantu dalam proses mengembangkan algoritma
pembelajaran mesin yang dilatih dan diuji oleh data besar ini untuk meningkatkan akurasi perkiraan.

Machine learning (ML) adalah jenis kecerdasan buatan yang menyediakan kemampuan komputer
untuk belajar tanpa secara eksplisit diprogram [16]. Proses pembelajaran mesin mirip dengan
penambangan data. Kedua sistem mencari data untuk mencari pola. Namun, alih-alih mengekstraksi
data untuk pemahaman manusia seperti halnya dalam aplikasi data mining, pembelajaran mesin
menggunakan data tersebut untuk mendeteksi pola dan menyesuaikan tindakan program yang sesuai
[16]. Algoritma ML yang diawasi dapat menerapkan apa yang telah dipelajari di masa lalu ke data baru.

Salah satu tugas penambangan data yang penting adalah klasifikasi. Yang bertujuan membangun
model klasifikasi berdasarkan data sebelumnya untuk mengklasifikasikan data baru. Model
pengelompokan ini dapat dievaluasi menggunakan ukuran yang berbeda, seperti akurasi, presisi,
penarikan, F-measure. Prediksi dapat dilakukan oleh model penggolong yang dilatih pada data
pelatihan untuk memprediksi label kelas data pengujian baru. Salah satu pengklasifikasi yang telah
terbukti efisiensinya terutama untuk klasifikasi dinamis dan nonlinier adalah Artificial Neural Network
(ANN). JST adalah model komputasi yang terdiri dari sejumlah unit pemrosesan sederhana yang
berkomunikasi dengan mengirim sinyal satu sama lain melalui sejumlah besar koneksi tertimbang.

Algoritma Artificial Bee Colony (ABC) digunakan dalam beberapa masalah optimasi, termasuk
optimalisasi bobot synaptic dari JST. Dalam penelitian ini, kami menyajikan penggunaan ABC sebagai
algoritma optimasi untuk bobot setiap sambungan antara neuron JST untuk meningkatkan akurasi
memprediksi badai, yang akan kita sebut pendekatan ANN-ABC.

Untuk mengevaluasi kesesuaian model yang dihasilkan, kami menggunakan tiga fungsi kebugaran
yang berbeda: akurasi, AUC, F-measure.

Kontribusi dari penelitian ini dapat diringkas oleh:

1. Menggunakan data nyata dan terbaru untuk pertama kalinya (data LCH).

2. Mengoptimalkan JST menggunakan ABC (ANN-ABC).

3. Terapkan ANN-ABC pada prediksi badai guntur untuk pertama kalinya.

4. Membandingkan hasil ANN-ABC dengan pengklasifikasi lain yang terkenal.

Makalah ini disusun sebagai berikut: Bagian II menjelaskan pekerjaan terkait di bidang prediksi cuaca
menggunakan pembelajaran mesin. Di Bagian III, termasuk metode yang digunakan dalam
pengembangan. Bagian IV menunjukkan metodologi yang diusulkan. Bagian V menyajikan eksperimen
dan hasil pendekatan yang diusulkan, dan Bagian VI menyimpulkan penelitian dan membahas
pekerjaan di masa depan.

II. PEKERJAAN YANG BERHUBUNGAN

Pekerjaan terkait menunjukkan bahwa prediksi cuaca adalah topik yang sangat menarik untuk diteliti,
apalagi prediksi badai petir jarang dipelajari. Seperti yang disebutkan dalam [1] penulis menggunakan
model prediksi suhu berdasarkan seri waktu menggunakan integrasi Backpropagation (BP) / Genetic
algorithm, data yang digunakan adalah untuk kota Ludhiana Punjab (India), hasil menunjukkan bahwa
algoritma BP menderita banyak masalah. , seperti minima, skala, waktu pelatihan yang lama, mereka
menyarankan untuk menyelesaikannya dengan menggunakan GA.

Para penulis dalam [2] mengusulkan teknik peramalan suhu dengan menggunakan Feed-forward
Artificial Neural Network (ANN). Data yang diambil adalah dari (Kaul) Haryana. Algoritma gradien
keturunan sangat lambat karena membutuhkan tingkat pembelajaran yang kecil untuk pembelajaran
yang stabil. Variasi momentum biasanya lebih cepat daripada gradien sederhana, karena
memungkinkan tingkat pembelajaran yang lebih tinggi dengan tetap menjaga stabilitas, juga data
dilatih oleh algoritma Levenberg-Marquardt. Hasil dari makalah ini mencerminkan bahwa Levenberg
BP telah membuktikan tingkat pembelajaran yang lebih baik daripada algoritma BP.

Dalam percobaan A. Grover, A. Kapoor dan E. Horvitz [3], penulis menggunakan jaringan kepercayaan
yang mendalam (DBN). Mereka melihat bahwa DBN menyebabkan pengurangan kesalahan 1-2%
tambahan. Setelah menetapkan keunggulan kernel data-sentris dan DBN secara independen, mereka
mengevaluasi akurasi prediksi model hibrida penuh mendalam untuk setiap variabel cuaca di AS.
Eksperimen menunjukkan bahwa metodologi baru dapat memberikan hasil yang lebih baik daripada
tolok ukur Kelautan dan Atmosfer Nasional (NOAA).

Para penulis [4] menunjukkan prediksi badai dengan bantuan pendekatan pembelajaran mesin hutan
acak yang meneliti masalah khusus menggabungkan berbagai model NWP (Numerical Weather
Prediction), radar, satelit dan bidang turunan untuk meramalkan badai. Untuk tujuan ini, metode
pembelajaran mesin yang menciptakan ansambel hutan acak dari pohon keputusan yang lemah dan
berkorelasi lemah digunakan untuk menentukan tingkat kepentingan prediktor. Pendekatan hutan
acak juga dapat digunakan untuk membantu mengidentifikasi "rezim", logika perkiraan untuk setiap
rezim dijalankan, dan hasilnya digabungkan berdasarkan nilai keanggotaan.

Seperti yang ditunjukkan dalam [5] penelitian ini melakukan prediksi kecepatan angin melalui
kombinasi regresi vektor dukungan dan model perkiraan. Dengan penekanan pada metode regresi
vektor dukungan (SVR) dan varian nu-SVR-nya. Hasil penelitian menunjukkan bahwa prediksi model
mereka dapat mengungguli penelitian cuaca dan peramalan dalam kasus data Berkeley Yacht Club dan
jumlah variabel hari sebelumnya yang dibutuhkan tidak melebihi 15 hari.

Penulis W. Collins, dan P. Tissot dalam [6] dan [7] mengembangkan jaringan syaraf tiruan perceptron
umpan-maju multiguna (ANN) untuk memprediksi badai. Dua set dikembangkan; satu set
dikembangkan setelah seleksi fitur berbasis korelasi (CFS). Model-model lain dikembangkan
berdasarkan semua prediktor. Hasil mengungkapkan bahwa dengan setidaknya satu metrik kinerja
berbasis kinerja, kinerja model melampaui model regresi multi-linear. Penampilan terbaik adalah hasil
teknik FS. Juga, Meningkatkan fraksi dari total data target positif di set pelatihan tidak meningkatkan
generalisasi.

Para penulis [14] memeriksa kinerja algoritma ABC untuk mengoptimalkan bobot koneksi jaringan
saraf umpan-maju untuk tugas-tugas klasifikasi, dengan algoritma pelatihan Back-Propagation (BP).
Hasilnya menunjukkan bahwa ABC dan BP yang dioptimalkan tidak berbeda untuk lima dari enam
dataset yang dipelajari, tetapi ABC berkinerja lebih baik daripada BP pada dataset Gen. Dengan
pengoptimalan ABC, ukuran pembesaran berat potensial bergantung pada perbedaan berat antar
individu, dan itu berarti algoritme dapat secara efektif menghasilkan tingkat pembelajaran sendiri
untuk setiap berat selama pelatihan, sehingga ABC berkinerja lebih baik daripada BP dengan tingkat
pembelajaran tunggal di seluruh jaringan. .

Seperti yang disebutkan dalam [17], penulis menyajikan menggunakan ABC untuk memaksimalkan
akurasi dan meminimalkan jumlah koneksi JST dengan mengembangkan bobot sinaptik, arsitektur JST
dan fungsi transfer setiap neuron. Percobaan diuji dengan dua fungsi kebugaran yang berbeda
berdasarkan kesalahan mean-square dan kesalahan klasifikasi. Melalui eksperimen ini, mereka
mengamati bahwa kedua fungsi tersebut mencapai kinerja yang sangat dapat diterima. Selain itu,
mereka menunjukkan bahwa fungsi kebugaran ini dapat mengurangi jumlah koneksi dari JST.

Penelitian ini mengusulkan penerapan ANN-ABC untuk memprediksi badai. Di mana kami mengambil
metrik evaluasi yang berbeda menjadi pertimbangan seperti presisi, penarikan kembali dan f-langkah.
Juga, ANN-ABC akan dibandingkan dengan pengklasifikasi terkenal lainnya dalam studi komprehensif.
Pekerjaan ini berbeda dari penelitian pekerjaan terkait lainnya dalam menerapkan ANN-ABC pada
prediksi badai petir untuk pertama kalinya pada data nyata dan terkini, yang membuat hasilnya lebih
andal dan akurat untuk iklim saat ini.

METODE DESKRIPSI

Bagian ini memberikan penjelasan singkat tentang metode yang digunakan dalam penelitian ini.

A. Jaringan Saraf Tiruan

Definisi Artificial Neural Network (ANN) adalah "sistem komputasi yang terdiri dari sejumlah elemen
pemrosesan yang sangat saling berhubungan, yang memproses informasi dengan respon status
dinamis mereka ke input eksternal." [9]. Alasan mengapa ANN dipilih sebagai bagian dari pendekatan
yang kami usulkan adalah bahwa cuaca adalah proses yang dinamis dan ANN telah membuktikan
efisiensinya terutama untuk klasifikasi dinamis dan nonlinier berdasarkan pada pekerjaan terkait yang
diteliti.

Jaringan syaraf biasanya disusun berlapis-lapis. Seperti yang ditunjukkan pada Gambar 1, lapisan
terdiri dari sejumlah node yang saling berhubungan yang juga disebut neuron yang mengandung
fungsi aktivasi. Pola disajikan ke jaringan melalui lapisan input, yang berkomunikasi ke satu atau lebih
lapisan tersembunyi di mana pemrosesan aktual dilakukan melalui sistem koneksi tertimbang. Layer
yang tersembunyi kemudian menghubungkan ke lapisan output dimana jawabannya adalah output.

B. Artificial Bee Colony

JST dapat digunakan bersama dengan metode pengoptimalan. Algoritma Artificial Bee Colony (ABC)
digunakan dalam optimasi bobot sinaptik dari JST. Algoritma ABC yang diusulkan oleh Karaboga pada
tahun 2005 [15] adalah algoritma optimasi stochastic yang terinspirasi oleh perilaku mencari makan
lebah madu. ABC mempertahankan populasi tiga jenis lebah (digunakan, penonton, dan pramuka)
seperti yang ditunjukkan pada Gambar 2 [15].

V. EKSPERIMEN DAN HASIL

Kinerja pendekatan kami dievaluasi dengan melakukan sejumlah eksperimen yang dijelaskan di
bagian ini.

A. Data

File data Metar dan SYNOP bandara Lake Charles (LCH) diberikan kepada kami oleh ArabiaWeather
[11]. Data ini berisi 104 atribut yang berbeda dan 14.969 contoh yang tercatat dari 21 Desember 2015
hingga 13 November 2016 untuk wilayah Danau Charles di Negara Bagian Louisiana [12].

B. Preprocessing Data

Langkah preprocessing adalah langkah paling penting dalam pembelajaran mesin, yang merupakan
kelompok langkah-langkah peleburan data yang rumit, pengurangan data dan penggantian data yang
rumit. Mengisi data yang tidak lengkap dan menghapus kebisingan dan ketidakkonsistenan data
disebut pembersihan data. Mengurangi volume data dengan mengambil kelompok bulan tertentu
yang paling sering terjadi adalah reduksi data. Akhirnya mengganti data nominal dengan data numerik
yang mewakili itu disebut penggantian data.

Persentase data yang hilang dikurangi dalam bentuk atribut utama (2% - 98%) hingga 0% dengan
menerapkan satu atau lebih dari langkah-langkah berikut pada setiap atribut:

1. Gandakan data untuk mengisi nilai-nilai yang hilang di mana ada perubahan yang diukur oleh suatu
periode waktu.

2. Mengisi bidang yang hilang dengan mengambil rata-rata dari dua bidang sebelum dan sesudah.

3. Menggabungkan beberapa kolom yang terhubung dalam arti menjadi satu kolom.

4. Mengisi data yang hilang berdasarkan atribut lain atau nilai kolom yang terkait. Gambar 4
menunjukkan kejadian badai hujan yang mengacu pada periode waktu yang dimulai dari 21 Desember
2015 hingga 13 November 2016. Dimana 1 nilai merupakan kejadian badai petir dan nilai 0 mewakili
hari normal. Gambar 4 juga menunjukkan bahwa tingkat tertinggi badai petir didistribusikan pada
tanggal antara Mei 2016 dan September 2016. Yang membuat kami meminimalkan data pelatihan
untuk mencakup periode waktu yang lebih kecil untuk meringankan masalah overfitting. Jumlah
kejadian badai petir sepanjang tahun adalah 597 kejadian.

Ketika menganalisis data untuk setiap bulan (Mei-September) kami memutuskan untuk
mempertimbangkan data musim panas (Juni, Juli, dan Agustus) dari LCH, mengetahui bahwa itu
memiliki total 278 kejadian badai petir yang kira-kira setengah dari keseluruhan kejadian badai petir.
Hasil dari preprocessing data adalah file data yang berisi 42 atribut preprocessed yang berbeda dan
3.910 instance yang Metar dan SYNOP rekam untuk musim panas.

C. Pengaturan percobaan

Percobaan yang kami lakukan adalah sebagai berikut. Pertama, karena masalah yang kita miliki
didasarkan pada data yang tidak seimbang, untuk menyelesaikan masalah overfitting; down sampling
dilakukan menggunakan Spread-Sub-Sample filter yang disediakan oleh WEKA [10], yang
memungkinkan untuk secara acak menentukan spread maksimum antara kelas paling langka (kasus
badai petir) dan kelas yang paling umum (kasus normal). Nilai sebaran distribusi yang digunakan
adalah 3,9 yang berarti kasus normal = 3,9 * kasus badai petir.

Kemudian, seleksi fitur - yang juga dikenal sebagai pemilihan variabel - diterapkan pada data untuk
mengambil fitur yang paling relevan yang paling terkait dengan badai untuk digunakan dalam
pelatihan dan pengujian model kami. Jumlah total fitur setelah preprocessing adalah 42, dan setelah
pilihan fitur kami hanya memiliki 31 fitur ditambah satu fitur untuk label kelas. Metode pemilihan fitur
yang digunakan didasarkan pada rasio keuntungan [10], yang merupakan rasio perolehan informasi
terhadap informasi penting.

Langkah selanjutnya adalah membagi data menjadi dua set, 66% untuk pelatihan dan 34% untuk
pengujian. Distribusi rekaman data setelah pemisahan itu: dalam pelatihan, ada 182 catatan badai dari
total 716 catatan, sementara dalam pengujian ada 96 catatan badai dari 368 catatan. Set pelatihan
digunakan dalam pelatihan ANN-ABC, sementara set pengujian digunakan untuk menguji kebaikan
model yang dihasilkan dalam memprediksi data pengujian baru. Pengaturan ABC yang digunakan
ditunjukkan pada Tabel I. Percobaan ANN dilakukan menggunakan sumber Java WEKA [13]
menggunakan pengaturan yang ditunjukkan pada Tabel II.

D. Hasil

Setelah preprocessing data, dan membangun model yang kami usulkan, kami menggunakan tiga fungsi
kebugaran yang berbeda untuk mengevaluasi solusi yang disarankan oleh ABC, kemudian masing-
masing dari 3 fungsi dijalankan 30 kali untuk menutupi keacakan dari solusi ABC. Tiga fungsi kebugaran
adalah: Akurasi (ANN-ABC / Akurasi), AUC (ANNABC / AUC), dan F-measure (ANN-ABC / Fmeasure).

Untuk mengevaluasi model kami, kami perlu membandingkannya dengan pengklasifikasi lainnya. Oleh
karena itu, kami menerapkan 7 pengklasifikasi terkenal pada data menggunakan pelatihan dan
pengujian set yang sama. Penggolong yang digunakan diimplementasikan dalam WEKA [10] dan
dijelaskan sebagai berikut:

• Bayes Network (BN): Algoritma pembelajaran menggunakan berbagai algoritma pencarian dan
pengukuran kualitas.
• J48: Kelas untuk menghasilkan pohon keputusan C4.5 yang dipangkas atau tidak terlindungi. Satu
lipatan digunakan untuk memangkas, dua lipatan digunakan untuk menumbuhkan pohon.

• IBK: Penggolongan tetangga K-terdekat, yang dapat memilih nilai K yang sesuai berdasarkan validasi
silang.

• K *: Sebuah classifier berbasis instance, kelas instance pengujian didasarkan pada kelas dari
instance-instance pelatihan yang mirip dengannya.

• JRip: Menerapkan peserta didik aturan proporsional, Pemangkasan Inkremental Berulang untuk
Menghasilkan Pengurangan Kesalahan.

• SMO: Menerapkan pengoptimalan minimal berurutan John Platt untuk melatih pengklasifikasi
vektor dukungan. Kami menggunakan pengaturan default-nya.

• Artificial Neural Network (ANN): pengklasifikasi jaringan saraf yang menggunakan propagasi balik
untuk mengklasifikasikan contoh.

Tabel III menunjukkan hasil matriks kebingungan menerapkan ANNABC dan pengklasifikasi WEKA
pada data pengujian. Di mana True Positive (TP) adalah jumlah yang ada badai yang terdeteksi dengan
benar. (Nilai yang lebih tinggi lebih baik).

Salah Negatif (FN) adalah jumlah yang ada badai tetapi diklasifikasikan sebagai tidak ada badai. (Nilai
yang lebih rendah lebih baik). Palsu Positif (FP) adalah jumlah yang tidak ada badai tetapi
diklasifikasikan sebagai badai petir. (Dikenal sebagai alarm palsu). True Negative (TN) adalah jumlah
yang tidak ada badai petir dan diklasifikasikan sebagai tidak ada badai petir. (Nilai yang lebih rendah
lebih baik). Dari matriks kebingungan, kita dapat menghitung banyak metrik yang digunakan untuk
mengevaluasi efisiensi penggolong: Akurasi dihitung menggunakan Persamaan (4), yang merupakan
jumlah TP ditambah TN dibagi dengan keseluruhan populasi

VI. KESIMPULAN DAN PEKERJAAN DI MASA DEPAN

Penelitian ini bertujuan untuk menggunakan Jaringan Saraf yang dioptimalkan dengan algoritma
optimasi Artificial Bee Colony yang disebut ANN-ABC untuk membangun model yang dapat
memprediksi badai. Data yang digunakan dalam penelitian ini adalah data nyata Metar dan SYNOP
terkait dengan bandara Lake Charles (LCH) di Louisiana. Langkah preprocessing data dilakukan,
termasuk pembersihan, pengurangan, dan penggantian data. Karena masalah yang harus dipecahkan
didasarkan pada ketidakseimbangan data dan untuk menghindari masalah yang berlebihan,
pengambilan sampel dilakukan menggunakan filter SpreadSub-Sample. Data yang digunakan dibagi
menjadi (66%) pelatihan dan pengujian (34%).

Model ANN-ABC diuji menggunakan tiga fungsi fitness yang berbeda untuk optimasi ABC; Akurasi
(ANNABC / Accuracy), AUC (ANN-ABC / AUC), dan Fmeasure (ANNABC / Fmeasure). Tiga pendekatan
yang diusulkan dibandingkan dengan pengklasifikasi terkenal lainnya dalam studi komprehensif.
Hasilnya menunjukkan bahwa ANN-ABC / Accuracy mendapatkan TN, FN, akurasi, dan presisi terbaik,
juga mendapat recall yang lebih baik, AUC, F-measure daripada ANN biasa. Di mana ANN-ABC / AUC
mendapatkan TP, FP, recall, AUC terbaik, dan mendapat akurasi, presisi, F-measure yang lebih baik
daripada ANN biasa. ANN-ABC / Fmeasure mendapatkan nilai f-measure terbaik, dan akurasi, presisi,
recall, AUC yang lebih baik daripada ANN biasa.
Pekerjaan kami di masa depan termasuk menguji metode pengoptimalan lainnya pada ANN dan
membandingkan hasilnya. Juga, menguji model kami untuk memprediksi badai untuk area lain.

Anda mungkin juga menyukai