Alma Hidayanti1; Amril Mutoi Siregar2; Santi Arum Puspita Lestari3; Yana Cahyana4
1
Teknik Informatika; Universitas Buana Perjuangan Karawang; Jl. Ronggo Waluyo Sirnabaya, Puseurjaya,
Kec. Telukjambe Timur, Kabupaten Karawang, Jawa Barat if17.almahidayanti@mhs.ubpkarawang.ac.id
2
Teknik Informatika; Universitas Buana Perjuangan Karawang; Jl. Ronggo Waluyo Sirnabaya, Puseurjaya,
Kec. Telukjambe Timur, Kabupaten Karawang, Jawa Barat amrilmutoi@ubpkarawang.ac.id
3
Teknik Informatika; Universitas Buana Perjuangan Karawang; Jl. Ronggo Waluyo Sirnabaya, Puseurjaya,
Kec. Telukjambe Timur, Kabupaten Karawang, Jawa Barat santi.arum@ubpkarawang.ac.id
4
Teknik Informatika; Universitas Buana Perjuangan Karawang; Jl. Ronggo Waluyo Sirnabaya, Puseurjaya,
Kec. Telukjambe Timur, Kabupaten Karawang, Jawa Barat yana.cahyana@ubpkarawang.ac.id
ABSTRACT
An increase in the covid-19 cases in Indonesia cannot be estimated to develop, so that it causes
various aspects of life in Indonesia. This research aims to analyze covid-19 data in Indonesia by
knowing the value of accuracy obtained in data. The method use in this research is the method linier
regression and random forest. The research result can be known that the analysis conducted in this
research using manual calculations with the microsoft excel, python programming language using
tools google colaboratory and data processing software using the tools rapidminer. The value of
accuracy in each method can be different according to the tools used as. On highest linier regression
method of accuracy is 99,7% with the value of RMSE (Root Mean Squared Error) is 26,19, the data
is analyzed using manual calculations with microsoft excel. Meanwhile, for the highest random forest
value of accuracy is 98,4% and analyzed using rapidminer tools.
ABSTRAK
Kenaikan kasus covid-19 di Indonesia tidak bisa diperkirakan perkembangannya, sehingga
menyebabkan buruknya berbagai aspek kehidupan di Indonesia. Penelitian ini bertujuan untuk
menganalisis data covid-19 di Indonesia dengan cara mengetahui nilai akurasi yang diperoleh
dalam data. Metode yang digunakan dalam penelitian ini yaitu metode regresi linier dan random
forest. Hasil penelitian dapat diketahui bahwa cara analisis yang dilakukan dalam penelitian ini
yaitu menggunakan perhitungan manual dengan tools microsoft excel, pemrograman bahasa python
menggunakan tools google colaboratory dan perangkat lunak pengolahan data menggunakan tools
rapidminer. Nilai akurasi dalam setiap metode dapat berbeda sesuai dengan tools yang digunakan.
Pada metode regresi linier nilai akurasi tertinggi adalah 99,7% dengan nilai RMSE (root mean
squared error) yaitu 26,19, data tersebut dianalisis menggunakan perhitungan manual dengan tools
microsoft excel. Sedangkan untuk metode random forest nilai akurasi tertinggi adalah 98,4% dan
dianalisis menggunakan tools rapidminer.
𝑌 = 𝑎 + 𝑏𝑋 (1)
Keterangan:
Y: Variabel Terikat a: Intercape ( nilai Y pada saat X=0)
X: Variabel Bebas b: Slope(perubahan rata-rata Y terhadap X)
∑𝑛𝑡=1(𝑌𝑡 − 𝑌̂𝑡 )2
𝑀𝑆𝐸 = √ (2)
𝑛
Keterangan :
MSE : Mean Square Error
𝑌𝑡 : Nilai aktual pada periode t
𝑌̂𝑡 : Nilai peramalan pada periode t
n : Banyaknya data
1.2.4 Accuracy
Accuracy merupakan salah satu metode pengujian algoritma berdasarkan tingkat kedekatan
antara nilai prediksi dengan nilai sebenarnya [15]. Dapat disimpulkan bahwa hasil akurasi merupakan
bentuk pengukuran performa dari algoritma yang sudah digunakan pada sebuah penelitian.
2. METODE/PERANCANGAN PENELITIAN
2.1 Metode Penelitian
Penelitian ini menggunakan metode analisis deskriptif dengan melakukan pendekatan
kuantitatif, bertujuan untuk mendapatkan gambaran mengenai suatu keadaan berdasarkan data yang
ada dengan cara menyajikan, mengumpulkan dan menganalisa data.
(374154−847875,2)2
=√
327
= 26,19
(𝑁𝑖𝑙𝑎𝑖 𝐸𝑟𝑟𝑜𝑟)
Nilai Akurasi = 100% –
100
(26,19)
= 100% –
100
= 100% – 0,2619
= 99,73%
Regresi linier menggunakan python
Tabel 3. Hasil prediksi google colaboratory
4.2 Saran
Penelitian penerapan metode regresi linier dan random forest pada data covid-19 di Indonesia
ini menyampaikan saran kepada pengembang penelitian selanjutnya, untuk meningkatkan,
merancang dan melakukan pengembangan sistem lebih lanjut terhadap metode regresi linier dan
random forest, menambahkan sumber data maupun atribut yang lebih lengkap, sehingga dapat
menunjang dalam melakukan analisis, menggunakan berbagai macam tools dalam melakukan
analisis data, melakukan penelitian dengan menggunakan dataset yang berbeda dengan metode yang
sama, serta menambahkan dan memiliki tujuan analisis yang lebih spesifik menggunakan algoritma
regresi linier dan random forest untuk memperoleh banyak pengetahuan.
DAFTAR PUSTAKA
[1] M. K. Sari, “Sosialisasi tentang Pencegahan Covid-19 di Kalangan Siswa Sekolah Dasar di
SD Minggiran 2 Kecamatan Papar Kabupaten Kediri,” J. Karya Abdi, vol. 4, no. 1, pp. 80–
83, 2020.
[2] N. H. . W. Nasution, “MANAJEMEN MASJID PADA MASA PANDEMI COVID 19
Oleh: Dr. Nurseri Hasnah Nasution, M.Ag 1 Dr. Wijaya, M.Si. 2,” Manaj. Masjid Pada
Masa Pandemi Covid 19, vol. 2, no. 1, p. 1, 2020.
[3] N. Kusumawati, F. Marisa, and I. D. Wijaya, “Prediksi Kurs Rupiah Terhadap Dollar
Amerika Dengan Menggunakan Metode Regresi Linear,” J I M P - J. Inform. Merdeka
Pasuruan, vol. 2, no. 3, pp. 45–56, 2017.
[4] A. R. Muhajir, E. Sutoyo, and I. Darmawan, “Forecasting Model Penyakit Demam Berdarah
Dengue Di Provinsi DKI Jakarta Menggunakan Algoritma Regresi Linier Untuk
Mengetahui Kecenderungan Nilai Variabel Prediktor Terhadap Peningkatan Kasus,”
Fountain Informatics J., vol. 4, no. 2, p. 33, 2019.
[5] V. W. Siburian and I. E. Mulyana, “Prediksi Harga Ponsel Menggunakan Metode Random
Forest,” Pros. Annu. Res. Semin., vol. 4, no. 1, pp. 144–147, 2018.
[6] H. Wiguna, Y. Nugraha, F. Rizka R, A. Andika, J. I. Kanggrawan, and A. L. Suherman,
“Kebijakan Berbasis Data: Analisis dan Prediksi Penyebaran COVID-19 di Jakarta dengan
Metode Autoregressive Integrated Moving Average (ARIMA),” J. Sist. Cerdas, vol. 3, no.
2, pp. 74–83, 2020.
[7] A. S. Albana and S. Azhari, “Prediksi Penyebaran COVID-19 Kota Surabaya dengan
Simulasi,” J. Adv. Inf. Ind. Technol., vol. 2, no. 1, pp. 36–42, 2020.
[8] S. A. Hardiyanti and Q. Shofiyah, “PREDIKSI KASUS COVID-19 DI INDONESIA
MENGGUNAKAN METODE ADAPTIVE NEURO FUZZY INFERENCE SYSTEM
(ANFIS),” Semin. Nas. Terap. Ris. Inov. Ke-6, vol. 1, no. 1, pp. 974–981, 2020.
[9] R. Teguh, A. S. Sahay, and F. F. Adji, “Pemodelan Penyebaran Infeksi Covid-19 Di
Kalimantan, 2020,” J. Teknol. Inf. J. Keilmuan dan Apl. Bid. Tek. Inform., vol. 14, no. 2, pp.
171–178, 2020.
[10] F. S. D. Arianto and Noviyanti, “Prediksi Kasus COVID-19 di Indonesia Menggunakan
Metode Backpropagation dan Fuzzy Tsukamoto,” J. Teknol. Inf., vol. 4, no. 1, pp. 120–127,
2020.
[11] F. R. Pratikto, “Prediksi Akhir Pandemi COVID-19 di Indonesia dengan Simulasi Berbasis
Model Pertumbuhan Parametrik,” J. Rekayasa Sist. Ind., vol. 9, no. 2, pp. 63–68, 2020.
[12] H. Y. Jayanti, “Peramalan pendapatan reksa dana dalam setahun menggunakan metode
regresi linier sederhana,” J. Teknol. Inf. Dan Komun., vol. VIII, no. 2, 2018.
[13] J. Sanjaya, E. Renata, V. E. Budiman, F. Anderson, and M. Ayub, “Prediksi Kelalaian
Pinjaman Bank Menggunakan Random Forest dan Adaptive Boosting,” J. Tek. Inform. dan
Sist. Inf., vol. 6, no. 1, pp. 50–60, 2020.
[14] M. M. Ramadhan, I. Budhi, and C. Setianingsih, “Penerjemahan Huruf Cyrillic Rusia Ke
Huruf Latin Menggunakan Algoritma SVM ( Support Vector Machine ) Translation Russian
Cyrillic To Latin Alphabet Using SVM ( Support Vector Machine ),” vol. 4, no. 3, pp.
4007–4014, 2017.
[15] A. P. Ayudhitama and U. Pujianto, “Analisa 4 Algoritma Dalam Klasifikasi Penyakit Liver
Menggunakan,” J. Inform. Polinema, vol. 6, pp. 1–9, 2020.