Penerapan Metode Multiple Linear Regression Untuk Prediksi Berat Badan Jerapah
Penerapan Metode Multiple Linear Regression Untuk Prediksi Berat Badan Jerapah
Gede Beny Indrawan1, Ketut Gede Subiksa2, Eugene3, I Gusti Agung Bajrajnana4
1,2,3,4
Universitas Pendidikan Ganesha; Jalan Udayana, telp.(0362)22570, Singaraja-Bali
e-mail: 1beny.indrawan@undiksha.ac.id, 2subiksa@undiksha.ac.id, 3eugene@undiksha.ac.id,
4
agung.bajrajnana@undiksha.ac.id
Abstrak
Jerapah merupakan hewan darat tertinggi di dunia, tetapi populasi jerapah mengalami
penurunan dan diancam kepunahan. jika jerapah tidak dilestarikan maka keseimbangan alam
akan terganggu serta berdampak buruk pada makhluk hidup lainnya. Oleh karena itu perlu
adanya sistem untuk mengetahui apakah jerapah tersebut kesehatannya terganggu. Untuk
mengetahui hal tersebut peneliti bisa melihat dari berat badan jerapah yang digunakan sebagai
faktor utama untuk memaksimalkan pemantauan kesehtannya. Agar bisa memprediksi berat
badan jerapah adapun metode regresi linier berganda. Tujuannya untuk memprediksi apakah
berat banda jerapah tetap normal untuk puluhan tahun kedepan. Dengan memanfaatkan dua
variabel independen yaitu tinggi dan umur jerapah hasil akhirnya yaitu berat badan jerapah
dapat diprediksi dengan akurat. Dengan adanya sistem ini peneliti bisa menjaga dan merawat
hewan jerapah dengan baik serta bisa meningkatkan reproduksi hewan dengan memilah hewan
yang sehat.
Abstract
Giraffes are the tallest land animals in the world, but giraffe populations are declining
and are threatened with extinction. If the giraffe is not preserved then the balance of nature will
be disturbed and have a bad impact on other living things. Therefore, it is necessary to have a
system to determine whether the health of the giraffe is disturbed. To find out, researchers can
see from the weight of the giraffe which is used as the main factor to maximize its health
monitoring. In order to predict the weight of a giraffe, there is a multiple linear regression
method. The goal is to predict whether the weight of the giraffe's band remains normal for
decades to come. By utilizing two independent variables, namely the height and age of the
giraffe, the final result, namely the giraffe's weight, can be predicted accurately. With this
system, researchers can look after and care for giraffes well and can increase animal
reproduction by sorting out healthy animals.
1. PENDAHULUAN
reproduksi dalam menambah jumlah populasi. Berat hewan jerapah jantan dewasa yaitu sampai
1.360 kilogram sedangkan jerapah betina yaitu 680 kilogram, hal yang paling penting untuk
melestarikannya adalah mengetahui berat badan ideal dengan memperhitungkan tinggi dan
umur jerapah tersebut. Jika diketahui umur dan beratnya ideal maka jerapah tersebut terbukti
sehat dan bisa direproduksi.
Metode yang digunakan dalam penelitian ini adalah dengan regresi linear berganda.
Metode ini dipilih karena nilai variabel yang terikat dengan pengaruh dari beberapa variabel
bebas. Dengan metode ini diharapkan bisa memprediksi berat badan jerapah ideal untuk
mencegah menurunya populasi hewan tersebut[1].
2. METODE
Pada penelitian ini menggunakan tahapan proses penggalian informasi dalam suatu
kumpulan data mulai dari pengumpulan data sampai membentuk informasi akhir. Selain itu
metode ini digunakan untuk menjelaskan mengenai proses informasi yang belum diketahui [2].
Berikut terdapat tahapan-tahapan prosesnya (Gambar 1) :
1. Pengumpulan data atau yaitu proses pemilihan data untuk memenuhi kebutuhan proses
penelitian data yang dipilih mengikuti batasan-batasan sesuai dengan kondisi atau fakta
yang ada.
2. Membangun model regresi merupakan proses hubungan antara varibel pada penelitian
ini independent variabelnya berjumlah 2 dan target variabel dependentnya adalah 1.
3. Validasi data, pada tahapan ini model yang dibangun akan dievaluasi dengan melihat
koefisien determinansinya.
4. Pada pengujian asumsi model yang sudah divalidasi akan dilakukan analisis residual.
5. Setelah semua proses sudah dilalui pada tahap akhir akan disumpulkan apakah model
yang dibangun dapat bekerja dengan baik untuk memprediksi berat badan jerapah.
3
Data hewan jerapah diambil dan ditentukan oleh peneliti mengikuti batas-batas umum
dari tinggi dan umur jerapah remaja sampai dewasa. Data yang diambil merupakan jerapah yang
sehat sebagai bahan awal untuk memprediksi berat jerapah. Hewan tertinggi di dunia ini
memiliki berat sampai 1.360 kilogram dan tinggi mencapai 5.5 meter serta umurnya sampai 26
tahun.
a. Persiapan Data
Dari batas tersebut kami dapat menentukan data hewan jerapah untuk memprediksi
beratnya. Berikut ini adalah data hewan jerapah (Tabel 1) :
Kode program diatas memberikan beberapa nilai penting dari model yang dibangun. Nilai
tersebut merupakan nilai intersep dan koefisien dari model yang dapat dimasukkan ke dalam
persamaan matematis sebagai berikut :
Setelah melihat hasil nilai dari model diatas kemudian akan dicoba hasil prediksi berat dari
hewan jerapah dengan memasukan nilai secara manual(Gambar 3).
Sebelum masuk ke langkah selanjutnya dari data dan model yang dibangun akan di visualisasi
dengan grafik 3D (Gambar 4)
c. Validasi Data
Setelah membangun model, hal paling penting adalah memvalidasi kinerjanya. Suatu
model dapat dievaluasi dengan melihat koefisien determinasinya (R2), uji F, uji t, dan residual.
Sebelum itu model yang dibangun sebelumnya akan di re-built dengan menggunakan pustaka
statsmodel fungsi OLS(). Kemudian hasil ringkasan model ditampilkan menggunakan fungsi
summary()[3]. Ringkasan ini mengandung banyak nilai penting yang digunakan untuk
mengevaluasi model yang dibuat (Gambar 5).
5
Koefisien determinan merupakan bagian dari total variasi dependen yang dijelaskan oleh variasi
variabel independen. Skor dihitung sebagai berikut (Gambar 6) :
Gambar 6. Hasil
Nilai berkisaran antara 0 dan 1, dimana artinya tidak ada hubungan linier antar
variabel dan menunjukkan hubungan linier yang sempurna. Nilai yang didapatkan
pada penelitian ini adalah 0.8991 yang berarti 89.91% variabel terikat dapat dijelaskan
menggunakan variabel bebas. Uji-F atau ANOVA (Analisis Varians) dalam regresi linier
berganda dapat digunakan untuk menentukan apakah model berkinerja lebih baik daripada
model yang lebih sederhana. Dengan Uji-F dapat mengevaluasi secara signifikan dengan
menghitung probabilitas yang setidaknya setinggi nilai yang diperoleh dari model (Gambar 7).
T-statistik adalah koefisien yang dibagi dengan kesalahan standarnya. Kesalahan tersebut
merupakan perkiraan deviasi dari koefisien, jumlah yang bervariasi di seluruh kasus. Hal ini
dapat dianggap sebagai ukuran ketepatan dengan koefisien regresi (Gambar 8).
d. Pengujian Asumsi
Selanjutnya dilakukan dengan validasi mode analisis residual(Gambar ?), adapun daftar
pengujiannya sebagai berikut (Gambar 9) :
1. Linearitas
Linearitas mengasumsikan adanya hubungan linier antara variabel independen dan
variabel dependen. Karena terdapat beberapa variabel independen, hal ini dapat
dilakukan dengan menggunakan plot untuk melihat nilai prediksi (Gambar 10 dan
Gambar 11).
2. Normalitas
Istilah kesalahan model dapat mengasumsikan model tersebut terdistribusi secara
normal. Program ini akan memeriksa normalitas residual dengan memanfaatkan plot ke
dalam histrogram dan melihat nilai p dari uji Anderson-Darling (Gambar 12).
3. Multikolinearitas
Mengasumsikan prediktor yang digunakan dalam regresi tidak berkorelasi satu sama
lain. Untuk mengidentifikasi apakah ada korelasi antara prediktor hal ini dapat dihitung
koefisien korelasi di setiap kolom dalam data menggunakan fungsi corr() (Gambar 13).
8
Pada grafik diatas menunjukkan banyak nilai positif, hasil tersebut memberikan sebuah
informasi bahwa kedua variabel independen saling mempengaruhi dan terdapat
multikolinearitas dalam data[4].
4. Autokorelasi
Autokorelasi adalah korelasi kesalahan (residual) dari waktu ke waktu. Dalam analisis
ini akan divalidasi apakah ada autokorelasi, hal tersebut terjadi jika residual dalam
periode lain (Gambar 14).
Model yang dibangun mendapatkan nilai skor 1.27 artinya dapat diasumsikan terdapat
autokorelasi dalam residual pada data.
5. Homoskedastisitas
Pada homoskedastisitas mengasumsikan jika terdapat varians yang sama maka terdapat
kesalahan pada model data. Masalah tersebut terjadi ketika tidak memiliki varians
genap di seluruh data (Gambar 15).
4. KESIMPULAN
Model yang dirancang berhasil melewati semua tes dalam langkah validasi model ,
sehingga dapat disimpulkan model ini dapat bekerja dengan baik untuk memprediksi berat
hewan jerapah di masa depan dengan menggunakan dua variabel independen. Tetapi model ini
hanya memiliki skor 89.91% artinya terdapat sekitar 11% faktor yang tidak diketahui yang
mempengahuri prediksi berat hewan jerapah.
DAFTAR PUSTAKA
Prediksi Harga Sewa Kamar Kost,” J. Strateg., vol. 1, no. November, pp. 615–629,
2019.