Anda di halaman 1dari 10

 1

Penerapan Metode Multiple Linear Regression Untuk


Prediksi Berat Badan Jerapah

Gede Beny Indrawan1, Ketut Gede Subiksa2, Eugene3, I Gusti Agung Bajrajnana4
1,2,3,4
Universitas Pendidikan Ganesha; Jalan Udayana, telp.(0362)22570, Singaraja-Bali
e-mail: 1beny.indrawan@undiksha.ac.id, 2subiksa@undiksha.ac.id, 3eugene@undiksha.ac.id,
4
agung.bajrajnana@undiksha.ac.id

Abstrak
Jerapah merupakan hewan darat tertinggi di dunia, tetapi populasi jerapah mengalami
penurunan dan diancam kepunahan. jika jerapah tidak dilestarikan maka keseimbangan alam
akan terganggu serta berdampak buruk pada makhluk hidup lainnya. Oleh karena itu perlu
adanya sistem untuk mengetahui apakah jerapah tersebut kesehatannya terganggu. Untuk
mengetahui hal tersebut peneliti bisa melihat dari berat badan jerapah yang digunakan sebagai
faktor utama untuk memaksimalkan pemantauan kesehtannya. Agar bisa memprediksi berat
badan jerapah adapun metode regresi linier berganda. Tujuannya untuk memprediksi apakah
berat banda jerapah tetap normal untuk puluhan tahun kedepan. Dengan memanfaatkan dua
variabel independen yaitu tinggi dan umur jerapah hasil akhirnya yaitu berat badan jerapah
dapat diprediksi dengan akurat. Dengan adanya sistem ini peneliti bisa menjaga dan merawat
hewan jerapah dengan baik serta bisa meningkatkan reproduksi hewan dengan memilah hewan
yang sehat.

Kata kunci : Hewan, Jerapah, Model Linier

Abstract
Giraffes are the tallest land animals in the world, but giraffe populations are declining
and are threatened with extinction. If the giraffe is not preserved then the balance of nature will
be disturbed and have a bad impact on other living things. Therefore, it is necessary to have a
system to determine whether the health of the giraffe is disturbed. To find out, researchers can
see from the weight of the giraffe which is used as the main factor to maximize its health
monitoring. In order to predict the weight of a giraffe, there is a multiple linear regression
method. The goal is to predict whether the weight of the giraffe's band remains normal for
decades to come. By utilizing two independent variables, namely the height and age of the
giraffe, the final result, namely the giraffe's weight, can be predicted accurately. With this
system, researchers can look after and care for giraffes well and can increase animal
reproduction by sorting out healthy animals.

Keywords : Animals, Giraffes, Linear Models

1. PENDAHULUAN

Menjaga kelestarian hewan sangat penting untuk melindungi ekosistem kehidupan di


bumi. Karena jika hewan tersebut mengalami kepunahan, maka sistem keseimbangan alam akan
terganggu dan mengalami dampak yang besar bagi kehidupan di bumi. Jerapah atau zarafah
adalah hewan mamalia dari afrika dan merupakan hewan tertinggi yang hidup di darat. Akan
tetapi populasi jerapah telah ditetapkan sebagai daftar merah Persatuan Internasional untuk
Konservasi Alam (IUCN) rentan mengalami kepunahan. Untuk mencegah hal tersebut peneliti
perlu memahami karakteristik jerapah mulai dari kebiasaannya di habitat dan menjaga
2 

reproduksi dalam menambah jumlah populasi. Berat hewan jerapah jantan dewasa yaitu sampai
1.360 kilogram sedangkan jerapah betina yaitu 680 kilogram, hal yang paling penting untuk
melestarikannya adalah mengetahui berat badan ideal dengan memperhitungkan tinggi dan
umur jerapah tersebut. Jika diketahui umur dan beratnya ideal maka jerapah tersebut terbukti
sehat dan bisa direproduksi.
Metode yang digunakan dalam penelitian ini adalah dengan regresi linear berganda.
Metode ini dipilih karena nilai variabel yang terikat dengan pengaruh dari beberapa variabel
bebas. Dengan metode ini diharapkan bisa memprediksi berat badan jerapah ideal untuk
mencegah menurunya populasi hewan tersebut[1].

2. METODE

Pada penelitian ini menggunakan tahapan proses penggalian informasi dalam suatu
kumpulan data mulai dari pengumpulan data sampai membentuk informasi akhir. Selain itu
metode ini digunakan untuk menjelaskan mengenai proses informasi yang belum diketahui [2].
Berikut terdapat tahapan-tahapan prosesnya (Gambar 1) :

Persiapan Data Pengujian Asumsi Kesimpulan

Membangun Validasi Data


Model Regresi
Gambar 1. Metode Penelitian Model Regresi Linier

1. Pengumpulan data atau yaitu proses pemilihan data untuk memenuhi kebutuhan proses
penelitian data yang dipilih mengikuti batasan-batasan sesuai dengan kondisi atau fakta
yang ada.
2. Membangun model regresi merupakan proses hubungan antara varibel pada penelitian
ini independent variabelnya berjumlah 2 dan target variabel dependentnya adalah 1.
3. Validasi data, pada tahapan ini model yang dibangun akan dievaluasi dengan melihat
koefisien determinansinya.
4. Pada pengujian asumsi model yang sudah divalidasi akan dilakukan analisis residual.
5. Setelah semua proses sudah dilalui pada tahap akhir akan disumpulkan apakah model
yang dibangun dapat bekerja dengan baik untuk memprediksi berat badan jerapah.
 3

3. HASIL DAN PEMBAHASAN

Data hewan jerapah diambil dan ditentukan oleh peneliti mengikuti batas-batas umum
dari tinggi dan umur jerapah remaja sampai dewasa. Data yang diambil merupakan jerapah yang
sehat sebagai bahan awal untuk memprediksi berat jerapah. Hewan tertinggi di dunia ini
memiliki berat sampai 1.360 kilogram dan tinggi mencapai 5.5 meter serta umurnya sampai 26
tahun.
a. Persiapan Data
Dari batas tersebut kami dapat menentukan data hewan jerapah untuk memprediksi
beratnya. Berikut ini adalah data hewan jerapah (Tabel 1) :

Tabel 1. Data Hewan Jerapah

No Tinggi Umur Berat


1 4.8 Meter 24 Tahun 1100 Kilogram
1 4.4 Meter 20 Tahun 1000 Kilogram
2 4.1 Meter 18 Tahun 980 Kilogram
3 4.8 Meter 20 Tahun 1200 Kilogram
4 5.0 Meter 26 Tahun 1360 Kilogram
5 4.5 Meter 23 Tahun 1280 Kilogram
6 3.0 Meter 15 Tahun 800 Kilogram
7 2.0 Meter 8 Tahun 500 Kilogram
8 3.5 Meter 18 Tahun 1110 Kilogram
9 2.5 Meter 10 Tahun 650 Kilogram

b. Membangun Model Regresi


Dari data yang dikumpulkan ada hubungan variabel antara data independen (tinggi dan
umur) dan data dependen (berat). Untuk model regresi yang dibangun adalah fungsi
LinearRegression() dari library sklearn. Berikut model yang dibangung menggunakan bahasa
pemrograman python (Gambar 2) :

Gambar 2. Model Regresi

Kode program diatas memberikan beberapa nilai penting dari model yang dibangun. Nilai
tersebut merupakan nilai intersep dan koefisien dari model yang dapat dimasukkan ke dalam
persamaan matematis sebagai berikut :

Adapun penjelasan dari masing-masing angka tersebut :


1. Nilai intersep adalah perkiraan nilai rata-rata variabel dependen, ketika semua nilai
variabel independen adalah 0 maka tinggi jerapah dengan 0 meter dan umurnya 0 tahun
mendapatkan berat sekitar 154 kilogram.
2. Untuk koefisien memiliki 2 nilai masing-masing untuk variabel tinggi dan umur. Nilai
ini mewakili hubungan variabel bebas dengan variabel terkait, dimana perubahan nilai
variabel terikat sama besar dengan koefisiennya.
4 

Setelah melihat hasil nilai dari model diatas kemudian akan dicoba hasil prediksi berat dari
hewan jerapah dengan memasukan nilai secara manual(Gambar 3).

Gambar 3. Prediksi Manual

Sebelum masuk ke langkah selanjutnya dari data dan model yang dibangun akan di visualisasi
dengan grafik 3D (Gambar 4)

Gambar 4. Grafis 3D Dari Model Regresi

c. Validasi Data
Setelah membangun model, hal paling penting adalah memvalidasi kinerjanya. Suatu
model dapat dievaluasi dengan melihat koefisien determinasinya (R2), uji F, uji t, dan residual.
Sebelum itu model yang dibangun sebelumnya akan di re-built dengan menggunakan pustaka
statsmodel fungsi OLS(). Kemudian hasil ringkasan model ditampilkan menggunakan fungsi
summary()[3]. Ringkasan ini mengandung banyak nilai penting yang digunakan untuk
mengevaluasi model yang dibuat (Gambar 5).
 5

Gambar 5. Validasi Data

Koefisien determinan merupakan bagian dari total variasi dependen yang dijelaskan oleh variasi
variabel independen. Skor dihitung sebagai berikut (Gambar 6) :

Gambar 6. Hasil

Nilai berkisaran antara 0 dan 1, dimana artinya tidak ada hubungan linier antar
variabel dan menunjukkan hubungan linier yang sempurna. Nilai yang didapatkan
pada penelitian ini adalah 0.8991 yang berarti 89.91% variabel terikat dapat dijelaskan
menggunakan variabel bebas. Uji-F atau ANOVA (Analisis Varians) dalam regresi linier
berganda dapat digunakan untuk menentukan apakah model berkinerja lebih baik daripada
model yang lebih sederhana. Dengan Uji-F dapat mengevaluasi secara signifikan dengan
menghitung probabilitas yang setidaknya setinggi nilai yang diperoleh dari model (Gambar 7).

Gambar 7. Hasil F-statistik


6 

T-statistik adalah koefisien yang dibagi dengan kesalahan standarnya. Kesalahan tersebut
merupakan perkiraan deviasi dari koefisien, jumlah yang bervariasi di seluruh kasus. Hal ini
dapat dianggap sebagai ukuran ketepatan dengan koefisien regresi (Gambar 8).

Gambar 8. Hasil T-test

d. Pengujian Asumsi
Selanjutnya dilakukan dengan validasi mode analisis residual(Gambar ?), adapun daftar
pengujiannya sebagai berikut (Gambar 9) :

Gambar 9. Pengujian Asumsi

1. Linearitas
Linearitas mengasumsikan adanya hubungan linier antara variabel independen dan
variabel dependen. Karena terdapat beberapa variabel independen, hal ini dapat
dilakukan dengan menggunakan plot untuk melihat nilai prediksi (Gambar 10 dan
Gambar 11).

Gambar 10. Kode Program Linearitas


 7

Gambar 11. Grafik Asumsi Linear

2. Normalitas
Istilah kesalahan model dapat mengasumsikan model tersebut terdistribusi secara
normal. Program ini akan memeriksa normalitas residual dengan memanfaatkan plot ke
dalam histrogram dan melihat nilai p dari uji Anderson-Darling (Gambar 12).

Gambar 12. Hasil Asumsi Normalitas

3. Multikolinearitas
Mengasumsikan prediktor yang digunakan dalam regresi tidak berkorelasi satu sama
lain. Untuk mengidentifikasi apakah ada korelasi antara prediktor hal ini dapat dihitung
koefisien korelasi di setiap kolom dalam data menggunakan fungsi corr() (Gambar 13).
8 

Gambar 13. Hasil Asumsi Multikolinearitas

Pada grafik diatas menunjukkan banyak nilai positif, hasil tersebut memberikan sebuah
informasi bahwa kedua variabel independen saling mempengaruhi dan terdapat
multikolinearitas dalam data[4].
4. Autokorelasi
Autokorelasi adalah korelasi kesalahan (residual) dari waktu ke waktu. Dalam analisis
ini akan divalidasi apakah ada autokorelasi, hal tersebut terjadi jika residual dalam
periode lain (Gambar 14).

Gambar 14. Hasil Asumsi Autokorelasi


 9

Model yang dibangun mendapatkan nilai skor 1.27 artinya dapat diasumsikan terdapat
autokorelasi dalam residual pada data.
5. Homoskedastisitas
Pada homoskedastisitas mengasumsikan jika terdapat varians yang sama maka terdapat
kesalahan pada model data. Masalah tersebut terjadi ketika tidak memiliki varians
genap di seluruh data (Gambar 15).

Gambar 15. Hasil Asumsi Homoskedastisitas

4. KESIMPULAN

Model yang dirancang berhasil melewati semua tes dalam langkah validasi model ,
sehingga dapat disimpulkan model ini dapat bekerja dengan baik untuk memprediksi berat
hewan jerapah di masa depan dengan menggunakan dua variabel independen. Tetapi model ini
hanya memiliki skor 89.91% artinya terdapat sekitar 11% faktor yang tidak diketahui yang
mempengahuri prediksi berat hewan jerapah.

DAFTAR PUSTAKA

[1] F. O. Lusiana, I. Fatma, and A. P. Windarto, “Estimasi Laju Pertumbuhan Penduduk


Menggunakan Metode Regresi Linier Berganda Pada BPS Simalungun,” J. Informatics
Manag. Inf. Technol., vol. 1 no 2, no. 1, p. 6, 2021, [Online]. Available:
http://hostjournals.com/jimat/article/view/104/63.
[2] Y. Asohi and A. Andri, “Impelementasi Algoritma Regresi Linier Berganda Untuk
Prediksi Penjualan,” J. Nas. Ilmu Komput., vol. 1, no. 3, pp. 149–158, 2020, doi:
10.47747/jurnalnik.v1i3.161.
[3] H. W. Herwanto, T. Widiyaningtyas, and P. Indriana, “Penerapan Algoritme Linear
Regression untuk Prediksi Hasil Panen Tanaman Padi,” J. Nas. Tek. Elektro dan Teknol.
Inf., vol. 8, no. 4, p. 364, 2019, doi: 10.22146/jnteti.v8i4.537.
[4] M. Fahlepi and A. Widjaja, “Penerapan Metode Multiple Linear Regression Untuk
10 

Prediksi Harga Sewa Kamar Kost,” J. Strateg., vol. 1, no. November, pp. 615–629,
2019.

Anda mungkin juga menyukai