Anda di halaman 1dari 9

Prediksi Emisi CO2 untuk Menentukan Kendaraan Ramah Lingkungan

dengan Menggunakan Metode Multiple Linear Regression


Widya Parasdiasari, Titania Permata Putri, Vira Maulina Putri, Tria Oktavia Aradiny
Email: widyaparasdiasari@student.telkomuniversity.ac.id ,
titaniasyahrul@student.telkomuniversity.ac.id , viramaulina@student.telkomuniversity.ac.id,
triaaradiny@student.telkomuniversity.ac.id

Rio Aurachman
rioaurachman@telkomuniversity.ac.id
Selaku Dosen Pembina

Abstract
Udara merupakan faktor yang penting dalam hidup dan kehidupan. Namun pada era
modern ini, perkembangan transportasi dapat menurunkan kualitas udara. Sektor
transportasi memiliki ketergantungan yang tinggi terhadap sumber energi. Hampir
sebagian besar produk kendaraan bermotor yang digunakan dalam sektor transportasi
menggunakan Bahan Bakar Minyak (BBM) sebagai sumber energi. Bahan bakar dari
transportasi atau kendaraan akan meningkatkan emisi CO2 di udara. Dengan
meningkatnya konsentrasi CO2 di atmosfer, maka akan menyebabkan semakin banyaknya
gelombang panas yang dipantulkan dari permukaan bumi diserap oleh atmosfer.
Hal ini akan mengakibatkan meningkatnya suhu rata-rata permukaan bumi yang biasa
dikenal dengan istilah global warming. Pada jurnal ini, akan dilakukan estimasi atau
prediksi besarnya emisi yang dihasilkan kendaraan dengan menggunakan metode
multiple regression linear untuk dapat memprediksi besarnya beban lingkungan yang
diakibatkan oleh kegiatan transportasi. Dataset perusahaan diolah hingga mendapatkan
prediksi yang tepat untuk menentukan kendaraan dengan emisi CO2 rendah sehingga
memiliki harga dan daya jual yang tinggi.
Keywords: Udara, Emisi CO2, Lingkungan, Kendaraan, Multiple Regression Linear.

1 Pendahuluan
1.1. Deskripsi Masalah
Udara merupakan faktor yang penting dalam hidup dan kehidupan. Namun pada era modern ini,
sejalan dengan perkembangan pembangunan fisik kota dan pusat-pusat industri, serta
berkembangnya transportasi, maka, kualitas udara pun mengalami perubahan yang disebabkan oleh
terjadinya pencemaran udara, atau, sebagai berubahnya salah satu komposisi udara dari keadaan
yang normal; yaitu masuknya zat pencemar (berbentuk gas-gas dan partikel kecil/aerosol) ke dalam
udara dalam jumlah tertentu untuk jangka waktu yang cukup lama, sehingga dapat mengganggu
kehidupan manusia, hewan, dan tanaman (BPLH DKI Jakarta, 2013).

Sektor transportasi memiliki ketergantungan yang tinggi terhadap sumber energi. Hampir
sebagian besar produk kendaraan bermotor yang digunakan dalam sektor transportasi
menggunakan Bahan Bakar Minyak (BBM) sebagai sumber energi. Penggunaan BBM sebagai
sumber energi tidak akan terlepas dari senyawa seperti karbon dioksida (Eldewisa dkk, 2008). Emisi
CO2 tersebut merupakan komponen utama Gas Rumah Kaca (GRK) yang dapat memperbesar Efek
Rumah Kaca (ERK) (Sasmita, 2011). Dengan meningkatnya konsentrasi CO2 di atmosfer, maka akan
menyebabkan semakin banyaknya gelombang panas yang dipantulkan dari permukaan bumi
diserap oleh atmosfer. Hal ini akan mengakibatkan meningkatnya suhu rata-rata permukaan bumi
yang biasa dikenal dengan istilah global warming.
Berdasarkan uraian tersebut maka dilakukan estimasi atau prediksi besarnya emisi yang dihasilkan
kendaraan. Sehingga dapat diprediksi besarnya beban lingkungan yang diakibatkan oleh kegiatan
transportasi tersebut. Dalam perhitungan kontribusi CO2 yang dihasilkan oleh kendaraan, dilakukan
dengan menggunakan metode Multiple Linear Regression. Multiple Linear Regression adalah salah
satu analisis statistik yang digunakan untuk melakukan prediksi hubungan antara kumpulan variabel
independen ke variabel dependen tunggal. Pada laporan ini, digunakan dataset peringkat konsumsi
bahan bakar khusus model dan perkiraan emisi karbon dioksida untuk kendaraan ringan baru dari
penjualan retail di Kanada. Adapun data-data tersebut adalah sebagai berikut:
● Model Year
● Make
● Model
● Vehicle class
● Engine size
● Cylinders
● Transmission
● Fuel type
● Fuel consumption in city (L/100 km)
● Fuel consumption in HWY (L/100 km)
● Fuel consumption comb (L/100 km)
● CO2 emissions (g/km)

Dalam dataset yang digunakan, data yang menjadi atribut sehingga menjadi data dasar dalam teknik
multiple linear regression, yaitu engine size, cylinders, fuel consumption comb (L/100 km), dan CO2
emissions (g/km). Dari data atribut yang digunakan, akan didapatkan prediksi kendaraan manakah
yang menghasilkan emisi CO2 paling rendah.

1.2. Rumusan Masalah


Adapun rumusan masalah pada jurnal ini, sebagai berikut:
1. Apa hasil prediksi dengan menggunakan metode multiple linear regression?
2. Bagaimana penentuan accuracy hasil prediksi yang telah dilakukan?
3. Bagaimana tingkat error dari hasil prediksi yang telah dilakukan?
4. Apa keuntungan yang diperoleh perusahaan berdasarkan hasil prediksi?

1.3. Target Peningkatan Performansi Setelah Penerapan Data Analitik


Pada penerapan data analitik ini menunjukkan CO2 emissions. Perusahaan dapat menghitung dan
memperkirakan CO2 emissions pada setiap kendaraan yang dihasilkan. Semakin akurat prediksi CO2
emissions dan semakin sedikit nilai CO2 emissions menunjukkan kendaraan ramah lingkungan yang
akan menjadi daya tarik untuk pelanggan karena saat ini banyak customer yang sadar akan lingkungan
dan mencari kendaraan pribadi yang ramah lingkungan sehingga akan meningkatkan tingkat
penjualan.

2 Analisis dan Perancangan Dataset


Multiple Linear Regression (MR) adalah salah satu analisis statistik yang digunakan untuk melakukan
prediksi hubungan antara kumpulan variabel independen ke variabel dependen tunggal. Regresi
berganda sangat fleksibel dan menguntungkan dalam melakukan penyelidikan berbagai macam
pertanyaan. Multiple Linear Regression atau Regresi Linear Berganda merupakan bagian dari
Regression Model yang memiliki hasil prediksi berupa nominal.
2.1. Analisis Desain Proses Data Analitik
Desain proses dari pengolahan data analitik yang dilakukan dimulai dari pengolahan dataset fuel
consumption. Pemecahan masalah pada studi kasus kali ini ditentukan oleh masing-masing kelompok
dengan tujuan akhir memberikan manfaat bagi perusahaan. Pemecahan masalah yang diusulkan
adalah dengan melakukan prediksi emisi CO2 yang dihasilkan oleh kendaraan sehingga mampu
menemukan kendaraan dengan emisi CO2 yang rendah. Penentuan tersebut dapat memudahkan
perusahaan dalam melakukan promosi kepada target pelanggan yang peduli lingkungan. Oleh karena
itu, ditentukan variabel x yaitu data-data nominal yang melalui tahapan pre-processing hingga
menentukan data outlier yang akan dieliminasi sehingga dapat menghasilkan variabel x yang relevan
untuk memprediksi variabel y (CO2 emissions). Setelah penentuan variabel x (independen) dan y
(dependen), maka tahap berikutnya adalah melakukan train dan test data, menghitung error.
Kemudian, membuat model matematika, melakukan prediksi dan pengambilan keputusan evaluasi
model menggunakan Distribution Plot dan tahap terakhir adalah menguji apakah prediksi telah sesuai
dengan menentukan R-square dan MSE.

2.2. Data Preprocessing


Preprocessing merupakan suatu tahapan penting pada proses mining. Raw data tidak dapat diproses
secara langsung sebagai model data, sehingga data preprocessing diperlukan untuk menghasilkan data
yang konsisten dan bersih. Pada kasus Fuel Consumption ini, dilakukan pengecekkan pada setiap data
set yang bertujuan untuk mengetahui apakah data set memiliki nilai null atau tidak dengan cara
seperti gambar berikut:

Berdasarkan output yang tertera pada gambar diatas, dapat diketahui bahwa tidak terdapat nilai null
pada semua data set. Langkah selanjutnya adalah membuat data frame baru dimana setiap data set
yang diambil adalah data set yang berupa nominal, seperti pada gambar:
Proses pengecekkan data outlier dilakukan dengan tujuan melihat variabel independent relevan
dengan output yang akan dicari yaitu variabel dependent (CO2 emissions). Pengecekan menggunakan
box plot, pada tahap ini dilihat apakah terdapat variabel independen yang tidak mempengaruhi
variabel dependen melalui codingan sebagai berikut:

Dari gambar dan tabel diatas dapat disimpulkan bahwa setiap variabel independen dibutuhkan
karena memiliki nilai yang berhubungan dengan variabel dependen.

3 Implementasi Metode
3.1. Hasil Pengamatan
Berikut ini adalah hasil pengamatan yang didapatkan dengan menggunakan MLR-Estimated Linear
Model. Pemodelan diawali dengan mendefinisikan z sebagai independent variable. Independent
variable yang dipilih dari dataset adalah engine size, cylinders, dan fuel consumption comb. Berikut ini
adalah codingan untuk pembuatan model matematika:
Dari codingan tersebut, didapatkan intercept sebesar 46.685 dan koefisien untuk masing-masing
independent variable sebesar 7.08 untuk engine size, 7.29 untuk cylinders, dan 12.56 untuk fuel
consumption comb. Didapatkan estimasi linear model CO2 = 46.685 + ((7.08 * ENGINESIZE) + ((7.29) *
CYLINDERS) + ((12.56) * FUELCONSUMPTION_COMB).

3.2. Model Evaluasi


Pada tahap ini, dilakukan dilakukan evaluasi untuk menentukan apakah model telah sesuai dan tepat.
Digunakan distribution plot karena metode pengecekan model ini cocok digunakan untuk model yang
terdiri dari lebih dari satu jenis independent variable. Berikut adalah hasil codingan dari distribution
plot dengan menggunakan Python.

Pada grafik dapat dilihat bahwa dua garis mempunyai pola yang hampir sama (bersinggungan)
sehingga dapat dikatakan bahwa model tersebut dikatakan sesuai.
Pada gambar diatas dapat diketahui nilai regresi yaitu sebesar 0.8736347592279666 yang dapat
dikatakan bahwa tingkat accuracy model tinggi.

Salah satu tahap penting untuk menguji model adalah split data menjadi training data dan testing
data. Target data disini adalah CO2 emissions di dalam data frame yang berbeda dengan nama y_data.
Kemudian dibuat juga x_data, yaitu data selain CO2 emissions. Setelah itu, secara random dilakukan
split data menjadi training dataset menggunakan function train_test_split. Adapun test_size yang
digunakan sebesar 80%. Didapatkan test samples sebanyak 820 dan training samples sebanyak 205.

Pada gambar di atas, kemudian dilanjutkan dengan melakukan fit atau training data dan dilakukan
perhitungan R-square. Dari hasil perhitungan, dapat diketahui bahwa R-square untuk test set lebih
kecil dari train set.

Terkadang dalam suatu kasus tidak memiliki testing data yang cukup, sebagai hasilnya maka perlu
digunakan cross validation. Ada beberapa metode dalam menggunakan cross validation. Pada gambar
di atas digunakan function cross_val_score. Dengan input object engine size, cylinders, dan fuel
consumption comb, target datanya adalah y_data. Adapun cv untuk menentukan jumlah fold. Pada
kasus ini cv adalah 4. Scoring disini menggunakan R-square dan didapatkan rata-rata R-square untuk
setiap fold sebesar 0.873, 0.757, 0.8974, 0.91.

Kemudian dapat juga dilakukan perhitungan rata-rata dan standar deviasi dari estimasi. Untuk rata-
ratanya sebesar 0.8595 dan standar deviasi sebesar 0.06. Dapat juga diterapkan negative squared
error sebagai score dengan cara setting parameter ‘scoring’ metric menjadi
‘neg_mean_squared_error’ dan didapatkan hasil sebesar 459.99, 984.65, 347.91,287.42. Kemudian
dapat juga dilakukan perhitungan rata-rata R-square menggunakan dua folds dan didapatkan hasil
sebesar 0.84.

Tahap selanjutnya adalah menentukan tingkat error dari model yang telah dikembangkan dengan
menggunakan Mean Square Error (MSE). Nilai MSE yang diperoleh untuk train dataset sebesar 5930.8
dan untuk test dataset sebesar 6321.67 dengan penentuan nilai yang dapat dilihat pada gambar di
atas.
3.3. Uji Coba Memprediksi Satu Data
Pada tahap ini akan dilakukan uji coba terhadap model yang sudah dibuat sebelumnya. Uji coba
dilakukan dengan memasukkan angka setiap variabel yang diketahu pada mobil pertama. Pada tabel
berisi angka setiap variabel tersebut didapat bahwa CO2 emissions didaptkan hasil 221.

Setelah memasukkan angka pada tabel pada model yang sudah dibuat didapatkan hasil 214,1611856
yang mana dapat dikatakan bahwa model sesuai karena hasil perhitungan CO2 emissions mendekati
221.

Dapat juga dilakukan prediksi data dengan menggunakan fungsi cross_val_predict. Fungsi ini akan split
data menjadi fold dengan jumlah yang telah ditentukan, akan menggunakan satu fold sebagai prediksi
dan dan fold lain digunakan sebagai test. Maka didapatkan hasil perkiraan untuk CO2 emissions
kendaraan kesatu sampai kelima secara berurutan adalah 196.38, 214.55, 158.02, 253.66, 247.27.

3.4. Analisis Manfaat Peningkatan Performansi Akibat Penerapan Data Analitik


Penerapan data analitik diharapkan dapat membuat perusahaan mengetahui kendaraan-kendaraan
dengan emisi CO2 yang rendah berdasarkan dataset enginesize, cylinders, dan
fuelconsumptions_comb. Perusahaan akan meningkatkan performansi pada kegiatan promosi dengan
memahami kebutuhan pelanggan yang tersegmentasi pada pelanggan peduli lingkungan. Kendaraan
dengan emisi CO2 yang rendah akan menghasilkan produk bernilai tinggi karena dapat dikategorikan
kendaraan ramah lingkungan dan meningkatkan penjualan.

4 Penutup
4.1 Kesimpulan
Berdasarkan hasil analisis diatas, maka terdapat beberapa kesimpulan yang dapat diambil dari tugas
besar ini adalah sebagai berikut:
1. Multiple Linear Regression (MR) digunakan sebagai metode untuk menganalisis statistik yang
digunakan pada prediksi hubungan antara kumpulan variabel independen ke variabel dependen
tunggal. Dimana berdasarkan data set yang sudah diolah pada studi kasus fuel consumption diatas,
didapatkan variabel independen (X) yang mempengaruhi variabel dependen (Y) yaitu CO2
emissions berupa:
● Enginesize
● Cylinders
● Fuel consumption comb
2. Data set yang didapatkan dari tahap preprocessing, membuktikan variabel independen manakah
yang akan mempengaruhi nilai dari variabel dependen atau CO2 emissions.
3. Analisa ini dilakukan untuk membantu perusahaan meramalkan serta mengambil keputusan
terkait perancangan kendaraan yang berorientasi pada jumlah emisi CO2 yang dihasilkan.
4. Pemecahan masalah yang diusulkan terkait prediksi emisi CO2 yang dihasilkan oleh kendaraan
sehingga dapat menghasilkan kadar emisi CO2 lebih rendah. Hal ini bertujuan untuk mengurangi
polusi dan meningkatkan kesadaran untuk menjaga lingkungan.

4.2 Saran
Berdasarkan hasil analisis dan kesimpulan diatas, maka didapatkan saran-saran yang dapat
memperbaiki kesalahan serta kekurangan untuk penelitian selanjutnya, yaitu sebagai berikut:
1. Menyertakan angka berupa range pada emisi tinggi, sedang, dan rendah sehingga peneliti dapat
mengklasifikasi emisi CO2 berdasarkan tingkatannya, sehingga memudahkan generalisasi pada
elemen-elemen setiap kendaraan yang mempengaruhi tingkat emisi.
2. Perusahaan mampu mengaplikasikan dan melakukan uji coba langsung pada jumlah emisi CO2 yang
telah diprediksi sehingga mendapatkan kepercayaan konsumen, menjaga nama baik, dan
meningkatkan permintaan terhadap produk.

References
[1] Aiken, L. S., West, S. G. (2012). Multiple linear regression. Handbook of Psychology, Second Edition,
2.
[2] Sulistyono, S., & Sulistiyowati, W. (2018). Peramalan produksi dengan metode regresi linier
berganda. PROZIMA (Productivity, Optimization and Manufacturing System Engineering), 1(2), 82-89.
[3] Ismiyati, Marlita, D., & Saidah, D. (2014). Pencemaran Udara Akibat Emisi Gas Buang. Jurnal
Manajemen Transportasi & Logistik, 242-243.

Anda mungkin juga menyukai