Anda di halaman 1dari 29

Perhitungan 2023, 11, 126

Komputasi n
Artikel

Analisis Spektrum Respons Bangunan Geser Bertingkat


Menggunakan Teknik Machine Learning
Manolis Georgioudakis 1,* dan Vagelis Plevris 2
di bawah syarat dan ketentuan lisensi Creative Commons Attribution (CC BY) ( https://
creativecommons.org/licenses/by/

Kutipan: Georgioudakis, M.; 4.0/).


1
Plevris, V. Spektrum Respons Lembaga Analisis Struktur &; Penelitian Antiseismik, Sekolah Teknik Sipil, Teknik Nasional
Analisis Geser Multi-Cerita Universitas Athena, Kampus Zografou, GR 15780 Athena, Yunani
2
Bangunan menggunakan teknik Departemen Teknik Sipil dan Lingkungan, Universitas Qatar, Doha PO Box 2713, Qatar;
pembelajaran mesin. Komputasi
vplevris@qu.edu.qa

2023, 11, 126.


* Korespondensi: geoem@mail.ntua.gr

https://doi.org/10.3390/
komputasi11070126 Analisis dinamis struktur adalah prosedur komputasi intensif yang harus dipertimbangkan,
untuk membuat penilaian kinerja seismik yang akurat dalam aplikasi teknik sipil dan
Editor Akademik: Gavril
struktural. Untuk menghindari tugas-tugas yang menuntut komputasi ini, metode yang
Grebenisan, Alin Pop dan Dan
disederhanakan sering digunakan oleh para insinyur dalam praktiknya, untuk
Claudiu Negra ̆u
memperkirakan perilaku struktur kompleks di bawah pemuatan dinamis. Makalah ini
Diterima: 6 Mei 2023 menyajikan penilaian beberapa algoritma pembelajaran mesin (ML), dengan karakteristik
Revisi: 9 Juni 2023 berbeda, yang bertujuan untuk memprediksi respons analisis dinamis bangunan bertingkat.
Diterima: 20 Juni 2023 Dataset besar hasil analisis respons dinamis dihasilkan melalui metode pengambilan sampel
Diterbitkan: 29 Juni 2023
standar dan prosedur analisis modal spektrum respons konvensional. Dalam upaya untuk
mendapatkan kinerja algoritma terbaik, pencarian hyper-parameter yang luas diuraikan,
diikuti oleh kepentingan fitur yang sesuai. Model ML yang menunjukkan kinerja terbaik
digunakan dalam aplikasi web, dengan tujuan memberikan prediksi respons dinamis
Hak cipta: © 2023 oleh penulis.
bangunan bertingkat, sesuai dengan karakteristiknya.
Pemegang Lisensi MDPI, Basel,
Swiss. Artikel ini adalah artikel
akses terbuka yang didistribusikan Kata kunci: analisis spektrum respons; algoritma ansambel; pembelajaran mesin; bangunan
geser; Kemampuan menjelaskan SHAP

1 . Perkenalan
Machine learning (ML) memiliki banyak aplikasi dalam pemodelan dan simulasi struktur [1]. Salah satu
aplikasi ML yang paling umum dalam analisis struktural adalah prediksi perilaku struktural di bawah beban dan
kondisi lingkungan yang berbeda. Algoritme ML dapat dilatih berdasarkan data dari analisis struktural
sebelumnya, untuk mempelajari bagaimana berbagai faktor—seperti sifat material, geometri, dan kondisi
pemuatan—memengaruhi respons struktural. Informasi ini kemudian dapat digunakan untuk memprediksi
perilaku struktur baru, tanpa perlu analisis tambahan yang memakan waktu dan mahal. Bidang aplikasi lain
yang menarik adalah pemantauan kesehatan struktural (SHM) dan identifikasi kerusakan [2], di mana, dengan
menganalisis perubahan respons struktural dari waktu ke waktu, dan menggunakan data yang dikumpulkan
oleh sistem SHM, algoritma ML dapat belajar mendeteksi dan melokalisasi kerusakan pada struktur dan, secara
umum, menilai kesehatan dan kondisi struktur dari waktu ke waktu. Dalam pengoptimalan desain [3], dengan
menganalisis hubungan antara berbagai parameter desain dan performa struktural, algoritme ML dapat
mengidentifikasi konfigurasi desain optimal yang meminimalkan bobot, memaksimalkan kekakuan, atau
mencapai karakteristik performa lain yang diinginkan [4,5]. ML juga dapat digunakan untuk mengukur
ketidakpastian yang terkait dengan analisis struktural, meningkatkan akurasi prediksi dan mengurangi risiko
kegagalan [6]. Secara keseluruhan, penggunaan ML dalam analisis struktural memiliki potensi untuk secara
signifikan meningkatkan akurasi dan efisiensi analisis struktural, serta memungkinkan kemampuan baru untuk
deteksi kerusakan dan pengoptimalan desain.
Di bidang khusus dinamika struktural dan rekayasa gempa, teknik ML juga semakin banyak digunakan [7],
karena dapat membantu mengekstrak wawasan yang berguna
Perhitungan 2023, 11, 126

Perhitungan 2023, 11, 126. https://doi.org/10.3390/computation11070126 https://www.mdpi.com/journal/computation


dan pola dari sejumlah besar data, yang dapat digunakan untuk
meningkatkan akurasi dan efisiensi teknik analisis dinamis struktural.
Model berbasis data untuk memprediksi respons dinamis sistem linier
dan non-linier sangat penting, karena penerapannya yang luas, dari
analisis probabilistik hingga masalah terbalik, seperti identifikasi sistem
dan diagnosis kerusakan. Dalam paragraf berikut, kami memeriksa
beberapa karya penting dan kontribusi mutakhir di lapangan.

Xie et al. [8] mempresentasikan evaluasi komprehensif tentang


kemajuan dan tantangan penerapan ML dalam rekayasa gempa. Studi
mereka menggunakan matriks atribut hierarkis untuk mengkategorikan
literatur, berdasarkan empat sifat, (i) metode ML; (ii) area topik; (iii)
sumber daya data; dan (iv) skala analisis. Tinjauan mereka memeriksa
sejauh mana ML telah diterapkan di beberapa bidang rekayasa gempa,
termasuk kontrol struktural untuk mitigasi gempa, penilaian kerapuhan
seismik, identifikasi sistem dan deteksi kerusakan, dan analisis bahaya
seismik. Zhang et al. [9] mempresentasikan kerangka kerja ML untuk
menilai keamanan struktural pascagempa. Mereka mengusulkan
metodologi sistematis untuk menghasilkan dataset yang andal untuk
setiap bangunan yang rusak, yang mencakup penggabungan konsep
respons dan pola kerusakan. Kapasitas keruntuhan sisa struktur yang
rusak dievaluasi, menggunakan analisis dinamis inkremental dengan
gerakan tanah berurutan. Algoritma ML digunakan, untuk memetakan
respons dan pola kerusakan pada status keselamatan bangunan,
berdasarkan ambang batas kapasitas keruntuhan residu yang telah
ditentukan sebelumnya.

Nguyen et al. [10] menerapkan teknik ML untuk memprediksi


respons seismik dari rangka penahan momen baja 2D di bawah gerakan
gempa. Mereka menggunakan dua algoritma ML populer — Artificial
Neural Network (ANN) dan eXtreme Gradient Boosting (XGBoost) —
dan mempertimbangkan lebih dari 22.000 analisis dinamis non-linear,
pada 36 kerangka momen baja dari berbagai karakteristik struktural, di
bawah 624 catatan gempa dengan percepatan puncak lebih besar dari
0,2 g. Kedua algoritma ML mampu memperkirakan respons
penyimpangan seismik struktur dengan andal, sementara XGBoost
menunjukkan kinerja terbaik. Sadeghi Eshkevari et al. [11]
mengusulkan ANN berulang berbasis fisika yang mampu
memperkirakan respons dinamis dari sistem kebebasan beberapa
derajat linier dan non-linier, mengingat gerakan tanah. Model ini dapat
memperkirakan serangkaian respons yang luas, seperti percepatan,
kecepatan, perpindahan, dan kekuatan internal sistem. Arsitektur blok
berulang terinspirasi oleh algoritma pemecah persamaan diferensial.
Studi ini menunjukkan bahwa jaringan dapat secara efektif menangkap
berbagai perilaku non-linear dari sistem dinamis dengan tingkat akurasi
Perhitungan 2023, 11, 126

yang tinggi, tanpa memerlukan informasi sebelumnya atau kumpulan


data yang terlalu besar.

Dalam karya menarik Abd-Elhamed et al. [12], analisis logis data (LAD)
digunakan untuk memprediksi respons seismik struktur. Para penulis
menggunakan gerakan tanah nyata, mempertimbangkan variasi
karakteristik gempa, seperti kelas tanah, periode karakteristik, langkah
waktu catatan, perpindahan tanah puncak, kecepatan tanah puncak,
dan percepatan tanah puncak. Model LAD dibandingkan dengan model
ANN, dan terbukti menjadi alat yang efisien untuk mempelajari,
mensimulasikan, dan memprediksi respons dinamis struktur di bawah
beban gempa. Gharehbaghi et al. [13] menggunakan pemrograman
genetik multi-gen (MGGP) dan ANN untuk memprediksi spektrum
kerusakan seismik. Mereka menggunakan sistem SDOF inelastis di
bawah satu set catatan gerakan tanah gempa, untuk menghitung
kerusakan spektral yang tepat, menggunakan indeks kerusakan Park-
Ang. Model ANN menunjukkan kinerja keseluruhan yang lebih baik,
namun model matematika berbasis MGGP juga berguna, karena
berhasil memberikan ekspresi matematika tertutup untuk mengukur
potensi kerusakan seismik struktur.

Kazemi et al. [14] mengusulkan model prediksi untuk respons seismik


dan penilaian kinerja bingkai penahan momen RC. Mereka melakukan
analisis dinamis inkremental (IDA) dari 165 frame RC dengan 2 hingga
12 lantai dan panjang teluk mulai dari 5,0 m hingga 7,6 m, berakhir
dengan total 92.400 titik data untuk melatih model berbasis data yang
dikembangkan. Parameter output yang diperiksa adalah rasio drift
antarlantai maksimum dan median kurva IDA, yang dapat digunakan
untuk memperkirakan kapasitas keadaan batas seismik dan penilaian
kinerja bangunan RC. Metodologi ini diuji di gedung RC lima lantai
dengan hasil yang sangat baik. Kazemi dan Jankowski [15]
menggunakan algoritma ML yang diawasi dengan Python, untuk
menemukan kurva IDA median untuk memprediksi kapasitas limit-state
seismik dari rangka penahan momen baja dengan mempertimbangkan
efek interaksi tanah-struktur. Mereka menggunakan struktur baja dua
hingga sembilan lantai yang mengalami tiga himpunan bagian gerakan
tanah seperti yang disarankan oleh FEMA-P695, dan total 128.000 titik
data. Mereka mengembangkan antarmuka pengguna grafis (GUI) yang
userfriendly untuk memprediksi percepatan spektral Sa (T1) dari
tingkat kinerja limit-state seismik menggunakan model prediksi yang
dikembangkan. GUI yang dikembangkan mengurangi kebutuhan akan
analisis komputasi yang mahal, memakan waktu, dan kompleks, sambil
memberikan kurva IDA median termasuk efek interaksi tanah-struktur.

Wakjira et al. [16] mempresentasikan model prediktif berbasis ML baru


yang dapat dijelaskan untuk respons siklik lateral dari dermaga
jembatan baja goyang dasar pasca-tegangan. Para penulis menerapkan
berbagai macam sembilan teknik ML yang berbeda, mulai dari yang
sederhana hingga yang paling canggih, untuk menghasilkan model
Perhitungan 2023, 11, 126

prediktif. Hasil yang diperoleh menunjukkan bahwa model yang paling


sederhana tidak memadai untuk menangkap hubungan antara faktor
input dan variabel respons, sementara model lanjutan, seperti XGBoost
yang dioptimalkan, menunjukkan kinerja terbaik dengan kesalahan
terendah. Metode yang disederhanakan dan perkiraan sangat berguna
dalam praktik teknik dan telah berhasil digunakan oleh berbagai
peneliti dalam dinamika struktural dan aplikasi terkait teknik gempa,
seperti evaluasi kinerja seismik rangka baja [17] dan lainnya.

Kebaruan dari pekerjaan ini terdiri dari pengembangan model ML baru


yang dioptimalkan untuk prediksi yang akurat dan efisien secara
komputasi dari periode eigen dasar, perpindahan maksimum serta gaya
geser dasar bangunan geser bertingkat. Empat algoritma ML yang
berbeda dibandingkan dalam hal performa prediksi mereka.
Interpretasi dan penjelasan diuraikan menggunakan penjelasan
permutasi dari metodologi SHAP. Selain itu, aplikasi web dikembangkan
berdasarkan model ML yang dioptimalkan, agar mudah digunakan oleh
para insinyur dalam praktiknya. Sisa makalah disusun sebagai berikut.
Bagian 2 mendefinisikan rumusan masalah, diikuti dengan deskripsi
dataset dan analisis data eksplorasi di Bagian 3. Bagian 4 memberikan
gambaran umum tentang algoritme ML, diikuti oleh alur ML dan hasil
performa Bagian 5 serta diskusi tentang interpretabilitas hasil di Bagian
6. Bagian 7 menyajikan dan membahas skenario kasus uji, sedangkan
Bagian 8 menyajikan aplikasi web yang telah dikembangkan dan
digunakan untuk penggunaan yang luas dan terbuka. Pada akhirnya,
diskusi singkat dan kesimpulan penelitian disajikan.

2. Perumusan Masalah
Analisis modal spektrum respons (RSMA) adalah metode untuk
memperkirakan respons struktural terhadap peristiwa dinamis pendek,
non-deterministik, dan sementara. Contoh peristiwa tersebut adalah
gempa bumi dan guncangan. Karena riwayat waktu yang tepat dari
beban tidak diketahui, sulit untuk melakukan analisis tergantung waktu.
Metode ini membutuhkan perhitungan bentuk mode alami dan
frekuensi struktur selama getaran bebas. Ini menggunakan matriks
massa dan kekakuan struktur untuk menemukan berbagai periode di
mana ia akan beresonansi secara alami, dan didasarkan pada
superposisi mode, yaitu, superposisi respons struktur untuk berbagai
mode, dan penggunaan spektrum respons. Idenya adalah untuk
memberikan masukan yang membatasi seberapa banyak eigenmode
yang memiliki frekuensi dan redaman alami tertentu dapat
bersemangat oleh peristiwa jenis ini. Spektrum respons digunakan
untuk menghitung respons maksimum di setiap mode, alih-alih
menyelesaikan masalah riwayat waktu secara eksplisit menggunakan
metode integrasi langsung. Maxima ini tidak bersamaan dan untuk
alasan ini respons modal maksimum untuk setiap mode tidak dapat
ditambahkan secara aljabar. Sebaliknya, mereka digabungkan
menggunakan teknik statistik, seperti akar kuadrat dari jumlah kuadrat
Perhitungan 2023, 11, 126

(SRSS) metode atau metode kombinasi kuadrat lengkap (CQC) yang


lebih kompleks dan terperinci. Meskipun metode spektrum respons
adalah perkiraan, metode ini diterapkan secara luas dalam dinamika
struktural dan merupakan dasar untuk metode gaya lateral setara (ELF)
yang populer. Dalam subbagian berikut, deskripsi singkat tentang RSMA
untuk struktur multi-cerita disediakan berdasarkan konsep dasar dari
sistem struktural derajat kebebasan tunggal.

2.1. Analisis Respons Sistem MDOF


Sistem bangunan geser single degree of freedom (SDOF) yang ideal
memiliki massa m yang terletak di bagian atas dan kekakuan k yang
disediakan oleh kolom vertikal. Untuk sistem seperti itu tanpa redaman,
frekuensi melingkar ω, frekuensi siklik f dan periode getaran alami (atau
periode eigen) T diberikan oleh rumus berikut:

rk ω Rm
ω= f= T = 2π (1) m 2π k

Mirip dengan sistem SDOF, bangunan geser bertingkat, diidealkan


sebagai sistem multi-derajat kebebasan (MDOF) digambarkan pada
Gambar 1, dengan penomoran cerita dari bawah ke atas. Sistem getar
gambar memiliki n cerita dan n derajat kebebasan (DOF),
dilambangkan sebagai ui perpindahan horizontal ( i = {1, 2, ··· , n}) di
bagian atas setiap cerita. Kesetimbangan dinamis struktur MDOF di
bawah eksitasi gempa bumi dapat dinyatakan dengan persamaan gerak
berikut setiap saat t:

Mu ̈(t) + Cu ̇(t) + Ku(t) = −M · r · u ̈g(t)

di mana M( n × n) adalah matriks massa struktur yang menahan massa


mi pada diagonalnya; K( n × n) adalah matriks kekakuan; C(n × n)
mewakili matriks redaman, r(n × n) adalah vektor koefisien
pengaruh; u ̈(t), u ̇(t), u(t) (semua n × 1) masing-masing adalah vektor
percepatan, kecepatan, dan perpindahan, dan u ̈g(t) adalah percepatan
gerak tanah, diterapkan pada DOF dari struktur yang didefinisikan oleh
vektor r.
Perhitungan 2023, 11, 126

Upun
cak
ug un mn

uj mj kn

u2 m2 kj

u1 m1 k2

k1

S
ug

Gambar 1. Model bangunan geser bertingkat dengan n DOF.

Sistem MDOF memiliki n frekuensi alami ωi (i = 1, 2, . . . , n) yang dapat


ditemukan dari persamaan karakteristik:

Dengan memecahkan determinan Persamaan (3), seseorang dapat


menemukan nilai eigen λi dari mode i yang merupakan kuadrat dari
frekuensi alami ωi sistem (λi = ωi2). Kemudian, vektor eigen (atau

bentuk mode atau mode eigen φi (masing-masing n × 1) dapat


ditemukan dengan persamaan berikut:

Persamaan (4) mewakili masalah nilai eigen umum, yang merupakan


masalah klasik dalam matematika. Solusi dari masalah ini melibatkan
serangkaian dekomposisi matriks yang dapat mahal secara komputasi,
terutama untuk sistem besar dengan banyak DOF. Biarkan respons
perpindahan sistem MDOF dinyatakan sebagai

u(t) = Φ · y(t)

di mana y(t) mewakili vektor perpindahan modal dan Φ = [φ1, φ2, . .


. , φn] adalah matriks yang mengandung vektor eigen. Mengganti
Persamaan (4) dalam Persamaan (2) dan mengalikan dengan ΦT yang
kita ambil

(6)
M∗ C∗ K∗
Perhitungan 2023, 11, 126

di mana M∗, C∗ dan K∗ adalah massa umum, redaman umum, dan


umum
matriks kekakuan, masing-masing. Berdasarkan sifat-sifat matriks Φ,
matriks M∗, K∗, dan C∗ semuanya matriks diagonal dan Persamaan
(6) berkurang menjadi sebagai berikut

y ̈i saya = {1, 2,
3, . . . , n} (7)

di mana yi(t) adalah respons perpindahan modal dari mode ith, ξi


adalah rasio redaman modal dari mode ith dan Γi adalah faktor
partisipasi modal untuk mode ith, dinyatakan dengan

TMr

Bagi = φmi saya∗

di mana mi∗ = φiTMφi adalah elemen ke-i dari matriks diagonal M∗.
Persamaan (7) mewakili n persamaan diferensial orde kedua (yaitu,
mirip dengan sistem SDOF), solusinya akan memberikan respons
perpindahan modal yi (t) untuk mode ith. Selanjutnya, respons
perpindahan di setiap mode sistem MDOF dapat diperoleh dengan
Persamaan (5) menggunakan yi (t).

2.2. Spektrum Respons


Dalam pekerjaan ini, kami menggunakan spektrum desain untuk
analisis elastis, seperti yang dijelaskan dalam §3.2.2.5 Eurocode 8 (EC8)
[18]. Perilaku inelastis struktur diperhitungkan secara tidak langsung
dengan memperkenalkan faktor perilaku q. Berdasarkan hal ini, analisis
elastis dapat dilakukan, dengan spektrum respons berkurang
sehubungan dengan yang elastis. Faktor perilaku q adalah perkiraan
rasio gaya seismik yang akan dialami struktur jika responsnya benar-
benar elastis dengan redaman kental 5%, terhadap gaya seismik yang
dapat digunakan dalam desain, dengan model analisis elastis
konvensional, masih memastikan respons struktur yang memuaskan.
Untuk komponen horizontal dari aksi seismik, spektrum desain, Sd (T),
didefinisikan sebagai

kalau 0 ≤ T ≤ TB
Perhitungan 2023, 11, 126

 Ag · S · 2,5q kalau TB

≤ T ≤ TC Sd(T) =(9) Ag · Sag kalau TC ≤ T ≤ TD

ag · S · 2,5q · Ag kalau TD
≤T

di mana T adalah periode getaran sistem SDOF linier, S adalah faktor


tanah, TB dan TC adalah batas bawah dan atas periode cabang
percepatan spektral konstan, masing-masing, TD adalah nilai yang
menentukan awal dari rentang respons perpindahan konstan
spektrum, ag adalah percepatan tanah desain pada tanah tipe 'A' dan
β adalah faktor batas bawah untuk spektrum desain horizontal, dengan
nilai yang disarankan 0,2. Meskipun q memperkenalkan non-linearitas
ke dalam sistem, demi kesederhanaan, dalam penelitian ini kita
mengasumsikan perilaku elastis struktur dengan mengambil q sama
dengan 1. Perlu dicatat bahwa kami tidak menggunakan spektrum
respons elastis horizontal yang dijelaskan dalam §3.2.2.2 EC8,
melainkan spektrum desain untuk analisis elastis §3.2.2.5, untuk kasus
q = 1.

Keduanya hampir sama, tetapi ada juga beberapa perbedaan kecil.

2.3. Metode Spektrum Respons untuk Sistem MDOF


Mengingat spektrum, Persamaan (7) membentuk persamaan gerak
sistem SDOF. Respon perpindahan modal maksimum yi,max ditemukan
dari spektrum respon sebagai berikut:

YiMaks = |yi(t)|maks = Bagi · Sd(T2i)


(10) Oh
saya
Akibatnya, respons perpindahan maksimum (ui, maks) dan akselerasi (u ̈i, maks)
dari sistem MDOF dalam mode ith diberikan sebagai berikut:

UI,maks =φi · yi,maks


(11) u ̈i

Dalam setiap mode getaran, kuantitas respons yang diperlukan dari


minat Q, yaitu, perpindahan, gaya geser, momen lentur, dll., Dari sistem
MDOF dapat diperoleh dengan menggunakan respons maksimum yang
diperoleh dengan Persamaan (11). Namun, respon maksimum akhir
Qmax, diperoleh dengan menggabungkan respon di masing-masing
mode menggunakan aturan kombinasi modal.

Dalam penelitian ini, aturan akar kuadrat umum dari jumlah kuadrat
(SRSS) digunakan sebagai berikut:

sn
Perhitungan 2023, 11, 126

Qmax = ∑ Q2i
i=1

Metode SRSS untuk menggabungkan respons modal maksimum pada


dasarnya baik ketika frekuensi modal dipisahkan dengan baik.

3. Deskripsi Dataset dan Analisis Data Eksplorasi


Dataset ini dihasilkan dari hasil analisis respons dinamis tahun 1995
dari bangunan geser bertingkat dari berbagai konfigurasi menggunakan
metode spektrum respons yang dijelaskan dalam Bagian 2. Lebih
spesifik, dataset terdiri dari 3 fitur, yaitu (i) <Cerita>, jumlah cerita di
bangunan geser; (ii) <k ̃>, kekakuan yang dinormalisasi atas massa
setiap cerita; dan (iii) <Tipe Ground>, tipe ground sesuai ketentuan
kode (EC8). Selain itu, dataset dilengkapi dengan 3 target, yaitu (i) <T1>,
eigenperiod fundamental bangunan; (ii) <Utop>, perpindahan
horizontal di cerita atas; dan (iii) <V ̃b>, gaya geser dasar yang
dinormalisasi di atas massa setiap lantai bangunan.

3.1. Deskripsi Set Data


Dalam penelitian ini, kita mengasumsikan konstanta k dan m untuk
semua cerita bangunan, yaitu, ki dan mi tetap konstan untuk setiap
cerita i. Tidak ada perubahan massa atau kekakuan setiap cerita, di
sepanjang ketinggian bangunan. Untuk bangunan seperti itu, respons
struktur dicirikan oleh rasio k / m daripada nilai individu k dan m dan
ini adalah alasan mengapa k / m, dilambangkan sebagai <k ̃>
(kekakuan yang dinormalisasi di atas massa), diambil sebagai input
dalam analisis, alih-alih memperhitungkan k dan m individu untuk
setiap cerita. Satuan yang digunakan untuk k ̃ adalah (N/m)/kg yang
setara dengan s−2. Kekakuan yang dinormalisasi berkisar antara 2000
hingga 12.000 s−2 (dengan langkah 500, yaitu, 21 nilai unik), sedangkan
jumlah cerita berkisar dari 2 hingga 20 (dengan langkah 1,
menghasilkan 19 nilai), mencakup berbagai struktur dan mewakili
mayoritas bangunan geser bertingkat khas yang dapat ditemukan
dalam praktik.

Gaya geser dasar yang dinormalisasi di atas massa setiap lantai


bangunan memiliki satuan N / kg, yang setara dengan m ·s−2.
Akselerasi tanah ag untuk penelitian ini dijaga konstan pada 1 g = 9,81
m / s2 karena mempengaruhi hasil secara linier, karena kita
mengasumsikan perilaku elastis (q = 1). Akibatnya, semua output
dihitung dengan mengacu pada akselerasi 1 g. Jika nilai lain digunakan
untuk akselerasi tanah, seperti yang dilakukan dalam skenario
pengujian yang diperiksa, maka output model perlu dikalikan dengan
nilai percepatan tanah ini untuk mendapatkan hasil yang benar. Rasio
redaman 5% dipertimbangkan dalam semua analisis.
Semua target, bersama dengan parameter input <k ̃> diperlakukan
sebagai variabel kontinu, sedangkan fitur yang tersisa diperlakukan
sebagai variabel bilangan bulat. Untuk fitur <Ground Type>, yang
secara native mengambil nilai dari daftar ['A', 'B', 'C', 'D', 'E'],
Perhitungan 2023, 11, 126

pengkodean ordinal digunakan. Dalam pengkodean ini, setiap nilai


kategori ditetapkan ke nilai bilangan bulat karena hubungan
keteraturan alami antara satu sama lain, yaitu, tanah tipe 'B', "lebih
buruk" daripada tanah tipe 'A', dll. Oleh karena itu, algoritma
pembelajaran mesin dapat memahami dan memanfaatkan hubungan
ini.

Dataset akhir, terdiri dari pengamatan 1995 secara total, yang


merupakan produk dari 19 × 21 × 5, di mana 19 adalah jumlah cerita
yang berbeda, 21 adalah nilai yang berbeda dari kekakuan yang
dinormalisasi atas massa setiap cerita, dan 5 adalah jenis tanah yang
berbeda dipertimbangkan.

3.2. Analisis Data Eksplorasi


Memahami data sangat penting sebelum membangun model
pembelajaran mesin apa pun. Parameter statistik dan distribusi variabel
dataset memberikan wawasan yang berguna tentang dataset dan
disajikan pada Tabel 1 dan Gambar 2, masing-masing. Dari yang
terakhir, dapat diamati bahwa semua target mengikuti distribusi
unimodal miring kanan dengan kurtosis platykurtic (lebih datar dari
distribusi normal).

Gambar 3 menggambarkan plot kotak dan Kumis untuk fitur (oranye)


dan target (biru moonstone). Garis vertikal merah menunjukkan
median dari setiap distribusi. Kotak ini menunjukkan rentang
interkuantil (IQR) yang mengukur penyebaran setengah tengah data
dan berisi 50% sampel, didefinisikan sebagai IQR = Q3 - Q1, di mana
Q1 dan Q3 masing-masing adalah kuartil bawah dan atas. Garis
horizontal hitam menunjukkan interval dari gerbang outlier bawah (Q1
− 1,5 · IQR) ke gerbang outlier atas (Q3 + 1,5 · IQR). Akibatnya, titik-titik
biru mewakili "outlier" di setiap target, menurut metode interquantile
range (IQR). Seringkali pencilan dibuang karena pengaruhnya terhadap
distribusi total dan analisis statistik dataset. Namun, dalam situasi ini,
konfigurasi bangunan 'ekstrem' sesekali (yaitu, struktur yang sangat
fleksibel) menyebabkan pencilan yang berada di luar distribusi dataset
yang biasa tetapi masih merupakan pengukuran yang valid.

Tabel 1. Parameter statistik himpunan data.

Tipe Tanah
Cerita k ̃ T1 Utop V ̃b

Satu [s−2] [s] [m] [m·s−2]


an
hitu 19 1995 1995 1995 1995 1995
ng 95
bera 11.0 7000.000 2.000 0.604 0.296 0.213
rti 00
Std 5.4 3028.600 1.414 0.341 0.240 0.101
79
Perhitungan 2023, 11, 126

6.0
25% 00 4500.000 0.330 0.104 0.142
50% 11.0 7000.000 2.000 0.567 0.254 0.201
00
75% 16.0 9500.000 3.000 0.801 0.416 0.282
00
Jenis [in [mengamb [int] [mengamb [mengamb [mengamb
t] ang] ang] ang] ang]

T1[s] Utop[m] Vb

Gambar 2. Histogram target T1, Utop, dan V ̃b.

Gambar 3. Plot Kotak dan Kumis untuk fitur (oranye) dan target (biru moonstone). Garis
vertikal merah menunjukkan median dari setiap distribusi. Titik-titik biru mewakili
pencilan dalam distribusi, menurut metode IQR.

Pada Gambar 4, plot gabungan dengan plot kernel density estimate


(KDE) untuk fitur utop terhadap T1 dan Ṽb juga digambarkan. KDE
adalah metode untuk memvisualisasikan distribusi pengamatan dalam
dataset, analog dengan histogram dan mewakili data menggunakan
Perhitungan 2023, 11, 126

kurva kerapatan probabilitas kontinu dalam dua dimensi. Tidak seperti


histogram, plot KDE menghaluskan pengamatan dengan kernel
Gaussian, menghasilkan perkiraan kepadatan kontinu. Dapat diamati
bahwa T1 dan V'b berkorelasi dengan hubungan tipe 'linier'. Hubungan
ini juga dapat diturunkan dari nilai korelasi tinggi yang digambarkan
pada Gambar 5 yang menunjukkan matriks korelasi dari fitur dan target
dataset, termasuk juga koefisien korelasi productmoment Pearson.
Koefisien korelasi momen produk Pearson (ρ) digunakan untuk
mengukur intensitas korelasi antara sepasang variabel acak independen

(x, y), menurut hubungan berikut

COV(x, y)
R(x, y) = (13) σxσy

di mana COV adalah kovarians antara dua variabel acak (x, y) dan σx,
σy adalah standar deviasi x, y, masing-masing. |ρ| > 0,8 mewakili
hubungan yang kuat antara x dan y, nilai antara 0,3 dan 0,8 mewakili
hubungan sedang, sedangkan |ρ| < 0,3 mewakili hubungan yang
lemah. Hal ini menunjukkan bahwa jumlah cerita, memiliki hubungan
yang kuat dengan T1 dan Utop, sedangkan Ground Type tidak memiliki
hubungan dengan jumlah cerita dan k ̃.

(sebuah) (b)

Gambar 4. Plot bersama dan KDE Utop vs. (a) T1 dan (b) V ̃b.
Perhitungan 2023, 11, 126

Gambar 5. Fitur dan target matriks korelasi.

4. Gambaran Umum Algoritma ML


Studi ini memperkirakan perilaku dinamis bangunan bertingkat geser
dalam hal memprediksi periode eigen fundamental (T1), perpindahan
puncak atap (utop), dan geser dasar yang dinormalisasi (Ṽb) dengan
menggunakan empat algoritma ML termasuk Ridge Regressor (RR),
regresi Random Forest (RF), Gradient Boosting (GB), dan regresi
Category Boosting (CB). Semua algoritma yang dipertimbangkan
(kecuali RR) termasuk dalam metode ansambel yang mencari kinerja
prediktif yang lebih baik dengan menggabungkan prediksi dari
beberapa model, biasanya dalam bentuk pohon keputusan dengan cara
mengantongi (bootstrap aggregating) dan meningkatkan teknik
pembelajaran ansambel. Pengantongan melibatkan pemasangan
banyak pohon keputusan (DT) pada sampel yang berbeda dari dataset
yang sama dan rata-rata prediksi, sementara, dalam meningkatkan,
anggota ansambel ditambahkan secara berurutan dengan mengoreksi
prediksi yang dibuat oleh model sebelumnya dan metode
menghasilkan rata-rata tertimbang dari prediksi. Teknik pembelajaran
ansambel menghilangkan varians apa pun, sehingga mengurangi
overfitting model. Di bagian berikut, gambaran umum setiap algoritma
ML disediakan, bersama dengan titik kuat dan lemahnya.
4.1. Regresi Punggungan (RR)
Dengan tidak adanya kendala, setiap model dalam pembelajaran mesin
akan overfit data dan membuat hubungan kompleks yang tidak perlu.
Untuk menghindari hal ini, diperlukan regularisasi data. Regularisasi
menyederhanakan model yang terlalu kompleks yang cenderung overfit
dan dapat digunakan untuk model pembelajaran mesin apa pun.
Regresi ridge [19] adalah versi reguler dari regresi linier yang
menggunakan fungsi kehilangan kesalahan kuadrat rata-rata (LF) dan
menerapkan Regularisasi L2. Dalam Regularisasi L2 (juga dikenal
sebagai Regularisasi Tikhonov), istilah penalti diterapkan ke dalam
kuadrat bobot (w) ke fungsi kerugian sebagai berikut:
m
Perhitungan 2023, 11, 126

Regularization(L2) = LF + l∑ Wi2
i=1

Akibatnya, fungsi biaya J(θ) dalam Regresi Ridge mengambil bentuk


berikut

J (θ)= 1 ∑m ys − ŷs 2 +λ∑n W2J


m s= 1 a a j=1
| a {z
}
| {z }
Fungsi Loss Hukuman

di mana m adalah jumlah total pengamatan dalam dataset, n adalah


jumlah fitur dalam dataset, y dan yˆ adalah kebenaran dasar dan nilai
prediksi model regresi, masing-masing, dan λ adalah istilah penalti
yang mengekspresikan kekuatan regularisasi. Hukuman dalam jumlah
bobot kuadrat mengurangi varians estimasi dan model, yaitu,
mengecilkan bobot dan, dengan demikian, mengurangi kesalahan
standar. Istilah penalti berfungsi untuk mengurangi besarnya bobot,
dan juga membantu mencegah overfitting. Hasilnya, RR dapat
memberikan peningkatan akurasi dan stabilitas prediktif.

Regresi ridge juga memiliki kemampuan untuk menangani hubungan


non-linear antara variabel prediktor dan hasil, berbeda dengan regresi
linier. Ini lebih kuat untuk kolinearitas daripada regresi linier dan dapat
diterapkan pada kumpulan data kecil, sementara tidak diperlukan
normalisasi data yang sempurna. Namun, RR dapat menjadi mahal
secara komputasi jika datasetnya besar. Selain itu, hasilnya sulit
ditafsirkan karena istilah regularisasi L2 memodifikasi bobot. Ini karena
fungsi biaya mengandung istilah kuadrat, yang membuatnya lebih sulit
untuk dioptimalkan. Selain itu, RR hanya menyediakan pendekatan
bentuk tertutup dari solusi dan dapat menghasilkan hasil yang tidak
stabil jika pencilan ada dalam dataset.

Meskipun, kita apriori tahu bahwa Regresi Ridge tidak akan mampu
bersaing dengan model ansambel lainnya, itu masih dipilih sebagai
metode sederhana untuk perkiraan kasar model yang akan dipasang.

4.2. Regresi Hutan Acak (RF)


Pohon keputusan adalah model keputusan sederhana seperti pohon
yang bekerja dengan baik untuk banyak masalah, tetapi mereka juga
bisa tidak stabil dan rentan terhadap overfitting. Hutan Acak yang
dikembangkan oleh Breiman [20] mengatasi keterbatasan ini dengan
menggunakan ansambel pohon keputusan sebagai pembelajar yang
lemah, di mana setiap pohon dilatih pada subset acak dari data dan
fitur (maka nama "Hutan Acak"). Subset dari data pelatihan dibuat
dengan pengambilan sampel acak dengan penggantian (bootstrap
sampling), dengan demikian, beberapa titik data dapat dimasukkan
dalam beberapa subset, sementara yang lain mungkin tidak disertakan
Perhitungan 2023, 11, 126

sama sekali. Setiap model dalam ansambel dilatih secara independen


menggunakan algoritma pembelajaran dan hiperparameter yang sama,
tetapi dengan subset data pelatihannya sendiri. Prediksi dari masing-
masing pohon kemudian digabungkan dengan mengambil rata-rata
(Gambar 6). Oleh karena itu, keacakan ini membantu mengurangi
varians model dan risiko masalah overfitting dalam metode pohon
keputusan.

DATASET

HIMPUNAN HIMPUNAN HIMPUNAN


BAGIAN 1 BAGIAN 2 BAGIAN N
BOOTSTRAP ...
SAMPLING

BANGUNAN ...
THE MODEL

POHON KEPUTUSAN 1 POHON KEPUTUSAN 2 POHON KEPUTUSAN N

BOOTSTRAP
MENGGABUNGKAN
PREDIKSI 1 PREDIKSI 2 ... PREDIKSI N

PREDIKSI RATA-RATA

PREDIKSI AKHIR

Gambar 6. Diagram alur algoritma Random Forest.

Random Forest adalah salah satu algoritma pembelajaran mesin paling


akurat yang mewarisi manfaat dari algoritma pohon keputusan. Ini
dapat bekerja dengan baik dengan variabel kategoris dan kontinu dan
dapat menangani kumpulan data besar dengan ribuan fitur. Random
Forest adalah algoritma yang kuat yang dapat menangani data berisik
dan outlier dan dapat menggeneralisasi dengan baik ke data yang tidak
terlihat tanpa perlu normalisasi karena menggunakan pendekatan
berbasis aturan. Meskipun merupakan algoritma yang kompleks, ini
cepat dan memberikan ukuran kepentingan fitur, yang dapat
membantu dalam pemilihan fitur dan pemahaman data.

Meskipun RF kurang rentan terhadap overfitting daripada pohon


keputusan tunggal, RF masih dapat overfit data jika jumlah pohon di
hutan terlalu tinggi atau jika pohon terlalu dalam. Hutan Acak dapat
kurang dapat ditafsirkan daripada pohon keputusan tunggal karena
melibatkan banyak pohon. Dengan demikian, mungkin sulit untuk
memahami bagaimana algoritma sampai pada prediksi tertentu. Waktu
pelatihan RF bisa lebih lama dibandingkan dengan algoritma lain,
terutama jika jumlah pohon dan kedalamannya tinggi. Random Forest
membutuhkan lebih banyak memori daripada algoritma lain karena
menyimpan banyak pohon. Ini bisa menjadi masalah jika himpunan
datanya besar. Secara keseluruhan, RF adalah algoritma yang praktis
Perhitungan 2023, 11, 126

dan kuat di mana parameter defaultnya seringkali cukup baik untuk


menghasilkan hasil yang dapat diterima.

4.3. Regresi Peningkat Gradien (GB)


Gradient Boosting adalah salah satu varian metode ansambel di mana
beberapa model lemah (pohon keputusan) digabungkan untuk
mendapatkan kinerja yang lebih baik secara keseluruhan. Algoritma
Gradient Boosting dikembangkan oleh Friedman [21] dan
menggunakan pohon keputusan sebagai pembelajar yang lemah.
Secara umum, peserta didik yang lemah tidak perlu memiliki struktur
yang sama, sehingga mereka dapat menangkap output yang berbeda
dari data. Dalam Gradient Boosting, fungsi kerugian dari setiap pelajar
yang lemah diminimalkan menggunakan prosedur penurunan gradien,
algoritma optimasi global yang dapat diterapkan pada fungsi kerugian
apa pun yang dapat dibedakan. Seperti yang ditunjukkan pada Gambar
7, residual (loss error) dari pohon sebelumnya diperhitungkan dalam
pelatihan pohon berikut. Dengan menggabungkan semua pohon,
model akhir mampu menangkap sisa kerugian dari peserta didik yang
lemah.

DATASET

LEMAH ...
PELAJAR

SISA 1 SISA SISA


POHON KEPUTUSAN N-1
POHON KEPUTUSAN POHON KEPUTUSAN 2 POHON KEPUTUSAN N

BOOTSTRAP
MENGGABUNGKAN
PREDIKSI 1 PREDIKSI 2 ... PREDIKSI N-1 PREDIKSI N

PREDIKSI JUMLAH TERTIMBANG

PREDIKSI AKHIR

Gambar 7. Diagram alur algoritma Gradient Boosting.

Untuk lebih memahami cara kerja Peningkatan Gradien, kami sajikan di bawah langkah-langkah yang
terlibat.
Langkah 1. Buat pohon dasar dengan simpul akar tunggal yang
bertindak sebagai tebakan awal untuk semua sampel.

Langkah 2. Buat pohon baru dari sisa (kesalahan kehilangan) pohon


sebelumnya. Pohon baru dalam urutan dipasang ke gradien
negatif dari fungsi kerugian sehubungan dengan prediksi saat
ini.
LANGKAH 3. Tentukan berat optimal pohon baru dengan
meminimalkan fungsi kehilangan keseluruhan. Berat ini
menentukan kontribusi pohon baru dalam model akhir.
Perhitungan 2023, 11, 126

Langkah 4. Skala pohon dengan tingkat pembelajaran yang


menentukan kontribusi pohon dalam prediksi.

Langkah 5. Gabungkan pohon baru dengan semua pohon sebelumnya


untuk memprediksi hasilnya dan ulangi Langkah 2 sampai
kriteria konvergensi terpenuhi (jumlah pohon melebihi batas
maksimum yang dicapai atau pohon baru tidak meningkatkan
prediksi).
Model prediksi akhir adalah jumlah tertimbang dari prediksi semua
pohon yang terlibat dalam prosedur sebelumnya, dengan pohon
berkinerja lebih baik memiliki bobot lebih tinggi dalam urutan.

Dalam Gradient Boosting, setiap pohon dibangun satu per satu,


sedangkan Hutan Acak membangun setiap pohon secara independen.
Dengan demikian, algoritma Gradient Boosting berjalan dalam urutan
tetap, dan urutan itu tidak dapat berubah, yang mengarah ke hanya
evaluasi berurutan. Algoritma Gradient Boosting tidak dikenal karena
mudah dibaca atau ditafsirkan dibandingkan dengan algoritma
ansambel lain seperti Random Forest. Kombinasi pohon dalam
Gradient Boosting bisa lebih kompleks dan lebih sulit untuk ditafsirkan,
meskipun perkembangan terakhir dapat meningkatkan interpretabilitas
model kompleks tersebut. Peningkatan Gradien sensitif terhadap
pencilan karena setiap penaksir wajib memperbaiki kesalahan pada
pendahulunya. Selain itu, fakta bahwa setiap estimator mendasarkan
kebenarannya pada prediktor sebelumnya, membuat prosedur sulit
untuk ditingkatkan.

Secara keseluruhan, Gradient Boosting bisa lebih akurat (dalam kondisi


tergantung pada sifat masalah dan dataset) daripada Random Forest,
karena sifat berurutan dari proses pelatihan pohon yang memperbaiki
kesalahan satu sama lain. Atribut ini mampu menangkap pola kompleks
dalam himpunan data, tetapi masih rentan terhadap overfitting dalam
himpunan data yang bising.

4.4. Regresi CatBoost (CB)


CatBoost adalah algoritma pembelajaran mesin sumber terbuka yang
relatif baru yang didasarkan pada pohon keputusan Gradient Boosted.
CatBoost dikembangkan oleh insinyur Yandex [22] dan berfokus pada
variabel kategoris tanpa memerlukan konversi data apa pun dalam
prapemrosesan. CatBoost membangun pohon simetris (setiap split
berada pada atribut yang sama), tidak seperti algoritma Gradient
Boosting, dengan menggunakan teknik permutasi. Ini berarti bahwa
dalam setiap perpecahan, daun dari pohon sebelumnya dibelah
menggunakan kondisi yang sama. Pasangan fitur-split yang
menyumbang kerugian terendah dipilih dan digunakan untuk semua
node level. Arsitektur pohon yang seimbang mengurangi waktu prediksi
sambil mengendalikan overfitting karena struktur berfungsi sebagai
regularisasi. CB menggunakan konsep peningkatan pesanan,
pendekatan berbasis permutasi untuk melatih model pada subset data
Perhitungan 2023, 11, 126

sambil menghitung residu pada subset lain. Teknik ini mencegah


overfitting dan pergeseran dataset yang terkenal, situasi yang
menantang di mana distribusi bersama fitur dan target berbeda antara
fase pelatihan dan pengujian.

CatBoost mendukung semua jenis fitur, seperti numerik, kategoris, atau


teks, yang mengurangi waktu fase prapemrosesan himpunan data. Ini
cukup kuat untuk menemukan hubungan non-linear antara target
model dan fitur dan memiliki kegunaan hebat yang dapat menangani
nilai yang hilang, pencilan, dan nilai kategoris kardinalitas tinggi pada
fitur tanpa perlakuan khusus. Secara keseluruhan, CatBoost adalah
kerangka kerja Gradient Boosting yang kuat yang dapat menangani fitur
kategoris, nilai yang hilang, dan masalah overfitting. Ini cepat, terukur,
dan memberikan interpretabilitas yang baik.

5. Alur ML dan Hasil Performa


Model ML yang dikembangkan dalam penelitian ini didasarkan pada
himpunan data yang dijelaskan dalam Bagian 3 dan memanfaatkan
pustaka Python sumber terbuka berikut, scikit-learn (RR, RF, GB) [23]
dan CatBoost (CB) [22]. Tiga model ML yang berbeda dipertimbangkan
untuk memprediksi periode eigen fundamental (T1), perpindahan
horizontal di lantai atas (Utop), dan basis geser yang dinormalisasi di
atas massa setiap cerita (Ṽb) bangunan geser. Fitur dari semua model
adalah jumlah cerita (Cerita), kekakuan yang dinormalisasi atas massa
setiap cerita (k ̃) dan Tipe Tanah.

5.1. Validasi Silang dan Penyetelan Hyperparameter


Dataset dibagi menjadi set pelatihan dan pengujian, dengan masing-
masing 80% dan 20% sampel. Set pelatihan divalidasi melalui metode
validasi silang k-fold sebagai berikut. Data dikocok dan dibagi menjadi k
subsampel berukuran sama. Salah satu subsampel k digunakan sebagai
set uji (validasi) dan subsampel yang tersisa (k − 1) disatukan untuk
digunakan sebagai data pelatihan. Kemudian model dipasang
menggunakan data pelatihan dan dievaluasi menggunakan set tes.
Proses ini diulang k kali sampai masing-masing kelompok telah
berfungsi sebagai set validasi. Hasil k dari masing-masing model dirata-
ratakan untuk mendapatkan estimasi akhir.

Keuntungan dari metode validasi silang k-fold adalah bias dan varians
berkurang secara signifikan, sementara ketahanan model meningkat.
Set pengujian, dengan data yang tetap tidak terlihat oleh model selama
pelatihan, digunakan untuk pengujian akhir kinerja model dan
generalisasi. Dengan istilah generalisasi kita mengacu pada
kemampuan model untuk beradaptasi dengan benar terhadap data
baru yang sebelumnya tidak terlihat, diambil dari distribusi yang sama
dengan yang digunakan untuk membuat model. Nilai k tergantung pada
ukuran dataset dengan cara yang tidak meningkatkan biaya komputasi.
Dalam penelitian ini, nilai k ditetapkan sama dengan 10.
Perhitungan 2023, 11, 126

Validasi silang dilakukan bersama dengan penyetelan hyperparameter


dalam alur data. Penyetelan hiperparameter adalah proses memilih
nilai yang dioptimalkan untuk parameter model yang memaksimalkan
akurasinya. Nilai optimal dari hyperparameters untuk setiap model
ditemukan menggunakan pencarian grid yang luas, di mana setiap
kemungkinan kombinasi hyperparameter diperiksa untuk menemukan
model terbaik. Nilai hiperparameter yang dioptimalkan, bersama
dengan rentang setiap model dan algoritma ML, disajikan pada Tabel 2.
Nama hyperparameter sesuai dengan yang ada di pustaka Python yang
digunakan [23]. Hyperparameter yang tidak ditampilkan telah diberi
nilai default.
Tabel 2. Nilai hyper-parameter optimal untuk setiap algoritma dan model ML yang ditemukan
melalui pencarian grid.

Nilai Optimal Model


Algoritma Parameter Hiper Rentang Pencarian T1 Utop V ̃b

Pemecah [0, 0.1, 0.5, 1, 5, 10] 50 50 50


max_iter alfa [50, 100, 500, 1000] LSQ SVD SVD
Ridge ['SVD', 'Cholesky', 'LSQR'] R
tol [0.0001, 0.001] 0.001 0.001 0.001

n_estimators max_depth [10, 20, 50, 100, 500] 500 500 500
kriteria min_samples_split [2, 5, 10] goreng goreng goreng
['sqr', 'abs', 'goreng', 'kacang 5 5 5
polong']
Hutan Acak [1, 2, 5, 10, 20]
min_samples_leaf [1, 2, 5] 1 1 2

min_impurity_decrease [0.01, 0.02, 0.05, 0.1, 0.2] 0.01 0.01 0.01

n_estimators [10, 20, 100, 500] 0.1 0.1 0.1


learning_rate kriteria [0.01, 0.1] SRK SRK SRQ
min_samples_leaf ['sqr', 'goreng'] 1 1 10
Peningkatan Gradien [1, 2, 5, 10]
min_samples_split [5, 10, 20, 100] 10 5 5
di mana "alpha": konstanta yang mengalikan
istilah L2, mengendalikan kekuatan max_depth [1, 2, 5, 10] 10 5 10
regularisasi. | "max_iter": jumlah maksimum
iterasi untuk pemecah gradien konjugat. | n_estimators [10, 20, 100, 500] 500 500 500
"solver": pemecah untuk digunakan dalam learning_rate l2_leaf_reg [0.01, 0.1] 0.1 0.1 0.1
rutinitas komputasi. | "tol": ketepatan solusi
CatBoost [1, 2, 5, 10] 1 1 2
(tol tidak berpengaruh untuk pemecah 'SVD'
dan 'Cholesky'). | "n_estimators": jumlah
bagging_temperature [0.0, 0.1, 0.2, 0.5, 1.0] 0 0 0
pohon di hutan. |
dalam [1, 2, 5, 10] 5 5 10

"max_depth": jumlah pohon di hutan. | "Criterion": fungsi untuk mengukur kualitas split. Nilai yang mungkin
adalah: 'sqr', 'abs', 'fried', dan 'pois' yang masing-masing merupakan singkatan dari 'squared_error',
'absolute_error', 'friedman_mse', dan 'poisson'. | "min_samples_split": jumlah pohon di hutan. |
"min_samples_leaf": jumlah minimum sampel yang diperlukan untuk berada di simpul daun. |
"min_impurity_decrease": nilai di mana sebuah node akan dibagi, jika pemisahan ini menginduksi, penurunan
pengotor lebih besar dari ini. | "learning_rate": faktor yang mengecilkan kontribusi setiap pohon. |
"l2_leaf_reg": koefisien istilah regularisasi L2 dari fungsi biaya. | "bagging_temperature": parameter untuk
menentukan pengaturan bootstrap Bayesian dan menetapkan bobot acak ke objek. Bobot diambil sampelnya
dari distribusi eksponensial jika nilai parameter ini diatur ke "1". Semua bobot sama dengan 1 jika nilai
parameter ini diatur ke "0". Nilai yang mungkin berada dalam rentang [0; inf). Semakin tinggi nilainya, semakin
agresif pengantongannya.
Perhitungan 2023, 11, 126

Tabel 3 mengumpulkan statistik waktu kesesuaian dan skor pengujian


untuk setiap model selama proses penyetelan crossvalidation dan
hyperparameter, yang dilakukan pada konfigurasi perangkat keras yang
sama. Hal ini menunjukkan bahwa Regresi Ridge memiliki waktu fit
terendah untuk semua model (hingga 395 percepatan bila
dibandingkan dengan yang paling lambat), sementara algoritma
CatBoost mengungguli semua yang lain dalam hal penilaian dan
menunjukkan nilai deviasi standar terendah.

Gambar 8–10 menunjukkan performa model ML untuk memprediksi T1, Utop, dan
V ̃b dari bangunan geser di kereta dan menguji dataset untuk nilai
hyperparameter yang dioptimalkan, sesuai. Secara umum, metode
ansambel mencapai akurasi yang lebih tinggi dibandingkan dengan
algoritma Regresi Ridge. Namun, algoritma Regresi Ridge berhasil
mencapai hasil yang dapat diterima dalam kasus model T1.

(a) Set kereta

(b) Set tes

Gambar 8. Plot aktual vs. Prediksi untuk (a) train dan (b) dataset uji untuk model T1.

(a) Set kereta


Perhitungan 2023, 11, 126

(b) Set tes

Gambar 9. Plot aktual vs. Prediksi untuk (a) train dan (b) dataset uji untuk model Utop.

(a) Set kereta

(b) Set tes

Gambar 10. Plot aktual vs. Prediksi untuk (a) train dan (b) dataset uji untuk model Ṽb.

Tabel 3. Performa Validasi Silang untuk setiap algoritme dan model ML.

Waktu yang Tepat [s] Skor Tes


Algoritma Calon Pola
Berarti Std Dev Berarti Std Dev
T1 0.003 0.000 0.915 0.006
Ridge 144 Utop 0.003 0.000 0.800 0.028
V ̃b 0.003 0.000 0.684 0.034
T1 1.184 0.073 0.999 0.001
Hutan Acak 2880 Utop 1.137 0.013 0.988 0.001
V ̃b 1.072 0.001 0.990 0.002
T1 0.919 0.011 1.000 0.000
Peningkatan Gradien 1024 Utop 0.583 0.001 0.999 0.001
V ̃b 0.839 0.006 0.999 0.000
CatBoost 640 T1 0.627 0.087 1.000 0.000
Utop 0.218 0.032 0.999 0.000
Perhitungan 2023, 11, 126

V ̃b 0.508 0.063 0.999 0.000


5.2. Metrik Evaluasi Model
Untuk mengukur performa model ML, metrik terkenal RMSE, MAE,
MAPE, dan R2 digunakan [24]. Definisi setiap metrik adalah sebagai
berikut

RMSE

1m
MAE = ∑(Xi − xˆi)
n i=1
xˆi
MAPE
n i=1 Xi

R
Di mana m adalah ukuran himpunan data, xi dan xˆi adalah nilai fitur
aktual dan diprediksi untuk pengamatan i, masing-masing.

Metrik performa setiap algoritma dan model ML disediakan dalam


Tabel 4. CatBoost dan Random Forest adalah dua algoritma ML
berkinerja terbaik. CatBoost berkinerja terbaik untuk eigenperiod
fundamental T1, dan perpindahan horizontal di Utop atas, dengan nilai
MAE masing-masing 0,008 dan 0,0034, untuk set uji, dibandingkan
dengan 0,0013 dan 0,0084 dari Random Forest. Di sisi lain, Random
Forest memiliki kinerja terbaik untuk gaya geser dasar yang
dinormalisasi pada massa setiap cerita Ṽb, dengan nilai MAE 0,0010
untuk set uji, dibandingkan dengan 0,0020 dari algoritma CatBoost.
Dua algoritma lainnya, Ridge dan Gradient Boosting menunjukkan nilai
MAE yang lebih besar serta nilai yang lebih buruk untuk metrik lainnya.
Tabel 4. Metrik performa setiap algoritme dan model ML. Algoritma yang akhirnya
dipilih (CatBoost) disorot dengan warna coklat.

RMSE MAE MAPE R2


Algoritma ML Kereta Ujian Kereta apiUjian Kereta Ujian Kereta Ujian
api api api
T1

Ridge 0.0098 0.0098 0.0743 0.0722 0.1916 0.1932 0.9163 0.9159


Hutan Acak 0.0000 0.0000 0.0006 0.0013 0.0010 0.0023 1.0000 1.0000
Peningkatan Gradien 0.0000 0.0000 0.0040 0.0041 0.0086 0.0097 0.9997 0.9997
CatBoost 0.0000 0.0000 0.0006 0.0008 0.0013 0.0020 1.0000 1.0000
Utop

Ridge 0.0123 0.0090 0.0754 0.0699 1.0630 1.0817 0.7924 0.8244


Hutan Acak 0.0000 0.0002 0.0035 0.0084 0.0150 0.0400 0.9994 0.9962
Perhitungan 2023, 11, 126

Peningkatan Gradien 0.0005 0.0006 0.0146 0.0164 0.1156 0.1488 0.9920 0.9889
CatBoost 0.0000 0.0000 0.0026 0.0034 0.0182 0.0238 0.9998 0.9995
V ̃b

Ridge 0.0031 0.0032 0.0440 0.0450 0.2833 0.3061 0.7010 0.6727


Hutan Acak 0.0000 0.0000 0.0004 0.0010 0.0024 0.0060 0.9999 0.9994
Peningkatan Gradien 0.0001 0.0001 0.0073 0.0080 0.0372 0.0441 0.9894 0.9866
CatBoost 0.0000 0.0000 0.0015 0.0020 0.0079 0.0110 0.9995 0.9990
Secara umum, CatBoost hadir pertama dalam akurasi dengan
kecocokan yang dapat diterima dan waktu yang diprediksi untuk
sebagian besar kasus, sementara Regresi Ridge mengambil trofi karena
menjadi yang tercepat agar sesuai dengan data. Secara keseluruhan,
CatBoost tampaknya menjadi model terbaik untuk bergerak maju,
karena datang pertama untuk, bisa dibilang, metrik yang paling
penting, meskipun untuk kasus model V'b , algoritma Random Forest
menunjukkan kinerja yang sedikit lebih baik.

6. Kemampuan Interpretasi ML
Model pembelajaran mesin sering diperlakukan sebagai "kotak hitam"
yang membuat interpretasinya sulit. Untuk memahami fitur utama
yang memengaruhi prediksi model, teknik pembelajaran mesin yang
dapat dijelaskan dapat digunakan untuk mengungkap propertinya.
Menuju ini, banyak teknik penjelasan telah dikembangkan. Salah satu
yang semakin diminati adalah metode SHAP (SHapley Additive
exPlanations) yang diperkenalkan oleh Lundberg dan Lee [25]. Metode
ini menjelaskan prediksi individu dan dapat digunakan untuk
kuantifikasi kepentingan fitur relatif. Metode SHAP didasarkan pada
permainan secara teoritis nilai-nilai Shapley optimal yang mengukur
kontribusi terhadap hasil dari setiap fitur secara terpisah di antara
semua fitur input.

6.1. Pentingnya Fitur


Pentingnya fitur SHAP adalah pendekatan abstrak untuk menjelaskan
prediksi model pembelajaran mesin. Ini memberikan cara intuitif untuk
memahami fitur mana yang paling penting untuk prediksi berdasarkan
besarnya atribusi fitur, di mana nilai Shapley absolut yang besar adalah
yang paling penting. Tingkat kepentingan fitur (FI) SHAP dapat diukur
menggunakan rumus berikut

1m (saya)

FIj = n i∑=1 |sj |

di mana m adalah jumlah pengamatan dalam dataset dan s (ji) adalah


nilai SHAP dari fitur j untuk pengamatan i. Gambar 11 menunjukkan
pentingnya fitur SHAP dengan mengurangi pentingnya model ML
berkinerja terbaik. Kami melihat bahwa jumlah cerita adalah fitur
terpenting yang memengaruhi semua target. Di sisi lain, fitur Ground
Perhitungan 2023, 11, 126

Type, tidak berdampak pada periode fundamental T1 struktur, yang


bermakna dan diharapkan sesuai dengan teori.

Gambar 11. SHAP menampilkan plot penting untuk model ML berkinerja terbaik.

6.2. Ringkasan Plot


Meskipun plot kepentingan fitur berguna, itu tidak mengandung
informasi di luar pentingnya. Untuk penjelasan yang lebih dalam
tentang model pembelajaran mesin, plot informatif tambahan akan
diperlukan. Salah satunya adalah apa yang disebut ringkasan atau plot
beeswarm. Plot beeswarm memvisualisasikan semua nilai SHAP di
mana urutan fitur (atas ke bawah) mengikuti kepentingannya terhadap
prediksi. Pada sumbu vertikal, nilai dikelompokkan berdasarkan fitur
dan warna titik menunjukkan nilai fitur mulai dari rendah (biru) hingga
tinggi (merah), untuk setiap grup. Poin dengan nilai Shapley yang sama
untuk setiap fitur tersebar secara vertikal, yang kemudian membentuk
distribusinya. Pada Gambar 12, plot beeswarm SHAP dengan performa
terbaik untuk setiap model ML ditampilkan.
Perhitungan 2023, 11, 126

(c) Model V ̃b

Gambar 12. Plot ringkasan yang menunjukkan dampak semua fitur pada (a) model T1,
(b) Utop, dan (c) V ̃b.

Dapat dilihat bahwa untuk jumlah cerita, ketika nilai fitur meningkat,
nilai SHAP juga meningkat. Ini memberi tahu kita bahwa jumlah cerita
yang lebih tinggi akan menghasilkan nilai prediksi yang lebih tinggi
untuk semua model. Dalam kasus fitur k ̃, kami melihat bahwa ketika
nilai fitur meningkat, nilai SHAP meningkat untuk model T1 dan Utop,
sedangkan sebaliknya untuk fitur yang sama, nilai SHAP menurun
dalam kasus model Vb. Seperti yang diharapkan, fitur Ground Type
tidak berdampak pada prediksi model T1, sementara itu berdampak
pada nilai Utop dan Vb yang diprediksi.
7. Skenario Kasus Uji
Kami mempertimbangkan tiga skenario kasus uji untuk menguji
efektivitas model yang dikembangkan dan, khususnya, model prediksi
CatBoost yang dipilih. Yang pertama adalah bangunan 3 lantai, diikuti
oleh bangunan 8 lantai dan bangunan 15 lantai. Nilai fitur untuk setiap
skenario disajikan dalam Tabel 5. Kekakuan yang dinormalisasi (k ̃)
untuk setiap skenario masing-masing adalah 2098,21, 5135,14, dan
7169,81 s−2. Untuk alasan praktis, kami lebih suka mengambil k dan m
sebagai parameter independen di awal dan kemudian menghitung k ̃,
daripada bekerja
Perhitungan 2023, 11, 126

dengan k ̃ dari awal, tetapi pada dasarnya sama.

Tabel 5. Nilai fitur untuk setiap skenario kasus pengujian.

Tanah
Cerita Massa (m) Kekakuan (k)
Skenario Jenis
[-] [kg] [N/m] [-]
[m/s2]

Hasilnya disajikan pada Tabel 6 untuk tiga output, yaitu, periode


fundamental T1, perpindahan lantai atas Utop dan gaya geser dasar Vb,
untuk setiap skenario. Dalam semua kasus, model prediksi berhasil
memberikan hasil presisi yang sangat tinggi dengan nilai kesalahan
kurang dari 3%. Nilai kesalahan maksimum hanya 2,93% sesuai dengan
gaya geser untuk skenario pertama. Perlu dicatat bahwa model ini
memberikan Ṽb, gaya geser dasar yang dinormalisasi di atas massa
setiap lantai bangunan. Dengan mengalikan ini dengan massa m, kita
memperoleh kolom terakhir dari tabel yang sesuai dengan gaya geser
basis akhir Vb.

Tabel 6. Nilai target (aktual dan diprediksi) untuk setiap skenario kasus pengujian.
Kesalahan absolut juga disediakan.

T1 Utop Vb

Kesalahan 1.95% 3.49% 2.85%


Absolut

Kesalahan
2.01% 0.05%
Absolut

Kesalahan 0.95% 1.75% 0.53%


Absolut
8. Aplikasi Web
Model ML berkinerja terbaik berdasarkan CatBoost, digunakan untuk
mengembangkan aplikasi web interaktif. GUI aplikasi ditunjukkan pada
Gambar 13 untuk input dan nilai prediksi skenario kasus pertama. Ini
berfungsi untuk prediksi cepat dari respons dinamis bangunan
bertingkat. Lebih khusus lagi, ini dapat memberikan prediksi periode
eigen dasar, serta perpindahan horizontal atap dan dasar geser untuk
konfigurasi cerita, massa, kekakuan, dan jenis tanah yang diminta.
Aplikasi web dikembangkan dalam kerangka kerja web Flask dan dapat
Perhitungan 2023, 11, 126

digunakan di setiap platform dengan lingkungan Python dengan paket


yang diperlukan. Kode sumber aplikasi tersedia di
https://github.com/geoem/drsb-ml (diakses pada 6 Mei 2023).

Gambar 13. GUI aplikasi web untuk prediksi cepat respons dinamis bangunan geser
bertingkat.

9. Kesimpulan
Makalah ini mempresentasikan penilaian beberapa algoritma ML untuk
memprediksi respons dinamis bangunan geser bertingkat. Dataset
besar hasil analisis respons dinamis dihasilkan melalui metode
pengambilan sampel standar dan prosedur analisis modal spektrum
respons konvensional dari sistem struktural multi-DOF. Kemudian,
pencarian hyperparameter ekstensif dilakukan untuk menilai kinerja
masing-masing algoritma dan mengidentifikasi yang terbaik di antara
mereka. Dari algoritma yang diperiksa, CatBoost datang pertama dalam
akurasi dengan kecocokan yang dapat diterima dan waktu yang
diprediksi untuk sebagian besar kasus, sementara Ridge Regressor
mengambil piala karena menjadi yang tercepat agar sesuai dengan
data. Secara keseluruhan, CatBoost tampaknya menjadi algoritma
berkinerja terbaik, meskipun untuk kasus model dasar geser yang
dinormalisasi, algoritma Random Forest menunjukkan kinerja yang
sedikit lebih baik.

Hasil penelitian ini menunjukkan bahwa algoritme ML, dan khususnya


CatBoost, dapat berhasil memprediksi respons dinamis bangunan geser
bertingkat, mengungguli metode sederhana tradisional yang digunakan
dalam praktik teknik dalam hal kecepatan, dengan kesalahan prediksi
minimal. Pekerjaan ini menunjukkan potensi teknik ML untuk
meningkatkan penilaian kinerja seismik dalam aplikasi teknik sipil dan
struktural, yang mengarah ke desain bangunan dan struktur lainnya
yang lebih efisien dan lebih aman. Secara keseluruhan, penggunaan
algoritma ML dalam analisis dinamis struktur adalah pendekatan yang
menjanjikan untuk secara akurat memprediksi perilaku dinamis sistem
yang kompleks.
Perhitungan 2023, 11, 126

Studi ini juga memiliki beberapa keterbatasan yang perlu disorot dan
didiskusikan. Pertama-tama, analisisnya hanya elastis dan faktor
perilaku q dari spektrum desain EC8 mengambil nilai tetap 1 selama
penelitian. Selain itu, redaman telah dipertimbangkan dengan nilai
tetap 5%, sedangkan kekakuan dan massa setiap cerita tetap konstan di
sepanjang ketinggian bangunan. Perluasan pekerjaan untuk
memperhitungkan keterbatasan ini adalah topik yang menarik yang
akan diselidiki di masa mendatang dengan menambahkan fitur
tambahan ke model ML.

Kontribusi penulis: konseptualisasi, M.G. dan V.P.; metodologi, M.G. dan V.P.;
perangkat lunak, M.G.; validasi, M.G. dan V.P.; analisis formal, M.G.; investigasi, M.G.;
sumber daya, M.G.; kurasi data, M.G.; menulis—persiapan draf asli, M.G.; menulis—
meninjau dan mengedit, M.G. dan V.P.; visualisasi, M.G.; pengawasan, V.P. Semua
penulis telah membaca dan menyetujui versi naskah yang diterbitkan.

Pendanaan: Penelitian ini tidak menerima dana eksternal.

Pernyataan Ketersediaan Data: Kode sumber aplikasi web tersedia di https://github.


com/geoem/drsb-ml (diakses pada 6 Mei 2023).

Konflik Kepentingan: Penulis menyatakan tidak ada konflik kepentingan.

Referensi
1. Solorzano, G.; Plevris, V. Metode kecerdasan komputasi dalam simulasi dan pemodelan struktur: Tinjauan canggih
menggunakan peta bibliometrik. Depan. Lingkungan Binaan. 2022, 8, 1049616. [CrossRef]
2. Georgioudakis, M.; Plevris, V. Kriteria Korelasi Modal Gabungan untuk Identifikasi Kerusakan Struktural dengan Data
Modal Berisik. Adv. Civ. Eng. 2018, 3183067.
3. Lagaros, N.D.; Plevris, V.; Kallioras, N.A. Mosaik algoritma metaheuristik dalam optimasi struktural. Lengkungan.
Metode Eng. 2022, 29, 5457–5492.
4. Plevris, V.; Lagaros, N.D.; Charmpis, D.; Papadrakakis, M. Metamodel dibantu teknik untuk optimasi struktural. Dalam
Prosiding Konferensi Eropa Tenggara Pertama tentang Mekanika Komputasi (SEECCM-06), Kragujevac, Serbia, 28-30
Juni 2006 ; hlm. 271–278.
5. Papadrakakis, M.; Lagaros, N.D.; Tsompanakis, Y.; Plevris, V. Optimasi struktural skala besar: Metode komputasi dan
algoritma optimasi. Lengkungan. Metode Eng. 2001, 8, 239–301. [CrossRef]
6. Lagaros, N.; Tsompanakis, Y.; Fragiadakis, M.; Plevris, V.; Papadrakakis, M. Teknik Komputasi Berbasis Metamodel
untuk Memecahkan Masalah Optimasi Struktural Mempertimbangkan Ketidakpastian. dalam optimasi desain
struktural mempertimbangkan ketidakpastian; Tsompanakis, Y., Lagaros, N., Papadrakakis, M., Eds.; Taylor & Francis:
Abingdon, Inggris, 2008; Bab 21, hlm. 567–597.
7. Lu, X.; Plevris, V.; Tsiatas, G.; De Domenico, D. Editorial: Metodologi dan Aplikasi yang Didukung Kecerdasan Buatan
dalam Gempa Bumi dan Teknik Struktural. Depan. Lingkungan Binaan. 2022, 8, 876077. [CrossRef]
8. Xie, Y.; Sichani, M.E.; Padgett, J.E.; DesRoches, R. Janji penerapan pembelajaran mesin dalam rekayasa gempa:
Tinjauan mutakhir. Tanah q. Spektrum 2020, 36, 1769–1801. [CrossRef]
9. Zhang, Y.; Burton, H.V.; Matahari, H.; Shokrabadi, M. Kerangka kerja pembelajaran mesin untuk menilai keamanan
struktural pascagempa. Struktur. Saf. 2018, 72, 1–16. [CrossRef]
10. Nguyen, H.D.; Dao, N.D.; Shin, M. Prediksi respon drift seismik dari rangka momen baja planar menggunakan jaringan
saraf tiruan dan meningkatkan gradien ekstrim. Eng. Struktur. 2021, 242, 112518. [CrossRef]
11. Sadeghi Eshkevari, S.; Takácˇ, M.; Pakzad, S.N.; Jahani, M. DynNet: Desain arsitektur saraf berbasis fisika untuk
pemodelan dan prediksi respons struktural nonlinier. Eng. Struktur. 2021, 229, 111582. [CrossRef]
12. Abd-Elhamed, A.; Sya'ban, Y.; Mahmoud, S. Memprediksi Respon Dinamis Struktur di bawah Beban Gempa
Menggunakan Analisis Logis Data. Bangunan 2018, 8, 61. [CrossRef]
13. Gharehbaghi, S.; Gandomi, M.; Plevris, V.; Gandomi, AH Prediksi spektrum kerusakan seismik menggunakan metode
kecerdasan komputasi. Komputasi. Struktur. 2021, 253, 106584. [CrossRef]
14. Kazemi, F.; Asgarkhani, N.; Jankowski, R. Respons seismik berbasis pembelajaran mesin dan penilaian kinerja
bangunan beton bertulang. Lengkung Civ. Mech. Eng. 2018, 23, 94. [CrossRef]
15. Kazemi, F.; Jankowski, R. Prediksi berbasis pembelajaran mesin tentang kapasitas limit-state seismik dari rangka
penahan momen baja dengan mempertimbangkan interaksi struktur tanah. Komputasi. Struktur. 2023, 274, 106886.
Perhitungan 2023, 11, 126

[CrossRef]
16. Wakjira, T.G.; Rahmzadeh, A.; Alam, MS; Tremblay, R. Alat prediksi efisien berbasis pembelajaran mesin yang dapat
dijelaskan untuk respons siklik lateral dari dermaga jembatan baja goyang dasar pasca-tegangan. Struktur 2022, 44,
947–964. [CrossRef]
17. Montuori, R.; Nastri, E.; Piluso, V.; Todisco, P. Pendekatan berbasis kinerja yang disederhanakan untuk evaluasi kinerja
seismik rangka baja. Eng. Struktur. 2020, 224, 111222. [CrossRef]
18. EN 1998-1 (Eurocode 8); Desain Struktur untuk Ketahanan Gempa — Bagian 1: Aturan Umum, Tindakan Seismik, dan
Aturan untuk Bangunan. Komite Eropa untuk Standardisasi: Brussels, Belgia, 2004.
19. Hoerl, A.E.; Kennard, R.W. Regresi Ridge: Estimasi Bias untuk Masalah Nonorthogonal. Teknometrik 1970, 12, 55–67.
[CrossRef]
20. Breiman, L. Hutan Acak. Mach. Belajar. 2001, 45, 5–32. [CrossRef]
21. Friedman, J.H. Pendekatan Fungsi Serakah: Mesin Penambah Gradien. Ann. Stat. 2001, 29, 1189–1232. [CrossRef] 22.
Prokhorenkova, L.O.; Gusev, G.; Vorobev, A.; Dorogush, A.V.; Gulin, A. CatBoost: Peningkatan yang tidak bias dengan
fitur kategoris. Dalam Prosiding Konferensi ke-32 tentang Sistem Pemrosesan Informasi Saraf (NeurIPS 2018),
Montreal, QC, Kanada, 4–6 Desember 2018; Bengio, S., Wallach, HM, Larochelle, H., Grauman, K., Cesa-Bianchi, N.,
Garnett, R., Eds.; hlm. 6639–6649.
23. Pedregosa, F.; Varoquaux, G.; Gramfort, A.; Michel, V.; Thirion, B.; Grisel, O.; Pirang, M.; Prettenhofer, P.; Weiss, R.;
Dubourg, V.; et al. Scikit-learn: Pembelajaran Mesin dengan Python. J. Mach. Belajar. Res. 2011, 12, 2825–2830.
24. Plevris, V.; Solorzano, G.; Bakas, N.; Ben Seghier, M.E.A. Investigasi metrik kinerja dalam analisis regresi dan model
prediksi berbasis pembelajaran mesin. Dalam Prosiding Kongres Eropa ke-8 tentang Metode Komputasi dalam Ilmu
dan Teknik Terapan, Oslo, Norwegia, 5–9 Juni 2022. [CrossRef]
25. Lundberg, S.M.; Lee, S.I. Pendekatan terpadu untuk menafsirkan prediksi model. dalam kemajuan dalam sistem
pemrosesan informasi saraf; Guyon, I., Luxburg, U.V., Bengio, S., Wallach, H., Fergus, R., Vishwanathan, S., Garnett, R.,
Eds.; Curran Associates, Inc.: Red Hook, NY, AS, 2017; Jilid 30.

Penafian / Catatan Penerbit: Pernyataan, pendapat dan data yang terkandung dalam semua publikasi semata-mata milik
penulis dan kontributor individu dan bukan dari MDPI dan / atau editor. MDPI dan / atau editor (s) melepaskan tanggung
jawab atas cedera pada orang atau properti yang dihasilkan dari ide, metode, instruksi atau produk yang dirujuk dalam
konten.

Anda mungkin juga menyukai