Tesis 2229101028 2022
Tesis 2229101028 2022
PROPOSAL TESIS
Oleh
ANAK AGUNG GDE WAHYU SUKMA ERLANGGA
NIM 2229101028
PROPOSAL TESIS
Oleh
ANAK AGUNG GDE WAHYU SUKMA ERLANGGA
NIM 2229101028
DAFTAR ISI.............................................................................................................i
DAFTAR TABEL..................................................................................................iii
DAFTAR GAMBAR..............................................................................................iv
DAFTAR RUMUS..................................................................................................v
BAB I PENDAHULUAN........................................................................................1
2.1 Wariga......................................................................................................8
2.3 Python....................................................................................................11
3.6 Modeling................................................................................................27
3.7 Evaluasi..................................................................................................27
DAFTAR PUSTAKA............................................................................................29
DAFTAR TABEL
(2.1)........................................................................................................................13
(2.2)........................................................................................................................13
(2.3)........................................................................................................................15
(2.4)........................................................................................................................15
(2.5)........................................................................................................................16
(2.6)........................................................................................................................16
(2.7)........................................................................................................................17
(2.8)........................................................................................................................18
(2.9)........................................................................................................................18
(2.10)......................................................................................................................18
(2.11)......................................................................................................................19
BAB I
PENDAHULUAN
budaya yang mereka anut. Masyarakat yang mayoritasnya pemeluk Agama Hindu
tersebut begitu taat dan mempercayai setiap ajaran yang mereka anut. Salah satu
Baik buruknya hari dapat ditentukan perhitungan waktu tradisional Bali yang
disebut dengan wariga, dimana wariga Bali berfungsi sebagai petunjuk jalan bagi
astronomi. Ilmu tersebut adalah ilmu yang memiliki kaitan dengan pengamatan
dan penjelasan mengenai kejadian yang terjadi di luar Bumi dan atmosfernya,
mulai dari asal mula, rotasi, evolusi serta sifat fisik dan kimiawi dari suatu bintang
mengenal ilmu astronomi dengan nama Jyotisa. Jyotisa merupakan salah satu
bagian dari kitab suci Weda atau lebih tepatnya termasuk ke dalam Wedangga.
Bersumber dari ajaran tersebut di Bali pun ajaran tersebut lebih dikenal dengan
1
2
wariga yang dapat digunakan untuk perhitungan baik buruknya hari (Kemenag
Buleleng, 2018).
salah satunya adalah upacara pawiwahan atau pernikahan. Namun, tidak semua
orang dan hanya orang tertentu saja yang mengetahui dasar perhitungan Wariga.
Selain itu, dalam menentukan atau melakukan klasifikasi terhadap baik buruknya
hari kerap kali memakan waktu yang cukup lama. Hal itu disebabkan karena cara
yang dipakai adalah cara manual yaitu dengan cara membaca kalender Bali yang
yang penulis lakukan, yaitu penelitian yang dilakukan oleh Anak Agung Gede Adi
Mega Putra dengan judul “Kalender Bali dalam Kehidupan Umat Hindu di Bali
seperti menggunakan ala ayuning dewasa dalam setiap kegiatan adat, budaya dan
agama. Selain itu, penelitian ini juga menjelaskan mengenai hal-hal yang diatur
kalender Bali dalam kehidupan sosio-religius umat Hindu di Bali. Namun, pada
Mahendrayana, dan Luh Gede Eka Wahyuni yang berjudul “Pemaknaan Tanda
dalam Ala Ayuning Dewasa Berdasarkan Wewaran pada Kalender Caka Bali”
pada ala ayuning dewasa berdasarkan wewaean pada kalender Bali. Sama seperti
Wariga.
dibandingkan dengan prediksi hari baik dari ahli wariga dengan menggunakan
recall 75%, dan F1 score sebesar 82,76% dari metode Sugeno yang merupakan
nilai tertinggi dibandingkan dengan dua metode lainnya. Pengujian dari penelitian
tersebut dilakukan dengan sistem berbasis web dengan jumlah hari yang diuji
Ardiati Ningrum, dan Siti Qomariyah pada tahun 2022 yaitu “Comparisons of
apakah pasien akan bertahan hidup atau tidak dimana dataset yang digunakan
4
bahwa SVM memiliki akurasi yang lebih baik untuk melakukan klasifikasi yaitu
sebesar 91,54%.
Lalu, penelitian oleh Artika Arista pada tahun 2022 yaitu “Comparison
validation dan akurasi yang lebih baik dibandingkan dengan Logistic Regression
dengan 98% akurasi cross-validation dan 98% akurasi untuk pengujian performa.
Metode yang akan digunakan antara lain Logistic Regression, Support Vector
Mehcine, dan Decision Tree. Penelitian ini akan membandingan ketiga metode
baik buruknya hari pernikahan berdasarkan Wariga. Dengan adanya penelitan ini
dalam menentukan baik buruknya hari untuk pernikahan. Selain itu, peneliti
berharap penelitian ini dapat menjadi salah satu upaya dalam melestarikan budaya
1. Proses penentuan atau klasifikasi baik buruknya hari untuk pernikahan masih
dilakukan secara manual, dimana harus menemui ahli Wariga dan prosesnya
fuzzy yaitu metode Tsukamoto, Mamdani dan Sugeno. Pada penelitian itu
matrix.
sebagai berikut.
2. Hari baik ditentukan melalui ajaran Wariga seperti, alahaning dewasa, tanggal
akurasi metode Logistic Regresion, Support Vector Mechine (SVM), dan Decision
Mechine (SVM), dan Decision Tree dalam melakukan klasifikasi terhadap baik
ilmu tentang proses penerapan metode mechine learning yaitu Logistic Regresion,
Support Vector Mechine (SVM), dan Decision Tree dalam melakukan klasifikasi
Peneliti juga berharap dengan penelitian ini manfaat praktis bisa dicapai,
diantarnya:
dan ahli Wariga sehingga dapat dikembangkan lebih lanjut pada penelitian
4. Dapat membantu dan mempermudah orang yang ingin menentukan baik atau
KAJIAN TEORI
2.1 Wariga
Wariga merupakan istilah yang sudah dikenal secara luas oleh masyarakat
Bali. Wariga merupakan suatu ajaran yang bersumber atau berpangkal dari Jyotisa
isinya dalah membahas tata surya, bulan dan benda angkasa lainnya yang
Pada wariga terdapat sistem atau aturan untuk menentukan baik buruknya
hari. Wariga dinyatakan berasal dari dari kata “Wara” yang berarti mulia atau
sempurna, “I” berarti mengarah, dan “Ga” berarti jalan atau pergi, sehingga istilah
wariga diartikan pula sebagai jalan untuk menuju pada yang sempurna
(perhitungan hari sebagai petunjuk untuk menuju ke arah yang lebih baik)
(Widana, 2022). Melalui ajaran wariga umat Hindu dituntun menggunakan waktu
setiap kegiatan adat, budaya dan agama yang mereka lakukan. Padewasan/ala
8
9
ayuning dewasa adalah salah satu yang perlu diperhatikan, dimana padewasan
berasal dari kata dasar dewasa (mendapat awalan pa- dan akhiran -an) yang
kesehatan. Salah satu bagian AI yang paling popular dan penting untuk banyak
aplikasi komersil saat ini adalah Machine Learning (ML). Machine Laerning
adalah subset kecerdasan buatan (AI) yang menyediakan kemampuan bagi sistem
untuk secara untuk secara otomatis belajar dan meningkatkan dari pengalaman
untuk membuat algoritme yang menjadi lebih efisien jika diberikan data yang
relevan daripada instruksi yang tepat (Arista, 2022). Kemampuan utama dari
telah diberikan. Machine learning dapat dibagi menjadi tiga jenis yaitu,
Berikut ini merupakan penjelasan dari ketiga jenis machine learning tersebut.
1. Supervised Learning
Supervised learning adalah salah satu jenis mechine learning yang paling
banyak dan umum digunakan oleh para praktisi. Algoritma supervised learning
10
diawasi (Tri Yunardi & Zata Dina, 2022). Dataset yang yang dapat digunakan
sebagai data latih pada algoritma ini adalah dataset yang sudah diberikan label.
Berdasarkan data latih yang terlabel tersebut akan dibangun model yang nantinya
dapat digunakan untuk melakukan prediksi pada data yand diinputkan. Terdapat
dua tipe masalah supervised learning yaitu klasifikasi dan regresi (Müller &
Guido, 2017). Klasifikasi adalah tipe supervised learning yang bertujuan untuk
menentukan atau memprediksi label dari data input, dimana label tersebut sudah
didefiniskan sebelumnya pada label data training. Terdapat dua jenis klasifikasi
multiclass classification yang dapat menentukan lebih dari dua label. Tipe
2. Unsupervised Learning
merupakan algoritma mechine learning yang digunakan pada data yang tidak
memiliki informasi atau lagel yang akan dijadikan acuan sebelumnya (Tri Yunardi
& Zata Dina, 2022). Pada unsupervised learning algortima pembelajaran hanya
menunjukan data input dan diminta untuk mengekstrak pengetahuan dari data
tersebut (Müller & Guido, 2017). Contoh dari unsupervised learning adalah
11
(Id, 2021).
3. Reinforcement Learning
algoritma dengan sistem trial and error (Andreanus & Kurniawan, 2017). Jika
reward atau hadiah, dimana layaknya manusia dapat membuat mesin bekerja lebih
mesin akan mendapatkan suatu penalti atau hukuman. Contohnya pada permainan
catur atau self-driving car, dimana komputer yang berinteraksi dengan lingkungan
dnimas dalam melakukan tugas tertentu dan algoritma akan membuat mesin
belajar untuk membuat suatu keputusan spesifik pada lingkungan yang berubah-
ubah.
2.3 Python
Rossum pada tahun 1991 dan merupakan bahasa pemrograman tingkat tinggi
(Saputra dkk., 2020). Saat ini bahasa pemrograman python sangat banyak
digunakan karena sintaks dan kodenya sederhana serta mudah untuk dibaca.
Selain itu, python juga bahasa pemrogaman yang dapat digunakan dalam banyak
bidang oleh sebab itu, python dikatakan sebagai general purpose programming
language. Data science adalah salah satu bidang yang menggunakan python.
Python dipilih karena python memiliki banyak library untuk data loading,
12
hanya bisa dijalankan secara lokal dengan server lokal, namun ada Google Colabs
dari ilmu statistiik yang diadopsi oleh machine learning untuk melakukan
respon bersifat biner atau dikotomus (Pamungkas dkk., 2019). Oleh sebab itu,
biasanya algoritma ini digunakan untuk melakukan klasifikasi biner atau binary
prediktornya seperti umur, riwayat penyakit keluarga, dan indeks massa tubuh,
dimana kelas dari variabel respon akan bernilai 1 dan 0. Fungsi yang digunakan
pada regresi logistic adalah fungsi logistic atau yang juga dikenal dengan nama
1 (2.1)
Sigmoid ( x )= −1
1+e
1 (2.2)
Y= −(b0+b1 X1 +b2 X 2 +b3 X 3 …+bn X n)
1+e
Decision Tree adalah salah satu algoritma supervised learning yang paling
mining (Id, 2021). Pada dasarnya metode atau algoritma ini mempelajari
Strukutur data tree adalah struktur data yang menyusun model dari pohon
keputusan atau decision tree. Sama seperti struktur data tree pohon keputusan
1. Root Node
Root node yaitu node yang terletak paling atas sehingga tidak memiliki input
2. Internal Node
Internal node adalah node percabangan sehingga memiliki satu input dan
3. Leaf Node
Leaf Node atau terminal node merupakan node yang terletak di ujung
sehingga hanya punya satu input dan tidak terdapat output, dan leaf juga biasanya
Untuk dapat membentuk suatu decision tree atau pohon keputusan seperti
pada Gambar 2.1 diatas digunakan entropy (S) dimana, entropy digunakan untuk
menentukan jumlah bit dalam proses ekstrasi kelas + dan – dari sejumlah data
acak pada ruang sampel S dan juga digunakan sebagai kebutuhan bit untuk
menyatakan suatu kelas. Berikut ini merupakan formula untuk menghitung nilai
Keterangan:
Selain entropy nilai yang juga berguna untuk membuat suatu pohon
keputusan adalah Gain. Gain berfungsi sebagai ukuran seberapa baik suatu atribut
dalam memisahkan training example ke kelas target dimana atribut dengan nilai
informasi gain tertinggi akan dipilih (Indah Werdiningsih dkk., 2020). Berikut ini
informasi gain.
|S v| (2.4)
Gain ( S , A )=Entropy ( S )−∑v ∈Values ( A ) Entropy (S v )
|S|
Keterangan:
A = Atribut.
V = Nilai atribut A.
16
memiliki tujuan untuk mencari suatu hyperline optimal dengan tujuan untuk
membagi kelas dengan jarak margin terjauh antar kelas (Pamungkas dkk., 2019).
Hyperline itu nantinya akan memisahkan data yang memiliki nilai variabel target
yang berbeda dan membantu untuk memisahkan data yang sulit untuk dipisahkan
tidak bisa memisahkan data yang tidak linear, akan tetapi masalah itu dapat
input (input space) ke dimensi yang lebih tinggi (feature space) (Werdiningsih
dkk., 2022). Terdapat tiga jenis kernel yaitu linear, polynomial, serta gaussian
radial basis function dan persamaannya dapat dilihat pada persamaan 2.5, 2.6, dan
2.7.
⟦ ⟧
d
KK ( x1 , x2 ) = ( t+ ⟦ x i ⟧ x j )
T
(2.6)
( )
2
−‖x 1−x 2‖
K ( x 1 , x 2 )=exp 2 (2.7)
2σ
one-vs-all atau one-vs-one. Data yang biasanya ditangani oleh algoritma atau
metode ini adalah data dengan dimensi yang tinggi dan tidak terlalu banyak. SVM
Vector) untuk membentuk model yang akan digunakan dalam proses klasifikasi
waktu yang cukup lama ketika melakukan pelatihan data jika dibandingkan
dengan algoritma lain dan juga fine-tuningnya harus cukup tinggi untuk
Confusion matrix adalah tabel yang menyatakan klasifikasi jumlah data uji
yang benar dan jumlah data uji yang salah (Normawati & Prayogi, 2021). Pada
confusion matrix terdapat 4 buah istilah yang teridiri dari (1) True Positif (TP),
yaitu nilai aktual positif yang diprediksi positif (2) False Positif (FP), yaitu nilai
actual negatif yang diprediksi positif (3) True Negatif (TN), yaitu nilai aktual
18
negatif yang diprediksi negatif, (4) False Negatif (FN), yaitu nilai aktual positif
melakukan kalkulasi nilai matriks evaluasi yaitu accuracy, precision, recall, dan
memahaminya contoh tabel dari confusion matrix dapat dilihat pada Tabel 2.1
dibawah ini.
Negatif (0)
1. Accuracy
TP+TN
Accuracy= (2.8)
TP+ FP+TN + FN
2. Precision
TP
Precision= (2.9)
TP+ FP
19
3. Recall
TP
Recall= (2.10)
TP+ FN
4. F1-Score
2× Recall × Precision
F 1 Score= (2.11)
Recall+ Precision
mengenai bagaimana
penelitian sebelumnya,
membahas mengenai
perhitungan Wariga
dengan menggunakan
tertinggi dibandingkan
adalah Echocardiogram
beberapa preprocessing
menggunakan metode
2022).
(Arista, 2022).
2020).
melakukan klasifikasi
customers. Berdasarkan
dkk., 2019).
BAB III
METODOLOGI PENELITIAN
Pada bab ini akan menjelaskan metodologi penelitian yang digunakan dan
Tahap ini adalah suatu tahapan yang dilakukan untuk lebih memahami
konsep dan teori yang berkaitan dengan penelitian dengan membaca literatur
seperti buku dan jurnal ilmiah. Pada penelitian ini akan dilakukan studi literatur
Pada tahap ini akan dilakukan penyusunan data yang telah diperoleh dari
hasil wawancara menjadi sebuah dataset dan setiap data diberikan label masing-
masing.
26
27
Data splitting adalah suatu tahap dimana data hasil preprocessing akan
dibagi menjadi data training dan juga data testing. Data training akan digunakan
untuk melatih model atau algoritma machine learning sedangkan data testing akan
digunakan untuk melakukan pengujian terhadap model yang telah dihasilkan dari
3.6 Modelling
Pada tahap ini akan dilakukan training dataset yang telah di-split menjadi
data training dan data testing menggunakan algoritma atau model mechine
learning. Pada penelitian ini akan digunakn tiga buah model atau algoritma
mechine learning yaitu, Logistic Regression, Decision Tree, dan Support Vector
Machine (SVM).
3.7 Evaluasi
Pada tahap ini akan dilakukan evaluasi terhadap model yang dihasilkan
dari training yang telah dilakukan untuk mengetahui apakah model yang
dihasilkan sudah bekerja dengan baik atau tidak. Evaluasi akan dilakukan
dapat mengetahui accuracy, precision, recall dan F1-score dari model. Jika, model
masih memiliki kinerja yang kurang baik dapat dilakukan hyperparameter tuning
dan Support Vector Machine (SVM) untuk mengetahui algoritma atau metode
Adi Mega Putra, A. A. G. (2020). Kalender Bali dalam Kehidupan Umat Hindu di Bali
(Perspektif Pendidikan Sosio-Religius). Jurnal Penelitian Agama, VI(1), 9–18.
Andreanus, J., & Kurniawan, A. (2017). Sejarah, Teori Dasar dan Penerapan
Reinforcement Learning: Sebuah Tinjauan Pustaka. Jurnal Telematika, 12(2),
113–118.
Arista, A. (2022). Comparison Decision Tree and Logistic Regression Machine
Learning Classification Algorithms to determine Covid-19. Sinkron, 7(1), 59–65.
https://doi.org/10.33395/sinkron.v7i1.11243
Firdausanti, N. A., Ningrum, R. A., & Qomariyah, S. (2022). Comparisons of Logistic
Regression and Support Vector Machines in Classification of Echocardiogram
Dataset. Inferensi, 5(2), 85. https://doi.org/10.12962/j27213862.v5i2.14121
Hary Candana, E. W., Gede, I., Gunadi, A., & Divayana, D. G. H. (2021).
PERBANDINGAN FUZZY TSUKAMOTO, MAMDANI DAN SUGENO
DALAM PENENTUAN HARI BAIK PERNIKAHAN BERDASARKAN
WARIGA MENGGUNAKAN CONFUSION MATRIX. Jurnal Ilmu Komputer
Indonesia (JIK), 6(2).
Id, I. D. (2021). MACHINE LEARNING : Teori, Studi Kasus dan Implementasi
Menggunakan Python. Unri Press. https://books.google.co.id/books?
id=JvBPEAAAQBAJ
Imron, M. A. (2015). Sejarah Terlengkap Agama-agama di Dunia. IRCiSoD.
https://books.google.co.id/books?id=aM9xEAAAQBAJ
Indah Werdiningsih, S. S. M. K., Barry Nuqoba, S. S. M. K., & Muhammadun, S. S.
M. S. (2020). Data Mining Menggunakan Android, Weka, dan SPSS. Airlangga
University Press. https://books.google.co.id/books?id=xEwCEAAAQBAJ
Indradewa, D. (2021). Etnoagronomi Indonesia. Penerbit Andi.
https://books.google.co.id/books?id=tN5KEAAAQBAJ
Kemenag Buleleng. (2018, Desember 11). Dasar - Dasar Wariga – KANTOR
KEMENTERIAN AGAMA KABUPATEN BULELENG. Kementrian Agama
29
30