PEMROGRAMAN KOMPUTER
Dosen Pengampu:
Dr. Tri Wiyanto, S.Si, MT
19730502 200312 1 002
Disusun Oleh :
Makalah ini kami buat dengan tujuan untuk menyelesaikan tugas mata kuliah “Pemograman
Komputer” dan yang terutama dalam rangka memperdalam pemahaman kami selaku
mahasiswa terkait materi Machine Learning.
Dalam proses pendalaman materi ini, tentunya kami mendapatkan bimbingan, arahan, koreksi
serta saran, untuk itu kami mengucapkan terima kasih kepada :
• Dr. Tri Wiyanto, S.Si, MT selaku dosen mata kuliah “Pemograman Komputer”
Makalah ini telah diselesaikan namun masih banyak kekurangan dan tentunya jauh dari
kesempurnaan. Oleh karena itu, kritik yang bersifat membangun sangat kami butuhkan untuk
kesempurnaan makalah ini. Demikian makalah ini kami buat, semoga bermanfaat bagi kita
semua.
Penyusun
Kelompok 3
ii
DAFTAR ISI
DAFTAR PUSTAKA
iii
BAB 1
PENDAHULUAN
Sejak pertama kali komputer diciptakan, manusia sudah memikirkan cara agar komputer
dapat belajar dari pengalaman. Hal tersebut terbukti pada tahun 1952 saat Arthur Samuel
menciptakan program bernama game of checkers di sebuah komputer IBM. Program tersebut
dapat mempelajari gerakan untuk memenangkan permainan checkers dan menyimpan
gerakan tersebut ke dalam memorinya. Dari sanalah kemudian muncul apa yang disebut
machine learning.
Machine learning merupakan bagian dari kecerdasan buatan yang dapat mempelajari
pola atau data secara otomatis. Menurut IBM, machine learning merupakan cabang dari
kecerdasan buatan (AI) dan ilmu komputer yang berfokus pada penggunaan data dan
algoritma untuk meniru cara manusia belajar dan secara bertahap dapat meningkatkan
akurasinya. Machine learning merupakan komponen penting dari bidang ilmu tentang
perkembangan data. Melalui penggunaan statistik, algoritma machine learning dilatih untuk
membuat klasifikasi atau prediksi dalam pengembangan data.
Pengembangan data yang ditangani machine learning ini mencakup wawasan utama dari
kecerdasan buatan dan pengambilan keputusan dalam aplikasi atau bisnis. Keberadaan
machine learning disebut mampu memengaruhi matrik pertumbuhan ideal dari basis data
dalam dunia bisnis teknologi informasi.
Perkembangan data yang makin hari semakin besar dan bertumbuh, permintaan pasar
untuk ilmuwan data juga akan meningkat. Hal ini nantinya akan menuntut para pakar data
untuk mengidentifikasi pertanyaan bisnis yang paling relevan dan lantas melakukan
sinkronisasi terhadap data untuk menjawab itu. Peran machine learning ada dalam
penyesuaian antara pertanyaan dan jawaban terkait data yang terus berkembang ini.
Secara umum bisa dikatakan bahwa machine learning adalah metode analisis data yang
dilakukan dengan otomatisasi pembuatan model analitis. Sebagai cabang dari AI, machine
learning didasarkan pada gagasan bahwa sistem dapat belajar dari data, mengidentifikasi
pola, dan membuat keputusan dengan sedikit intervensi manusia dalam proses tersebut.
Beberapa contoh program berbasis machine learning yang digunakan dalam kehidupan
sehari-hari adalah pendeteksi spam, pendeteksi wajah, rekomendasi produk, asisten virtual,
1
diagnosis medis, pendeteksi penipuan kartu kredit, perdagangan saham, segmentasi
pelanggan, dan mobil dengan kemudi otomatis.
Salah satu pemanfaatan machine learning yang akan kami lakukan adalah diagnosis
medis dengan dataset Cervical Cancer Behavior Risk. Dataset ini menjelaskan bagaimana
pola hidup seseorang yang dapat berakibat menimbulkan suatu penyakin yang cukup ganas
di dunia medis. Machine learning akan memproses secara otomatis data yang telah
terkumpul sebelumnya. Dataset Cervical Cancer Behavior Risk ini akan menunjukkan sikap
– sikap apa saja yang dapat memicu terjadinya sebuah penyakin kanker serviks dan
mendiagnosis seseorang tersebut mengidap penyakit knaker serviks atau tidak.
Berdasarkan latar belakang yang telah diuraikan, maka rumusan masalah dari makalah
ini adalah bagaimana cara menerapkan model machine learning untuk Cervical Cancer
Behavior Risk Data Set.
1.3 Tujuan
Adapun tujuan pembuatan makalah ini yakni menerapakan dan mengetahui bagaiaman
machine learning dapat mendiagnosis suatu penyakit pada diri seseorang melalui sebuah
dataset yang berisi sikap-sikap atau gejala seseorang mengidap suatu penyakit dalam
beberapa kondisi.
2
BAB 2
DASAR TEORI
Menurut IBM, machine learning merupakan cabang dari kecerdasan buatan (AI) dan
ilmu komputer yang berfokus pada penggunaan data dan algoritma untuk meniru cara
manusia belajar dan secara bertahap dapat meningkatkan akurasinya. Machine learning
merupakan komponen penting dari bidang ilmu tentang perkembangan data. Melalui
penggunaan statistik, algoritma machine learning dilatih untuk membuat klasifikasi atau
prediksi dalam pengembangan data. Ada juga yang mengatakan bahwa Machine learning
merupakan bagian dari kecerdasan buatan yang dapat mempelajari pola atau data secara
otomatis .
Pengembangan data yang ditangani machine learning ini mencakup wawasan utama
dari kecerdasan buatan dan pengambilan keputusan dalam aplikasi atau bisnis.
Keberadaan machine learning disebut mampu memengaruhi matrik pertumbuhan ideal dari
basis data dalam dunia bisnis teknologi informasi.Perkembangan data yang makin hari
semakin besar dan bertumbuh, permintaan pasar untuk ilmuwan data juga akan meningkat.
Hal ini nantinya akan menuntut para pakar data untuk mengidentifikasi pertanyaan bisnis
yang paling relevan dan lantas melakukan sinkronisasi terhadap data untuk menjawab itu.
Peran machine learning ada dalam penyesuaian antara pertanyaan dan jawaban terkait data
yang terus berkembang ini.
Secara umum bisa dikatakan bahwa machine learning adalah metode analisis data yang
dilakukan dengan otomatisasi pembuatan model analitis. Sebagai cabang dari AI, machine
learning didasarkan pada gagasan bahwa sistem dapat belajar dari data, mengidentifikasi
pola, dan membuat keputusan dengan sedikit intervensi manusia dalam proses tersebut.
Peran machine learning dalam bidang kesehatan sangat beraneka ragam, seperti halnya
identifikasi, diagnosis, prediksi suatu penyakit, smart health records, medical imaging, dan
lain sebagainya. Maka, tak heran jika tidak sedikit orang menganggap keberadaan machine
learning akan sangat membantu.
Seperti yang diungkapkan oleh Ratih Ardiati Ningrum, M.S., M.Stat, selaku
dosen Teknologi Sains Data (TSD) Fakultas Teknologi Maju dan Multidisiplin (FTMM),
3
jika algoritma machine learning bisa diterapkan secara maksimal, maka seorang dokter
dapat mendiagnosis suatu penyakit lebih awal dan akurat.
“Beberapa dokter sudah mulai melirik algoritma machine learning untuk diterapkan pada
pemrosesan datanya. Ini tentu akan memberikan efisiensi dan akurasi yang tinggi,” ujar
dosen lulusan National Chiao Tung University, Taiwan itu.
1. Bertindak seperti Otak Manusia
Sebagai contoh, penerapan metode pada statistika tradisional terdapat dua asumsi yang
harus dipenuhi. Namun, dengan machine learning proses analisis data menjadi lebih
fleksibel, kita dapat menggunakan algoritma mana saja dan menyesuaikannya dengan pola
data yang ada. Selanjutnya, berdasarkan algoritma-algoritma tersebut kemudian dianalisis
dan dipilih hasil yang paling optimal dalam akurasi, sensitivitas, nilai errornya, dan kriteria
kebaikan model yang lain. Machine learning membantu tenaga medis
mendapatkan insight dari data supaya lebih cepat dan akurat dalam mendiagnosis atau
mengidentifikasi penyakit
Machine learning menawarkan banyak algoritma yang dapat digunakan mengolah data.
Algoritma-algoritma tersebut terbagi ke dalam supervised,
unsupervised, dan reinforcement learning dimana setiap jenisnya dibagi lagi ke dalam
beberapa jenis algoritma. Sebagai contoh, untuk supervised learning dikenal decision
tree, support vector machine, neural network, naive bayes, dan lain sebagainya.
4
Penerapan machine learning dalam bidang kesehatan seperti halnya pendeteksian suatu
penyakit. Misalnya saja terdapat sebuah benjolan di kulit, maka machine learning bisa
mendeteksi apakah benjolan itu merupakan tumor jinak atau tumor ganas (kanker). Selain
itu, pada bidang radiologist, machine learning dapat membantu membaca visualisasi hasil
X-Ray lebih cepat dan akurat.
5
2.4 Pengertian Kanker Serviks
Kanker serviks adalah kanker yang tumbuh pada sel-sel di leher rahim. Kanker ini umumnya
berkembang perlahan dan baru menunjukkan gejala ketika sudah memasuki stadium lanjut.
Oleh sebab itu, penting untuk mendeteksi kanker serviks sejak dini sebelum timbul masalah
serius.
Serviks atau leher rahim adalah bagian rahim yang terhubung ke vagina. Fungsinya
adalah untuk memproduksi lendir yang membantu menyalurkan sperma dari vagina ke
rahim saat berhubungan seksual. Serviks juga berfungsi melindungi rahim dari bakteri dan
benda asing dari luar.
Kanker serviks atau kanker leher rahim adalah salah satu jenis kanker yang paling sering
terjadi pada wanita. Berdasarkan penelitian pada tahun 2020, ada lebih dari 600.000 kasus
kanker serviks dengan 342.000 kematian di seluruh dunia.
Kanker serviks terjadi ketika sel-sel yang sehat mengalami perubahan atau mutasi.
Mutasi ini menyebabkan sel-sel tersebut tumbuh tidak normal dan tidak terkendali
6
sehingga membentuk sel kanker. Belum diketahui apa yang menyebabkan perubahan
pada gen tersebut. Namun, kondisi ini diketahui terkait dengan infeksi HPV.
Angka harapan hidup pada penderita kanker serviks tergantung stadium yang
dialaminya. Angka ini merupakan gambaran persentase penderita yang masih hidup 5
tahun setelah didiagnosis menderita kanker serviks. Sebagai contoh, angka harapan
hidup 80% berarti 80 dari 100 penderita bertahan hidup hingga 5 tahun atau lebih setelah
terdiagnosis kanker serviks.
Berikut adalah angka harapan hidup pada penderita kanker serviks berdasarkan
stadium yang dialami:
Stadium 1: 80–93%
Stadium 2: 58–63%
Stadium 3: 32–35%
Stadium 4: ≤16%
7
BAB 3
METODOLOGI
Aplikasi Jupyter
8
14) socialSupport_appreciation : apresiasi dukungan sosial
15) socialSupport_instrumental : instrument dukungan sosial
16) empowerment_knowledge : pengetahuan pemberdayaan
17) empowerment_abilities : kemampuan pemberdayaan
18) empowerment_desires : keinginan pemberdayaan
19) ca_cervix (this is class attribute, 1=has cervical cancer, 0=no cervical
cancer)
Untuk antribut yang X (input) sendiri terdapat behavior_sexsualRisk sampai
dengan empowerment_desires , pada bagian X karena yang didrop adalah bagian
ca_cervix, sedangkan pada bagian Y (output) terdapat ca_cervix, dan pada Y yang
akan didrop adalah
‘behavior_sexualRisk','behavior_eating','behavior_personalHygine','intention_a
ggregation','intention_commitment','attitude_consistency','attitude_spontaneity','
norm_significantPerson','norm_fulfillment','perception_vulnerability','perceptio
n_severity','motivation_strength','motivation_willingness','socialSupport_emotio
nality','socialSupport_appreciation','socialSupport_instrumental','empowerment
_knowledge','empowerment_abilities',’ empowerment_desires’.
4. Pisahkan data training dan testing
Pada langkah ini digunakan library sklearn yang berfungsi untuk memisahkan antara
data train dan testing. Data train sendiri adalah data yang melatih mesin learning
agar dapt mengeluarkan output yang diinginkan sedangkan data testing sendiri
adalah data yang menunjukan apakah telah sesuai dengan seharusnya. X_train,
X_test, Y_train, Y_test digunakan untuk membagi antara train dan test.
5. Import jenis machine lerning
Yang mana data akan dikonvers keIntergrnya, sehingga keluaran dari kelompok
kami yakni 0.6
6. Build classifier
Tedapat beberapa pengklasifikasian yakni Decision Tree Classifier, Random Forest,
Gradient Boosting Classifier, Naive Bayesian Classifier, K-Nearest Neighbor,
Logictic Regression Classifier, dan SVM Classifier.
9
BAB 4
4.1 Hasil
Pemrograman Hasil
import pandas as pd Hanya sebagai library saja
df=pd.read_excel(r'D:\pemkom3.xlsx
')
df
X=df.drop(['ca_cervix'],axis='colum
ns')
Y=df.drop(['behavior_sexualRisk','be
havior_eating','behavior_personalHy
gine','intention_aggregation','intentio
n_commitment','attitude_consistency'
,'attitude_spontaneity','norm_signific
antPerson','norm_fulfillment','percept
ion_vulnerability','perception_severit
y','motivation_strength','motivation_
willingness','socialSupport_emotiona
lity','socialSupport_appreciation','soc
ialSupport_instrumental','empowerm
ent_knowledge','empowerment_abilit
ies','empowerment_desires'],axis='co
lumns')
X
10
Y
X_train
X_test
Y_train
11
Y_test
dt_clf.fit(X_train, Y_train)
dt_clf.score(X_test,Y_test)
y_pred = dt_clf.predict(X_test)
dt_clf.score(X_test,Y_test)
B. Random Forest
0,8
from sklearn import ensemble
rf_clf=
ensemble.RandomForestClassifier(n
_estimators=100)
12
rf_clf.fit(X_train, Y_train)
rf_clf.score(X_test,Y_test)
y_pred = rf_clf.predict(X_test)
rf_clf.score(X_test,Y_test)
y_pred = gb_clf.predict(X_test)
gb_clf.score(X_test,Y_test)
y_pred = nb_clf.predict(X_test)
nb_clf.score(X_test,Y_test)
13
E. K-Nearest Neighbor
from sklearn.neighbors import
0.8666666666666667
KNeighborsClassifier
knn_clf =
KNeighborsClassifier(n_neighbors=
3)
knn_clf.fit(X_train, Y_train)
knn_clf.score(X_test,Y_test)
y_pred = knn_clf.predict(X_test)
knn_clf.score(X_test,Y_test)
y_pred = lr_clf.predict(X_test)
lr_clf.score(X_test,Y_test)
y_pred = sv_clf.predict(X_test)
sv_clf.score(X_test,Y_test)
14
4.2 Analisis
Analisis dari machine learning pada Cervical Cancer Behavior Risk bahwa machine
learning kami akan bekerja paling baik pada saat langkah Naïve Bayesian Classifier dan
Logictic Regression Classifier karena output yang dihasilkan adalah bernilai
0,9333333333333333 yang berarti semakin bagus machine learning bekerja karena mendekati
93%, sedangkan machine learning ini memiliki output paling kecil pada Gradient Boosting
Classifier dengan nilai output 0,7333333333333333 atau hanya sekitar 73%.
15
BAB 5
KESIMPULAN
Dari percobaan machine learning yang telah kami lakukan dapat disimpulkan bahwa
machine learning adalah metode analisis data yang dilakukan dengan otomatisasi pembuatan
model analitis mesin yang dikembangkan untuk bisa belajar dengan sendirinya tanpa arahan
dari penggunanya. Peran machine learning dalam bidang kesehatan sangat beraneka ragam,
seperti halnya identifikasi, diagnosis, prediksi suatu penyakit, smart health records, medical
imaging, dan lain sebagainya. Pembelajaran mesin dikembangkan berdasarkan disiplin ilmu
lainnya seperti statistika, matematika dan data mining yang mana dalam percobaan ini kami
menggunakan Cervical Cancer Behavior Risk Data Set sehingga kami dapat belajar dengan
mendiagnosis penyakit dengan data Cervical Cancer Behavior Risk tanpa perlu di program
ulang atau diperintah. Machine learning kami akan mempelajari Cervical Cancer Behavior
Risk Data Set untuk beberapa kondisi sikap seseorang yang terkena kanker serviks maupun
tidak.
Dari machine learning Cervical Cancer Behavior Risk Data Set yang kelompok kami
programkan dapat kami simpulkan bahwa machine learning ini bekerja paling optimal saat
Naïve Bayesian Classifier dan Logictic Regression Classifier karena output yang dihasilkan
adalah bernilai 0,9333333333333333 yang berarti semakin bagus machine learning bekerja
karena mendekati 93%, sedangkan machine learning ini memiliki output paling kecil pada
Gradient Boosting Classifier dengan nilai output 0,7333333333333333 atau hanya sekitar
73%. Untuk meningkatkan kinerja machine learning kami hanya bias mendropkan 1 data
saja yaitu ca_cervix sehingga output yang dihasilkan optimal.
16
DAFTAR PUSTAKA
1. Dicoding Intern “Apa itu Machine Learning? Beserta Pengertian dan Cara Kerjanya” 19
Agustus 2020
Available : https://www.dicoding.com/blog/machine-learning-adalah/[akses 22 April
2022]
2. Raharja Algonz D.B. “Machine Learning: Pengertian, Cara Kerja, dan 3 Metodenya!” 22
februari 2022
Available : https://www.ekrut.com/media/apa-itu-machine-learning [akses 22 April
2022]
3. Winkler, Markus “Dosen Teknologi Sains Data: Keterlibatan Machine Learning
dalam Dunia Kesehatan akan Menambah Efisiensi dan Akurasi Diagnosis” 25 mei 2021
Available : https://ftmm.unair.ac.id/dosen-teknologi-sains-data-keterlibatan-machine-
learning-dalam-dunia-kesehatan-akan-menambah-efisiensi-dan-akurasi-
diagnosis/#:~:text=Penerapan%20machine%20learning%20dalam%20bidang,atau%20
tumor%20ganas%20(kanker) [akses 22 April 2022]
4. Alodok, “Kanker Serviks – Gejala, penyebab dan mengobati “
Available : https://www.alodokter.com/kanker-serviks
17