Anda di halaman 1dari 21

Model Klasifikasi dan

Prediksi pada Pengidap


Penyakit Kanker
Oleh:
Payudara Immanuela C P (1202164156)
Silvia Angelina(1202160293)
Humairah (1202160385)
Cesar Aini S (1202164280)
 Kanker payudara merupakan penyakit yang paling umum di
antara wanita di dunia. Dalam melakukan diagnosis,
terdapat tantangan, yaitu bagaimana mengklasifikasikan
kalau tumor tersebut menjadi ganas (kanker) atau jinak
Latar (tidak bersifat kanker). Maka untuk meningkatkan tingkat
diagosis pada kanker payudara, dapat menggunakan teknik
Belakang Machine Learning.
 Dokter sendiri hanya bisa mendeteksi adanya kanker
dengan akurasi 79%, sedangkan menggunakan Machine
Learning menghasilkan akurasi 91%.
Python
Python adalah salah satu bahasa pemograman
tingkat tinggi yang bersifat interpreter, interactive,
objectoriented.
Tinjauan
Pustaka Jupiter Notebook
Jupyter Notebook adalah aplikasi web open-source
yang memungkinkan kita untuk membuat dan
berbagi dokumen yang berisi kode langsung,
persamaan, visualisasi, dan teks naratif.
Algoritma Supervised Learning
Algoritma supervised learning adalah sebuah pendekatan
dimana sudah terdapat data yang dilatih. Tujuan dari
pendekatan ini adalah mengkelompokan suatu data ke data
yang sudah ada.
Tinjauan
Pustaka(2)
Algoritma yang termasuk dalam supervised learning adalah
- Regresi Linier Berganda -Analisis Deret Waktu
- Decision Tree dan Random Forest-Naive Bayes Classifier
- Nearest Neighbor Classifier -Artificial Neural Network
- Support Vector Machine
Algoritma Support Vector Machines
Support Vector Machine (SVM) adalah klasifikasi linear biner
yang batas keputusannya dibuat secara eksplisit untuk
meminimalkan kesalahan generalisasi.
Tinjauan
Pustaka(3) Sejarah Support Vector Machines
Algoritma Support Vector Machines merupakan sebuah generaliasasi
nonlinier dari algoritma Generalized Potrait yang berkembang di
Rusia pada tahun 1960-an (1963, 1964).
SVM diperkenalkan oleh Vapnik, Boser, dan Guyer dalam konferensi
COLT tahun 1992 dalam sebuah jurnal dan berkembang dengan
sangat cepat.
Formula matematis SVM

Tinjauan Perbedaan antara Algoritma Support Vector Machies dengan Algoritma


Pustaka(4) Supervised Learning lainnya (Naïve Bayes)
SVM sangat cocok untuk klasifikasi dataset yang kompleks tetapi kecil atau
menengah. Sedangkan Naive Bayes merupakan sebuah pengklasifikasian
probabilistik sederhana yang menghitung sekumpulan probabilitas dengan
menjumlahkan frekuensi dan kombinasi nilai dari dataset yang diberikan.
Pada beberapa penelitian sebelumnya SVM cenderung menghasilkan
performa yang lebih baik dari Naïve Bayes pada segi akurasi hasil klasifikasi.
Kelebihan Kekurangan
1. Generalisasi : Mampu 1. Sulit dipakai dalam
mengklasifikasikan pattern- problem berskala besar
pattern yang tidak masuk (jumlah sampel yang
Kelebihan dan dalam kelas diolah)

Kekurangan 2. Curse of dimensionality :


Masalah dalam
2. Secara teoritik
dikembangkan untuk
SVM menghadapi suatu pattern problem klasifikasi dengan
dua class.
3. Memiliki landasan teori
yang dapat dianalisa
dengan jelas.
4. Feasibility : dapat
diimplementasikan relatif
mudah
1. Pengenalan atribut dataset
2. Import package dan dataset
3. Menampilkan data dalam bentuk dataframe
4. Klasifikasi Malignant dan Benign dalam dataset
Langkah 5. Membuat matriks target dan prediktor
Penyelesaian 6. Membuat training dan testing data
Studi Kasus 7. Mengimport SVM algoritma
8. Membuat matriks confucion
9. Normalisasi data
10. Melakukan testing dari normalisasi data
 Dataset ini diambil dari UCI yang merupakan Breast Cancer
Diagnosis Dataset, yang digunakan untuk mengklasifikasi tumor
1. Pengenalan ke dalam dua kategori yaitu Malignant (Berbahaya) dan Benign
(Tidak Berbahaya) dari dataset yang berupa inti – inti sel yang
atribut dataset diteiliti.
 Atributnya :
 ID number
 Diagnosis (M= Malignant/berbahaya, B= Benign/tidak)
2. Import package dan
dataset

 Mengimport libraries :
 Pandas
 Numpy
 Matplotlib
 Seaborn
3.
Menampilkan
data dalam
bentuk
dataframe
4. Klasifikasi
malignant dan
benign dalam
dataset
5. Membuat
matriks target
dan prediktor
6. Membuat
training dan
testing data
7. Mengimport
SVM algoritma
8. Membuat
matriks
confusion
9. Normalisasi
data
10. Melakukan
testing dari
normalisasi
data
Hasil akurasi Akurasi : (66 + 0)/(66+48+0+0)*100% = 0,58%
sebelum Presisi : (66)/(66+48)*100% = 0,58%
Normalisasi Recall : (66)/(0+66)*100% = 100%
Hasil akurasi Akurasi = (66+47)/(66+47+1+0)*100% = 0,99%
setelah Presisi = (66)/(66+1)*100% =0,99%
Recall = (66)/(66+0)*100% = 100%
Normalisasi
Terimakasih

Anda mungkin juga menyukai