Anda di halaman 1dari 5

KERTAS KERJA UJIAN  

Semester : Gasal / Genap / Pendek*) Tahun Akademik : 2022


         
 

Nomor Induk Mahasiswa  41519010077 Nomor Ujian : Paraf Mahasiswa


Nama   Reza Aditya  
Fakultas / Program
Fasilkom / Ilmu Komputer Paraf Pengawas
Studi
Mata Kuliah    Machine Learning  
Nilai Ujian (00-
Dosen    Saruni Dwiasnati, ST, MM, M.kom
100)
Waktu   Hari Tanggal Jam Ruang  
Pelaksanaan Ujian   Senin 27 Juni 2022 08.00 – 11.00 C. 307  

1. Pengertian Supervised Learning

Supervised learning atau pembelajaran yang diawasi adalah pendekatan


machine learning yang ditentukan berdasarkan penggunaan dataset berlabel
(labeled dataset). Dalam dataset ini, terdapat sebuah “label”, yaitu satu kolom
yang menjadi target output model. Dalam supervised learning, model dilatih
menggunakan dataset training dan diawasi (supervise) untuk melakukan
klasifikasi atau prediksi sesuai dengan output berupa data berlabel yang sudah
ditentukan sebelumnya, berdasarkan pola yang ada dalam data training.
Perbedaan Supervised Learning Dan Unsupervised Learning
 Kegunaan

Jika dilihat dari kegunaannya, kedua pendekatan ini sangat


berbeda. Supervised learning akan membantu untuk mengumpulkan atau
memproduksi output data dari pengalaman yang sudah pernah terjadi.
Hal ini mirip dengan memori manusia.Baru bisa mengingat nama
seseorang ketika sudah pernah berkenalan atau bertemu.Sementara
itu, unsupervised learning lebih sering digunakan untuk menemukan
seluruh pola yang tidak dikenal dalam data.
 Proses Kerja

Pada model supervised learning,Akan mendapatkan variabel


data input dan output. Namun, hal ini tidak terjadi pada unsupervised
learning. Pada pendekatan tersebut,Hanya akan mendapatkan
data input.Ini karena supervised learning memungkinkan untuk
mengumpulkan atau memproduksi output data yang didapat dari
pengalaman sebelumnya. Sementara itu, unsupervised learning tidak
dirancang untuk “belajar” dari pengalaman sebelumnya sehingga tidak
menghasilkan output data.
 Proses Belajar

Pada supervised learning, algoritma komputer melakukan pembelajaran


secara offline sebelum menghadapi data. Artinya, komputer “dibekali”
sejumlah materi tertentu agar nanti dapat mengenali data dengan
mudah.Hal ini tidak terjadi pada unsupervised learning. Pada pendekatan
ini, algoritma komputer mempelajari data secara real-time. Itu artinya,
ketika komputer berhadapan dengan data, pada saat itu juga, komputer
belajar mengenali data.
Kesimpulan
Baik supervised maupun unsupervised learning adalah pendekatan yang
dilakukan algoritma komputer dalam mengenali pola pada
data. Supervised mengenali data dari label khusus yang telah diberikan
sebelumnya, sedangkan unsupervised mengenali data secara real-
time begitu data disajikan.

2. A. Decision Tree, sebuah metode pengambilan keputusan dengan menyusun


setiap opsi atau pilihan menjadi bentuk yang bercabang. Itulah kenapa metode
ini disebut sebagai pohon keputusan. Karena bentuknya yang seperti sebuah
pohon yang memiliki banyak cabang di bagian ranting maupun akarnya. Decision
tree menyediakan cara untuk menyajikan algoritma dengan pernyataan kontrol
bersyarat. Mereka termasuk cabang yang mewakili langkah-langkah
pengambilan keputusan yang dapat mengarah pada hasil yang menguntungkan.
Struktur flowchart mencakup node internal yang mewakili tes atau atribut pada
setiap tahap. Setiap cabang mewakili hasil untuk atribut, sedangkan jalur dari
daun ke akar mewakili aturan untuk klasifikasi. Decision tree merupakan salah
satu bentuk algoritma pembelajaran terbaik berdasarkan berbagai metode
pembelajaran.

B. Naïve Bayes merupakan sebuah metoda klasifikasi yang berakar pada


teorema Bayes. Metode pengklasifikasian dengan menggunakan metode
probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas
Bayes , yaitu memprediksi peluang di masa depan berdasarkan pengalaman di
masa sebelumnya sehingga dikenal sebagai Teorema Bayes . Naive Bayes
merupakan teknik klasifikasi yang didasarkan pada asumsi kemandirian antar
prediktor yang dikenal dengan teorema Bayes . Secara sederhana,
pengklasifikasi Naive Bayes mengasumsikan bahwa keberadaan fitur tertentu
dalam kelas tidak terkait dengan keberadaan fitur lainnya.
C. K-Nearest Neighbor (KNN), Sebuah algoritma yang mencari jarak terdekat
antara data yang akan dievaluasi dengan K tetangga (neighbor) terdekatnya
dalam pelatihan. Metode KNN banyak digunakan karena mempunyai beberapa
kelebihan, diantaranya yaitu dapat menghasilkan data yang lebih akurat dan
efektif apabila training data cukup besar.K-nearest neighbors melakukan
klasifikasi dengan proyeksi data pembelajaran pada ruang berdimensi banyak.
Ruang ini dibagi menjadi bagian-bagian yang merepresentasikan kriteria data
pembelajaran. Setiap data pembelajaran direpresentasikan menjadi titik-titik c
pada ruang dimensi banyak.

D. Logistic Regression, adalah suatu cara permodelan masalah keterhubungan


antara suatu variabel independen terhadap variabel dependen. Contohnya
adalah menentukan apakah suatu nilai ukuran tumor tertentu termasuk kedalam
tumor ganas atau tidak.
3. Cara Kerja algoritma K-Nearest Neighbor, yaitu:
A1. Klasifikasi Terdekat (Nearest Neighbor Classification)
Data baru yang diklasifikasi selanjutnya diproyeksikan pada ruang dimensi
banyak yang telah memuat titik-titik c data pembelajaran. Proses klasifikasi
dilakukan dengan mencari titik c terdekat dari c-baru (nearest neighbor). Teknik
pencarian tetangga terdekat yang umum dilakukan dengan menggunakan
formula jarak euclidean. Berikut beberapa formula yang digunakan dalam
algoritma KNN.
 Euclidean Distance
Jarak Euclidean adalah formula untuk mencari jarak antara 2 titik dalam
ruang dua dimensi.

 Hamming Distance
Jarak Hamming adalah cara mencari jarak antar 2 titik yang dihitung
dengan panjang vektor biner yang dibentuk oleh dua titik tersebut dalam
block kode biner.
 Manhattan Distance
Manhattan Distance atau Taxicab Geometri adalah formula untuk mencari
jarak d antar 2 vektor p,q pada ruang dimensi n.
 Minkowski Distance
Minkowski distance adalah formula pengukuran antar 2 titik pada ruang
vektor normal yang merupakan hibridisasi yang menjeneralisasi euclidean
distance dan mahattan distance.
Teknik pencarian tetangga terdekat disesuaikan dengan dimensi data, proyeksi, dan
kemudahan implementasi oleh pengguna.
A2. Banyaknya k Tetangga Terdekat
Untuk menggunakan algoritma k nearest neighbors, perlu ditentukan banyaknya
k tetangga terdekat yang digunakan untuk melakukan klasifikasi data baru.
Banyaknya k, sebaiknya merupakan angka ganjil, misalnya k = 1, 2, 3, dan
seterusnya. Penentuan nilai k dipertimbangkan berdasarkan banyaknya data yang
ada dan ukuran dimensi yang dibentuk oleh data. Semakin banyak data yang ada,
angka k yang dipilih sebaiknya semakin rendah. Namun, semakin besar ukuran
dimensi data, angka k yang dipilih sebaiknya semakin tinggi.
A3. Algoritma K-Nearest Neighbors

Tentukan k bilangan bulat positif berdasarkan ketersediaan data pembelajaran.


Pilih tetangga terdekat dari data baru sebanyak k. Tentukan klasifikasi paling umum
pada langkah (2), dengan menggunakan frekuensi terbanyak. Keluaran klasifikasi
dari data sampel baru.
Kelebihan

 Algoritma K-NN kuat dalam mentraining data yang noisy.


 Algoritma K-NN sangat efektif jika datanya besar.
 Mudah diimplementasikan

Kekurangan
 Algoritma K-NN perlu menentukan nilai parameter K.
 Sensitif pada data pencilan.
 Rentan pada variabel yang non-informatif

Studi Kasus Penggunaan Algorima KNN adalah Implementasi Algoritma KNN Untuk

Identifikasi Kualitas Air Kota Surakarta

 Penelitian ini berhasil menerapkan algoritma K-Nearest Neighbor untuk


menghitung dan memberikan hasil klasifikasi terhadap kualitas air
 Penelitian ini menggunakan111 record data, 71 data digunakan sebagai data
training, 40 data sebagai data testing. Dari data testing tersebut 33 data
diprediksi benar dan 7 data diprediksi salah dengan perhitungan jumlah K
sebanyak 7.
 Sistem untuk identifikasi kualitas air dengan menggunakan metode KNN
hasilnya akurat dengan mencapai tingkat akurasi sebesar 82,5%.

4. Persamaan Dan Perbedaan Algoritma SVM Dan Algoritma KNN tergantung pada
pemilihan studi kasus.

5. Merupakan salah satu саbаng ilmu dаrі kecerdasan buаtаn, adalah dіѕірlіn іlmu yang
mencakup perancangan dan реngеmbаngаn algoritme уаng mеmungkіnkаn kоmрutеr untuk
mengembangkan perilaku уаng dіdаѕаrkаn pada data еmріrіѕ, seperti dаrі sensor dаtа bаѕіѕ
dаtа. Sіѕtеm реmbеlаjаr dapat mеmаnfааtkаn соntоh (data) untuk mеnаngkар ciri уаng
diperlukan dаrі рrоbаbіlіtаѕ уаng mеndаѕаrіnуа (уаng tіdаk diketahui). Dаtа dараt dilihat
ѕеbаgаі соntоh уаng mеnggаmbаrkаn hubungаn antara variabel уаng diamati. Fоkuѕ besar
реnеlіtіаn реmеlаjаrаn / pembelajaran mеѕіn / machine learning аdаlаh bаgаіmаnа
mengenali ѕесаrа otomatis роlа kompleks dаn mеmbuаt kерutuѕаn cerdas berdasarkan
dаtа.

Implementasi Machine Learning Secara Global

 Fitur Face Unlock Untuk Smartphone


 Game
 Stock Market Analysis
 Robot Locomation
 Natural Language Processing
 Medical Diagnosis
 Sequence Mining
 Software Engineering

Anda mungkin juga menyukai