Anda di halaman 1dari 2

UAS Machine Learning

Fakultas Teknik Universitas Hamzanwadi


Semester Ganjil 2021-2022
Tugas Kelompok (1 kelompok maksimal 3 orang)

HANYA BOLEH DIDISKUSIKAN ANTAR ANGGOTA KELOMPOK, TIDAK BOLEH


BERDISKUSI/MENGCOPY/MENCONTEK KELOMPOK LAIN.

Scan pdf jawaban + file jupyter notebook dikumpulkan dan dikompres jadi file zip dan
dimasukkan ke e-learning (cukup 1 per-kelompok)

Soal 1-5 tulis jawabannya di kertas dan scan sebagai pdf

1. Jelaskan apa yang dimaksud Machine Learning sesuai definisi 2 ahli AI berikut : Arthur
Samuel dan Tom Mitchel.
2. Jelaskan 3 tipe pembelajaran dalam Machine Learning dan contoh kasus masing-masing
tipe pembelajaran
3. Jika ( ) = 3 ' + 2 * − 5 - + 10, berapa
a. Laju perubahan f(x) pada x = 4.
b. Laju perubahan gradient dari f(x) atau turunan kedua dari f(x)
c. Integral f(x) pada x = -3
4. Jelaskan definisi fungsi jarak (distance function) berikut : Manhattan distance, Euclidean
distance dan Hamming distance
5. Jelaskan mengapa hasil clustering dari algoritma K-Means berubah-ubah setiap kali
dijalankan dan bagaimana mendapatkan nilai K yang optimal?

Soal 6-8 buat jupyter notebooknya

6. Pada file “asuransi.csv”, kolom x adalah jumlah klaim asuransi sementara kolom y
menunjukkan jumlah bayaran asuransi dalam ribuan dolar.
- Lakukan Analisa pada data (tentukan std, mean, min, max dll)
- Bagi data pelatihan 75% dari total dataset
- Bandingkan performa algoritma Regresi linear dan KNN
- Plot data dan model yang dihasilkan masing-masing algoritma
- Prediski nilai jumlah asuransi ketika ada klaim asuransi sebanyak 17, 42 dan 67 pada
masing-masing model regresi linear dan KNN

7. Pada dataset “pima-indian-diabetes.txt” terdapat data orang orang Indian yang memiliki
penyakit diabetes (kelas 1) atau tidak (kelas 0) dengan keterangan data-data kesehatan
yang dimilikinya.
Terdapat data dengan 9 kolom sebagai berikut dalam file tersebut:
1. Berapa kali hamil.
2. Konsentasi Plasma glucose dalam 2 hours pada tes oral toleransi glukose
3. Tekanan darah Diastolic (mm Hg).
4. Ketebalan Triceps (mm).
5. 2-Hour serum insulin (mu U/ml).
6. Body mass index (weight in kg/(height in m)^2).
7. Fungsi Diabetes pedigree.
8. Umur (tahun).
9. Kelas (0 = Tidak diabetes, 1 = Diabetes).

- Lakukan Analisa pada data (tentukan std, mean, min, max dll)
- Bagi data pelatihan menjadi 80% dari total dataset dan
- Gunakan algoritma Regresi Logistik untuk mengklasifikasikan seseorang menderita
penyakit diabetes atau bukan dari atribut 1-8.
- Plot data dan model yang dihasilkan masing-masing algoritma

8. Pada file “pelanggan_toko.csv”,terdapat 5 buah fitur pada setiap datanya, yaitu :


NoPelanggan, Jenis Kelamin, Umur, Pendapatan pertahun (1000$), Skor Pengeluaran (1-
100)

- Lakukan Analisa pada data (tentukan std, mean, min, max dll)
- Tentukan jumlah K yang optimal dengan metode elbow
- Latih model clustering menggunakan algoritma K-Mean

Anda mungkin juga menyukai