Anda di halaman 1dari 6

BERIKUT QUIS SECARA MENDALAM MENURUT PENGERTIAN ANDA

TERHADAP MACHINE LEARNING

Ketentuan :
1) Berilah Nama : Jonato Antonio Freitas
2) NIM/NPM :20211310109
3) Upload dalam file PDF ke dalam folder Quis, batas Upload sebelum UTS berlangsung
4) Biasakan ada referensi yang ditulis
5) Walaupun ini pertanyaan umum tetapi anda jawab, menurut kedalaman pengetahuan
anda.

Pertanyaan

1. Apa Berbagai Jenis Pembelajaran Mesin (ML)?


. Jenis pembelajaran (ML) ini merupakan teknologi yang mampu mempelajari data yang ada dan
melakukan tugas-tugas tertentu sesuai dengan apa yang ia pelajari. Sebelum kita membahas lebih
jauh mengenai machine learning, mari kita telusuri terlebih definisinya. Pembelajaran
mesin dikembangkan berdasarkan disiplin ilmu lainnya seperti statistika, matematika dan data
mining sehingga mesin dapat belajar dengan menganalisa data tanpa perlu di program ulang atau
diperintah. Dalam hal ini machine learning memiliki kemampuan untuk memperoleh data yang
ada dengan perintah ia sendiri. ML juga dapat mempelajari data yang ada dan data yang ia
peroleh sehingga bisa melakukan tugas tertentu.

2. Apa itu Overfitting, dan Bagaimana Cara Menghindarinya?


. Overfitting adalah suatu keadaan dimana data yang digunakan untuk pelatihan itu adalah yang
"terbaik". Sehingga apabila dilakukan tes dengan menggunakan data yang berbeda dapat
mengurangi akurasi (hasil yang dibuat tidak sesuai yang diharapkan).

3. Apa itu 'Training Set' dan 'test Set' dalam Model Machine Learning? Berapa Banyak Data yang
Akan Anda Alokasikan untuk Pelatihan, Validasi, dan Set Tes Anda?
Machine learning (ML) sesuai namanya adalah mesin yang dirancang untuk belajar (a machine
that is designed to learn). Oleh karena itu agar kita bisa mengetahui apakah ia belajar sesuai
keinginan kita, dan apakah performa yang diberikan sudah sesuai dengan tingkat akurasi yang kita
inginkan, setelah mesin itu kita ajari (train), maka perlu kita tes (test):
- Training set adalah bagian dataset yang kita latih untuk membuat prediksi atau menjalankan fungsi
dari sebuah algoritma ML. Kita memberikan petunjuk melalui algoritma agar mesin yang kita latih bisa
mencari korelasinya sendiri atau belajar pola dari data yang diberikan.
- Test set adalah bagian dataset yang kita tes untuk melihat keakuratannya, atau dengan kata lain
melihat performanya.

4. Bagaimana Anda Menangani Data yang Hilang atau Rusak dalam Dataset?
Salah satu cara yang dapat dilakukan untuk menangani missing data adalah dengan mengisi
missing data dengan nilai-nilai yang mungkin berdasarkan informasi yang tersedia pada data atau
dikenal dengan imputasi. Mean dan Algoritma K-Means merupakan metode yang dapat
digunakan untuk imputasi missing data

5. Bagaimana Anda Dapat Memilih Pengklasifikasi Berdasarkan Ukuran Data Set Pelatihan?
Kita harus yakin bahwa model yang dibuat merupakan model terbaik yang akan memberikan hasil
maksimal dan akurat. Oleh karena itu, kita perlu melakukan validasi terhadap model sebelum
digunakan untuk produksi. Validasi model adalah mengukur kinerja model dengan menghitung
segala bentuk tingkat kesalahan prediksi pada model. Lalu mengapa perlu mengetahui kinerja
model tersebut? dengan mengetahui kinerja model dapat membantu kita untuk mengoptimalkan
parameter pada model itu sendiri sehingga model jauh lebih akurat. Kita juga dapat memilih
model dengan algoritma terbaik karena setiap algoritma memiliki karateristik yang berbeda. Dan
yang terpenting adalah kita dapat mengetahui seberapa baik kinerja model tersebut sebelum
digunakan dalam produksi.

6. Jelaskan Matriks Kebingungan sehubungan dengan Algoritma Pembelajaran Mesin (ML)?


. Ada beberapa cara untuk berbicara tentang mengapa matriks kebingungan berharga dalam
pembelajaran mesin (ML) - tetapi salah satu cara paling sederhana adalah menjelaskan bahwa
matriks kebingungan adalah sumber visualisasi data.
Matriks kebingungan memungkinkan pemirsa untuk melihat sekilas hasil dari menggunakan classifier
atau algoritma lainnya. Dengan menggunakan tabel sederhana until menunjukkan hasil analitis, matriks
kebingungan pada dasarnya membuat output Anda menjadi lebih mudah dicerna. Matriks
kebingungan menggunakan terminologi khusus untuk mengatur hasil. Ada positif sejati dan negatif
sejati, serta positif palsu dan negatif palsu. Untuk matriks kebingungan yang lebih rumit atau yang
didasarkan pada klasifikasi perbandingan, nilai-nilai ini mungkin ditampilkan sebagai kelas aktual dan
prediksi untuk dua objek berbeda.

7. Apa itu Positif Palsu dan Negatif Palsu dan Bagaimana Signifikansinya?
. Dalam penguin medis dan lebih umum dalam klasifikasi biner, positif palsu adalah kesalahan
dalam pelaporan data di mana hasil tes tidak tepat menunjukkan adanya suatu kondisi, seperti
penyakit (hasilnya positif), padahal kenyataannya tidak ada , sementara negatif palsu adalah
kesalahan di mana hasil tes tidak tepat menunjukkan tidak adanya kondisi (hasilnya negatif),
padahal kenyataannya itu ada. Ini adalah dua jenis kesalahan dalam tes biner(dan dikontraskan
dengan hasil yang benar, baik positif benar atau negatif sejati.) Mereka juga dikenal dalam
kedokteran sebagai diagnosis positif palsu (masing-masing negatif), dan dalam klasifikasi statistik
sebagai kesalahan positif palsu (masing-masing negatif).Positif palsu berbeda dari overdiagnosis,
dan juga berbeda dari overtesting.

8. Apa Tiga Tahap Membangun Model dalam Pembelajaran Mesin?


Sejak pertama kali komputer diciptakan, manusia sudah memikirkan cara agar komputer dapat
belajar dari pengalaman. Hal tersebut terbukti pada tahun 1952 saat Arthur Samuel menciptakan
program bernama game of checkers di sebuah komputer IBM Program tersebut dapat mempelajari
gerakan untuk memenangkan permainan checkers dan menyimpan gerakan tersebut ke dalam
memorinya. machine learning merupakan domain ilmu komputer dengan basis matematika
komputasi dan statistik yang dapat mempelajari pola dalam data untuk membuat prediksi masa
depan. Dalam perkembangannya, machine learning dijalankan dengan tiga metode utama yaitu :
- Supervised Learning
- Semi-supervised Learning (Unsupervised)
- Reinforcement Learning

9. Apa itu Pembelajaran Mendalam?


Penelitian dalam pembelajaran siswa menunjukkan bahwa setiap proses pembelajaran melibatkan
kedalaman studi tertentu dan ada perbedaan individu dalam hal bagaimana siswa mendekati
pembelajaran mereka. Belajar sangat kontekstual dan inti dari setiap proses pembelajaran terletak
dua konsep dasar yang layak disebut: pembelajaran yang mendalam dan pembelajaran
permukaan. Pembelajaran mendalam adalah pendekatan yang berkomitmen untuk belajar di mana
pelajar menggunakan keterampilan kognitif tingkat tinggi untuk menguasai konten akademik,
bekerja secara kolaboratif dan berpikir serta berinteraksi secara kritis dan aktif dengan konten
yang dipelajari. Tetapi tidak semua pembelajaran itu sama. Mungkin karena beberapa alasan,
siswa cenderung menghindari kerja keras dan alih-alih mengandalkan sumber informasi tunggal,
dan sebagai akibatnya mereka belajar hanya apa yang diperlukan tetapi tidak lebih. Ini disebut
sebagai pembelajaran Permian. Pendekatan permukaan sangat kontras dengan pendekatan
mendalam. Jadi penting bagi para guru untuk memahami berbagai cara siswa belajar dan
menafsirkan. Ada berbagai penokohan yang berbeda dengan pembelajaran dalam dan permukaan.
10. Apa Perbedaan Antara Pembelajaran Mesin (ML) dan Pembelajaran Mendalam (DL)?
Sepengetahuan saya, tidak ada definisi yang betul-betul jelas, tapi memang ada pengertian yang
biasanya diajarkan. Secara kasar, pemelajaran mesin mendalam (deep learning) merujuk pada
pemelajaran mesin dengan menggunakan model jaringan saraf tiruan yang lapis tersembunyinya
banyak. Biasanya lebih dari satu buah. Seperti yang kita ketahui, salah satu arsitektur jaringan
saraf tiruan yang paling sering dijadikan contoh adalah feedforward neural network.

11. Apa itu Pembelajaran Mesin Semi-diawasi?


Pembelajaran semi-diawasi: Pendekatan pembelajaran mesin ini melibatkan campuran dari dua
jenis sebelumnya. Ilmuwan data dapat memberi makan algoritme yang sebagian besar berlabel
data pelatihan, tetapi modelnya bebas menjelajahi datanya sendiri dan mengembangkan
pemahamannya sendiri tentang kumpulan data.

12. Apa Itu Teknik Pembelajaran Mesin Tanpa Pengawasan?


. Pembelajaran mesin adalah metode analisis data yang mengautomasi pembuatan model analitik.
Pembelajaran tanpa pengawasan (Unsupervised Learning) digunakan terhadap data yang tidak
memiliki label historis. Sistem tidak diberi tahu “jawaban yang benar”. Algoritma harus mencari
tahu apa yang ditampilkan. Tujuannya adalah untuk mengeksplorasi data dan menemukan
beberapa struktur di dalamnya.

13. Apa Perbedaan Antara Pembelajaran Mesin yang Diawasi dan Tidak Diawasi?
Perbedaan utama antara pembelajaran mesin diawasi dan tidak diawasi adalah itu pembelajaran
yang diawasi menggunakan data berlabel sementara pembelajaran yang tidak diawasi
menggunakan data yang tidak berlabel.

14. Apa Perbedaan Antara Pembelajaran Mesin Induktif dan Pembelajaran Mesin Deduktif?
. Perbedaan antara pembelajaran mesin induktif dan pembelajaran mesin deduktif :
- PEMBELAJARAN MESIN INDUKTIF:
Dari perspektif pembelajaran induktif, kita diberikan sampel input dan sampel output dan masalahnya
adalah untuk memperkirakan fungsi . Secara khusus, masalahnya adalah untuk menggeneralisasi dari
sampel dan pemetaan agar berguna untuk memperkirakan output untuk sampel baru di masa depan.
- PEMBELAJARAN MESIN DEDUKTIF :
Pendekatan deduktif untuk mengajar bahasa dimulai dengan memberikan aturan kepada siswa,
kemudian contoh, kemudian praktik. Ini adalah pendekatan yang berpusat pada guru untuk menyajikan
konten baru. Ini dibandingkan dengan pendekatan induktif, yang dimulai dengan contoh dan meminta
peserta didik untuk menemukan aturan dan karenanya lebih berpusat pada peserta didik.

15. Bandingkan K-means dan Algoritma KNN.


. Kedua penelitian yang masing-masing menggunakan metode tersebut, menghasilkan kinerja
yang baik (akurasi di atas 50%). Namun, untuk dapat digunakan secara luas, perlu diteliti metode
mana yang memiliki akurasi lebih tinggi. Berdasarkan hal tersebut dalam penelitian ini, dilakukan
perbandingan metode K-Means dan K-NN dalam kasus peringkasan teks secara otomatis.
Dokumen yang digunakan sebagai bahan uji adalah dokumen latar belakang laporan Skripsi.
Perbandingan dilakukan dengan menggunakan 100 buah data. Berdasarkan pengujian yang telah
dilakukan, peringkasan dengan K-NN menghasilkan rata-rata akurasi sebesar 49%, sementara K-
Means sebesar 51%. Hal ini menunjukkan bahwa walaupun K-Means memiliki akurasi yang lebih
tinggi, perbedaan keduanya tidaklah mencolok secara umum. Dalam beberapa dokumen, K-NN
justru menghasilkan akurasi yang lebih tinggi secara signifikan.

16. Apa itu 'naive' di Naive Bayes Classifier?


Naive Bayes classifier merupakan salah satu metoda pemelajaran mesin yang memanfaatkan
perhitungan probabilitas dan statistik yang dikemukakan oleh ilmuwan Inggris Thomas Bayes,
yaitu memprediksi probabilitas pada masa depan berdasarkan pengalaman pada masa
sebelumnya.
17. Jelaskan Bagaimana Suatu Sistem Dapat Memainkan Permainan Catur Menggunakan
Reinforcement Learning.
. Reinforcement learning artinya model belajar untuk melihat situasi dan menentukan aksi untuk
memperoleh hasil terbaik.Hal ini yang dibahas tuntas oleh Pak Rian pada seminar yang dilaksana
secara daring melalui Zoom Meeting dan YouTube Live Streaming ini. Contoh nya Sebuah state
menyimpan informasi apa yang terjadi pada suatu permainan dalam satu waktu. Dalam permainan
catur, sebuah state bisa berupa posisi bidak-bidak pada papan pada suatu waktu. Bayangkan ada
orang bermain catur, lalu kita foto papan catur setiap pemain menggerakan bidaknya, maka foto-
foto itu disebut dengan state.

18. Bagaimana Anda Mengetahui Algoritma Machine Learning mana yang harus dipilih untuk
Masalah Klasifikasi Anda?
Karena algoritma machine learning sesuai dengan permasalahan yang dihadapi oleh perusahaan.
Permasalahan di sini memang beragam, misalnya faktor klasifikasi, regresi, deteksi anomali,
clustering, image classification, text analytic, dan sebagainya. Jika Anda telah mengklasifikasikan
dan memetakan masalah yang ada, eliminasilah algoritma yang tidak digunakan. Hal itu bisa
mengefisienkan waktu dan pemetaan. Dan perhatikan ukuran training set, apalagi ketika
mengumpulkan data dalam jumlah besar. Bila Anda memiliki kumpulan data yang tidak terlalu
banyak dan fitur yang cukup lengkap, Anda bisa memilih algoritma dengan bias dan varian yang
rendah, seperti Linear SVM dan Naive Bayes. Sebaliknya, jika kumpulan data dalam jumlah yang
besar, pilih bias rendah dengan varian yang tinggi, seperti Kernel SVM, KNN, maupun
menggunakan metode decision trees.

19. Bagaimana Amazon Dapat Merekomendasikan Hal Lain untuk Dibeli? Bagaimana Mesin
Rekomendasi Bekerja?
AWS Compute Optimizer menyediakan rekomendasi instans Amazon EC2 untuk membantu
Anda meningkatkan performa, menghemat uang, atau keduanya. Anda dapat menggunakan
rekomendasi ini untuk memutuskan apakah akan beralih ke jenis instans baru. Untuk membuat
rekomendasi, Compute Optimizer menganalisis spesifikasi instans dan metrik pemanfaatan Anda
yang ada. Data yang dikompilasi kemudian digunakan untuk merekomendasikan jenis instans
Amazon EC2 mana yang paling mampu menangani beban kerja yang ada. Rekomendasi
dikembalikan bersama dengan harga instans per jam. Topik ini menguraikan cara melihat
rekomendasi melalui konsol Amazon EC2.

20. Kapan Anda Akan Menggunakan Klasifikasi daripada Regresi?


. Klasifikasi adalah tentang mengidentifikasi keanggotaan kelompok sementara teknik regresi
melibatkan memprediksi respons. Kedua teknik tersebut terkait dengan prediksi, di mana
klasifikasi memprediksi milik suatu kelas sedangkan regresi memprediksi nilai dari himpunan
kontinu. Teknik klasifikasi lebih disukai daripada regresi ketika hasil model perlu mengembalikan
kepemilikan titik data dalam kumpulan data ke kategori eksplisit tertentu. (Misalnya, ketika Anda
ingin mengetahui apakah sebuah nama laki-laki atau perempuan, bukan hanya mencari tahu
seberapa berkorelasinya nama itu dengan nama laki-laki dan perempuan.

21. Bagaimana Anda Mendesain Filter Spam Email?


Menggunakan pesan tertentu untuk membuat filter
1. Buka Gmail.
2. Centang kotak di sebelah email yang Anda inginkan.
3. Klik Lainnya .
4. Klik Filter pesan seperti ini.
5. Masukkan kriteria filter Anda.
6. Klik Buat filter.
22. Apa itu Hutan Acak?
Hutan acak adalah konstruk data yang diterapkan pada pembelajaran mesin yang
mengembangkan sejumlah besar pohon keputusan acak yang menganalisis sekumpulan variabel.
Jenis algoritma ini membantu meningkatkan cara teknologi menganalisis data yang kompleks.

23. Mempertimbangkan Daftar Panjang Algoritma Pembelajaran Mesin, dengan Kumpulan Data,
Bagaimana Anda Memutuskan Yang Mana yang Akan Digunakan?
Beberapa algoritma pembelajaran mesin paling sering digunakan antara lain:
• Linear regression.
• Logistic regression.
• K-means clustering.
• Hierarchical clustering.
• K Nearest Neighbor (KNN)
• Decision Tree.
• Random Forest.
• Support Vector Machine (SVM)

24. Apa itu Bias dan Varians dalam Model Machine Learning?
Bias adalah kencenderungan algoritma machine learning untuk melakukan penyederhanaan dalam
mempelajari kumpulan data dengan tidak mempertimbangkan semua informasi
Variance adalah variabilitas dalam prediksi model. Variance terjadi ketika model bekerja terlalu
baik pada data pelatihan namun tidak bekerja dengan baik pada data pengujian atau data validasi.
Dengan kata lain, model akan menghasilkan akurasi yang baik menggunakan data latih,
sedangkan saat menggunakan data uji atau data validasi hasilnya akurasinya kurang baik

25. Apa Trade-off Antara Bias dan Varians?


Dalam statistik dan pembelajaran mesin, tradeoff bias-varians adalah properti model yang varians
dari parameter yang diestimasi di seluruh sampel dapat dikurangi dengan meningkatkan bias
dalam parameter yang diestimasi.

26. Tentukan Presisi dan Recall.


Presisi adalah tingkat ketepatan antara informasi yang diminta oleh pengguna dengan jawaban
yang diberikan oleh sistem. Sedangkan recall adalah tingkat keberhasilan sistem dalam
menemukan kembali sebuah informasi. Sedangkan di “dunia lain” seperti dunia statistika dikenal
juga istilah accuray.

27. Jelaskan Secara Siat Regresi Logistik.


Regresi logistik adalah sebuah pendekatan untuk membuat model prediksi seperti halnya regresi
linear atau yang biasa disebut dengan istilah Ordinary Least Squares (OLS) regression.
Perbedaannya adalah pada regresi logistik, peneliti memprediksi variabel terikat yang berskala
dikotomi. Skala dikotomi yang dimaksud adalah skala data nominal dengan dua kategori,
misalnya: Ya dan Tidak, Baik dan Buruk atau Tinggi dan Rendah.

28. Jelaskan Algoritma K Nearest Neighbor.


Algoritme k tetangga terdekat adalah sebuah metode untuk melakukan klasifikasi terhadap objek
berdasarkan data pemelajaran yang jaraknya paling dekat dengan objek tersebut. Data
pemelajaran digambarkan ke ruang berdimensi banyak dengan tiap-tiap dimensi mewakili tiap
ciri/fitur dari data.

29. Apa itu Sistem Rekomendasi?


Sistem rekomendasi merupakan sistem yang bertujuan untuk memperkirakan informasi yang
menarik bagi pengguna dan juga membantu user dalam menentukan pilihannya.

30. Apa asumsi yang perlu Anda ambil sebelum memulai dengan regresi linier?
Asumsi normalitas adalah asumsi residual yang berdistribusi normal. Asumsi ini harus dipenuhi
untuk model regresi linier yang baik.

Selamat menjawab….

Anda mungkin juga menyukai