Machine Learning Topik 1
Machine Learning Topik 1
Ada banyak sumber data yang tersedia (wikipedia, encyclopedia, group, media
sosial, dll)
Pattern recognition :
Bidang ilmu yang memfokuskan diri
pada pengenalan pola/keteraturan
dalam data
Machine Learning
Neurocomputing :
Bidang komputasi yang
menggunakan proses kerja
otak/saraf sebagai
modelnya/analoginya
Data mining
Proses menemukan
pola/keteraturan dalam data yang
berukuran besar
Machine Learning
Knowledge discovery :
Bidang interdisipliner yang
memfokuskan pada metodologi
untuk mengekstraksi
knowledge/pengetahuan dari data
Statistic:
Cabang ilmu matematika yang
berhubungan dengan
pengumpulan,
pengelolaan/pengorganisasian,
analisi, interpretasi dan
representasi
Machine Learning
Database :
Kumpulan data yang terstruktur ,
disimpan dalam komputer, serta
dapat diakses dengan bebarapa
cara.
Machine Learning VS Data Mining
• Machine learning :
lebih menekankan pada aspek teori daripada aplikasi
tidak memperhitungkan run time maupun skalabilitas
• Data mining
lebih menekankan pada aspek aplikasi (business) daripada teori
Banyak membahas tentang database, runtime serta skalabilitas
Machine Learning
Bidang-bidang yang berkaitan dengan machine learning
antara lain:
• Kecerdasan Buatan
• Teori kompleksitas
• Teori Informasi
• Filsafat
• Psikologi dan neurobiology
• Statistik
Contoh
Klasifikasi keren dan imut
Entitas Kelas
Boneka Barbie imut
Harley Davidson keren
Rajawali keren
Hello Kitty imut
Singa keren
Upin Ipin ???
Koala ???
Ular ???
Contoh 1
Skenario :
Anda seorang manager supermarket dan ingin meningkatkan penjualan
tanpa meningkatkan biaya/pengeluaran
Strategi :
Menata peletakan barang sedemikian rupa sehingga menyebabkan
konsumen berbelanja lebih banyak
Association rules
Contoh 2
Skenario :
Anda seorang manager warehouse yang diminta menata ulang sistem
penyimpanan barang di gudang
Strategi :
Mengidentifikasi jenis-jenis barang yang disimpan digudang dan
meletakkan barang sejenis berdekatan
Clustering
Contoh 3
Skenario :
Anda seorang manager R&D sebuah produk makanan yang sedang
mengembangkan produk baru serta ingin mengetahui seberapa nikmat
resep yang baru tersebut
Strategi :
Menguji resep baru dengan bahan-bahan (gula, garam, tepung dsb) yang
kadarnya divariasi dan mengestimasikan penerimaan konsumen untuk
berbagai komposisi bahan tersebut
Regression
Apakah konsep itu?
Gaya pembelajaran konsep :
1. Association learning : mendeteksi keterkaitan antar
feature
2. Clustering : pengelompokan instance yang sama kedalam
cluster/kelompok
3. Classification learning : memprediksi kedalam kelas-kelas
diskrit
4. Regression : memprediksi kuantitas numeris
Aplikasi Machine Learning
• Diagnosis medis (kanker, tumor, db)
• Keamanan jaringan (intrusion detection system, social network analysis,
dsb)
• Deteksi spam
• Behavioral analytics
• Customer sentiment analysis
• Prediksi (permainan bola, harga komoditas, cuaca, dsb)
• Iklan (menyajikan iklan sesuai dengan karakteristik konsumen)
• Pengolahan citra
• Fraud detection
• dsb
Poin wise mutual information
• Telomoyo
• Apakah Telomoyo itu sebuah gunung atau bukit?
• Kita selesaikan secara empiris via Google counts
Telomoyo *
gunung
bukit
*
Kesimpulan: … ???
Pointwise mutual information
• Untuk menentukan relasi hal, kita memakai Pointwise Mutual
Information
Telomoyo *
Gunung 189.000 86.400.000 Pmi(telomoyo, gunung) = 4,86
Bukit 218.000 80.800.000 Pmi(telomoyo, bukit) = 5,15
* 335.000 4480000000