Multimedia
Pertemuan 11
10/3/2020 1
Data Mining
10/3/2020 2
Multimedia Data Mining
10/3/2020 3
Definisi Penambangan Multimedia
Segmentasi Data :
Data multimedia dibagi menjadi segmen yang
saling berhubungan logis (objek).
Ekstraksi pola.
Prosedur penambangan dan analisis harus
mengungkapkan beberapa hubungan antara
objek pada tingkat yang berbeda.
Representasi pengetahuan.
Pola terkait yang digabungkan.
10/3/2020 5
Generalisasi Data Spasial and Multimedia
10/3/2020 6
Apa Itu Sistem Database Spasial?
1. Data geometris, geografis atau spasial: data terkait ruang
Contoh: Ruang geografis (abstraksi 2-D permukaan bumi), desain
VLSI, model otak manusia, ruang 3-D yang merepresentasikan
susunan rantai molekul protein.
2. Sistem database spasial vs. sistem database gambar.
Sistem basis data citra: menangani citra raster digital (mis.,
Penginderaan satelit, tomografi komputer), juga dapat berisi
teknik untuk analisis dan ekstraksi objek dari citra dan beberapa
fungsionalitas basis data spasial.
Sistem basis data spasial (geometris, geografis): menangani
objek dalam ruang yang memiliki identitas dan luasan, lokasi,
dan hubungan yang jelas.
10/3/2020 7
Pemodelan Objek Spasial
Apa yang perlu diwakili?
Dua pandangan alternatif penting
Objek tunggal: entitas berbeda yang diatur
dalam ruang yang masing-masing memiliki
deskripsi geometrisnya sendiri.
Pemodelan kota, hutan, sungai.
Kumpulan objek yang terkait secara spasial:
gambarkan ruang itu sendiri (tentang setiap
titik dalam ruang).
Pemodelan penggunaan lahan, pembagian
negara menjadi distrik.
10/3/2020 8
Model Objek Tunggal : Titik, Garis dan Wilayah
10/3/2020 9
Analisis Asosiasi Spasial
Rule Asosiasi Spasial : A ⇒ B [s%, c%]
A dan B adalah kumpulan predikat spasial atau non-
spasial :
Relasi Topologikal : intersects, overlaps, disjoint, etc.
Orientasi Spasial : left_of, west_of, under, etc.
Informasi jarak: close_to, within_distance, etc.
s% adalah nilai Support and c% adalah nilai Confidence.
Contoh :
1) Adalah a(x, large_town) ^ intersect(x, highway) → berdekatan ke(x,
water) [s=7%, c=85%]
2) Jenis objek apa yang biasanya berada di dekat lapangan golf?
10/3/2020 10
Penambangan Progresif dari Rule
Asosiasi Spasial
Hirarki hubungan spasial:
g_berdekatan dengan: dekat dengan, sentuh, berpotongan,
berisi, dll.
Pertama-tama cari hubungan kasar dan kemudian perbaiki.
Penambangan dua langkah asosiasi spasial:
Langkah 1: Perhitungan spasial kasar (sebagai filter)
Menggunakan MBR atau R-tree untuk estimasi kasar.
Langkah2: Algoritme spasial terperinci (sebagai
penyempurnaan).
Berlaku hanya untuk objek yang telah lulus uji asosiasi
spasial kasar (tidak kurang dari min_support).
10/3/2020 11
Aturan Penambangan Spasial Co-
location
Aturan co-location mirip dengan aturan asosiasi tetapi
mengeksplorasi lebih mengandalkan korelasi otomatis
spasial.
Ini mengarah pada pemrosesan yang efisien.
Itu dapat diintegrasikan dengan penyempurnaan
progresif untuk lebih meningkatkan kinerjanya.
Ide penambangan co-location spasial dapat diterapkan
pada pengelompokan, klasifikasi, analisis outlier, dan
tugas penambangan potensial lainnya.
10/3/2020 12
Spatial Autocorrelation
10/3/2020 13
Spatial Autocorrelation (cont’d)
10/3/2020 14
Spatial Classification
Metode dalam klasifikasi :
Decision-tree classification, Naïve-Bayesian classifier +
boosting, neural network, logistic regression, etc.
Klasifikasi multi-dimensi berbasis asosiasi - Contoh:
mengklasifikasikan nilai rumah berdasarkan kedekatan
dengan danau, jalan raya, pegunungan, dll.
Dengan asumsi sampel pembelajaran tidak tergantung
satu sama lain.
Korelasi otomatis spasial melanggar asumsi ini!
Metode klasifikasi spasial populer :
Spatial auto-regression (SAR)
Markov random field (MRF)
10/3/2020 15
Spatial Trend Analysis
Fungsi
Mendeteksi perubahan dan tren di sepanjang
dimensi spasial.
Mempelajari tren perubahan data non-spasial
atau spasial dengan ruang.
Contoh Penerapan
Amati tren perubahan iklim atau vegetasi
dengan jarak yang semakin jauh dari lautan.
Tingkat kejahatan atau perubahan tingkat
pengangguran terkait dengan distribusi
geografis kota.
10/3/2020 16
Spatial Cluster Analysis
10/3/2020 17
Constraints-Based Clustering
C3
C2
C1
River
Mountain C4
Data spasiotemporal :
Data memiliki perluasan spasial dan berubah
seiring waktu
Mis: Kebakaran hutan, benda bergerak, badai
& gempa bumi
Deteksi anomali otomatis pada benda bergerak
besar :
Objek bergerak ada di mana-mana: GPS, radar,
dll.
Mis: Pengawasan kapal maritim
Masalah: Deteksi anomali otomatis
10/3/2020 20
Analisis: Anomali Penambangan pada Objek
Bergerak
10/3/2020 23
Atribut Ekspresi Motif
Setiap ekspresi motif memiliki
atribut (misalnya kecepatan,
lokasi, ukuran).
Atribut mengungkapkan
bagaimana suatu motif
diekspresikan.
Menyampaikan informasi
semantik yang berguna untuk
klasifikasi :
lingkaran sempit dengan
kecepatan 30mph di dekat
landmark Y.
Lingkaran ketat dengan
kecepatan 10mph di lokasi X.
10/3/2020 24
Ruang Fitur Berorientasi Motif
10/3/2020 26
Kueri dalam Sistem Pengambilan Berbasis Konten
10/3/2020 29
Satu Tanda Tangan untuk Seluruh
Gambar?
10/3/2020 32
Pencarian Multi-Dimensional
Pada Database Multimedia
10/3/2020 33
Penambangan Database Multimedia
Mempersempit atau
menggabungkan pencarian
Menelusuri "pesawat di langit biru"
(kisi tata letak atas berwarna biru dan
kata kunci = "pesawat")
10/3/2020 34
Penambangan Database Multimedia
The Data Cube and
the Sub-Space Measurements
By Size
By Format
By Format & Size
RED
WHITE
BLUE
Cross Tab By Colour & Size
JPEG GIF By Colour By Format & Colour
RED
WHITE Sum By Colour
BLUE • Format gambar
By Format • Durasi
Group By
Sum • Warna
Colour
RED • Tekstur
WHITE • Kata kunci
BLUE
• Ukuran
Measurement • Lebar
Sum
• Tinggi
• Domain internet gambar
• Domain internet halaman induk
• Popularitas gambar
10/3/2020 35
Penambangan Database Multimedia Pada
10/3/2020 36
Klasifikasi Dalam MultiMediaMiner
10/3/2020 37
Penambangan Asosiasi Pada Data
Multimedia
Asosiasi antara konten gambar dan fitur konten non-gambar
“Jika setidaknya 50% dari bagian atas gambar berwarna
biru, kemungkinan besar itu mewakili langit.”
Asosiasi di antara konten gambar yang tidak terkait dengan
hubungan spasial
"Jika sebuah gambar berisi dua kotak biru, kemungkinan
besar gambar tersebut juga berisi satu lingkaran merah."
Asosiasi antar konten gambar terkait dengan hubungan
spasial
"Jika segitiga merah berada di antara dua kotak kuning,
kemungkinan besar ada benda berbentuk oval di
bawahnya."
10/3/2020 38
Penambangan Asosiasi Pada Data
Multimedia
Fitur spesial:
Membutuhkan # kejadian selain keberadaan Boolean,
misalnya, "Dua kotak merah dan satu lingkaran biru"
menyiratkan tema "pertunjukan udara“.
Membutuhkan relasi spasial :
Biru di atas objek persegi berwarna putih dikaitkan
dengan dasar cokelat.
Perlu penambangan multi-resolusi dan penyempurnaan
progresif.
Mengeksplorasi asosiasi terperinci di antara objek pada
resolusi tinggi itu mahal :
Sangat penting untuk memastikan kelengkapan
pencarian di ruang multi-resolusi.
10/3/2020 39
Penambangan Asosiasi Pada Data
Multimedia
10/3/2020 40
Penambangan Database Multimedia
10/3/2020 41
Tantangan : Dimensionalitas