KAJIAN PUSTAKA
Data atau informasi tidak hanya disajikan dalam bentuk teks, tetapi juga
dapat berupa gambar, audio (bunyi, suara, musik), dan video. Keempat macam
data atau informasi ini sering disebut multimedia. Era teknologi informasi saat
ini tidak dapat dipisahkan dari multimedia. Situs web (website) di Internet dibuat
yang dapat diputar. Beberapa waktu lalu istilah SMS begitu populer diantara
pengguna telepon genggam (handphone). Tetapi, saat ini orang tidak hanya
dapat mengirim pesan dalam bentuk teks tapi juga dalam bentuk gambar
Service).
Gambar (image) adalah istilah lain untuk gambar sebagai salah satu
informasi visual. Gambar mempunyai karakteristik yang tidak dimiliki oleh data
teks, yaitu gambar kaya dengan informasi. Maksudnya sebuah gambar dapat
bentuk tekstual.
yang berkembang sangat pesat sejalan dengan kemajuan teknologi pada industri
saat ini. Fungsi utama dari Digital Image Processing adalah untuk memperbaiki
kualitas dari gambar sehingga gambar dapat dilihat lebih jelas tanpa ada
5
ketegangan pada mata, karena informasi penting diekstrak dari gambar yang
dihasilkan harus jelas sehingga didapatkan hasil yang terbaik. Selain itu DIP
digunakan untuk memproses data yang diperoleh dalam persepsi mesin, yaitu
diskrit dari nilai tingkat keabuan pada titik-titik elemen gambar. Bentuk gambar
dalam layar monitor akan menempati sebuah ruang yang disebut dengan pixel
and description ).
data gambar berupa digitizer atau scanner, computer digital, alat penyimpanan
6
• Pengolahan informasi data planet yang diterima dari pesawat ruang
kejernihannya.
• Image processing juga digunakan pada model system radar dan sonar.
2.1.1. Citra
Secara harafiah, citra (image) adalah gambar pada bidang dwimatra (dua
dimensi). Gambar 2.1 adalah citra seorang gadis model yang bernama Lena, dan
dari sudut pandang matematis, citra merupakan fungsi menerus (continue) dari
intensitas cahaya pada bidang dwimatra. Sumber cahaya menerangi objek, objek
memantulkan kembali sebagian dari berkas cahaya tersebut. Pantulan cahaya ini
ditangkap oleh oleh alat-alat optik, misalnya mata pada manusia, kamera,
pemindai (scanner), dan sebagainya, sehingga bayangan objek yang disebut citra
tersebut terekam.
Citra sebagai keluaran dari suatu sistem perekaman data dapat bersifat :
7
Citra yang dimaksudkan di sini adalah “citra diam” (still images). Citra
diam adalah citra tunggal yang tidak bergerak. Gambar 2.1 adalah dua buah citra
kita sebagai gambar yang bergerak. Setiap citra di dalam rangkaian itu disebut
frame. Gambar-gambar yang tampak pada film layar lebar atau televisi pada
Meskipun sebuah citra kaya informasi, namun seringkali citra yang kita
derau (noise), warnanya terlalu kontras, kurang tajam, kabur (blurring), dan
8
sebagainya.Tentu saja citra semacam ini menjadi lebih sulit diinterpretasi karena
manusia maupun mesin), maka citra tersebut perlu dimanipulasi menjadi citra
lain yang kualitasnya lebih baik. Bidang studi yang menyangkut hal ini adalah
contoh, citra burung nuri pada Gambar 2.2 (a) tampak agak gelap, lalu dengan
bila :
9
(a) (b)
Gambar 2.2. (a) Citra burung nuri yang agak gelap, (b) Citra burung yang telah
10
Pengolahan Citra
citra citra
Grafika Pengenalan
Komputer Pola
deskripsi deskripsi
titik, panjang garis, jari-jari lingkaran, tebal garis, warna, dan sebagainya.
reality.
data Grafika
citra
deskriptif Komputer
dibentuk oleh garis-garis lurus, dengan data masukan berupa koordinat awal dan
11
Gambar 2. 5. (a) Program Grafika Komputer untuk membuat gambar ‘rumah (b)
diinterpretasi oleh manusia atau mesin (dalam hal ini komputer). Teknik-teknik
adalah citra dan keluarannya juga citra, namun citra keluaran mempunyai
kualitas lebih baik daripada citra masukan. Termasuk ke dalam bidang ini juga
Pengolahan
citra citra
Citra
Pengubahan kontras citra seperti pada Gambar 2.2 adalah contoh operasi
derau (noise) pada citra Lena (Gambar 2.7). Citra Lena yang di sebelah kiri
12
(filtering), derau pada citra masukan ini dapat dikurangi sehingga dihasilkan
(a) (b)
Gambar 2.7. (a) Citra Lena yang mengandung derau, (b) hasil dari operasi penapisan
derau.
citra) secara otomatis oleh mesin (dalam hal ini komputer). Tujuan
bisa mengenali objek yang dilihatnya karena otak manusia telah belajar
dengan objek lainnya. Kemampuan sistem visual manusia inilah yang dicoba
ditiru oleh mesin. Komputer menerima masukan berupa citra objek yang akan
13
Pengenalan Deskripsi
citra
Pola objek
Contoh pengenalan pola misalnya citra pada Gambar 2.9 adalah tulisan
tangan yang digunakan sebagai data masukan untuk mengenali karakter ‘A’.
Gambar 2.9. Citra karakter ‘A’ yang digunakan sebagai masukan untuk pengenalan
huruf
1. Bidang Militer
3. Bidang Biologi
4. Bidang Pendidikan
7. Bidang Perdagangan
8. Bidang Hiburan
9. Komunikasi data
15
2.1.3. Histogram
Salah satu cara untuk memperbaiki suatu citra digital adalah dengan
mereka yang sesuai. Untuk piksel dengan ukuran level brightness sebesar 8-bit
maka brightness akan memiliki grey level yang berkisar antara nol (hitam)
sampai 255 (putih). Sehingga histogram yang memiliki nilai brightness yang
lebih kecil akan terlihat lebih gelap dibandingkan dengan yang memiliki nilai
lebih besar.
semua grey level yang ada dalam histogram terpakai. Dapat kita lihat bahwa
histogram yang memiliki grey level dibawah 120 memiliki tingkat kegelapan
yang lebih gelap, dimana warna gelap tersebut dimiliki oleh ban mobil dan
bagian bawah mobil, serta bayangan mobil yang memiliki warna cenderung
hitam. Di sini juga terlihat bahwa apabila suatu gambar memiliki warna yang
mana gambar tersebut adalah gambar yang sama, tetapi telah dinaikkan nilai
16
brightness-nya. Sekarang histogram cenderung merata dan agak sedikit
Gambar 2.11. Gambar ban mobil dan histogramnya setelah dinaikkan nilai brightness-nya.
Disini kita dapat melihat bahwa kita belum memakai seluruh dari grey
level yang tersedia. Kita dapat menarik histogram citra tersebut sehingga semua
grey level yang tersedia sepenuhnya terpakai, dan teknik itu akan menghasilkan
tersebut terdapat noise apabila histogram yang ideal telah kita ketahui. Sehingga
kami dapat menghilangkan noise tersebut. Proses ini tidak hanya semata-mata
17
kami lakukan untuk mendapatkan citra yang lebih baik, tetapi juga untuk lebih
selanjutnya.
Jenis operasi ini bertujuan untuk memperbaiki kualitas citra dengan cara
c. penajaman (sharpening)
masukan sebuah citra yang gambarnya hendak dibuat tampak lebih tajam.
18
(a) (b)
Gambar 2.12. (a) Citra Lena asli, (b) Citra Lena setelah ditajamkan
Tujuan pemugaran citra hampir sama dengan operasi perbaikan citra. Bedanya,
masukan adalah citra yang tampak kabur (blur). Kekaburan gambar mungkin
disebabkan pengaturan fokus lensa yang tidak tepat atau kamera bergoyang pada
19
(a) (b)
Gambar 2.13. Kiri: Citra Lena yang kabur (blur), kanan: citra Lena setelah deblurring
bentuk yang lebih kompak sehingga memerlukan memori yang lebih sedikit. Hal
penting yang harus diperhatikan dalam pemampatan adalah citra yang telah
Gambar sebelah kiri adalah citra kapal yang berukuran 258 KB. Hasil
pemampatan citra dengan metode JPEG dapat mereduksi ukuran citra semula
20
(a) (b)
Gambar 2.14. (a) Citra boat.bmp (258 KB) sebelum dimampatkan, (b) citra boat.jpg (49
Jenis operasi ini bertujuan untuk memecah suatu citra ke dalam beberapa
segmen dengan suatu kriteria tertentu. Jenis operasi ini berkaitan erat dengan
pengenalan pola.
Jenis operasi ini bertujuan menghitung besaran kuantitif dari citra untuk
21
Gambar 2.15 adalah contoh operasi pendeteksian tepi pada citra Camera.
(a) (b)
Gambar 2. 15. (a) Citra camera, (b) citra hasil pendeteksian seluruh tepi
Jenis operasi ini bertujuan untuk membentuk ulang objek dari beberapa
citra hasil proyeksi. Operasi rekonstruksi citra banyak digunakan dalam bidang
mencoba meniru cara kerja sistem visual manusia (human vision). Human vision
sehingga manusia mengerti objek apa yang tampak dalam pandangan matanya.
22
Hasil interpretasi ini mungkin digunakan untuk pengambilan keputusan
sejumlah besar proses untuk persepsi visual, seperti akuisisi citra, pengolahan
objek di dalam citra, pengukuran ciri yang berkaitan dengan geometri objek, dan
23
Gambar 2. 16. (a) Citra camera, (b) citra hasil pendeteksian seluruh tepi
Dari penjelasan di atas, dapat kita lihat bahwa pengolahan citra dan
bidang ini, tidak ada hubungan antara keduanya, tetapi beberapa tahun
24
menggunakan representasi kurva dan permukaan dan beberapa teknik lain dari
digunakan adalah teknik warna, teknik tekstur, dan teknik bentuk. Gambar 2.17
Image
Query Image
Database
Pre-processing
Pre-processing
Feature
Extraction
Feature
Extraction
Indexing
Feature Similarity
Database Comparison
Retrival Result
25
Indexing, retrieval, dan database merupakan tiga hal yang tidak dapat
dipisahkan pada data dan informasi. Indexing yang baik akan sangat
menentukan kecepatan dan ketepatan retrieval data yang secara phisik sangat
gambar. Jadi berbeda dengan teknik pengindeksan yang saat ini umum
digunakan, yaitu dengan pemberian tag atau deskripsi singkat secara manual
oleh manusia, yang mana selain sangat terbatas pada bahasa yang digunakan
bisa saja sebuah tag ataupun deskripsi singkat yang diberikan bersifat ambigu
atau memiliki makna yang berbeda, belum lagi jika memperhatikan adanya
faktor kesalahan manusia. Namun jika “tag” yang digunakan adalah fitur dari
gambar, yang mana seluruh proses pengambilan fitur tersebut dilakukan secara
disebutkan di atas yang terdapat pada sistem yang telah ada seperti saat ini pada
umumnya.
diantaranya:
‐ Warna
26
piksel pada masing-masing jenis warna dengan membaca masing-
‐ Bentuk
Ciri bentuk suatu gambar dapat ditentukan oleh tepi (sketsa), atau
lokal gambar).
‐ Tekstur
Segmentasi adalah bagian dari proses ekstraksi ciri. Segmentasi bertujuan untuk
mendapatkan segmen citra digital yang tegas antara layar belakang obyek pada
citra digital.
27
Dari ketiga fitur tersebut, yang menjadi pusat perhatian adalah warna.
Maka selanjutnya akan dibahas lebih lanjut tentang apa dan bagaimana fitur
tersebut diekstrak.
• Histogram warna
• Moment warna
warna.
28
Dimisalkan r, g, dan b masing-masing mewakili tingkat warna
merah, hijau, dan biru dari sebuah pixel, dimana masing-masing nilai r,
g, dan b memiliki nilai terendah 0 dan nilai tertinggi 255. Selain itu kita
juga punya max yang mana isinya adalah max(r, g, b) dan min yang
rumus:
0, jika max = 0
S= max-min min
=1- , selain itu
max max
V = max
29
digunakan di dua halaman web yang ditemukan, yaitu
http://en.wikipedia.org/wiki/HSV_color_space#Conversion_from_RGB_
http://en.literateprograms.org/RGB_to_HSV_color_space_conversion_(
bidang pemrograman).
didasarkan pada isi dan konteks dari dokumen-dokumen itu sendiri. Berdasarkan
suatu query (inputan user) yang diharapkan dapat memenuhi keinginan user dari
mencari informasi yang dibutuhkan oleh user, dalam bentuk yang paling
sederhana, sebuah query merupakan suatu keywords (kata kunci) dan dokumen
besar, yaitu:
himpunan kata atau frase. Contoh model ini ialah standard Boolean
Contoh model ini ialah vector space model dan latent semantic
indexing (LSI).
pencarian dan akses pada dokumen yang telah disimpan dalam bentuk elektronik
secara cepat dan akurat. Dewasa ini teknik Information Retrieval telah
31
tersebut membandingkan isi dari dokumen terhadap query hanya berdasarkan set
term index yang tersedia saja. Hal ini dapat mengakibatkan performa IR system
yang kurang baik dikarenakan dua faktor. Yang pertama, akan banyak dokumen
yang tidak berkaitan dengan konsep atau ide yang diharapkan dihasilkan oleh IR
dimasukkan dalam query. Yang kedua, banyak dokumen relevan yang tidak
term yang diindex oleh query. Model Latent Semantic Indexing (LSI)
masalah semantic dalam term sehingga dokumen yang tidak mengandung term
yang diminta pun dapat ditemukan karena memiliki hubungan dengan term yang
diminta. Gambar arsitektur dari LSI dapat dilihat pada gambar 2.19.
32
Dari ilustrasi pada gambar 2.19, dapat dilihat bahwa input dari LSI
terdiri dari 2 jenis yaitu koleksi data asal yang akan menjadi topik dari pencarian
yang dilakukan LSI dan input yang kedua adalah berupa set query yang
merupakan kata kunci dari data yang ingin dicari oleh user. Koleksi data
sebelum dapat digunakan dalam proses query akan memerlukan beberapa proses
mengidentifikasi tiap kata yang memiliki potensi menjadi term index. Kemudian
inverted file dari LSI. Langkah terakhir dalam persiapan data adalah proses
dekomposisi matrix, yaitu memecah Term Data Matrix menjadi 3 matrix baru
keterkaitan antar term dari tiap data. Metode yang digunakan untuk dekomposisi
matrix ada 2 cara yaitu Singular Value Decomposition atau disingkat SVD dan
jawaban untuk set query yang diminta. Perbandingan dan perbedaan dari kedua
33
Tabel 2.1. Perbandingan SVD dengan SDD
SVD SDD
Matrix SVD Matrix SDD
Matrix U dan V pada SVD menggunakan Matrix X dan Y pada SDD menggunakan
bilangan real untuk elemen matrixnya kombinasi angka -1, 0, atau 1 untuk
elemen matrixnya
Ruang Penyimpanan Ruang Penyimpanan
SVD membutuhkan ruang penyimpanan SDD hanya membutuhkan ruang sebesar k
sebesar k (m+n+1) untuk matrixnya (m+n) untuk menyimpan matrixnya
Perhitungan SVD Perhitungan SDD
Nilai matrix SVD dicari berdasarkan nilai Nilai matrix SDD didapatkan dari hasil
eigen dan vector eigen iterasi matrix
Google) dengan halaman web yang sesuai sehingga iklan yang relevan
34
mencocokan kata kunci pada suatu halaman dengan kata kunci pada
sebuah matriks persegi bilangan real atau pun kompleks, dengan banyak
35
adalah matriks diagonal m kali n dengan bilangan real non negative pada
matriks unitary n kali n dari K). Faktorisasi semacam ini disebut SVD
dari A.
singular values, yang mana bisa disebut sebagai “gain controls” scalar
2.5.3. K-means
36
K-means clustering adalah sebuah metode analisa cluster yang
tengah terdekatnya.
posisi titik pusat setiap kelompok dan data apa saja yang termasuk ke
dengannya.
37
dihitung kembali. Proses ini dilakukan terus menerus hingga
untuk himpunan data yang sama, hasilnya belum tentu sama. Hasil
metode ini akan sangat tergantung pada penempatan pertama posisi pusat
38
1. Dari sekumpulan data yang kita miliki ditentukan berapa jumlah
random.
Gambar 2.22. tampilan hasil titik pusat yang telah dilakukan secara rando
39
3. Lalu semua titik dibandingkan jaraknya dengan kelima titik pusat
Gambar 2.23. tampilan titik pusat yang telah dibentuk pada masing-masing
cluster
Gambar 2.24. tampilan titik pusat pada masing-masing cluster yang telah
dibentuk kembali
40
5. Kemudian langkah 3 sampai seterusnya diulang sampai terjadi
konvergensi.
tiap baris m adalah sebuah fitur yang diekstrak dari gambar dan tiap
G1 G2 G… … Gn
… … … … … F1
… … … … … F2
A= … … … … … F…
… … … … … …
… … … … … Fm
Misal, ada 3 buah gambar yang memiliki kesamaan dan mau dibentuk
41
1 1 1
0 1 1
1 0 0
0 1 0
1 0 0
A= 1 0 1
1 1 1
1 1 1
1 0 1
0 2 0
0 1 1
42
-0.4201 0.0748 -0.0460
43
-0.4201 0.0748 k=2
-0.2995 -0.2001
-0.1206 0.2749
-0.1576 -0.3046
-0.1206 0.2749
-0.4201 0.0748
-0.2626 0.3794
-0.3151 -0.6093
-0.2995 -0.2001
-0.4945 0.6492
44
Jadi, “koordinat” bagi tiap gambar bisa didapat dari matriks V, yaitu:
• G1 = (-0.4945, 0.6492)
• G2 = (-0.6458, -0.7194)
• G3 = (-0.5817, 0.2469)
yang setiap barisnya mewakili kata yang unik dan setiap kolom mewakili
sel diberi bobot oleh sebuah fungsi yang menghasilkan keutamaan kata
ketiga adalah matriks diagonal yang memuat nilai skala jika ketiga
yang berhubungan dengan kata kunci yang dicari. Kemudian, dari kata-
suatu fungsi dari data latihan. Data latihan terdiri dari pasangan nilai input
(biasanya dalam bentuk vektor), dan output yang diharapkan untuk input yang
fungsi untuk semua nilai input yang mungkin, setelah mengalami sejumlah data
latihan.
generalisasi dari data latihan yang diberikan, untuk memprediksikan nilai output
dari input yang belum pernah diberikan sebelumnya dengan dara yang masuk
akal.
46