Anda di halaman 1dari 17

PENGENALAN POLA PADA CITRA DIGITAL

1. Definisi Pengolahan Citra

Pengenalan pola merupakan bidang dalam pembelajaran mesin dan dapat diartikan sebagai
"tindakan mengambil data mentah dan bertindak berdasarkan klasifikasi data". Dengan
demikian, ia merupakan himpunan kaidah bagi pembelajaran diselia (supervised learning).
Ada beberapa definisi lain tentang pengenalan pola, di antaranya:

Penentuan suatu objek fisik atau kejadian ke dalam salah satu atau beberapa kategori.

Ilmu pengetahuan yang menitikberatkan pada deskripsi dan klasifikasi (pengenalan)


dari suatu pengukuran.

Suatu pengenalan secara otomatis suatu bentuk, sifat, keadaan, kondisi, susunan tanpa
keikutsertaan manusia secara aktif dalam proses pemutusan. [5]

Berdasar beberapa definisi di atas, pengenalan pola bisa didefinisikan sebagai cabang
kecerdasan yang menitik-beratkan pada metode pengklasifikasian objek ke dalam klas - klas
tertentu untuk menyelesaikan masalah tertentu.
Ada 3 teori dalam pengenalan pola citra:
Teori template
Teori Feature
Teori Struktural

Teori template

1. Manusia membandingkan dua pola dari seberapa jauh kedua pola


tersebut saling overlap
2. Tidak bisa diterapkan untuk semua proses pengenalan pola
3. Pola-pola diuraikan ke dalam fitur-fitur

Teori Feature

Pola-pola diuraikan ke dalam fitur-fitur

Teori yang paling umum, dapat digunakan untuk setiap proses


perseptual yang kabur

Teori Struktural

Menjelaskan secara jelas bagaimana fitur-fitur itu disatukan.

Deskripsi lebih kompleks

2. Aplikasi Aplikasi Pengenalan Pola


-

Machine Vision

Pengenalan pola menjadi dasar dari sistem mesin ini. Mesin ini menangkap sebuah atau
sekelompok object dengan kamera dan selanjutnya dianalisa untuk di deskripsikan object
atau benda tersebut

Character recognition (OCR)

Salah satu area pengenalan pola yang secara umum menangani permasalahan otomatisasi dan
informasi. Sistem OCR mempunyai front end device yang terdiri dari pembangkit cahaya,
lensa scan, document transport dan sebuah detektor.

Computer aided diagnosis


Sistem ini membantu dokter dalam mengambil keputusan suatu diagnosis.

Speech recognition

Pengenalan pola suara salah satu aplikasi yang berkembang saat ini. Sistem ini mengijinkan
kita untuk berkomunikasi antara manusia dengan memasukkan data ke computer.
Meningkatakan efisiensi industri manufaktur, mengontrol mesin dengan berbicara pada mesin
itu.

3. Fitur Dan Pola


Fitur adalah segala jenis aspek pembeberwujud simbolik (mis. warna) atau numerik (mis. tinggi).
Ada beberapadefinisi terkait dengan fitur sebagai berikut:
a. Kombinasi dari d buah fitur dinyatakan sebagai vektor kolom dimensi-d dan
disebut vector fitur.
b. Ruang dimensi-d yang dibentuk oleh vector fitur desebut ruang fitur
c. Objek dinyatakan sebagai sebuah titik di dlm ruang fitur. Penggambarandemikian
disebut sebagai diagram hambur (scatter plot).

Kualitas dari suatu vector fitur dilihat dari kemampuannya membedakan objek
yang berasal dari kelas yang berbeda beda. Objek dalam kelas yang sama

haruspunya nilai vektor fitur yang sama dan objek yang berada dalam kelas
yangberbeda harus punya nilai vektor fitur yang berlainan pula. Sifat-sifat dari
fitur,linear/non-linear

separability,

korelasi

dan

modalitas

sangat

penting

untukmenentukan sistem pengenal yang cocok. Berbagai sifat fitur yang penting

dapat digambarkan dalam diagram hambur berikut ini.

4. Pemilah Bayes (Classifier)

Tugas dari pemilah adalah untuk menyekat ruang fitur kedalam daerah-daerahas (Gb.XX). Garis batas
antar daerah keputusan disebutGambar 5.8 Daerah kelas dan 5 Tyang dilabeli dengan
kelsebagai perbatasan keputusan. Pemilahan vektor fitur x meliputi penentuandaerah
keputusan yang sesuai dan pengelompokan x kedalam kelas ini Pemilahdapat diwujudkan
sebagai sekumpulan fungsi diskriminan Dalam contoh diatas, pemilah menentukan vektor
fitur x ke dalam kelas i jika g i ( x ) >g j (x ),i j

5. Metode Clustering

Clustering

adalah

suatu

metode

pengelompokan

berdasarkan

ukuran

kedekatan(kemiripan).Clustering beda dengan group, kalau group berarti kelompok yang


sama,kondisinya kalau tidak ya pasti bukan kelompoknya.Tetapi kalau cluster tidak harus
sama akan tetapi pengelompokannya berdasarkan pada kedekatan dari suatu karakteristik
sample yang ada, salah satunya dengan menggunakan rumus jarak ecluidean.Aplikasinya
cluster ini sangat banyak, karena hamper dalam mengidentifikasi permasalahan atau
pengambilan keputusan selalu tidak sama persis akan tetapi cenderung memiliki kemiripan
saja.
-

Metode Clustering

pada dasarnya mengoptimumkan pusat cluster(centroid) atau

mengoptimalkan lebar antar cluster.


Macam-macam metode clustering :

Berbasis Metode Statistikk


a. Hirarchical clustering method

: pada kasus untuk jumlah kelompok belum

ditentukan terlebih dulu, contoh data-data hasil survey kuisioner


Macam-metode jenis ini: Single Lingkage,Complete Linkage,Average Linkage dll.

b. Non Hirarchical clustering method: Jumlah kelompok telah ditentukan terlebih


dulu.Metode yang digunakan : K-Means.

Berbasis Fuzzy : Fuzzy C-Means

Berbasis Neural Network : Kohonen SOM, LVQ

Metode lain untuk optimasi centroid atau lebar cluster : Genetik Algoritma (GA)

METODE CLUSTERING HIRARKI.

Dalam makalah ini dibahas beberapa teknik clustering hirarki agglomerative yaitu metode
single linkage (jarak terkecil atau tetangga terdekat), complete linkage (jarak terjauh) dan
average linkage (jarak rata-rata). Teknik clustering hirarki agglomerative bekerja dengan
sederetan dari penggabungan yang berurutan atau sederetan dari pembagian yang berurutan
dan berawal dari objek-objek individual. Jadi pada awalnya banyaknya cluster sama dengan
banyaknya objek. Objek-objek yang paling mirip dikelompokkan, dan kelompok-kelompok
awal ini digabungkan sesuai dengan kemiripannya. Sewaktu kemiripan berkurang, semua

subkelompok digabungkan menjadi satu cluster tunggal. Hasil-hasil dari clustering dapat
disajikan secara grafik dalam bentuk dendrogram atau diagram pohon. Cabang-cabang dalam
pohon menyajikan cluster dan bergabung pada node yang posisinya sepanjang sumbu jarak
(similaritas) menyatakan tingkat di mana penggabungan terjadi. Dalam makalah ini diberikan
juga

langkah-langkah

dalam

algoritma

clustering

hirarki

agglomerative

untuk

mengelompokkan N objek (item/variabel). Input untuk algoritma metode linkage bisa berujud
jarak atau similarities antara pasangan-pasangan dari objek-objek. Kelompok-kelompok
dibentuk dari entities individu dengan menggabungkan jarak paling pendek atau similaritas
(kemiripan) yang paling besar.

METODE-METODE YANG DI GUNAKAN CLUSTER HIRARKI

Metode Single Linkage

Input untuk algoritma single linkage bisa berujud jarak atau similarities antara pasanganpasangan dari objek-objek. Kelompok-kelompok dibentuk dari entities individu dengan
menggabungkan jarak paling pendek atau similarities (kemiripan) yang paling besar. Pada
awalnya, kita harus menemukan jarak terpendek dalam D = {dik} dan menggabungkan objekobjek yang bersesuaian misalnya, U dan V , untuk mendapatkan cluster (UV). Untuk langkah
(3) dari algoritma di atas jarak-jarak antara (UV) dan cluster W yang lain dihitung dengan
cara d min{ d d } (UV )W UW, VW = (1) Di sini besaran-besaran dUW dan dVW berturut-turut
adalah jarak terpendek antara cluster-cluster U dan W dan juga cluster-cluster V dan W .

Metode Complete Linkage

Complete linkage memberikan kepastian bahwa semua item-item dalam satu cluster berada
dalam jarak paling jauh ( simila ritas terkecil) satu sama lain. Algoritma aglomerative pada
umumnya dimulai dengan menentukan entri (elemen matriks) dalam D = {dik} dan

menggabungkan objek-objek yang bersesuaian misalnya U dan V untuk mendapatkan cluster


(UV). Untuk langkah (3) dari algoritma di atas jarak-jarak antara cluster (UV) dan cluster W
yang lain dihitung dengan d maks{ d d }

Metode Average Linkage

Average linkage memperlakukan jarak antara dua cluster sebagai jarak rata-rata antara semua
pasangan item-item di mana satu anggota dari pasangan tersebut kepunyaan tiap cluster.
Mulai dengan mencari matriks jarak D = {dik} untuk memperoleh objek-objek paling dekat
( paling mirip) misalnya U dan V . Objek objek ini digabungkan untuk membentuk cluster
(UV). Untuk langkah (3) dari algoritma di atas jarak-jarak antara(UV) dan cluster W yang lain
ditentukan oleh (UV ) = (3) di mana dik adalah jarak antara objek i dalam cluster (UV) dan
objek k dalam cluster W , dan Nuv dan Nw berturut-turut adalah banyaknya item-item dalam
cluster (UV) dan W.

Clustering Dengan Pendekatan Automatic Mapping

Self-Organising Map (SOM)


Self-Organising Map (SOM) merupakan suatu tipe Artificial Neural Networks yang ditraining secara unsupervised. SOM menghasilkan map yang terdiri dari output dalam dimensi
yang rendah (2 atau 3 dimensi). Map ini berusaha mencari property dari input data.
Komposisi input dan output dalam SOM mirip dengan komposisi dari proses feature scaling
(multidimensional scaling).
Walaupun proses learning yang dilakukan mirip dengan Artificial Neural Networks, tetapi
proses untuk meng-assign input data ke map, lebih mirip dengan K-Means dan kNN
Algorithm. Adapun prosedur yang ditempuh dalam melakukan clustering dengan SOM
adalah sebagai berikut:

Tentukan weight dari input data secara random

Pilih salah satu input data

Hitung tingkat kesamaan (dengan Eucledian) antara input data dan weight dari input
data tersebut dan pilih input data yang memiliki kesamaan dengan weight yang ada
(data ini disebut dengan Best Matching Unit (BMU))

Perbaharui weight dari input data dengan mendekatkan weight tersebut ke BMU
dengan rumus:
Wv(t+1) = Wv(t) + Theta(v, t) x Alpha(t) x (D(t) Wv(t))
Dimana:
o

Wv(t): Weight pada saat ke-t

Theta (v, t): Fungsi neighbourhood yang tergantung pada Lattice distance
antara BMU dengan neuron v. Umumnya bernilai 1 untuk neuron yang cukup
dekat dengan BMU, dan 0 untuk yang sebaliknya. Penggunaan fungsi
Gaussian juga memungkinkan.

Alpha (t): Learning Coefficient yang berkurang secara monotonic

D(t): Input data

Tambah nilai t, sampai t < Lambda, dimana Lambda adalah jumlah iterasi

Variasi Metode Clustering

Quality Threshold Clustering Method

Locality Sensitive Hashing

Algoritma Rock

Hierarchical Frequent Term-Base Clustering

Suffix Tree Clustering

Single Pass Clustering

Neighborhood Clustering

Sequence Clustering

Spectral Clustering

Clustering on Frequent Tree

Latent Class Cluster Analysis a.k.a. Latent Profile Analysis a.k.a. Mixture Model for
Continuous Variabel

Latent Class Analysis a.k.a. Mixture Model for Categorical Variable

Hal-hal Terkait Dengan Clustering

Analisa Faktor

Singular Value Decomposition

Eigen Value and Eigen Vector

Similarity Measure

Feature Discretisation

Feature Selection

Feature Scaling

Indexing Method For Searching

Pembahasan Metode Cluster

Pertama akan kita bahas dulu metode cluster secara statistic untuk non hirachical
method yaitu: K-Means Clustering

Algoritma:
1. Partisi item menjadi K initial cluster
2. Lakukan proses perhitungan dari daftar item, tandai item untuk kelompok yang mana
berdasarkan pusat(mean) yang terdekat (dengan menggunakan distance dapat
digunakan Euclidean distance).Hitung kembali pusat centroid untuk item baru yang
diterima pada cluster tersebut dari cluster yang kehilangan item.
3. Ulangi step 2 hingga tidak ada lagi tempat yang akan ditandai sebagai cluster baru.

Contoh :
Dikethui data sebagai berikut:
Item

Observasi
X1

X2

-1

-2

-3

-2

Ditanya: Lakukan cluster menjadi 2 kelompok (K=2).

Langkah pertama:
Cluster

Koordinate dari Centroid

X1

X2

(AB)

5 (1)
2
2

3 1
2
2

(CD)

1 (3)
1
2

2 ( 2 )
2
2

Langkah kedua :

Lakukan perhitungan jarak dengan eclidean dari masing-masing item dari


centroid(pusat) cluster dan tandai kembali setiap item berdasarkan kedekatan
group.Jika item bergerak dari initial configuration, Centroid(pusat/means) cluster
harus diupdate sebelum diproses.Kita hitung kwadrat jarak(squared distance) sbb:
d 2 ( A, ( AB )) (5 2) 2 (3 2) 2 10
d 2 ( A, (CD )) (5 1) 2 (3 2) 2 61

Sejak A dekat pada cluster (AB) dibandingkan pada cluster (CD), maka tidak perlu
ditandai.Lanjutkab perhitungan :
d 2 ( B, ( AB )) ( 1 2) 2 (112 ) 2 10
d 2 ( B, (CD )) ( 1 1) 2 (1 2) 2 9

Sehingga B akan ditandi kembali menjadi anggota baru pada cluster (CD), sehingga
membentuk cluster baru (BCD) maka koordinat dari pusat cluster terupdate sebagai
berikut :

Cluster

Koordinate dari Centroid

X1

X2

(BCD)

-1

-1

Selanjutnya lakukn chek untuk setiap item untuk ditandai kembali. Perhitungan kwadrat
jarak(squared distances) dibarikan sbb:

Cluster

Koordinate dari Centroid


A

40

41

89

(BCD)

52

Kita lihat setiap item yang baru telah ditandai untuk cluster berdasarkan centroid(pusat)
terdekat maka proses telah dihentikan.Sehingga dengan K=2 cluster maka terbentuk
cluster sebagai berikut : A dan (BCD).

6. PengenalanPolaTerbimbingVersusTakTerbimbing

Pengenalan pola terbimbing(supervised)dan tak terbimbing(unsupervised)berkaitan dengan


bagaimana klasifikasi dilakukan atau bagaimana pemilah dirancang. Bila vector fitur
pelatihan tersedia dan telah diketahui kelas kelasnya ,kemudian vector fitur pelatih anter
sebut dimanfaatkan untuk merancang pemilah maka pengenalan pola ini disebut terbimbing.
Akan tetapi, tidak selamanya vector fitur pelatihan tersedia sebelumnya sehingga untuk
proses

klasifikasi,

sekumpulan

vector

fitur

dikelompokkan

kedalam

beberapa

kluster(group)berdasarkan tingkat kemiripannya. Pengenalan pola seperti itu disebut


pengenalan takter bombing atau clustering.

Distance(Jarak)

Jarak digunakan untuk menentukan tingkat kesamaan(similaritydegree)atau ketidak


samaan(disimililaritydegree)dua vector fitur. Tingkat kesamaan berupa
Suatu nilai(scone)dan berdasarkan skor tersebut dua vector fitur akan dikatakan mirip atau
tidak. Teknik Clustering(UnsupervisedLearning)Teknik clustering merupakan seni atau teknik
mengelompokkan data(objek)kedalam beberapa kluster(kelompok)yang belum diketahui.
Berbeda dengan teknik klasifikasi, pada clustering, jumlah dan karakteristik dari kelompok
akan diperoleh dari data dan biasanya kelompok-kelompok tersebut belum diketahui
sebelumnya.
7. Pengelompokkan Berbasis Hirarki (HierachicalClustering)
Algoritma hirarki menghasilkan pengelompokkan seperti tree atau den dogram. Pada level
puncak tree setiap objek dinyatakan sebagaik luster terpisah. Pada level tengah jumlah kluster
berkurang dan pada level terbawah semua objek dikelompokkan menjadi 1kluster. Salah satu
metode yang tergolong kedalam metode hirarki dan paling sering digunakan adalah
agglomerative hierarchical.

Algoritma Agglomerative Hierachical

Metode ini dimulai dengan setiap objek dinyatakan sebagai kluster tersendiri.
Kedekatan(jarak) antar kluster dihitung dan kluster yang paling dekat digabung. Kedekatan
pada kluster baru dihitung ulang dan kluster paling dekat digabung lagi. Proses tersebut
dilakukan

secara

berulang

Ada

berbagai

metode

digunakan

untuk

menghitung

kedekatan(jarak) antara duakluster, diantaranya sebagai berikut.


a. Metode tetangga terdekat (nearestneighbor) single-linkage.
b. Metode tetangga terjauh (farthest neighbor) atau complete-linkage. Metode rata-rata
atau average linkage.

8. PengelompokkanBerbasisPartisi(PartisionClustering)

Berbeda dengan metode hirarki yang mengelompokkan objek dengan konsep tree, metode
partisi mengelompokkan objek dengan mencari pusat kluster (clusterseeking). Seluruh objek
akan dipartisi kedalam beberapa kluster dengan setiap kluster memiliki pusat kluster. Salah
satu metode cukup terkenal yang masuk kedalam kategori ini adalah metode K-means.
Teknik yang lainnya adalah algoritma Maximum-distance dan algoritma Isodata.

9. AlgoritmaK-means
K-means mengelompokkan objek menjadi K kluster. Metode akan mencari pusat kluster dan
batas-batas kluster melalui proses perulangan (iterative). Kedekatan atau kemiripan
(similarity) suatu objek dengan objek yang lain atau dengan pusat kluster dihitung dengan
menggunakan jarak.

Daftar Pustaka

Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification (2nd
edition), Wiley, New York, ISBN 0-471-05669-3.
^ J. Schuermann: Pattern Classification: A Unified View of Statistical and Neural
Approaches, Wiley&Sons, 1996, ISBN 0-471-13534-8
^ IJCSNS, 2006, ISSN 1738-7906)
^ IJCSNS, 2006, ISSN 1738-7906
^ McGraw-Hill Dictionary of Scientific and Technical Terms (2003)

PENGOLAHAN CITRA DIGITAL


TENTANG
PENGENALAN POLA

DISUSUN OLEH :

KELOMPOK 6
ARI
AZHAR
EDY SAPUTRA
ELMI FITRIANI
M.FAHRY
SAHRUDIN

KELAS A
PRODI SISTEM INFORMASI
FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS ISLAM INDRAGIRI TEMBILAHAN
2011 / 2012