Anda di halaman 1dari 20

Pengolahan Citra Digital

Segmentasi Citra

Oleh : Lukki Arjuna 10951005568

Fakultas Sains dan Teknologi Jurusan Teknik Informatika Universitas Islam Negeri Sultan Syarif Kasim Riau

1. Gambaran Umum
Segmentasi citra digital adalah pembagian daerah citra digital menjadi bagian-bagian daerah yang lebih kecil berdasarkan letak pixel dan intensitasnya yang masih berdekatan. Pendekatan yang digunakan antara lain berdasarkan jumlah daerah pembagian yang diinginkan, dan ada juga berdasarkan kriteria untuk suatu tujuan tertentu. Algoritma segmentasi citra umumnya didasarkan pada salah satu dari diskontinuitas atau similaritas. Pada diskontinuitas, citra dipartisi berdasarkan perbedaan intensitas yang mencolok, misalnya edge (tepian) dari citra. Sedangkan pada similaritas, citra dibagi menjadi beberapa region berdasarkan kesamaan yang dimiliki dalam hal kriteria-kriteria yang telah ditentukan sebelumnya. Segmentasi banyak digunakan dalam bidang komputer vision untuk memisahkan objek dari latar belakangnya dan memisahkan objek yang satu dengan objek yang lain. Satu daerah dipandang sebagai satu objek atau bagian dari suatu objek. Jika tujuan yang diinginkan adalah pengenalan objek, maka objek-objek yang terpisah tersebut akan lebih mudah dikenali oleh komputer. Tetapi jika tujuan yang diinginkan adalah menentukan koordinat dimensi tiga pixel-pixel, maka koordinat dari pixel-pixel yang satu daerah tersebut dipandang sebagai titik-titik yang berdekatan atau sebagai suatu permukaan objek yang kontinu. Ketunggalan dan keglobalan segmentasi merupakan hal yang sangat penting dalam komputer vision. Ketunggalan adalah segmentasi citra digital tidak akan berubah walaupun nilai awal proses segmentasi berubah. Sedangkan keglobalan adalah proses segmentasi dilakukan dengan melibatkan semua pixel-pixel citra digital. Mean Shift merupakan metode yang sekaligus memenuhi sifat ketunggalan dan keglobalan.

2. Metode Segmentasi Citra


2.1. Deteksi Diskontinuitas

Ada tiga macam diskontinuitas tingkat keabuan pada citra digital; yaitu : point (titik), line (garis), edge (tepi).Cara yang paling banyak digunakan untuk mendeteksi diskontinuitas pada citra digital adalah dengan menjalankan mask (filter) melewati seluruh citra Mask umumnya berupa matriks m x n, terdiri dari koefisien-koefisien yang jika dijumlahkan akan

bernilai nol, yang menyatakan bahwa response mask akan bernilai nol di area yang tingkat keabuannya konstan. Response dari mask pada sembarang titik pada citra :

dimana zi adalah tingkat keabuan dari piksel citra, dan diasosiasikan dengan koefisien mask wi. Response mask didefinisikan pada lokasi titik pusat mask.

Deteksi Titik (Point detection) Suatu titik terdeteksi berada di pusat mask jika |R| T, dimana T adalah threshold

nonnegative. Idenya adalah bahwa titik yang terisolasi (suatu titik dengan tingkat keabuan yang sangat berbeda dari latar belakangnya dan berada di area yang homogen atau hampir homogen) akan sangat berbeda dengan latar belakangnya

Deteksi Garis (Line Detection) Jika mask sebelah kiri dipindahkan pada seluruh citra, maka responnya akan lebih

kuat pada garis dengan ketebalan satu piksel dan berorientasi horisontal. Koefisien mask jika dijumlahkan adalah nol. Hal ini menunjukkan bahwa respon mask adalah nol pada area dengan tingkat keabuan konstan. Misalkan R1, R2, R3, dan R4, menyatakan respons dari mask. Anggaplah bahwa setiap mask dijalankan sendiri-sendiri pada suatu citra. Jika, pada satu titik citra, |Ri|>|Rj|, untuk semua ji, titik tersebut dikatakan lebih berasosiasi dengan garis dengan arah mask i. Jika kita ingin mendeteksi garis dengan arah yang sudah ditentukan, kita bisa menggunakan mask yang sesuai dengan arah tersebut dan melakukan thresholding terhadap outputnya.

2.2.

Deteksi Tepi (Edge Detection)

Tepi (edge) adalah himpunan piksel terhubung yang terletak pada boundary di antara dua region. Tepi ideal seperti diilustrasikan pada gambar 10.5.a adalah himpunan piksel terhubung (dalam arah vertikal), masing-masing terletak pada transisi step orthogonal dari tingkat keabuan. Pada prakteknya, ketidaksempurnaan optik, sampling, dan proses pengambilan data citra, akan menghasilkan tepi-tepi yang kabur, dengan derajat kekaburan ditentukan oleh faktor-faktor seperti kualitas peralatan yang digunakan untuk mengambil data citra, rata-rata

sampling, dan kondisi pencahayaan. Akibatnya, tepi lebih banyak dimodelkan seperti ramp (lihat gambar fig 10.5.b). Ketebalan tepi ditentukan oleh panjang ramp. Panjang ramp ditentukan oleh kemiringan (slope), dan slope ditentukan oleh derajat kekaburan. Tepian yang kabur cenderung lebih tebal, dan tepian yang tajam cenderung lebih tipis. Magnitude dari turunan pertama bisa digunakan untuk mendeteksi keberadaan edge pada suatu titik dalam citra (misalnya, menentukan apakah suatu titik berada pada ramp atau tidak). Tanda dari turunan kedua bisa digunakan untuk menentukan apakah suatu piksel edge terletak pada sisi gelap atau sisi terang dari edge. Property zero-crossing (garis lurus imajiner yang menghubungkan nilai ekstrim positif dan negatif dari turunan kedua akan melintasi nol di pertengahan edge) cukup berguna untuk menentukan pusat dari edge yang tebal. Agar dapat diklasifikasikan sebagai titik tepi, transisi tingkat keabuan pada titik tersebut harus cukup kuat dibandingkan background di sekitarnya. Untuk menentukan apakah suatu nilai cukup signifikan atau tidak, bisa digunakan threshold. Jadi, suatu titik di dalam citra merupakan bagian dari edge, jika turunan pertama 2-D nya lebih besar dari threshold. Himpunan titik-titik yang terhubung menurut kriteria keterhubungan tertentu didefinisikan sebagai edge. Istilah segmen edge digunakan jika ukuran edge relatif pendek dibanding ukuran citra. Permasalahan dalam segmentasi adalah bagaimana cara merangkai segmen-segmen edge ini menjadi edge yang lebih panjang. Edge juga bisa ditentukan menggunakan property zero crossings dari turunan kedua. Operator Gradien Gradien dari citra f(x,y) pada lokasi (x,y) didefinisikan sebagai vektor :

Magnitude vektor adalah :

Arah gradien pada (x,y) adalah : dimana (x,y) menyatakan sudut vector f di (x, y) terhadap sumbu x-axis. Pendekatan lain untuk memperkirakan magnitude vektor adalah :

Laplacian Laplacian dari fungsi 2-D f(x, y) adalah turunan kedua yang didefinisikan sebagai :

Laplacian umumnya tidak digunakan dalam bentuk aslinya untuk deteksi tepi, karena:

sangat sensitive terhadap noise magnitude dari Laplacian menghasilkan menghasilkan tepi ganda tidak dapat mendeteksi arah tepian.

Peranan Laplacian untuk segmentasi adalah :


mendeteksi lokasi edge(tepi) menggunakan properti zero crossing. Untuk menentukan apakah suatu oiksel berada di daerah gelap atau daerah terang dari edge (tepi) Untuk menemukan edge dengan zero-crossing, Laplacian dikombinasikan dengan fungsi Gaussian berikut:

dimana

r2

x2

y2,

dan

adalah

standard

deviasinya.

Sehingga Laplacian dari h adalah:

yang disebut sebagai Laplacian of Gaussian(LoG). Tujuan dari fungsi Gaussian pada LoG adalah untuk memperhalus citra, dan tujuan dari operator Laplacian tersebut adalah untuk memberikan suatu citra dengan zero-crossing yang digunakan untuk menentukan lokasi dari edge (tepi). Zero crossing berada di antara nilai positif dan negative dari Laplacian, sehingga satu cara untuk memperkirakan zero crossing adalah men-threshold citra LoG dengan menetapkan semua nilai positif menjadi, misal, putih, dan semua nilai negative menjadi hitam. Kelebihan zero crossing adalah kemampuannya untuk mereduksi noise dan potensinya untuk citra yang tidak rata.

Edge Linking and Boundary Detection

Local Processing Dua hal terpenting yang digunakan untuk menentukan persamaan edge pixel pada analisis ini adalah: kekuatan dari respon gradient operator yang digunakan untuk

memproduksi edge pixel (diperoleh dari nilai

); dan arah dari vektor gradien.

Suatu edge pixel dengan koordinat (x0,y0) dalam predefined neighborhood (x,y), sama dalam hal magnitude pixel pada (x,y) jika dimana E

merupakan nonnegative threshold. Suatu edge pixel pada (x0,y0) dalam predefined neighborhood dari (x,y) mempunyai kesamaan angle dengan pixel pada (x,y) jika dimana A merupakan nonnegative angle threshold. Satu titik pada predefined neighborhood dari (x,y) dihubungkan dengan pixel pada (x,y) jika kriteria magnitude dan arah terpenuhi. Proses ini diulang pada setiap lokasi dalam gambar.

Global Processing via the Hough Transform Dalam hal ini, titik-titik dihubungkan oleh ketetapan awal apakah titik-titik itu berada pada kurva dari bentuk yang ditetapkan. Selain itu juga memperhatikan relasi global antara pixel. Hough Transform merupakan pendekatan alternatif untuk menemukan himpunan dari beberapa titik dalam suatu image yang terletak pada garis lurus. Satu jalan yang dapat digunakan untuk masalah representasi suatu garis menggunakan persamaan y = ax + b adalah dengan menggunakan representasi normal dari suatu garis: x cos + y sin = . Hough Transform dapat diaplikasikan kepada fungsi dari bentuk g(v,c) = 0, dimana v merupakan koordinat vektor dan c adalah koefisien vektor. Pendekatan Hough Transform: 1. Hitung gradien dari suatu image dan lakukan pembatasan untuk mendapatkan binary image. 2. Spesifikasikan subdivisi dalam -plane. 3. Periksa jumlah accumulator cells untuk pixel dengan konsentrasi tinggi. 4. Periksa relasi antara pixel-pixel dalam cell yang terpilih.

Global Processing via Graph-Theoretic Techniques Merupakan pendekatan yag paling rumit dan butuh waktu pemrosesan yang lebih lama dibandingkan metode-metode sebelumnya. Graph G = (N,U)dimana U merupakan pasangan elemen yang tidak berurutan dari N. Arc merupakan setiap pasang (ni,nj) dari U. Jika suatu arc diarahkan dari node ni ke node nj, maka nj disebut successor dari node parent ni. Expansi dari suatu node adalah proses mengidentifikasi successor dari suatu node. Start atau root node yaitu level yang

terdiri dari single node, sedangkan goal node adalah node pada level paling akhir. Suatu cost c(ni,nj) dapat dihubungkan dengan setiap arc(ni,nj). Urutan dari node n1, n2,...,nk, dengan setiap node ni menjadi successor dari node ni-1, disebut path dari n1 ke nk. Cost dari path keseluruhan adalah:

Setiap elemen edge yang didefinisikan oleh pixel p dan q mempunyai cost sebagai berikut: , dimana H = nilai gray-level tertinggi dalam

suatu image, f(p) = nilai gray-level dari p, f(q) = nilai gray-level dari q. Dengan kesepakatan bahwa titik p berada pada sisi right-hand dari arah perjalanan elemenelemen edge. Jika r(n) merupakan perkiraan biaya dari minimum-cost path dari node awal s ke node akhir, dimana path dibatasi melalui n, maka r(n) = g(n) + h(n) dimana g(n) lowest-cost path dari s ke n, dan h(n) didapatkan dengan menggunakan informasi heuristic yang tersedia. Langkah-langkah algoritma yang menggunakan r(n) sebagai dasar dari pencarian grafik: 1. Tandai node awal open dan tetapkan g(s) = 0 2. Jika tidak ada node yang bertanda OPEN keluar dengan kegagalan; jika tidak lanjutkan 3. Tandai dengan closed n node open yang hasil penghitungan r(n)dari persamaan r(n) = g(n) + h(n) bernilai paling kecil 4. Jika n adalah node akhir, keluar dengan solusi path yang didapatkan dengan tracing back melalui pointer; jika tidak lanjutkan 5. Tambahkan node n, menghasilkan semua successor (jika tidak ada successor, kembali ke langkah kedua) 6. Jika successor ni tidak ditandai, maka r(ni) = g(n) + c(n,ni), tandai dengan open dan kembalikan pointer ke n. 7. Jika successor ni ditandai closed atau open, update nilainya dengan . Tandai opensuccessor bertanda

closed tersebut yang memilki nilai g lebih rendah dan arahkan pointer ke n dari semua node yang memiliki nilai g lebih rendah. Lanjutkan ke langkah kedua.

2.3.

Thresholding

Merupakan posisi pusat pada aplikasi segmentasi image karena karakterisitik yang intuitif dan kesederhanaan implementasi.

Foundation Menjelaskan dua tipe thresholding: single threshold dan multiple threshold. Pada single threshold, pixel object dan background mempunyai gray level yang dikelompokan menjadi dua mode yang dominan. Satu cara untuk memisahkan object dari background adalah dengan memilih background batas T. Maka, titik (x,y) dimana disebut object point; selain itu berarti titik tersebut merupakan background point. Di lain pihak, pada multiple threshold, pixel object dan background mempunyai gray level yang dikelompokkan menjadi tiga mode yang dominan, menggolongkan satu titik (x,y) sebagai object class jika object class yang lain jika Fungsi T pada thresholding: , dan merupakan background jika , dimana , lalu ke . adalah gray

level titik (x,y) dan p(x,y) menunjukkan beberapa local property pada titik ini. Batasan image g(x,y):

pixel yang diberi label 1 mengacu pada object sedangkan yang berlabel 0 merupakan background. Tiga tipe threshold: 1. Global, jika T tergantung hanya pada f(x,y). 2. Local, jika T tergantung pada f(x,y) maupun p(x,y). 3. Dynamic atau adaptive, jika T tergantung pada koordinat spasial x dan y.

The Role of Illumination Pada chapter 2 diperkenalkan sebuah model sederhana dari sebuah image f(x,y) yang dibentuk sebagai hasil dari sebuah komponen yang direfleksikan oleh r(x,y) dan sebuah komponen cahaya i(x,y). Tujuan dari bab ini adalah menggunakan model ini untuk mendiskusikan secara jelas efek dari cahaya pada thresholding, terutama pada global thresholding. Fungsi computer generated reflectance ditunjukkan pada gambar 10.27(a). Histogram pada fungsi ini ditunjukkan pada gambar 10.27(b), bimodal dan dapat dipartisi dengan

mudah dengan menempatkan single global threshold T pada lembah histogram. Perkalian fungsi reflectance pada gambar 10.27(a) oleh fungsi illumination ditunjukkan pada gambar 10.27(c) yang menghasilkan image yang ditunjukkan pada gambar 10.27(d). Gambar 10.27(e) menunjukkan histogram dari image ini. Alasan mengapa histogram pada gambar 10.27(e) diubah, dapat dijelaskan sebagai berikut : Dari persamaan (4.5-1) F(x,y) = i(x,y)r(x,y) (10.3-3) Mengambil logaritma natural dari persamaan ini menghasilkan sebuah penjumlahan : Z(x,y) = ln f(x,y) = ln i(x,y) + ln r(x,y) = i(x,y) + r(x,y) Dari teori probabilitas, jika i(x,y) dan r(x,y) adalah variable yang independent, histogram dari z(x,y) diberikan oleh convolution dari histogram i(x,y) dan r(x,y)/ Jika i(x,y) konstan, I(x,y) juga akan konstan, dan histogramnya akan menjadi simple spike (seperti sebuah impulse). Ketika mengakses sumber illumnitaion yang tersedia, sebuah solusi yang digunakan untuk mengkompensasi ketidakseragaman adalah memproyeksikan pola illumination ke dalam sebuah konstanta, permukaan putih yang memantulkan cahaya. Ini menghasilkan sebuah image g(x,y) = ki(x,y) dimana k adalah sebuah konstanta yang tergantung pada permukaan dan i(x,y) adalah pola illumination.

f(x,y) = i(x,y)r(x,y) mendapatkan fungsi illumination yan sama, f(x,y) dibagi g(x,y) menghasilkan fungsi normal h(x,y) = f(x,y)/g(x,y) = r(x,y)/k.

Jika r(x,y) dapat disegmen menggunakan single threshold T, kemudian h(x,y) dapat disegmen menggunakan single threshold dari nilai T/k.

Basic Global Thresholding Teknik yang paing sederhana dari semua thresholding adalah mempartisi image histogram menggunakan single global threshold T.

Segmentasi diselesaikan dengan men-scan image pixel per pixel dan melabelkan tiap pixel sebagai obyek atau background, tergantung pada gray level dari pixel tersebut lebih besar / kecil daripada nilai T. Misal obyek lebih gelap dari background, maka pixel dengan gray level <= T dilabelkan hitam(0), dan pixel dengan gray level > T dilabelkan putih(255). Algoritma berikut dapat digunakan untuk mendapatkan T secara otomatis : 1. Pilih sebuah perkiraan inisial untuk T 2. Segmen image menggunakan T. Ini akan menghasilkan 2 grup pixel :

G1 yang terdiri dari semua pixel dengan nilai gray level > T dan G2 terdiri dari pixel dengan nilai <=T 3. Hitung nilai gray level rata rata dan G2. 4. Hitung nilai threshold baru : 5. Ulangi langkah 2 4 sampai perbedaan T pada iterasi yang berturut turut lebih kecil daripada parameter yang ditetapkan sebelumnya

dan

untuk piksel piksel pada area G1

Basic Adaptive Thresholding Semua subimage yang tidak mengandung batasan antara obyek dan background mempunyai varian yang lebih kecil dari 75. Semua image mengandung batasan yang mempunyai varian yang lebih dari 100. Tiap subimage dengan varian yang lebih besar dari 100 disegmen dengan sebuah threshold yang dihitung untuk subimage tersebut menggunakan algoritma yang didiskusikan pada bab sebelumnya.

Optimal Global and Adaptive Thresholding Seandainya sebuah image hanya mengandung dua area gray-level yang utama. Nilai z menunjukkan nilai gray-level. Nilai nilai ini adalah kuantitas random, dan histogramnya kemungkinan adalah perkiraan dari probability density function (PDF), p(z). Fungsi density secara keseluruhan adalah penjumlahan atau pencampuran dari dua density, satu untuk terang, dan yang lain untuk area gelap pada gambar. Gambar 10.32 menunjukkan dua PDF. Diasumsikan bahwa dua PDF yang lebih besar terhubung dengan background level, sedangkan yang lebih kecil menjelaskan gray level obyek dalam image. Campuran PDF yang menggambarkan variasi gray level secara keseluruhan pada image adalah : p(z) = P1p1(z) + P2p2(z) P1 dan P2 adalah probabilitas dari dua kelas piksel. P1 adalah probabilitas piksel random dengan nilai z. P2 adalah probabilitas yang mana piksel adalah background piksel. Asumsikan bahwa piksel yang diberikan termasuk onyek atau background, sehingga P1 + P2 = 1 Sebuah image disegmentasikan oleh klasifikasi sebagai background semua piksel dengan gray level yang lebih besar dari threshold T. Semua piksel yang lain disebut piksel obyek. Probabilitas dari sebuah variable random yang mempunyai nilai pada interval [a,b] adalah integral dari PDF dari a ke b, yang mana area kurva PDF di antara dua batasan ini.

Probabilitas adalah

klasifikasi

sebuah

titik

background

sebagai

titik

obyek

Ini adalah area di bawah kurva dari p2(z) ke sebelah kiri dari threshold. Probabilitas dari klasifikasi sebuah titik obyek sebagai background adalah

Yang mana area di bawah kurva dari p1(z) ke kanan T. Kemudian probabilitas keseluruhan error adalah E(T) = P2E1(T) + P1E2(T) Untuk mencari nilai threshold untuk error ini minimal membutuhkan perbedaan E(T) dengan respect T (menggunakan Leibnizs rule) dan hasilnya sama dengan 0. Hasilnya : P1p1(T) = P2p2(T) Satu dari density utama yang digunakan pada cara ini adalah Gaussian density, yang mana digolongkan oleh dua parameter: mean dan varian. Dalam kasus ini,

dimana

dan

adalah mean dan varian dari Gaussian density dari satu kelas dari dan adalah mean dan varians dari kelas lain.

piksel piksel dan

Menggunakan persamaan pada solusi umum dari persamaan (10.3-10) menghasilkan solusi berikut untuk threshold T : AT2 + BT + C = 0 dimana

Karena persamaan kuadrat mempunyai dua solusi yang memungkinkan, nilai dua threshold dibutuhkan untuk mendapatkan solusi optimal. Jika varian varian sama, , cukup untuk sebuah single threshold :

Use of Boundary Characteristic for Histogram Improvement and Local Thresholding Puncak histogram yang tinggi, sempit, simetrik, dan terpisah oleh lembah yang dalam, menambah kemungkinan untuk mendapatkan threshold yang bagus. Sebuah pendekatan untuk menambah bentuk histogram dengan hanya

mempertimbangkan pixel yang berada atau dekat pada batasan antara objek dan background. Perbaikan yang sangat jelas yaitu ketergantungan histogram terhadap ukuran objek dan background lebih sedikit. Contohnya histogram dari sebuah gambar yang terdiri dari objek-onjek yang kecil pada sebuah background yang besar akan didominasi oleh puncak yang besar karena konsentrasi yang tinggi dari sebuah tipe pixel. Probabilitas dari letak pixel pada sebuah objek akan mendekati probabilitas letak pixel tersebut pada background, jadi memperbaiki simetri pada lembah histogram. Penggunaan pixel yang dapat memenuhi ukuran yang berdasarkan gradient and Laplacian operators memiliki kecenderungan ke lembah yang lebih dalam diantara puncak histogram. Penggunaan Laplacian dapat memberi informasi mengenai letak pixel mana yang berada pada sisi yang terang dan gelap dari sebuah edge.

Threshold Based on Several Variables Sensor menyediakan lebih dari satu variable untuk mengkarakterisasi setiap pixel pada sebuah image, maka di sini diperbolehkan multispectral thresholding. Gambar berwarna merupakan contoh dimana tiap pixelnya dikarakterikasi oleh tiga nilai RGB. Maka sekarang bukan hanya histogram 2-D lagi, tetapi pada kasus ini 3-D. Prosedur dasarnya sama seperti metode yang digunakan untuk satu variable. Contoh, sebuah gambar dengan tiga variable (RGB komponen), masing-masing memiliki 16 level kemungkinan, sebuah 16x16x16 cube. Tiap cell dari cube adalah nilai pixel yang RGB komponennya memiliki nilai yang berkorespondensi dengan koordinat yang mendefinisikan lokasi dari cell tertentu. Tiap nilai lalu dibagi dengan total nilai pixel pada gambar untuk di tampilkan pada sebuah histogram.

Konsep dari thresholding sekarang menjadi satu cara untuk menemukan cluster dari titik-titik pada ruang 3-D. Contoh, K signifikan cluster dari titik-titik yang ditemukan pada histogram. Gambar bisa disegmentasi dengan menetapkan sebuah nilai (putih) pada pixel yang memiliki komponen RGB yang lebih dekat pada satu cluster dan nilai lainnya (black) pada pixel lainnya di gambar. Hue and saturation merupakan property yang penting pada banyak aplikasi yang menggunakan gambar untuk inspeksi secara otomatis.

2.4.

Region-Based Segmentation

Tujuan dari segmentasi yaitu membagi sebuah gambar menjadi beberapa region. Pada bagian ini membahas teknik segmentasi berdasarkan menemukan region secara langsung.

Basic Formulation R merepresentasikan seluruh region gambar. Proses segmentasi yang mempartisi R menjadi n subregion, R1,R2 ,..,Rn yaitu

P(Ri) merupakan logical predicate yang mendefinisikan semua titik pada kumpulan Ri dan
o o o o

merupakan himpunan kosong Mengindikasikan segmentasi harus lengkap, semua pixel harus pada region Titik-titik pada sebuah region harus terhubung Region-region harus disjoint Kesepakatan antara property harus dipenuhi oleh pixel-pixel pada region segmentasi. Contoh, P(Ri) = TRUE jika Ri memiliki level gray yang sama.
o

Region Ri dan Rj berbeda

Region Growing Region growing merupakan sebuah prosedur dimana sekumpulan pixel atau subregion hingga region yang lebih besar berdasarkan criteria yang sudah didefinisikan Pendekatan dasar misalnya sekumpulan titik awal dan dari sini region tumbuh dengan menambahkan pada masing-masing benih ke pixel tetangga yang memiliki property yang sama dengan benih tersebut.

Deskriptor bisa mendapatkan hasil yang salah jika keterhubungan dan informasi pixel yang bersebelahan tidak digunakan dalam proses growing region. Contohnya visualisasi sebuah susunan random pixel dengan hanya tiga nilai gray level yang jelas. Mengelompokkan pixel dengan level gray yang sama pada sebuah region tanpa memperhatikan konektivitas yang akan menghasilkan hasil segmentasi menjadi tidak ada artinya Permasalahan

multimodal

histogram

baik

jika

diselesaikan

menggunakan

pendekatan dasar region Region Splitting and Merging Selain mendiskusina grow region dari sekumpulan benih titik , alternative lainnya dengan membagi sebuah gambar ke dalam bagian-bagian secara acak, region yang tidak berhubungan satu sama lain, lalu merge dan/atau split region sehingga memenuhi kondisi yang ditentukan. Prosedurnya yaitu : 1. Split menjadi empat disjoint quadrants pada region Ri dimana P(Ri ) = FALSE 2. Merge region yang bersebelahan Rj dan Rk dimana P(Ri U Rk) = TRUE 3. Stop ketika tidak mungkin ada lagi merge dan split Properti yang berdasarkan mean dan standard deviasi dari pixel pada sebuah bidang untuk menentukan texture dari sebuah region. Konsep texture segmentation berdasarkan kegunaan ukuran textur untuk predikat P(Ri ) 2.5. Segmentation by Morphological Watersheds

Segmentasi dengan watershed lebih menghasilkan segmentasi yang stabil, termasuk lanjutan batasan segmentasi

Basic Concepts Konsep watershed berdasarkan memvisualisasikan sebuah gambar pada tiga dimensi, dua ruang koordinat versus level gray. Seperti sebuah interpretasi topographic, dapat ditentukan tiga jenis titik : a. titik yang termasuk sebuah regional minimum b. titik pada sebuah jatuhan air, jika ditempatkan pada lokasi ini, akan menjadi sebuah single minimum c. titik dimana air akan seperti jatuh je lebih dari satu seperti minimum

Prinsip tujuan algoritma segmentasi berdasarkan konsep ini yaitu untuk mencari garis batas air

Dam Construction Pembuatan dam berdasarkan pada binary image. Cara paling sederhana untuk membangun dam yaitu dengan cara memisahkan himpunan titik binary menggunakan pembesaran morfologis seperti digambarkan di gambar 10.45.

Watershed Segmentation Algorithm M1, M2,., MR merupakan koordinat titik pada daerah minima dari image g(x,y). C(Mi) adalah koordinat titik pada kolam penampungan yang berhubungan dengan daerah minimum M. T[n] merupakan himpunan koordinat titik pada g(x,y) di bawah plane g(x,y)=n. T[n]{(s,t)|g(s,t)<n} Cn(Mi) merupakan himpunan koordinat titik pada kolam penampungan yang berhubungan dengan daerah minimum M dan meluap pada stage n.

C[n] adalah gabungan dari porsi kolam penampungan yang meluap pada stage n :

C[max

1]

adalah

gabungan

dari

semua

kolam

penampungan

Algoritma

untuk

menemukan

watershed

lines

diinisialisasi

dengan

C[min+1]=T[min+1]. Algoritma berulang-ulang dengan asumsi pada step n, C[n-1] sudah dibuat. Procedure untuk mendapatkan C[n] dari C[n-1] tergantung pada 3 kondisi sebagai berikut untuk masing-masing connected component qQ[n] dimana Q adalah himpunan dari connected component di T[n]:
o o o

q C[n-1] kosong q C[n-1] berisi satu connected component dari C[n-1] q C[n-1] berisi lebih dari satu connected component dari C[n-1]

kondisi (a) terjadi jika sebuah minimum baru ditemukan dimana q disatukan dengan C[n-1] untuk membentuk C[n]. Kondisi (b) terjadi ketika q berada di dalam kolam penampungan dari beberapa daerah minimum dimana q disatukan dengan C[n-1] untuk membentuk C[n]. Kondisi (c) terjadi ketika semua atau bagian dari pemisah dua atau lebih kolam penampungan ditemukan.

The Use of Marker Aplikasi dari Watershed Segmentation Algorithm yaitu mengarah pada

oversegmentation yang berkaitan dengan noise dan ketidakteraturan gradient lainnya. Pendekatan untuk mrngontrol oversegmentation berdasarkan pada konsep markers. Marker adalah sebuah connected component dari image. Internal marker berhubungan dengan objek kepentingan sedangkan external marker berhubungan dengan background. Procedure pemilihan marker terdiri dari preprocessing dan penentuan himpunan criteria yang harus dipenuhi marker. Sebagai gambaran bisa dilihat pada gambar 10.47 dan 10.48.

The Use of Motion in Segmentation Motion adalah isyarat yang sangat kuat yang digunakan oleh manusia dan binatang untuk memisahkan objek perhatian dari detail yang tidak relevan.

Spatial Techniques BasicApproach Pendekatan paling sederhana untuk mendeteksi perubahan dua image frame f(x,y,ti) dan f(x,y,tj) pada waktu ti dan tj yaitu dengan membandingkan dua image per pixel membentuk sebuah image yang berbeda. Perbedaan antara dua image pada waktu ti dan tj yaitu:

T adalah threshold yang sudah ditentukan. Accumulative differences Accumulative difference image (ADI) dibuat dengan membandingkan reference image dengan setiap image berikutnya yang berurutan. Reference image merupakan sebuah urutan image frame , ,, . ADI terdiri atas tiga

tipe yaitu : absolute, positive, dan negative ADI. Untuk K > 1 maka nilai ADI yaitu :

Dimana

adalah absolute, positive, dan negative ADI.

Urutan inequalities dan tanda dari threshold pada persamaan (10.6-3) dan (10.6-4) dibalik jika nilai tingkat keabuan dari pixel background lebih besar dari tingkat pergerakan obyek.

Berdasarkan gambar di atas dapat disimpulkan bahwa: (1) nonzero area dari positive ADI sama dengan ukuran pergerakan obyek. (2 lokasi positive ADI sesuai dengan lokasi pergerakan obyek pada reference frame. (3) penghitungan pada positive ADI berhenti ketika pergerakan obyek sudah dipindahkan semua sama seperti obyek pada reference frame. (4) absolute ADI terdiri dari wilayah positive dan negative ADI. (5) arah dan kecepatan dari pergerakan obyek bisa ditentukan dari entry pada absolute dan negative ADI.

Establishing a reference image Procedure untuk mendapatkan reference image yaitu menentukan image pertama dalam urutan image untuk menjadi reference image. Ketika sebuah komponen nonstationary sudah dipindahkan semua dari posisinya pada reference image, background yang sesuai pada frame yang sekarang disalin pada lokasi yang ditempati oleh objek pada reference frame. Reference image yang hanya berisi stationary component didapatkan jika semua pergerakan obyek sudah dipindahkan semua dari posisi aslinya. Gambar 10.50 menunjukkan dua frame gambar dari persimpangan lalu lintas. Gambar pertama ditetapkan sebagai reference.

Frequency Domain Techniques

Pada bagian ini akan dibahas masalah penentuan estimasi pergerakan dengan Fourier transform. Rumus Euler :

Untuk t = 0, 1,, K-1; x = 0, 1,,M-1; a1>=0 dan Dt adalah interval waktu antar frame. Untuk K digital image berukuran MxN, maka jumlah proyeksi ke x axis pada setiap integer waktu adalah :

Sedangkan jumlah proyeksi ke y axis yaitu:

1-D Fourer Transform dari persamaan (10.6-6) dan (10.6-7) yaitu:

dan

Hubungan frequency-velocity yaitu :

Tanda dari x-component velocity didapatkan dari perhitungan :

Karena gx sinusoidal, bisa ditunjukkan bahwa S1x dan S2x akan mempunyai tanda yang positif. sama pada sembarang titik, jika componen velocity v1