Anda di halaman 1dari 9

Klasifikasi Lesi Serviks Menggunakan Model Filter Bank-Based Texture

† † † ‡
Yeshwanth Srinivasan , Brian Nutter , Sunanda Mitra , Benny Phillips , and Eric
¦
Sinzinger
† Dept. of Electrical and Computer Engineering, Texas Tech University, Lubbock, Texas
79409 ‡ OB/GYN-Lubbock, School of Medicine, Lubbock, Texas 79430
¦ Dept. of Computer Science, Texas Tech University, Lubbock, Texas 79409
yeshwanth.srinivasan@ttu.edu, brian.nutter@ttu.edu, sunanda.mitra@coe.ttu.edu,
eric.sinzinger@ttu.edu

Abstrak
Makalah ini mengeksplorasi klasifikasi pola tekstur yang diamati pada gambar digital serviks.
Secara khusus, masalah identifikasi dan segmentasi punctation dan pola mosaik
dipertimbangkan. Pertama, kemampuan filter banks skala besar dalam mengkarakterisasi
belokan dan struktur mosaik dipelajari menggunakan model texton. Namun, model berbasis
texton gagal untuk secara konsisten mengklasifikasikan punctation dan bagian mosaik yang
diperoleh dari gambar serviks subjek yang berbeda. Kami menyajikan metode baru untuk
mensegmentasi punctation yang menggabungkan pemfilteran yang cocok menggunakan
templat Gaussian dengan Model Campuran Gaussian. Fitur yang diekstraksi dari objek yang
terdeteksi menggunakan metode novel ini pada bagian punctation dan mosaik ditampilkan
untuk memberikan klasifikasi yang sangat baik antara punctation dan mosaicism. Hasil
menunjukkan efektivitas pendekatan kami dalam mendeteksi punctation dan memisahkan
bagian punctation dari bagian mosaik.

1. Pendahuluan
Kanker serviks adalah bentuk kanker paling umum kedua pada wanita, mempengaruhi
lebih dari 12.000 wanita di Amerika dan 400.000 wanita di seluruh dunia [1]. Papanicolaou
(Pap) smear test [2] adalah alat skrining yang paling umum untuk kanker serviks, tes optik
seperti inspeksi visual dengan asam asetat (VIA) dan serviks dan kolposkopi untuk
pemeriksaan visual serviks [3] menjadi semakin populer . Secara khusus, servikografi dan
kolposkopi dianggap sebagai alat skrining yang lebih efektif karena kemampuannya untuk
pemrosesan otomatis dan analisis longitudinal.
Segmentasi otomatis dan klasifikasi lesi serviks adalah alat yang sangat diinginkan
untuk deteksi kanker serviks otomatis dan non-invasif. Alat-alat tersebut sangat
meningkatkan kekuatan kolposkop, yang merupakan perangkat yang digunakan untuk
merekam gambar serviks secara fotografi, dengan menambahkan kemampuan analitis ke
sistem pencitraan, sehingga mengurangi jumlah input manusia yang diperlukan dalam
membuat keputusan. Namun, segmentasi dan klasifikasi daerah prekanker pada serviks
adalah tugas non-sepele yang diperumit oleh beberapa faktor, termasuk permukaan serviks
yang tidak seragam, variasi pencahayaan, arah dan skala penglihatan, dan perbedaan dalam
modalitas pencitraan.
Kanker serviks didahului oleh Cervical Intraepithelial Neoplasia (CIN), yang
mengacu pada spektrum kelainan epitel superfisial. Fitur CIN yang paling penting yang
membantu dalam membedakan antara lesi normal dan abnormal adalah perubahan acetowhite
(AW) dan pola vaskular [4]. Wilayah AW adalah epitel putih yang muncul setelah penerapan
asam asetat. Ini membantu dalam deteksi dan karakterisasi kelainan serviks pada tahap awal
karena menghasilkan garis demarkasi yang tajam antara epitel normal dan abnormal. Pola
pembuluh darah yang diamati pada CIN pada dasarnya dari tiga jenis: Punctations,
Mosaicism dan Vasculature. Kapiler berkelok, memanjang, dan melebar yang dekat dengan
permukaan disebut sebagai punctation. Pola vaskular yang teratur yang dibentuk oleh kapiler
yang sejajar dengan permukaan disebut pola mosaik. Contoh punctation dan mosaik
ditunjukkan pada Gambar 1 (a) - (e) dan (f) - (j), masing-masing. Pembuluh darah terminal
yang tidak teratur dalam ukuran, bentuk, kekasaran dan pengaturan, dengan jarak antar
kapiler yang lebih besar daripada di epitel normal, disebut sebagai vasculature.
Masalah pengelompokan gambar serviks ke dalam wilayah yang bermakna secara
patologis, seperti Squamous Epithelium (SE), Columnar Epithelium (CE), AW, mosaik dan
punctation, telah ditangani oleh beberapa peneliti di masa lalu dengan berbagai tingkat
keberhasilan [5, 6, 7]. Namun, sistem yang sepenuhnya otomatis yang menguraikan gambar
digital serviks, yang diperoleh dalam kondisi yang sangat bervariasi, ke daerah yang secara
patologis signifikan masih hanya dalam tahap pengembangan. Dalam tulisan ini, kami
mencoba untuk memecahkan masalah penting dari mengklasifikasikan bagian gambar yang
berisi punctation dan pola mosaik ke dalam kategori masing-masing. Setelah diklasifikasi
secara akurat, punctation dan mosaik dapat disegmentasi menggunakan metode yang sesuai
untuk setiap jenis tekstur.
Sisa dari makalah ini disusun sebagai berikut. Pada bagian 2, dibahas mengenai
pengelompokan bagian mosaik dan punctation diperlakukan sebagai masalah klasifikasi
tekstur, dan solusi dicoba menggunakan texton 2 dimensi(2-D). Hasil disediakan untuk
menunjukkan ketidakcukupan model berbasis texton dalam mengkarakterisasi mosaik dan
punctations untuk klasifikasi yang akurat. Bagian 3 memperkenalkan metode baru
berdasarkan pemfilteran yang cocok dan Gaussian Mixture Model (GMM) untuk memotong
segmen secara akurat. Terlihat bahwa fitur geometris yang diekstraksi dari objek
tersegmentasi dapat digunakan untuk klasifikasi bagian mosaik dan punctasi yang akurat.
Bagian 4 menyimpulkan makalah dengan diskusi tentang pentingnya hasil dan pekerjaan di
masa depan.

2. Filter bank dan textons


Klasifikasi tekstur menggunakan filter banks telah banyak diterapkan pada klasifikasi
gambar dari basis data tekstur standar dengan akurasi lebih dari 95% [8, 9, 10]. Gagasan
dasarnya adalah untuk mengkarakterisasi tekstur dengan tanggapannya terhadap seperangkat
filter linear Nfil yang selektif secara orientasi dan frekuensi. Respons Nfil-dimensional pada
setiap piksel di seluruh gambar pelatihan tekstur tertentu dikelompokkan untuk
mengembalikan satu set kecil vektor respons prototipe yang disebut textons. Vektor respons
itu sendiri disebut vektor penampilan karena mengkodekan variasi tekstur lokal. Respons
pada setiap piksel kemudian dikuantisasi ke texton terdekat, dan histogram label texton diplot
dan digunakan sebagai model untuk tekstur itu. Dengan demikian, jika satu set texton dilatih
pada gambar permukaan bertekstur yang diperoleh di bawah, beberapa, tetapi tidak semua
dari kemungkinan pencahayaan dan kondisi tampilan, maka model texton dapat digunakan
untuk secara akurat mengklasifikasikan gambar dari permukaan yang sama yang diperoleh di
bawah semua kemungkinan pencahayaan dan tampilan variasi arah. Rincian lebih lanjut
tentang metode filter bank, model texton dan variasi pendekatan berbasis texton dapat
diperoleh dari [8], [9] dan [10].
Delapan Respons Maksimum atau MR8 filter bank dari Varma dan Zisserman adalah
kumpulan dari 8 filter invarian rotasi yang telah terbukti memberikan diskriminasi yang
sangat baik antara tekstur yang menggunakan hanya satu gambar sebagai input [9]. Filter
bank terdiri dari filter Gaussian dengan σ = 10, filter Laplacian of Gaussian (LoG) dengan σ
= 10, satu set filter tepi berorientasi 6, dan 6 filter bar berorientasi pada 3 skala yang berbeda,
(σx, σy) = {(1, 3), (2, 6), (4, 12)}. Namun, untuk mencapai invarian rotasi dan mengurangi
dimensi vektor respons filter, hanya respons maksimum dari 6 filter berorientasi pada setiap
skala yang diambil, menghasilkan respons 3 tepi dan respons 3 batang untuk total 8 respons
filter yang relevan, termasuk filter Gaussian dan LoG.
Premis dalam menggunakan filter bank ini untuk mengklasifikasikan mosaicism dan
punctation sangat mudah. Pola mosaik dibentuk oleh struktur vaskular tertutup yang dapat
didekati dengan seperangkat tepi berorientasi. Karenanya, mereka merespons dengan baik
filter tepi dan bar. Di sisi lain, punctations, yang pada dasarnya adalah objek lingkaran,
merespons lebih baik untuk filter Gaussian dan LoG simetris yang berputar secara simetris.
Karena perbedaan jenis filter yang ditanggapi oleh mosaik dan punctation, model texton
diharapkan dapat bekerja dengan baik, meskipun gambar pelatihan terdaftar yang diperoleh
dari berbagai sudut pandang dan pencahayaan untuk setiap tekstur tidak tersedia.

2.1. Metodologi
Gambar yang digunakan untuk setiap jenis tekstur (mosaik dan punctations)
ditunjukkan pada gambar 1. Gambar berukuran 100 x 100 bagian RGB diperoleh dari gambar
serviks dan kolposkopi. Specular Reflections (SR) karena kesulitan iluminasi khusus aplikasi
dihilangkan dengan menerapkan ambang keras pada nilai R, G dan B yang melebihi 200 dan
interpolasi berulang untuk piksel yang dihapus menggunakan piksel non-SR di lingkungan
7x7. Seperti yang disarankan dalam [9], setiap gambar dikonversi ke skala abu-abu dan
intensitas dinormalisasi untuk memiliki rata-rata nol dan satuan standar deviasi. Filter
dinormalisasi sehingga memiliki norma unit L1. Setiap gambar kemudian dikonvolusi dengan
38 filter, dan vektor respons filter 8-D pada setiap piksel x dikontraskan secara normal
menggunakan hukum Weber sebagai:

F(x)=F(x)log(1+L/0.03)/L , (1)

di mana L = F (x) 2 adalah L2 dari vektor respon filter di x. Kemudian, vektor respons filter
dari kelima gambar dari masing-masing tekstur digabungkan dan dikelompokkan menjadi
100 kluster menggunakan kluster K-means. Centroid cluster adalah teks. Textons terdekat
kemudian secara progresif digabungkan untuk mengurangi jumlah texton dari 200, dengan
100 dari mosaicism dan 100 dari punctations, ke satu set kompak dari 100 texton.
Respons filter pada setiap piksel dikuantisasi ke texton terdekat, dan histogram label
texton untuk setiap gambar diplot. Histogram label menjadi model yang mewakili gambar
tekstur. Jika model tersebut secara memadai mewakili perbedaan tekstur antara mosaicism
dan punctations, maka, setidaknya untuk gambar pelatihan, kesamaan dalam histogram label
antara gambar dengan tekstur yang sama harus lebih besar daripada kesamaan dalam
histogram label antara gambar dari tekstur yang berbeda. Ukuran kesamaan yang digunakan
adalah jarak chi-square antara histogram yang diberikan oleh:

(2)
di mana h1 dan h2 adalah dua histogram label dibandingkan dan Nbins adalah jumlah texton
dalam model, yaitu 100 dalam hal ini. Filter dukungan 7 digunakan.

2.2. Hasil
Gambar 2 menunjukkan respons dari satu gambar punctation, P2, dan satu gambar
mosaik, M2. Seperti yang diharapkan, struktur mosaik merespon kuat terhadap filter bar dan
tepi, dan struktur vaskular juga ditekankan oleh filter Gaussian dan LoG karena dukungan
kecil dari filter. Namun, punctation hanya merespons filter Gaussian dan LoG.
Tabel 1 menunjukkan jarak chi-square antara masing-masing histogram model dan
setiap histogram model lainnya di set. Meskipun respons filter untuk mosaik dan punctation
berbeda secara persepsi, jarak chi-square tidak sesuai dengan perbedaan yang diamati dalam
respons filter. Bahkan, jarak chi-square menunjukkan bahwa beberapa gambar mosaik lebih
mirip dengan beberapa gambar punctation daripada gambar mosaik lainnya dalam set
pelatihan, menunjukkan bahwa teks gagal untuk mengkarakterisasi perbedaan dalam tekstur
antara mosaik dan punctation. Kurangnya gambar terdaftar dari berbagai sudut pandang
untuk setiap tekstur mencegah model berbasis texton dari menemukan teks yang secara
individual spesifik untuk tekstur tertentu.

3. Pemfilteran yang cocok untuk mendeteksi punctation


Punctations muncul sebagai objek yang berbentuk lingkaran dengan rona kemerahan
pekat pada gambar RGB, atau sebagai objek gelap pada gambar skala abu-abu yang sesuai.
Karena bentuk dan ukuran objek cukup seragam dan apriori dikenal, penyaringan cocok
menggunakan template yang cocok dengan bentuk objek yang akan dideteksi dapat
digunakan untuk menonjolkan objek-objek ini. Punctations juga memiliki kecenderungan
untuk terjadi dalam kelompok-kelompok tanpa garis demarkasi yang jelas antara dua atau
lebih punctations. Pemfilteran yang cocok menggunakan template Gaussian membantu
meningkatkan derajat pemisahan antara dua titik dekat karena objek yang terdeteksi terpaksa
berbentuk lingkaran. Matched filtering diimplementasikan sebagai konvolusi yang diberikan
oleh
m(x, y)=G(x, y)∗ f (x, y) (3)

di mana G (x, y) adalah kernel Gaussian 2-D yang dapat dipisahkan dengan σ = 10, yang
ditemukan untuk secara memadai menggambarkan variasi dalam intensitas di sekitar tanda
baca dalam sampel yang digunakan, f (x, y) adalah gambar input, dan m (x, y) adalah cocok
dengan gambar yang difilter. Pemfilteran yang cocok pada dasarnya melayani dua tujuan:
meningkatkan kontras di sekitar tusukan individual dan menghaluskan daerah yang seragam.
Gambar yang dihasilkan, m (x, y), terdiri dari titik-titik gelap pada latar belakang yang cerah.
Intensitas m (x, y) dapat dimodelkan sebagai campuran dari dua Gaussians, satu yang
dominan memodelkan variasi dalam intensitas punctations, dan yang lain yang memodelkan
variasi intensitas di latar belakang. Dengan kata lain, kita dapat menulis Probability Density
Function (PDF) dari intensitas m (x, y) sebagai

(4)
di mana N = 2 adalah jumlah Gaussians dalam campuran, αi adalah probabilitas apriori dari
setiap PDF, θi = (μi, Σi) adalah parameter dari PDF, yang untuk GMM adalah sarana dan
matriks kovarians, Θ = (α1, α2 ..., αN, θ1, θ2 ..., θN), dan x adalah himpunan tingkat abu-abu
intensitas piksel dalam m. Estimasi kemungkinan maksimum untuk parameter αi, μi, dan Σi
dapat ditemukan menggunakan algoritma Expectation-Maximization (EM) [11, 12].
Keuntungan penting dari pemodelan m (x, y) sebagai GMM adalah membantu untuk
membuat algoritma deteksi independen dari proses akuisisi gambar. Karena algoritma EM
diterapkan pada setiap gambar individu, tanda baca akan dideteksi terlepas dari variasi dalam
modalitas iluminasi dan perolehan gambar selama tanda kutip tampak lebih gelap daripada
latar belakang.

3.1 Metodologi untuk mendeteksi punctation


Pertama, SR dihilangkan dengan menggunakan prosedur yang diuraikan dalam bagian
2.1. Gambar dikonversi menjadi skala abu-abu dan diproses menggunakan difusi anisotropik
seperti yang disarankan dalam [13]. Pemfilteran ini berfungsi untuk menghaluskan latar
belakang yang tidak konsisten sembari menjaga tepian yang memisahkan punctation dari
latar belakang. Gambar yang telah diproses kemudian dikenakan pemfilteran yang cocok
menggunakan kernel Gaussian dengan dukungan dari 7. Gambar yang difilter yang cocok
kemudian dimodelkan sebagai campuran dari dua Gaussians, parameter yang diperkirakan
menggunakan algoritma EM. Akhirnya, setiap piksel ditetapkan ke salah satu dari dua
kelompok - objek dan latar belakang - berdasarkan probabilitas posteriori maksimum yang
ditemukan dari parameter yang diestimasi. PDF dengan rata-rata lebih rendah sesuai dengan
tanda baca dan diberi label ‘1’, sedangkan latar belakang berlabel ‘0’.

3.2 Klasifikasi mosaik dan punctation


Untuk memisahkan bagian gambar mosaik dan punctation, prosedur yang diuraikan
dalam bagian 3.1 diterapkan untuk semua 10 gambar dalam gambar 1, dan area, yang
merupakan fitur yang digunakan untuk membedakan gambar mosaik dan punctation, dari
masing-masing objek dalam gambar biner dihitung. Objek dengan luas kurang dari 5 piksel
dihapus, dan luas rata-rata objek di setiap gambar dihitung. Punctations pada gambar sampel
menempati setidaknya 5 piksel, dan objek yang kurang dari 5 piksel biasanya hanya speckle
noise. Untuk gambar mosaik, pemfilteran yang cocok hanya menonjolkan seluruh struktur
pembuluh darah sambil mengambil objek seperti tusukan belok. Oleh karena itu luas rata-rata
objek yang terdeteksi umumnya jauh lebih tinggi untuk gambar mosaik karena kontribusi
signifikan dari struktur pembuluh darah.

3.3 Hasil
Hasil deteksi punctation menggunakan matched filtering pada gambar P2 ditunjukkan pada
gambar 3. Kontur objek yang terdeteksi ditandai dengan warna biru. Dapat dilihat bahwa
algoritma ini memberikan perkiraan yang sangat baik dari punctation dan bahkan mendeteksi
clustered punctation sebagai objek yang terisolasi. Tabel 2 menunjukkan luas rata-rata objek
yang terdeteksi untuk gambar dalam Gambar 1. Dapat dilihat bahwa besarnya nilai untuk
mosaikisme secara konsisten lebih tinggi daripada untuk tanda baca. Rata-rata luas objek
pada semua gambar mosaik jauh lebih besar daripada nilai yang sesuai untuk gambar
punctation, dan area rata-rata terkecil dari objek untuk gambar mosaik lebih besar daripada
luas rata-rata objek terbesar untuk gambar tanda baca. Pemisahan ini menunjukkan bahwa
algoritma kami dapat digunakan untuk membedakan bagian mosaik dari bagian tanda baca
dengan modifikasi kecil yang disarankan di bagian berikut untuk meningkatkan derajat
pemisahan dengan menghilangkan positif palsu, yang mengurangi luas rata-rata objek dalam
gambar mosaik.

4. Diskusi dan pekerjaan di masa depan


Dalam penelitian ini, kami telah mendemonstrasikan metode untuk mendeteksi punctation
dan menerapkannya untuk membedakan gambar punctation dari gambar bagian mosaik.
Setelah dua jenis pola dibedakan dan dipisahkan, struktur mosaik dapat disegmentasi
menggunakan pendekatan yang ditunjukkan dalam [7, 14, 15]. Ini adalah langkah penting
dalam membangun sistem yang sepenuhnya otomatis yang menguraikan gambar serviks
menjadi bagian yang bermakna secara patologis, yang merupakan tujuan akhir dari penelitian
ini. Pekerjaan di masa depan di bidang ini akan mencakup pelatihan karakteristik lingkungan
di sekitar punctation positif sejati untuk menghilangkan positif palsu dari bagian mosaik dan
punctation dan meningkatkan paritas dalam bidang rata-rata objek dalam gambar mosaik dan
punctation, memperkirakan secara kuantitatif jumlah tanda baca dan yang terkait itu untuk
konsekuensi patologisnya, metode skala-ruang untuk secara akurat menentukan punctations
dari semua ukuran, dan pengujian ekstensif pada dataset yang lebih besar dari gambar serviks
dan kolposkopi.

Tabel 1. Jarak chi-square antara histogram model label texton untuk gambar yang digunakan
dalam pelatihan

Gambar 2. Respon dari punctation dan gambar mosaik pada 8 filter. (a) - (h) Respon gambar
punctation P2. (i) - (p) Tanggapan gambar mosaik M2. S1, S2 dan S3 menunjukkan 3 skala
berbeda skala yang digunakan.
Gambar 3. Deteksi punctation menggunakan match filtering dan GMM. (a) - (d)
menggunakan gambar P2 dari gambar 1 (b). (e) - (h) menggunakan Gambar M2
dari gambar 1 (g).

Tabel 2. Luas rata-rata objek yang terdeteksi untuk 10 gambar pada gambar 1
M1 M2 M3 M4 M5 P1 P2 P3 P4 P5
Area
rata- 49.51 68.54 92.41 35.72 35.62 33.50 24.90 30.35 25.58 28.02
rata