Adhi H
Adhi H
= =
=
x x
N
i
N
j
j , i p f
1 1
2
1
(2)
Correlation :
( ) ( )
2
1 1
3
1
= =
=
x x
N
i
N
j
y x
y x
j , i p ij f
(3)
Invers difference moment :
( )
( ) j , i p
j i
f
x x
N
i
N
j
= =
+
=
1 1
2 5
1
1
(4)
Entropy :
( ) ( ) [ ] j , i p log j , i p f
x x
N
i
N
j
= =
=
1 1
9
(5)
PRINCIPAL COMPONENT ANALYSIS (PCA)
Dalam studi ini, digunakan metode Principal Component Analysis (PCA) untuk
menemukan sebuah sub set dari sekumpulan ciri tekstur multi resolusi asli sehingga
ciri yang mempunyai pengaruh besar dipilih sebagai input pengklasifikasi.
Principal Component Analysis sering digunakan secara luas pada aplikasi
remote sensing untuk mereduksi dimensi [5]. Penggunakan tradisional dari metode ini
meliputi pencarian untuk mengganti kolom m dari baris ciri dengan kolom baru n.
Untuk beberapa set data, penggabungan dua ciri dapat menghasilkan kekuatan baru
untuk membedakan dibandingkan dengan sebelumnya. Tetapi, ciri yang berlebihan
tidak dapat diidentifikasi oleh pemakaian ini karena ciri aslinya telah ditransformasi
menjadi ciri baru. Metode ini didasarkan pada pencarian dan pembuangan ciri yang
berhubungan dengan bobot terbesar dalam eigenvektor dari eigenvalue terkecil.
PCA adalah sebuah cara mengidentifikasi pola dalam data dan mengekspresikan
data dengan cara memperhatikan kemiripan dan perbedaannya. Ketika pola dalam data
menjadi sulit untuk ditemukan dalam data dengan dimensi yang besar, PCA
merupakan alat yang tanggung untuk menganlisis data tersebut. Keuntungan utama
PCA adalah mampu menemukan pola dalam data dan meng-compress data dengan
cara mereduksi jumlah dimensi tanpa harus kehilangan banyak informasi.
PROBABILISTIC NEURAL NETWORK
Jaringan neural probabilistik (Probabilistic Neural Network) dapat digunakan
untuk menyelesaikan masalah klasifikasi. Ketika diberikan input, lapisan pertama
menghitung jarak dari vektor input terhadap vektor input pelatihan, dan menghasilkan
vektor yang elemen-elemennya menandakan seberapa dekat input terhadap input
pelatihan. Lapisan kedua menjumlahkan kontribusi ini untuk setiap input kelas untuk
menghasilkan vektor output jaringan PNN. Akhirnya, fungsi transfer yang sempurna
pada output lapisan kedua mengambil probabilitas maksimum dan menghasilkan 1
untuk kelas yang sesuai dan menghasilkan 0 untuk kelas yang lain.
Jaringan neural probabilistik dibangun menggunakan ide dari teori probabilitas
klasik, seperti pengklasifikasi Bayesian (Bayesian classification) dan pengestimasi
klasik (classical estimator) untuk fungsi kerapatan probabilitas (probability density
function), untuk membentuk sebuah jaringan neural sebagai pengklasifikasi pola.
Jaringan neural probabilistik dipilih karena dikenal mempunyai waktu pelatihan
sangat singkat serta mempunyai tingkat generalisasi yang baik [6].
EKSPERIMEN
Citra yang digunakan disini adalah 432 citra welding dengan ukuran piksel 360
180. Citra tersebut dikelompokkan kedalam 8 kelas yaitu normal, distributed
porosity, incomplete penetration, burn through, cluster porosity, excessive cap,
excessive penetration, incomplete fussion. Dalam pemrosesannya, citra tersebut
dikuantisasi menjadi 256 derajat keabuan.
Ekstraksi ciri diawali dengan mengkuantisasi citra input RGB menjadi citra
dalam 256 derajat keabuan. Langkah selanjutnya membentuk matriks co-occurrence
dengan beberapa variasi window pada setiap citra. Dengan pemilihan empat jenis
orientasi (0, 45, 90 dan 135) pada 14 pengukuran akan didapat sebuah set data
yang terdiri atas 56 baris diekstraksi dari setiap citra. Set data ini digunakan sebagai
set data awal. Set data ini terdiri atas 56 ciri (Gambar 5).
Gambar 5. Pengukuran Ciri dengan menggunakan GLCM
Set data awal yang terdiri atas 56 ciri selanjutnya dilakukan pemilihan ciri
dengan menggunakan PCA. Karena itu diperlukan serangkaian eksperimen untuk
menentukan jumlah ciri yang tepat untuk mewakili data cacat pengelasan tersebut agar
mampu menghasilkan pengenalan yang tinggi pada JNB. Jumlah ciri semakin kecil
akan memperkecil jumlah neuron pada lapisan input. Hal tersebut tentunya akan
mempercepat proses pelatihan dan proses pengenalan JNB. Namun di sisi lain, jumlah
ciri yang semakin kecil akan semakin mengurangi informasi penting bagi JNB.
Karena itu perlu dicari sebuah nilai optimal antara jumlah ciri dan jumlah informasi,
sehingga diharapkan tidak akan mengurangi akurasi pengenalan JNB dengan jumlah
ciri yang kecil. Pada eksperimen ini digunakan nilai 2% untuk PCA.
Untuk mengetahui hasil pengenalan cacat pengelasan pada penelitian ini
diperlukan persiapan data masukan untuk proses pembelajaran dan data masukan
untuk proses pengujian. Maka pada bagian ini akan dijelaskan bentuk metode
pemilihan data masukan, variasi perbandingan data pembelajaran dan data pengujian
serta hasil pengenalan cacat pengelasan oleh JNB.
Pemilihan data pembelajaran dan data pengujian merupakan salah satu penentu
keberhasilan sistem pengenalan. Apabila dapat dipilih satu set data pembelajaran yang
mampu mewakili keseluruhan keadaan sistem pengenalan maka akan diperoleh nilai
pengenalan tinggi. Untuk mendapatkan set data yang mewakili keseluruhan keadaan
sistem pengenalan tentunya bukanlah merupakan hal mudah.
Pada penelitian ini digunakan tiga jenis pemilihan data, yaitu sebagai berikut:
Random penuh
Sedangkan pada jenis pemilihan data ini, sebuah set indeks baru selalu
dibuat dengan cara random pada setiap kelas pada setiap awal eksperimen.
Sehingga akan dihasilkan suatu urutan data yang berbeda-beda pada setiap
pelatihan dan pengujian. Dari urutan yang baru tersebut akan dilakukan
pemilihan data pelatihan dan data pengujian sesuai dengan perbandingan
tertentu.
Semi random
Pada jenis pemilihan data ini, sebuah set indeks baru telah dibuat terlebih
dahulu dengan cara random pada setiap kelas sebelum dilaksanakan
eksperimen. Sehingga akan dihasilkan suatu urutan data yang tetap pada
setiap pelatihan dan pengujian. Dari urutan yang baru tersebut akan
dilakukan pemilihan data pelatihan dan data pengujian sesuai dengan
perbandingan tertentu.
Pilih
Pada jenis pemilihan data ini, sebuah set indeks baru telah dibuat terlebih
dahulu dengan dipilih secara manual dengan memperhatikan pola cacat
pengelasan pada setiap kelas sebelum dilaksanakan eksperimen. Sehingga
akan dihasilkan suatu urutan data yang tetap pada setiap pelatihan dan
pengujian. Pada metode ini, telah dipilih satu set data yang digunakan
untuk pelatihan dan satu set data yang digunakan pengujian.
Telah dilakukan beberapa variasi setting eksperimen dengan menggunakan 432
citra dengan 8 kelas klasifikasi. Variasi setting eksperimen dilakukan untuk mencari
parameter-parameter yang mampu menghasilkan nilai akurasi data maksimal. Variasi
setting eksperimen meliputi : matrik co-occurrence (berupa jarak piksel dan sudut),
level derajat keabuan, persen PCA (jumlah ciri input jaringan saraf buatan), spread
(sebaran gaussian), metode pemilihan data pelatihan dan data pengujian dan
perbandingan antara data pelatihan dan pengujian.
Setelah didapatkan parameter-parameter yang dianggap dapat memberikan hasil
pengenalan maksimal, parameter tersebut disimpan dan kemudian akan diambil
sebagai input sistem untuk melakukan pembelajaran selanjutnya untuk melakukan
pengujian.
Setelah dilakukan proses pembelajaran menggunakan vektor pelatihan maka
jaringan terlebih dahulu diuji untuk mendapatkan pengenalan terhadap vektor
pelatihan, yaitu sebuah set data yang dipilih dari 432 citra untuk digunakan sebagai
data proses pembelajaran. Kemudian dilakukan pengujian terhadap jaringan dengan
menggunakan vektor testing, yaitu sebuah set data yang merupakan sisa dari 432 citra
yang tidak digunakan dalam proses pembelajaran. Persentase pengenalan atau akurasi
dinyatakan sebagai nilai perbandingan antara jumlah data citra yang berhasil dikenali
oleh jaringan dengan jumlah total data pengujian (8 kelas) seperti pada persamaan 6.
% 100
Total Data Jumlah
Benar kasi Terklasifi Data Jumlah
%Akurasi = (6)
Gambar 6 memperlihatkan perbandingan pengenalan sistem yang menggunakan
PNN sebagai pengklasifikasi pada sistem pengenalan cacat pengelasan berbasis
GLCM pada ketujuh variasi jarak piksel. Eksperimen ini menggunakan parameter
eksperimen sebagai berikut :
Spread = 0.03
Perbandingan Data Pelatihan dan Pengujian = 50 : 50
Persen PCA = 2%
Gambar 6. Hasil Pengenalan sistem berbasis GLCM pada variasi jarak piksel
Dari Gambar 6 terlihat pemilihan data semi random dan random menghasilkan
tingkat pengenalan yang hampir sama. Hal tersebut menunjukkan sistem kestabilan
sistem terhadap perubahan pemilihan data pembelajaran dan pengujian. Dengan kata
lain, sistem tidak terlalu tergantung dengan adanya perubahan data pembelajaran,
sistem tetap mampu membentuk jaringan dengan tingkat pengenalan yang relatif
sama. Sedangkan pemilihan data dengan metode pilih mempunyai tingkat pengenalan
yang baik, hal ini wajar dan telah diprediksi sebelumnya, karena data pembelajaran
dipilih dengan menggunakan data yang dianggap paling mewakili. Tingkat pengenalan
sistem terbaik diberikan oleh jarak piksel 1 dan penambahan jarak piksel pada jendela
matriks co-occurrence mengurangi tingkat pengenalan sistem. Hal tersebut ditentukan
oleh bentuk fisik tekstur pada citra input.
Pada Gambar 7 memperlihatkan perbandingan pengenalan sistem yang
menggunakan PNN sebagai pengklasifikasi pada sistem pengenalan cacat pengelasan
berbasis GLCM pada variasi derajat keabuan. Pada penelitian ini telah diteliti lima
variasi derajat keabuan yaitu 8, 16, 32, 64 dan 256.
Gambar 7. Hasil Pengenalan sistem berbasis GLCM pada derajat keabuan
Derajat keabuan 256 mampu menghasilkan tingkat pengenalan paling baik
dibandingkan dengan derajat keabuan yang lain. Hal ini disebabkan karena pada
derajat keabuan ini, informasi yang dimiliki oleh citra relatif lebih banyak
dibandingkan dengan derajat keabuan yang lebih rendah. Namum derajat keabuan
yang besar membutuhkan waktu komputasi yang lebih lama dibandingkan dengan
derajat keabuan yang lebih rendah (lihat Tabel 1). Karena itu tidak perlu
menggunakan derajat keabuan yang tinggi, ditambah apabila pengurangan derajat
keabuan tidak terlalu mengurangi tingkat pengenalan secara signifikan.
Tabel 1. Waktu komputasi pada variasi derajat keabuan
Derajat Keabuan
GLCM
(sekon)
8 0,171
16 0,250
32 0,422
64 1,250
256 24,047
KESIMPULAN
Dalam tulisan ini, telah dilakukan penelitian sebuah metode untuk mendeteksi
cacat pengelasan berbasis Gray Level Co-occurrence matrix (GLCM). Film sinar-X
standar IIW telah dijadikan sebagai input sistem pengenalan. Film sinar-X telah
didigitalisasi terlebih dahulu dengan menggunakan kamera digital. Ciri tekstur
diekstrak dengan menggunakan empat persamaan Harralick pada matrik co-
occurrence. Probabilistic Neural Network telah digunakan sebagai pengklasifikasi
output pengenalan berupa delapan kelompok jenis cacat pengelasan. Tingkat
pengenalan sistem terbaik mampu memcapai 99,54 % pada derajat keabuan 256 dan
jarak piksel 1. Penelitian ini membuat sebuah kontribusi dalam memecahkan
permasalahan dalam sistem pengenalan weld defect.
DAFTAR PUSTAKA
1. ANTONIO ALVES DE CARVALHO, RAPHAEL CARLOS DE S BRITO
SUITA, ROMEU RICARDO DA SILVA, JOO MARCOS ALCOFORADO
REBELLO, Evaluation of the Relevant Features of Welding Defects in
Radiographic Inspection, Materials Research, 6(3) (2003) 427-432
2. MERY, D, Automatic detection of welding defects using textute feature
International Symposium on Computed Tomography and Image Processing for
Industrial Raidology, Berlin, 2003.
3. CELEBI, ERBUG, ADIL ALPKOCAK, Clustering of Texture Features for
Content based Image Retrieval, Dokuz Eylul University, Department of
Computer Engineering, 35100 Bornova, Izmir, TURKEY, 2000.
4. MERY, D, Processing Digital X-ray Images and Its Applications in the
Automated Visual Inspection of Aluminum Casting, 3rd Pan American
Conference for Nondestructive Testing PANNDT, Rio de Janeiro RJ, June
2003.
5. WU. D, J. LINDERS, Comparison of three different methods to select feature for
discriminating forest cover types using SAR Imaginary, International Journal of
Remote Sensing, 21(10) (2000) 2089-2099
6. TRIANTO, ADI, Ekstraksi ciri pada data suara menggunakan spektra orde
tinggi dan kuantisasi vektor untuk identifikasi pembicara menggunakan Jaringan
Neural Buatan, Tesis, Program Pasca Sarjana Ilmu Komputer, Universitas
Indonesia, 2000.
DISKUSI
ELFRIDA SARAGI
Hasil Akurasi pengenalan rata-rata semua kelas untuk citra yang belum diketahui jenis
cacatnya mencapai maksimal 99,54 %. Bagaimana / apakah bisa digunakan metode
clustering berdasarkan kemiripan masing-masing, kemudian menggunakan pemodelan
dengan berbagai variabel indikator untuk mendapatkan jenis cacatnya.
ADHI HARMOKO
Kalau digunakan metode clusterring jumlah kelas bisa berubah menjadi naik/turun.
Pada penelitian ini jumlah kelas telah ditentukan yaitu: 8. Dengan Metode Neural
Network data telah ditentukan target kelasnya. Sistem akan men-generate nilai-nilai
fungsi sendiri dengan data pembelajaran.
GATOT S
1. Bagaimana menentukan jarak pixel dan banyaknya pixel pada jejak di film?
2. Bagaimana penerapan metode yang disampaikan pada cacat welding pada masing-
masing 8 kelas cacat welding?
ADHI HARMOKO
1. Penelitian ini ditunjukkan untuk menentukan jarak pixel optimal, pada kasus ini
jarak pixel kecil lebih optimal. Hal ini karena jenis cacat yang diamati
mempunyai ukuran yang relatif kecil.
2. Metodenya adalah supervised learning. Sistem dibuat belajar dengan sendirinya
dengan diberikan input dan target. Ketika pengujian data diberikan berbeda
dengan data yang telah dipelajari untuk melihat kemampuan sistem.
RIDWAN
Jenis-jenis cacat logam dan kendala apa saja yang sering timbul dalam eksperimen
yang Bapak temukan.
ADHI HARMOKO
Logam yang diteliti adalah metal, ada banyak jenis cacat. Namun pada penelitian ini
hanya dikelompokkan ke dalam 8 kelas. Kendala yang timbul adalah terbatasnya
jumlah data sampel.
DAFTAR RIWAYAT HIDUP
1. Nama : Adhi Harmoko C
2. Tempat/Tanggal Lahir : Jakarta, 28 Agustus 1978
3. Instansi : Dept. Fisika FMIPA Universitas Indonesia
4. Pekerjaan / Jabatan : Dosen
5. Riwayat Pendidikan :
S1 Fisika FMIPA Universitas Indonesia
S2 Fasilkom Universitas Indonesia
6. Pengalaman Kerja : Dosen Universitas Indonesia
Back