Anda di halaman 1dari 9

Klasifikasi Ikan Layang dan Ikan Tongkol Menggunakan

Metode PCA (Principal Component Analysis)


Qory Aprilarita

Jurusan Ilmu Komputer FMIPA Unila

Abstract

Classification is one of the important tasks that are common in everyday life. The
process helps people save time and work. One of the example classification task is
classification types of fish. That is because the shape is similar to other types.
Therefore, in this study will be the classification of the flying fish and tuna. The goal is
to help sellers and buyers in practice recognizing the type of fish. The method used is
the extraction image of PCA and Euclidean Distance method. Results of research
conducted is a system able to work optimally in doing classification task with accuracy
value of 91,67%.

Keywords: Euclidean Distance; Ikan Layang; Ikan Tongkol; Klasifikasi; PCA.

1. Pendahuluan

Indonesia merupakan salah satu negara kepulauan terbesar di dunia. Sebagai negara
kepulauan, maka jelas Negara Indonesia memiliki wilayah daratan dan lautan (perairan)
yang luas. Wilayah perairan Indonesia memiliki luas kurang lebih 5.193.250 km2.
Dengan wilayah perairan yang luas, maka tak heran jika Indonesia memiliki banyak
keragaman hayati bawah laut seperti contohnya ikan. Ikan merupakan komoditi
perdagangan yang menguntungkan bagi devisa negara. Banyak jenis ikan yang beredar
di pasaran, diantaranya adalah ikan layang dan ikan tongkol. Ikan layang dan ikan
tongkol memiliki potensi ekonomi yang cukup tinggi karena memiliki permintaan yang
terus meningkat [1].

Ikan layang dan ikan tongkol memiliki bentuk fisik yang hampir sama, sehingga
menyebabkan konsumen kesulitan dalam membedakannya. Selama ini konsumen dan
penjual hanya dapat melakukan cara-cara manual dalam mengidentifikasi kedua jenis
ikan tersebut. Tentunya cara tersebut tidaklah praktis untuk dilakukan dan memberikan
efek yang merugikan jika dibandingkan dengan cara otomatis yang dibantu dengan
teknologi yang maju. Kerugian tersebut akan semakin terasa apabila terjadi kasus
dimana penjual harus memasukkan ikan dalam jumlah yang sangat banyak ke dalam
wadah yang berbeda jenisnya. Proses tersebut akan memakan waktu yang cukup
panjang dan menghabiskan tenaga. Belum lagi jika penjual salah menempatkan ikan,
maka akan menimbulkan kerugian bagi konsumen. Timbulnya permasalahan di atas
memunculkan beragam solusi praktis, salah satunya adalah metode klasifikasi ikan
layang dan ikan tongkol yang dilakukan dengan bantuan komputer [2].

Telah banyak metode yang digunakan untuk tujuan klasifikasi, namun dari sekian banyak
metode, metode PCA (Principal Component Analysis) adalah yang paling sering
digunakan karena memiliki nilai akurasi yang cukup tinggi dan mampu bekerja secara
optimal. PCA bertujuan untuk mereduksi dimensi dengan melakukan transformasi linear
dari suatu ruang berdimensi tinggi ke dalam ruang dimensi [1]. Tujuan dari penelitian
ini sendiri adalah untuk memudahkan konsumen maupun penjual dalam mengenali jenis
ikan layang dan ikan tongkol dengan menggunakan metode PCA, sehingga dapat
menghemat waktu dan tenaga.

2. Metodologi

2.1. Waktu dan Tempat Penelitian

Penelitian ini dilakukan di Jurusan Ilmu Komputer Fakultas Matematika dan Ilmu
Pengetahuan Alam Universitas Lampung dan Pasar Tempel Way Halim untuk
pengambilan dataset. Waktu penelitian dilaksanakan dalam kurun waktu satu minggu,
yaitu dari 3 Januari 2017 sampai dengan 10 Januari 2017.

2.2. Alat Pendukung

Alat pendukung yang digunakan dalam penelitian ini adalah sebagai berikut:
a. Perangkat keras
 Perangkat laptop ASUS dengan spesifikasi Processor Intel (R) Core (TM) i3-
2370M CPU @ 2.40 GHz, Harddisk 500 GB, RAM 2.00 GB, OS Windows 8.1 Pro
32 bit

b. Perangkat lunak
 Matlab R2012a sebagai text editor source code
 Microsoft Word sebagai text editor penulisan paper.

2.3. Tahapan Penelitian

Dalam membuat paper ini dilakukan studi pustaka dan metode eksperimental. Tahapan
penelitian dapat digambarkan melalui flowchart di bawah ini.
2.4. Metode Penelitian

Metode yang digunakan selama dilakukan penelitian adalah metode PCA dan Euclidean
distance. Berikut ini adalah penjelasan dari kedua metode.

2.4.1. PCA

PCA adalah suatu metode yang melibatkan prosedur matematika yang mengubah dan
mentransformasikan sejumlah besar variabel yang berkorelasi menjadi sejumlah kecil
variabel yang tidak berkorelasi, tanpa menghilangkan informasi penting di dalamnya.
PCA banyak digunakan untuk memproyeksikan atau mengubah suatu kumpulan data
berukuran besar menjadi bentuk sajian data dengan ukuran yang lebih kecil.
Transformasi PCA terhadap sebuah ruang data yang besar akan menghasilkan sejumlah
vektor basis ortonormal dalam bentuk kumpulan vektor eigen dari suatu matriks
kovarian tertentu yang dapat secara optimal menyajikan distribusi data. Sasaran dari
PCA pada penelitian ini adalah menangkap variasi total dari citra ikan-ikan yang ada di
dalam basis data yang dilatihkan. Untuk kemudian mereduksinya sehingga menjadi
variabel-variabel yang lebih sedikit. Dengan mereduksi sehingga dimensinya menjadi
lebih kecil, maka vektor mana yang harus direduksi dan mana yang tidak direduksi
dapat ditentukan dengan mengurutkan nilai eigen terbesar ke nilai eigen terkecil dan
vektor eigennya diurutkan sesuai dengan nilai eigen yang bersangkutan. Vektor yang
direduksi adalah vektor yang mempunyai nilai eigen yang kecil, karena nilai eigen yang
kecil menandakan informasi yang dibawa tidaklah seberapa penting, sehingga dapat
direduksi tanpa mempengaruhi ruang citra [2].

Secara singkat langkah-langkah dari proses pembentukan ruang eigen menggunakan


PCA adalah sebagai berikut:

1. Misalnya, terdapat sejumlah n citra.

X  x1 x2  xn 

2. Menghitung citra rata-rata dari matriks X dengan persamaan sebagai berikut.

3. Mengurangi matriks X dengan citra rata-rata, sehingga didapatkan matriks Y


sebagai berikut.

4. Menentukan matriks kovarians C dengan dimensim x m , yaitu jumlah piksel x


jumlah piksel sebagai berikut.
5. Mencari nilai eigen dan vektor eigen dari C sehingga memenuhi persamaan:

C . b = .b

6. 
Jika e1 e2  e M  dan 1 2  M adalah PCA atau vektor eigen dan nilai
eigen dari matriks kovarians C maka harga e dapat dihitung dari  hasil langkah 6.

 Menentukan jumlah vector eigen em berdasarkan nilai ambang, yaitu dengan
mengambil sejumlah tertentu dari vektor eigen e [2].

2.4.2. Euclidean Distance

Setelah didapatkan vektor ciri dari citra uji, maka proses selanjutnya adalah
membandingkan vektor ciri dari citra uji dengan vektor ciri citra latih. Perbandingan
tersebut dapat dilakukan dengan cara menghitung jarak euclidean (euclidean distance),
yang merupakan selisih nilai piksel antara 2 vektor tersebut. Jarak euclidean adalah akar
dari jumlah selisih kuadrat antara 2 vektor, dan secara matematis dapat dirumuskan:

Keterangan :

de : jarak euclidean
fdi : bobot citra pelatihan
kj : data bobot test
m : jumlah data pelatihan [2].

2.5. Tahap Pengembangan Sistem

Tahapan dalam pengembangan sistem dapat digambarkan seperti pada diagram berikut.
3. Pembahasan

Dataset yang digunakan pada penelitian ini adalah data gambar yang berjumlah 200
foto, dimana 100 foto adalah data foto ikan layang, dan 100 foto lainnya adalah data
foto ikan tongkol. Dataset diambil dengan menggunakan kamera ponsel berkemampuan
8 megapixel. Setelah foto diambil, maka langkah selanjutnya adalah meng-cropping
gambar untuk diberi background warna dasar putih. Setelah itu, semua foto di-resize ke
ukuran 225 x 232 pixel. Setelah semua foto memiliki ukuran yang sama, m aka langkah
selanjutnya adalah menjadikan foto ke dalam citra grayscale dengan tujuan untuk
mereduksi ukuran dimensi gambar saat proses ekstraksi ciri menggunakan PCA. Berikut
ini merupakan tahapan gambar yang dihasilkan dari tahap praproses.

Gambar 3.1 Hasil Foto

Gambar 3.2 Hasil Cropping

Gambar 3.3 Hasil Resize

Gambar 3.4 Hasil Grayscale

Setelah tahap praproses dilakukan maka langkah selajutnya adalah tahap ekstraksi fitur
dengan menggunakan PCA dan tahap pengujian. Pada tahap pengujian, diberikan
sebuah skenario dimana dari 200 dataset dibagi menjadi 70% untuk data latih dan 30%
untuk data uji. Hal pertama yang perlu dilakukan adalah mengatur direktori tempat data
latih dan data uji berada, selanjutnya sistem akan mulai melakukan klasifikasi. Dalam
proses pengklasifikasian tersebut, sistem akan memberikan sebuah pertanyaan apakah
gambar yang ditampilkan oleh sistem mirip dengan data uji yang telah diatur
sebelumnya. Pemberian pertanyaan ditujukan untuk mengetahui keakuratan sistem
dalam mengklasifikasi, sehingga pada hasil akhirnya akan diberikan jumlah persentase
keakuratan sistem. Berikut merupakan tampilan sistem.

Gambar 3.5 Tampilan Interface Sistem

Pada tampilan program, diketahui bahwa nilai akurasi yang diperoleh adalah sebesar
91,67% dengan empat kali kesalahan data prediksi. Nilai akurasi sendiri diperoleh dari
perhitungan jumlah seluruh dataset dibagi dengan jumlah kesalahan data prediksi lalu
dikali 100.

Selain menampilkan akurasi, sistem juga menampilkan nilai Euclidean Distance dan
data prediksi untuk setiap data uji. Berikut ini adalah tabel hasil pengujian 60 data set
yang dijadikan data uji.

Hasil
Data Uji Kesimpulan
Euclidean Distance Data Prediksi
Data ke-1 3.574 Data ke-34 Cocok
Data ke-2 6.865 Data ke-62 Cocok
Data ke-3 3.234 Data ke-47 Cocok
Data ke-4 4.941 Data ke-15 Cocok
Data ke-5 5.480 Data ke-43 Cocok
Data ke-6 7.648 Data ke-22 Cocok
Data ke-7 5.724 Data ke-65 Cocok
Data ke-8 5.716 Data ke-61 Cocok
Data ke-9 2.928 Data ke-8 Cocok
Data ke-10 6.425 Data ke-9 Cocok
Data ke-11 7.453 Data ke-31 Cocok
Data ke-12 3.512 Data ke-70 Cocok
Hasil
Data Uji Kesimpulan
Euclidean Distance Data Prediksi
Data ke-13 9.866 Data ke-67 Cocok
Data ke-14 8.088 Data ke-70 Cocok
Data ke-15 8.311 Data ke-21 Cocok
Data ke-16 2.117 Data ke-47 Cocok
Data ke-17 3.817 Data ke-34 Cocok
Data ke-18 3.469 Data ke-8 Cocok
Data ke-19 3.657 Data ke-34 Cocok
Data ke-20 7.319 Data ke-31 Cocok
Data ke-21 5.751 Data ke-78 Tidak Cocok
Data ke-22 7.273 Data ke-43 Cocok
Data ke-23 6.845 Data ke-61 Cocok
Data ke-24 5.598 Data ke-64 Cocok
Data ke-25 8.599 Data ke-43 Cocok
Data ke-26 3.487 Data ke-42 Cocok
Data ke-27 7.462 Data ke-36 Cocok
Data ke-28 7.263 Data ke-31 Cocok
Data ke-29 7.393 Data ke-87 Tidak Cocok
Data ke-30 4.113 Data ke-64 Cocok
Data ke-31 6.156 Data ke-139 Cocok
Data ke-32 1.980 Data ke-123 Cocok
Data ke-33 6.137 Data ke-89 Cocok
Data ke-34 4.564 Data ke-138 Cocok
Data ke-35 5.171 Data ke-81 Cocok
Data ke-36 6.131 Data ke-121 Cocok
Data ke-37 5.640 Data ke-139 Cocok
Data ke-38 4.255 Data ke-82 Cocok
Data ke-39 3.542 Data ke-82 Cocok
Data ke-40 5.639 Data ke-23 Tidak Cocok
Data ke-41 3.515 Data ke-139 Cocok
Data ke-42 5.235 Data ke-113 Cocok
Data ke-43 3.273 Data ke-133 Cocok
Data ke-44 5.740 Data ke-135 Cocok
Data ke-45 2.967 Data ke-134 Cocok
Data ke-46 4.508 Data ke-133 Cocok
Data ke-47 3.162 Data ke-85 Cocok
Data ke-48 2.626 Data ke-122 Cocok
Data ke-49 5.032 Data ke-116 Cocok
Data ke-50 4.639 Data ke-113 Cocok
Data ke-51 2.558 Data ke-96 Cocok
Data ke-52 4.958 Data ke-90 Cocok
Data ke-53 5.274 Data ke-128 Cocok
Hasil
Data Uji Kesimpulan
Euclidean Distance Data Prediksi
Data ke-54 5.379 Data ke-128 Cocok
Data ke-55 6.648 Data ke-95 Cocok
Data ke-56 5.520 Data ke-130 Cocok
Data ke-57 8.563 Data ke-127 Cocok
Data ke-58 3.272 Data ke-128 Cocok
Data ke-59 3.209 Data ke-20 Tidak Cocok
Data ke-60 5.594 Data ke-49 Tidak Cocok

5. Kesimpulan

Dari hasil dan pembahasan yang dibahas sebelumnya, didapat kesimpulan bahwa:
1. Tahap praproses dimulai dari cropping, resize, lalu konversi ke grayscale.
2. Dataset yang digunakan berupa gambar ikan layang dan ikan tongkol yang difoto
dengan menggunakan kamera digital.
3. Dataset berjumlah 200 data dan berdasarkan metode holdout 70:30, data dibagi
menjadi 140 data latih dan 60 data uji.
4. Program dengan metode PCA bekerja dengan sangat baik, dimana hasil akurasi
mencapai nilai 91,67%
5. Semakin banyak data latih yang digunakan maka semakin baik persen tasi
keakuratan program dalam mengklasifikasi.
6. Faktor ciri-ciri ikan juga berpengaruh penting dalam sistem pengenalan, artinya
setiap jenis ikan semakin banyak ciri-ciri yang dominan, hasil pengenalan akan
semakin akurat.

6. Ucapan Terima Kasih


Dalam pembuatan paper ini banyak pihak yang membantu penulis sehingga dapat
menyelesaikan paper ini, untuk itu Penulis mengucapkan terimakasih kepada:
a. Tuhan Yang Maha Esa yang telah memberikan kesehatan dan kelancaran kepada
penulis sehingga dapat menyelesaikan paper ini.
b. Orang tua yang telah memberikan dukungan kepada penulis untuk menyelesaikan
paper ini.
c. Dosen yang telah membimbing penulis dalam menyelesaikan paper ini.

7. Refference
[1] Danar Putra Pamungkas, Fajar Rohman Hariri, Pengenalan Citra Tanda
Tangan Menggunakan Metode 2DPCA dan Euclidean Distance, Seminar
Nasional Teknologi Informasi dan Multimedia 2016 (2016).

[2] Suharto Jati Santoso, Budi Setiyono, R. Rizal Isnanto, Pengenalan Jenis-Jenis
Ikan Menggunakan Metode Analisis Komponen Utama, Fakultas Teknik
Universitas Diponegoro (2011).
[3] Wan Rita Fayetri, T. Efrizal dan Andi Zulfikar, Kajian Analitik Stok Ikan
Tongkol (Euthynnus affinis) Berbasis Data Panjang Berat yang Didaratkan di
Tempat Pendaratan Ikan Pasar Sedanau Kabupaten Natuna, Faculty of Marine
Science and Fisheries Maritime Raja Ali Haji of University (2013).