Anda di halaman 1dari 13

PENGENALAN JENIS TUMBUHAN BERDASARKAN BENTUK DAUN

Ji-Xiang Du, Xiao-Feng Wang, Guo-Jun Zhang


Departemen Otomasi, Universitas Sains dan Teknologi China, Hefei, Anhui
230027, China
Lab Komputasi Cerdas, Institute of Intelligent Machines, Akademi Sains China,
P.O. Kotak 1130, Hefei, Anhui 230031, Tiongkok
Abstrak
Tanaman memiliki banyak kegunaan dalam bahan makanan, obat-obatan dan
industri. Dan itu juga sangat penting untuk perlindungan lingkungan.
Namun, tugas yang penting dan sulit adalah untuk mengenali spesies tanaman di
bumi. Merancang yang nyaman dan otomatis sistem pengenalan tanaman
diperlukan dan berguna karena dapat memfasilitasi tanaman pengklasifikasian
cepat, dan pemahaman dan mengelola mereka. Dalam makalah ini, database daun
dari tanaman yang berbeda pertama kali dibangun. Kemudian, metode klasifikasi
baru, disebut sebagai pusat median bergerak (MMC) pengklasifikasi hypersphere,
untuk database daun berdasarkan morfologi digital fitur diusulkan. Metode yang
diusulkan lebih kuat daripada yang didasarkan pada fitur kontur sejak yang
signifikan titik kelengkungan sulit ditemukan. Akhirnya, efisiensi dan efektivitas
metode yang diusulkan dalam mengenali yang berbeda tanaman ditunjukkan oleh
eksperimen.
Kata Kunci: Fitur morfologi digital; Pengakuan tanaman; Database daun;
Hypersphere classifier

1. Latar Belakang
Tanaman adalah hal yang sangat penting bagi kehidupan dan perkembangan
manusia. Semua di dunia, saat ini ada sekitar 310000-420000 spesies tanaman
yang diketahui, dan banyak yang masih belum diketahui namun.
Saat ini, taksonomi tanaman biasanya mengadopsi metode klasifikasi tradisional.
Dan sejauh ini banyak klasifikasi lainnya metode, seperti anatomi morfologi,
biologi sel, biologi molekul, fitokimia, juga telah digunakan. Metode-metode ini
sangat berhubungan dengan biologi dan kimia. Meski demikian, akuisisi data
yang dibutuhkan dari tubuh atau spesimen hidup tanaman secara langsung dan
otomatis oleh komputer belum dilaksanakan.
Dengan memburuknya lingkungan, semakin banyak spesies tanaman langka
berada di ambang kepunahan. Banyak tanaman langka yang mati. Saat ini, ada
sekitar 22–47% spesies tumbuhan dari semua tanaman yang diketahui yang
terancam punah, dimana ada sekitar 100.000–15.000 tanaman yang mungkin akan
mati dalam waktu singkat. Begitu, perlu dan mendesak bagi kami untuk membuat
basis data bio-diversity dengan teknologi informasi sesegera mungkin.
Sejak beberapa dekade terakhir, pemrosesan gambar digital, analisis gambar dan
visi mesin telah dikembangkan dengan tajam, dan telah menjadi bagian yang
sangat penting dari kecerdasan buatan dan antarmuka antara manusia dan mesin
grounded theory dan teknologi terapan. Teknologi ini telah diterapkan secara luas
dalam industri dan kedokteran, tetapi jarang di dunia yang terkait dengan
pertanian.
Pekerjaan penelitian kami dalam makalah ini adalah memperkenalkan teori
pengolahan citra digital ke dalam taksonomi numerik dalam botani. Umumnya,
fitur morfologi digital paling konvensional dan banyak digunakan. Jadi ini
Metode ekstraksi fitur yang efisien diadopsi dalam makalah ini. Dengan
menghitung fitur morfologi digital dari beberapa jenis spesies tumbuhan,
tumbuhan dapat diklasifikasikan secara otomatis.
Makalah ini disusun sebagai berikut: Bagian 2 memperkenalkan metode pre
processing akuisisi gambar. Di Bagian 3, metode ekstraksi fitur morfologi digital
dijelaskan dan dibahas. Bagian 4 menyajikan prinsip dasar dari sentra pemindahan
pusat median baru (MMC) hipersfer. Eksperimen Hasilnya disajikan dalam
Bagian 5, dan Bagian 6 menyimpulkan keseluruhan makalah dan memberikan
kesimpulan terkait.

2. Pengambilan gambar dan pra pemrosesan


Pada bagian ini, kami memperkenalkan cara memperoleh daun tanaman dan
menyajikan prosedur pra pemrosesan pada tanaman daun. Hal ini sangat
diperlukan untuk karya ekstraksi fitur morfologi digital daun tanaman.
2.1. Akuisisi daun tanaman
Tanaman biasanya dapat diidentifikasi sesuai dengan bentuk, warna, tekstur dan
struktur daunnya, kulit kayu, bunga, semai dan morf. Namun, sangat sulit bagi
orang untuk menganalisis bentuk bunga, semai dan morph tanaman untuk struktur
3D mereka yang rumit jika hanya didasarkan pada gambar 2D. Jadi dalam
penelitian kami, kami akan mengidentifikasi tanaman yang berbeda fitur daun.
Daun biasanya berkelompok - kelompok sehingga tidak mudah bagi kita untuk
secara otomatis ekstrak fitur daun dari latar belakang yang rumit. Database
gambar daun digunakan sebagai berikut eksperimen dikumpulkan dan dibangun
sendiri di laboratorium kami. Prosedurnya adalah kita memetik daunnya, letakkan
di pemindai, lalu ambil gambar warna digital daun secara langsung, atau letakkan
di panel, ambil gambar warna digital daun dengan kamera digital. Dengan cara
ini, kita bisa mendapatkan gambar hanya termasuk satu daun, dan latar belakang
gambar daun akan menjadi buram.
Database ini mencakup 20 spesies tanaman yang berbeda. Setiap spesies
mencakup 20 gambar sampel. Maka di sana benar-benar 400 gambar dengan
database. Gambar sampel yang representatif untuk 20 spesies dalam database
ditunjukkan dalam Gambar. 1 dan 2.
2.2. Pemrosesan preprocessing citra daun
Warna daun tanaman biasanya berwarna hijau (seperti ditunjukkan pada Gambar.
3 (a)). Apalagi nuansa dan keragaman perubahan air, nutrisi, atmosfer dan musim
dapat menyebabkan perubahan warna, sehingga fitur warna menjadi rendah.
Dengan demikian, kami memutuskan untuk mengenali berbagai tanaman dengan
gambar daun berlevel abu-abu (seperti ditunjukkan pada Gambar 3 (b)), sementara
mengabaikan informasi warna.
Akibatnya, hanya komponen Gray untuk setiap piksel dihitung dari gambar warna
dengan

di mana R, G, B sesuai dengan warna pixel [8,9], masing-masing.


Persegi panjang bunga (ROI) dari gambar daun harus mencakup semua piksel
nilai abu-abu mereka lebih kecil dari ambang tertentu, maka gambar biner daun
seperti yang ditunjukkan pada Gambar. 3 (c) didapat. Dalam penelitian kami,
ambang batasnya secara otomatis mendapat sesuai dengan histogram dari gambar
abu-abu daun. Maka kontur daun dapat diekstraksi dari citra biner oleh operator
morfologi matematika (seperti ditunjukkan pada Gambar. 3 (d))

3. Ekstraksi fitur morfologi digital


Pada bagian ini, kami memperkenalkan cara mengekstrak fitur morfologi digital.
Fitur-fitur tersebut diambil dari kontur daun. Fitur morfologi digital (DMF)
umumnya termasuk fitur geometri (GF) dan fitur momen tak berubah (MF). Fitur
geometris terdiri dari aspek rasio, persegi panjang, luas rasio konveksitas, rasio
perimeter konveksitas, kebulatan, bundar, eksentrisitas dan faktor bentuk, dll.
3.1. Rasio aspek
Rasio aspek adalah rasio antara panjang maksimum Dmax dan panjang minimum
Dmin minimum bounding rectangle (MBR)
Dmax
AR = Dmin

3.2. Rectangularity
The persegi panjang, mewakili rasio area ROI dan area MBR, dihitung oleh
A ROI
R = Dmax x Dmin

3.3. Rasio luas lambung cembung


Rasio luas dari convex hull, mewakili rasio area ROI AROI dan convex hull area
AC, adalah dihitung oleh
𝐴 𝑅𝑂𝐼
CA = Ac

3.4. Perimeter rasio cembung cembung


Perimeter rasio cembung cembung, mewakili rasio ROI perimeter PROI dan
lambung cembung perimeter PC, dihitung oleh
P ROI
CP = Pc

3,5. Kebulatan
kebulatan didefinisikan sebagai
ri
S = rc

3.6. Bentuk bundar


Circularitas didefinisikan oleh semua titik-titik pembatas dari ROI
μR
C = σR

di mana μR adalah jarak rata-rata antara pusat ROI dan semua poin yang
membatasi, dan σR adalah deviasi rata-rata kuadrat dari jarak rata-rata:

3.7. Keanehan
Eksentrisitas didefinisikan sebagai rasio panjang sumbu inersia utama dari ROI
EA dengan panjang sumbu inersia minor dari ROI EB
EA
E = EB

3.8. Faktor bentuk


Faktor bentuk adalah bentuk deskripsi karakteristik populer independen dari
transformasi linear yang diberikan oleh
4πA ROI
F= P^2 ROI
The convex hull, elips, MBR dan incircle dan excircle dari ROI daun ditunjukkan
pada Gambar. 4.
3.9. Saat-saat invarian
Selain fitur di atas, momen juga banyak digunakan sebagai fitur untuk pemrosesan
dan klasifikasi gambar, yang memberikan makna yang lebih geometris dan intuitif
daripada fitur morfologis. Itu Hu yang pertama kali menetapkan dasar
matematika untuk invariants momen dua dimensi.

Hu mendefinisikan tujuh momen invarian dihitung dari momen tengah melalui


pesanan tiga yang juga invariant di bawah objek terjemahan, skala dan rotasi.
Dengan demikian, kami mempertimbangkan untuk menggunakan invariants sesaat
Hu ini sebagai klasifikasi fitur dalam makalah ini. Nilai-nilai mereka dapat
dihitung dari kontur menggunakan momen Chen yang ditingkatkan sebagai
berikut:
Peningkatan orde geometrik Chen dari pesanan (p + q) didefinisikan sebagai
4. klasifikasi MMC hipersfer
4.1. Algoritma MMC
Ide dasar MMC adalah bahwa setiap kelas pola dianggap sebagai rangkaian
'‘hyperspheres’ ’, yang diperlakukan sebagai satu set 'titik' 'dalam pendekatan
konvensional. Langkah pertama MMC adalah menghitung median
multidimensional dari titik-titik kelas yang dipertimbangkan, atur pusat awal
sebagai titik itu paling dekat dengan median itu, temukan radius maksimum yang
dapat mencakup poin-poin kelas. Melalui tertentu iterasi kita menghilangkan
pusat dari hypersphere dengan cara yang akan memperbesar hypersphere dan
memilikinya mencakup sebanyak mungkin poin. Ini dilakukan dengan memiliki
pusat ‘‘ hop ’dari satu titik data ke titik yang berdekatan. Begitu kita menemukan
kemungkinan hypersphere terbesar, titik-titik di dalam hypersphere ini
dihapus, dan seluruh prosedur diulang untuk poin yang tersisa dari kelas. Kami
terus berlanjut sampai semua poin dari kelas itu ditutupi oleh beberapa
hyperspheres. Pada titik itu, kami menangani poin dari kelas berikutnya
dengan cara yang sama. Langkah terakhir adalah untuk menghapus hyperspheres
berlebihan, yang benar-benar dicakup oleh hipersfer yang lebih besar. Langkah-
langkah rinci dari algoritma dinyatakan sebagai berikut:
Langkah 1: Tentukan K = 1, C = 1, S = semua titik dari kelas C.
Langkah 2: Temukan median titik-titik S.
Langkah 3: Pilih titik terdekat Py ke median itu sebagai pusat awal hypersphere
K.
Langkah 4: Temukan titik terdekat Pz dari kelas yang berbeda dari pusat, dan
biarkan D1 menjadi jarak antara Py dan Pz.
Langkah 5: Temukan titik terjauh dari kelas yang sama di dalam hypersphere
radius D1 ke pusat. Biarkan D2 menjadi jarak dari pusat ke titik terjauh itu.
Langkah 6: Atur radius hypersphere K as (D1 + D2) / 2.
Langkah 7: Cari di antara titik E terdekat dari kelas C yang sama yang berada di
arah negatif dengan hormat ke arah Pz-Py. Tujuannya adalah memindahkan pusat
ke titik baru untuk memperbesar hipersfer. Intinya, yang memiliki arah paling
negatif, dipilih untuk menggantikan Py sebagai pusat baru.
Langkah 8: Jika tidak ada titik dalam arah negatif yang bisa kita pindahkan,
hipersphere K telah selesai, lain ulangi langkah 5–7.
Langkah 9: Hapus poin yang dicakup oleh hipersphere K dari S.
Langkah 10: Tentukan K = K + 1. Jika S bukan langkah ulangi kosong 2–9, yang
lain atur C = C + 1, dan operasikan pada kelas baru dengan menjalankan langkah
1–9.
4.2. Tahap klasifikasi MMC
Setelah pelatihan MMC selesai, setiap titik data yang diberikan dapat
diklasifikasikan oleh MMC. Kita punya dipilih untuk menggunakan jarak ke
permukaan luar dari hypersphere sebagai kriteria pemilihan. Jika intinya
berada di dalam hypersphere, jaraknya akan negatif. Khususnya, untuk
mendapatkan informasi kelas untuk masukan apa pun sampel, kami melakukan
langkah-langkah berikut:
• Hitung jarak Di antara titik data dan pusat dari masing-masing hi hypersphere.
• Indeks untuk tetangga terdekat Hypersphere Iq dipilih sebagai

dimana H adalah jumlah total hyperspheres, Ri adalah radius hypersphere Hi.


4.3. Data preprocessing untuk aplikasi MMC untuk menanam pengakuan
Fitur digital yang diekstraksi dari daun tanaman biasanya memiliki kisaran besar
dalam nilai numerik, kita harus menormalkan semua elemen dalam vektor fitur ke
yang baru sebagai berikut:

di mana Xij adalah elemen ke-j dari fitur vektor Xi, θjMax adalah nilai maksimum
elemen jth dari semua vektor dari kelas yang berbeda dan θjMin adalah nilai
minimum dari elemen ke-j dari semua vektor dari kelas yang berbeda.
Data biasanya mengandung suara, yang menghasilkan sampel tumpang tindih
dalam ruang pola, dan mungkin ada menghasilkan beberapa outlier dalam
kumpulan data pelatihan. Jadi kita perlu menghilangkan pencilan ini dari set data
pelatihan bahwa batas keputusan yang lebih baik dapat dengan mudah dibentuk.
Kami di sini menerapkan metode Wilson Editing untuk menghapusnya
poin yang tidak setuju dengan mayoritas tetangga terdekat mereka.

5. Hasil eksperimen
Percobaan dirancang untuk mengklasifikasikan setiap gambar tes ke dalam satu
kelas. Karena semua gambar daun diambil oleh diri kita sendiri, kelas sejati
mereka diketahui. Dalam percobaan kami, kami mengenali pabrik oleh classifier
MMC. Kami juga melakukan perbandingan kinerja dari classifier MMC dengan
tetangga terdekat (1-NN) metode dan metode k-NN.
Pertama, kami memilih sepuluh sampel sebagai sampel pelatihan, dan sisanya
digunakan sebagai sampel pengujian. Gambar. 5 menunjukkan histogram dari
radiografi hypersphere dari sampel pelatihan, dan tingkat klasifikasi yang benar
dari setiap

kelas ditunjukkan pada Gambar. 6. Akibatnya, waktu pelatihan dikonsumsi dari


MMC, waktu klasifikasi, nomor vektor penyimpanan dan rata-rata tingkat
pengenalan yang benar untuk ketiga pengklasifikasi dapat diperoleh, masing-
masing, seperti yang ditunjukkan pada Tabel 1.
Untuk melakukan perbandingan kinerja lebih, kami memilih i (i = 1,2,3..., 19)
sampel sebagai data pelatihan, lalu sisanya (20 - I) adalah sebagai data uji.
Hasilnya masing-masing ditampilkan dalam Gambar. 6–11.
Dari Tabel 1 Gambar. 7 dan 9, dapat dilihat bahwa nomor vektor penyimpanan
untuk yang pertama lebih kecil dari untuk yang terakhir dua dan tingkat
pengenalan yang benar untuk MMC sedikit lebih rendah daripada yang lain.
Gambar 8 menunjukkan bahwa waktu klasifikasi yang dikonsumsi untuk MMC
lebih pendek dari yang untuk 1-NN dan 4-NN pengklasifikasi. Meskipun waktu
pelatihan MMC dekat dengan salah satu classifier 1-NN, pelatihan MMC hanya
sekali selesai untuk memberikan contoh pelatihan. Gambar. 10 menunjukkan
bahwa morfologi digital fitur yang kami ekstrak efisien untuk pengenalan
tanaman. Ketika sampel pelatihan setiap kelas akan terlampaui tiga sampel,
tingkat pengenalan yang benar lebih besar dari 75%. Selain itu, dapat dilihat
bahwa jumlah poin bergerak E memiliki efek pada tingkat pengenalan (seperti
yang ditunjukkan pada Gambar. 11), tetapi efek ini lebih tipis daripada efek dari k
pada classifier k-NN (seperti ditunjukkan pada Gambar. 12). Oleh karena itu,
dapat disimpulkan bahwa ketika ada sejumlah besar sampel, pemecah hipersfer
MMC adalah kandidat yang lebih disukai daripada 1-NN dan pengklasifikasi k-
NN.
6. Kesimpulan
Dalam tulisan ini, fitur pengenalan otomatis berbasis morfologi digital untuk
gambar tanaman adalah diusulkan dan dilakukan. Lima belas fitur digunakan
untuk mengklasifikasikan 20 spesies daun tanaman. Sebagai tambahan pusat
median hipersfer yang bergerak baru diadopsi untuk melakukan klasifikasi. Hasil
eksperimen menunjukkan bahwa metode yang diusulkan efektif dan efisien.
Secara khusus, dengan membandingkan dengan Klasifikasi 1-NN dan k-NN,
dapat ditemukan bahwa classifier MMC tidak hanya dapat menghemat ruang
penyimpanan tetapi juga mengurangi waktu klasifikasi di bawah kasus tidak
mengorbankan akurasi klasifikasi.

Anda mungkin juga menyukai