dengan
LW-Swin Transformator
Shizhong Yang , Wei Wang , Sheng Gao * , Zhaopeng Deng
Sekolah dari Informasi Dan Kontrol Rekayasa, Qingdao Universitas dari Teknologi, Qingdao 266520, Cina
A R T SAYA C L E SAYA
N F HAI A B S T R A C T
Kata kunci:
Stroberi Mengidentifikasi kematangan stroberi dapat menjadi tantangan karena lingkungan pertumbuhannya yang
LW-Swin Transformator kompleks, campur tangan ence dari intensitas cahaya, dan naungan yang disebabkan oleh agregasi stroberi.
Kematangan deteksi Untuk mengatasi permasalahan tersebut, penelitian ini Mengidentifikasi kematangan stroberi dapat menjadi
LS-YOLOv8s tantangan karena lingkungan pertumbuhannya yang kompleks, campur tangan ence dari intensitas cahaya, dan
Sisa jaringan naungan yang disebabkan oleh agregasi stroberi. . Penelitian ini mengusulkan sebuah novel Model LS-YOLOv8s
untuk mendeteksi dan menilai kematangan stroberi, yang didasarkan pada kedalaman YOLOv8s sedang belajar
algoritma dan menggabungkan LW-Swin Transformator modul. Ke memperbaiki itu pertunjukan dari itu model,
dua baru acak variabel adalah diperkenalkan di dalam itu kontras peningkatan proses ke kontrol itu efek
peningkatan. Kumpulan data diperluas dari 1089 menjadi 7515 gambar, yang meningkatkan keragaman data dan
mengurangi risiko penyesuaian model yang berlebihan. Selain itu, modul Swin Transformer telah ditambahkan
ke TopDown Layer2 selama tahap penggabungan fitur untuk menangkap ketergantungan jarak jauh dalam data
masukan dan meningkatkan kemampuan generalisasi model dengan menggunakan mekanisme perhatian
mandiri multi-kepala. Terakhir, jaringan fusi fitur yang lebih efisien dicapai dengan memperkenalkan jaringan
sisa dengan pembelajaran parameter Dan berskala normalisasi ke dalam itu asli sisa struktur dari itu Babi
Transformator. Ke evaluasi itu efektivitas LS-YOLOv8s untuk mendeteksi kematangan stroberi, kami
mengumpulkan kumpulan data gambar stroberi dari dasar penanaman stroberi. Kumpulan data dipecah
menggunakan pendekatan validasi silang 5 kali lipat, yang meningkatkan kualitas model evaluasi proses.
Eksperimental _ _ hasil menunjukkan itu LS-YOLOv8s lebih baik dibandingkan lainnya model, dengan A 1.6 %,
33.5 %, Dan 3.4 % peningkatan di dalam peta0.5 pada itu validasi mengatur dibandingkan ke YOLOv5,
PusatNet, Dan SSD,
masing-masing. Selain itu, LS-YOLOv8 mencapai presisi dan kecepatan deteksi yang lebih baik dibandingkan
YOLOv8m saja sekitar 51,93 % dari jumlah parameter yang digunakan, mencapai presisi deteksi 94,4 % dan
19,23FPS deteksi kecepatan, meningkat sebesar 0,5 % dan 6,56fps, masing-masing. Model LS-YOLOv8s dapat
memberikan keandalan dukungan teoritis untuk mendeteksi target stroberi, mengevaluasi kematangannya, dan
mengotomatisasi stroberi pemetikan proses untuk kebun buah-buahan pengelolaan.
1. Perkenalan
dan pelacakan target melalui model algoritmik. Objek tradisional metode
Pesatnya perkembangan teknologi computer vision telah deteksi menggunakan beberapa jendela geser untuk melintasi gambar
membuat deteksi objek salah satu bidang yang paling menjanjikan untuk Himpunan data, ekstrak fitur, Dan kereta A penggolong ke mengenali itu
aplikasi. Obyek deteksi sudah banyak digunakan dalam berbagai aplikasi target gambar. Mao dan He (2020) mengusulkan penggabungan penyakit
sehari-hari kehidupan, seperti pengawasan keamanan, mengemudi jagung multi-fitur pengakuan algoritma menggabungkan SVM pengakuan
otonom, dan adegan drone analisis ( Jiao et al., 2019 ). Strawberry ketepatan Dan efek pengenalan pada fitur tunggal untuk gambar penyakit
merupakan buah yang kaya akan nutrisi nilai dan fitokimia bermanfaat, daun jagung, dan itu rata-rata presisi dari ini model untuk itu
menyediakan nutrisi penting bagi tubuh manusia ( Yang et al., 2023 ). pengakuan dari tiga penyakit jagung sebesar 93,33%. Untuk pengenalan
Penerapan visi komputer teknologi untuk mengidentifikasi stroberi ( citra penyakit tomat secara kompleks lingkungan, Yang dkk. (2021)
Hu et al., 2022 ) memiliki potensi yang luas untuk digunakan, dan juga mengusulkan CCL-SVM berbasis SVM untuk tomat daun gambar penyakit
memberikan dukungan teoritis untuk pengambilan robot stroberi ( pengakuan di dalam kompleks lingkungan menggabungkan fitur tekstur
Yang et Al., 2023 ). warna untuk tiga hama dan penyakit umum tomat, dengan sebuah
Obyek deteksi adalah A teknik itu memungkinkan waktu keseluruhan pengakuan kecepatan dari 97,5 % ketika mengurangi
sebenarnya pengakuan komputasi upaya. Zhang et Al. (2014) diajukan A metode untuk
* Sesuai pengarang.
Surel alamat: ysz X lj@126.com (S. Yang), 1787899973@qq.com (W. Wang), gaosheng@qut.edu.cn (S. Gao), dengzhaopeng@qut.edu.cn (Z. Deng).
https://doi.org/10.1016/j.compag.2023.108360
Diterima 5 Juni 2023; Diterima di dalam diperbaiki membentuk 7 September 2023; Diterima 23 Oktober 2023
Tersedia on line 4 November 2023
0168-1699/© 2023 Elsevier BV Semua hak disimpan.
S. Yang et Computers and Electronics in Agriculture 215 (2023)
secara otomatis penilaian buah kematangan Dan kualitas menggunakan 90%, dan itu deteksi kecepatan Juga puas otomatis Dan efisien mesin
buah warna perbedaan- kesimpulan. Itu metode menentukan itu pemetikan. Li dkk. (2019) mengubah jaringan tulang punggung aslinya
frekuensi oleh menganalisa A dua- dimensi warna histogram untuk model deteksi objek SSD ke jaringan sisa yang dalam untuk mencapai real-
setiap nilai Dan memproyeksikan itu memasukkan warna ke indeks klasifikasi waktu dan deteksi jeruk dengan presisi rata-rata dari 87,89%,
warna tertentu. Penilaian dicapai dengan menganalisis indeks warna 0,34 % lebih tinggi dari 87,55 % dari asli SSD. Xiang dkk. (2019)
proyeksi belakang yang diperoleh. HASIL eksperimental menunjukkan hal mengembangkan sistem deteksi dan penilaian online berbasis CNN. alat
itu metode ini memiliki akurasi yang tinggi. Algoritme visi tradisional untuk mendeteksi kematangan dua sisi buah mangga. Penelitian ini
yang diandalkan fitur ekstraksi memiliki ditampilkan jelas keterbatasan dirancang A mengatur dari fleksibel berputar mekanika ke meraih
Kapan berurusan dengan tugas data yang kompleks dan berskala besar. tidak merusak berputar
Variasi posisi dan sudut pertumbuhan stroberi, saling oklusi antara
stroberi dan di antaranya stroberi, ranting Dan daun-daun, Dan
perubahan di dalam Petir kondisi Bisa pose tantangan ke itu tepat
deteksi dari stroberi menggunakan tradisional penglihatan algoritma.
Kematangan deteksi di dalam stroberi di dalam- melibatkan perubahan
warna, bentuk, ukuran dan tekstur, sehingga menyulitkan tradisional
metode ke menangkap Dan menganalisa ini berbeda fitur secara
bersamaan, yang mempengaruhi deteksi kematangan yang akurat. Lebih-
lebih lagi, penampilan stroberi sangat bervariasi antar tahap
pertumbuhan dan varietas stroberi, menghasilkan distribusi stroberi
yang kompleks kematangan data itu tradisional fitur ekstraksi Dan
klasifikasi metode berjuang ke secara akurat mengenali. Dalam sedang
belajar saraf bersih- bekerja adalah terlatih lebih tepatnya dibandingkan
diprogram, mengurangi itu membutuhkan untuk luas pakar analisis Dan
mencari setelan. Dalam sedang belajar ditawarkan
besar fleksibilitas di dalam kematangan deteksi Dan lainnya daerah,
memungkinkan
hasil yang lebih baik dapat dicapai tanpa memerlukan pengalaman
budidaya. Untuk alasan ini, deteksi kematangan berbasis pembelajaran
mendalam dipilih makalah ini. Dengan pesatnya perkembangan
pembelajaran mendalam dan pro- pos dari konvolusional saraf jaringan
( LeCun et Al., 2015; Girshick et Al., 2014; Ren et Al., 2017; Redmon et
Al., 2016; Liu et Al., 2016 ), obyek deteksi algoritma memiliki masuk A
baru panggung.
Dalam sedang belajar metode memiliki pernah secara luas digunakan
di dalam pertanian di dalam- inspeksi. Zhang dkk. (2022) mengusulkan
deteksi objek pembelajaran mendalam- metode penghitungan hasil buah
berdasarkan penghitungan buah dan diverifikasi pada a pohon yang
berbuah lebat dapat mencapai penghitungan jumlah buah yang akurat
ketahanan yang baik terhadap cahaya, bayangan, dan ketidaklengkapan.
Goyal dkk. (2022) mengusulkan model deteksi buah dan deteksi kualitas
berdasarkan sistem deteksi objek YOLOv5 untuk pemilahan buah pada
tahap pertama buah deteksi Dan di dalam itu Kedua panggung untuk
kualitas deteksi, dengan A peta sebesar 92,80 % pada tahap pertama dan
99,60 % dan 93,10 % untuk apel dan pisang masing-masing di dalam itu
Kedua panggung. Parico Dan malu (2021) digunakan itu YOLOv4 model
Dan kedalaman penyortiran untuk waktu sebenarnya pir buah deteksi
dan penghitungan untuk penghitung buah pir. Jia dkk. (2022)
mengusulkan sebuah model segmentasi YOLOF-Snake yang efisien untuk
segmentasi buah, dengan secara signifikan meningkatkan akurasi dan
efisiensi segmentasi secara efektif memperluas itu aplikasi dari pertanian
peralatan Dan menyediakan dukungan teoritis untuk segmentasi buah
dan sayuran lainnya. Lagu dan Wang (2022) mengusulkan metode untuk
mengubah Faster R-CNN yang asli jaringan saraf yang sepenuhnya
terhubung menjadi saraf biner yang sepenuhnya konvolusional jaringan.
Ini model tercapai sebuah rata-rata presisi dari 87.5 % di dalam jeruk
daun penyakit gambar pengakuan, Dan itu pengakuan waktu dulu
ditingkatkan
oleh 0,53 detik dibandingkan ke fitur ekstraksi jaringan dari yang asli
Lebih cepat R-CNN. Li et Al. (2020) ditargetkan pahit melon daun
penyakit di dalam alami lingkungan Itu fitur ekstraksi jaringan dari itu
asli Lebih cepat R-CNN dulu tergabung ke dalam A fitur piramida
jaringan untuk deteksi target gambar penyakit daun pare di lingkungan
alam catatan, Dan itu rata-rata presisi dari itu model dicapai 86.39 %.
Zhao dkk. (2019) mengusulkan jaringan saraf konvolusional mendalam
berdasarkan YOLOv3 ke meraih tepat apel pengakuan di dalam kompleks
mengepung- catatan. Rata-rata presisi rata-rata model pelatihan pada
validitas set tanggal sebesar 87,71%, presisi sebesar 97%, recall sebesar
2
S. Yang et Computers and Electronics in Agriculture 215 (2023)
selama berputar. Kekerasan daging digunakan sebagai dasar penilaian jaringan struktur itu ditingkatkan itu pertunjukan berdasarkan pada itu
mengklasifikasikan kematangan buah mangga. Hasil percobaan YOLOv8s model ke meraih lebih baik stroberi kematangan deteksi. Ini
menunjukkan hal itu itu sistem tercapai A kematangan klasifikasi belajar diajukan tiga kunci perbaikan model untuk mendeteksi
ketepatan dari 96,72 %, menghasilkan dapat diandalkan hasil. Li et Al. kematangan stroberi. Pertama, kita dipekerjakan A data augmentasi
(2022) diajukan A komputer penglihatan- algoritma berbasis untuk strategi ke memperluas itu Himpunan data oleh memperkenalkan acak
deteksi PM dan IL daun stroberi dan ditingkatkan model YOLOv4 asli variabel. Ini ditingkatkan itu nomor Dan keberagaman sampel dan
dengan memperkenalkan konvolusi mendalam dan hybrid mekanisme mengurangi risiko kesesuaian model yang berlebihan. Kedua, kita
perhatian. Model terbaik yang ditingkatkan, DAC-YOLOv4, memiliki menambahkan struktur Swin Transformer ke TopDown Layer2 dalam
rata-rata ketepatan perbaikan dari 72.7 % dibandingkan dengan itu asli fitur tersebut fusi panggung, yang ditingkatkan panjang jarak
YOLOv4, Dan memiliki A lebih besar ukuran kompresi. Di dalam ketergantungan pada pemodelan
ketentuan dari waktu sebenarnya deteksi kecepatan, DAC-YOLOv4
mencapai 43 Dan 20 FPS pada itu Jetson Xavier NX Dan Jetson nano
masing-masing, pertemuan itu persyaratan dari itu tertanam platform.
Dengan demikian, DAC-YOLOv4 memiliki Bagus pertunjukan di dalam
deteksi PM daun strawberry dan memberikan solusi efektif secara dini
deteksi dan pencegahan PM stroberi. Wang dkk. (2022) diusulkan A
model ditelepon DSE-YOLO ke mendeteksi multi-tahap stroberi buah-
buahan ke alamat itu masalah dari kecil stroberi ukuran, latar depan
kategori ketidakseimbangan dan lingkungan alam yang kompleks.
Modul DSE digunakan untuk mengekstrak berbagai fitur detail dan
semantik secara horizontal dan vertikal dimensi untuk fokus pada buah
kecil dan meningkatkan akurasi deteksi. Itu masalah ketidakseimbangan
kategori latar depan ditangani oleh konstruksi ing EBCE Dan DEMSE
kehilangan fungsi. E X perimen pada itu Himpunan data menunjukkan
itu DSE-YOLO secara signifikan berkinerja lebih baik mutakhir teknik
dengan F-1 skor nilai-nilai dari ke atas ke 81.59 % Dan peta nilai-nilai
dari 86.58 %, terutama dalam pemandangan alam di mana setiap tahap
buah stroberi dapat ditemukan secara akurat terdeteksi.
Babi Transformator adalah A novel dalam sedang belajar model
dikembangkan oleh Microsoft Riset Asia, digunakan di dalam gambar
pengakuan, alami bahasa pemrosesan dan pemrosesan ucapan. Swin
Transformer mengusulkan sebuah novel terlokalisasi sebelumnya
pengetahuan oleh menggambar pada itu keuntungan dari berbelit-belit-
jaringan saraf nasional dan mekanisme perhatian diri, yaitu
menggunakan sistem self-attention. mekanisme perhatian dalam jendela
kecil untuk menghitung fitur mengurangi kompleksitas komputasi dan
meningkatkan kinerja modelnya ( Baek dan Chung, 2023 ).
Transformator Babi ( Liu dkk., 2021 ) terdiri dari tiga utama modul: A
terlokalisasi sebelumnya pengetahuan modul, A perhatian diri modul
Dan A global A posteriori pengetahuan modul. Lingkungan setempat A
apriori pengetahuan modul adalah itu inti dari itu Babi Transformator
dan mengurangi kompleksitas komputasi dan membaik itu pertunjukan
dari itu model oleh menggunakan A perhatian diri mekanisme dalam
jendela kecil untuk menghitung fitur. Modul perhatian diri adalah
digunakan ke melakukan perhatian diri perhitungan pada itu
memasukkan urutan ke menangkap itu jarak jauh ketergantungan di
dalam itu memasukkan urutan. Itu modul pengetahuan posterior global
digunakan untuk mengekstrak fitur dari seluruh urutan untuk
menangkap informasi global dalam urutan dengan lebih baik.
Dibandingkan ke tradisional konvolusional saraf jaringan, Babi Trans-
yang pertama menawarkan kinerja yang unggul dan kompleksitas
komputasi yang lebih sedikit. Itu Babi Transformator Bisa Juga
menghasilkan fitur dari bervariasi ukuran melalui
berbeda pengumpulan operasi, dengan demikian beradaptasi lebih baik
ke kebutuhan dari aplikasi-
aplikasi di dalam berbeda domain.
Saat ini stroberi kematangan berdasarkan pada penilaian manual,
yang memiliki itu masalah dari besar pribadi subyektif faktor, tidak
konsisten standar Dan tinggi tenaga kerja intensitas. Itu menggunakan
dari komputer penglihatan untuk deteksi kematangan stroberi bisa
memastikan deteksi kematangan yang akurat, yang Bisa lebih baik
membawa keluar tepat waktu pemetikan, menghindari itu limbah dari
stroberi jatuh tempo ke sebelum waktunya pemetikan. Ini membaik itu
kualitas Dan mencicipi dari itu produk. Ini membantu ke mengurangi
itu nomor dari mentah atau terlalu masak stroberi memasuki itu pasar,
meningkat itu komoditas nilai dan daya saing stroberi secara
internasional. Berdasarkan di atas alasan, ini kertas diajukan A baru
3
S. Yang et Computers and Electronics in Agriculture 215 (2023)
4
S. Yang et Computers and Electronics in Agriculture 215 (2023)
Ara. 1. Sebagian Himpunan data menampilkan.
5
S. Yang et Computers and Electronics in Agriculture 215 (2023)
Gambar 2. Struktur jaringan LS-YOLOv8s. Si merah putus-putus bagian dari gambar menunjukkan perbaikan struktur yang diusulkan makalah ini, yang
menggantikan sebelumnya struktur konvolusi dengan Swin Transformer dan meningkatkan struktur sisa sebelumnya dengan memasukkan parameter yang dapat
dipelajari dan normalisasi skala. (Untuk penafsiran dari itu referensi ke warna di dalam ini angka legenda, itu pembaca adalah dirujuk ke itu web Versi: kapan
dari ini artikel.)
untuk mengatur kontras dari itu gambar; β adalah A acak bilangan bulat di
dalam itu jangkauan [8, 12] Dan ini
Meja 1
LS-YOLOv8s jaringan parameter.
Operasi Memasukkan Keluaran Melang Inti
kah
Modul Konv (640.640,3) (320.320.32) 2 (3,3)
Modul Konv (320.320.32) (160.160.64) 2 (3,3)
CSPlayer_2Konv (160.160.64) (160.160.64) 1 (1,1)
Modul Konv (160.160.64) (80,80,128) 2 (3,3)
CSPlayer_2Konv (80,80,128) (80,80,128) 1 (1,1)
Prestasi1 (80,80,128)
Modul Konv (80,80,128) (40,40,256) 2 (3,3)
CSPlayer_2Konv (40,40,256) (40,40,256) 1 (1,1)
Prestasi2 (40,40,256)
Modul Konv (40,40,256) (20,20,512) 2 (3,3)
CSPlayer_2Konv (20,20,512) (20,20,512) 1 (1,1)
SPPF (20,20,512) (20,20,512)
Prestasi3 (20,20,512)
6
S. Yang et Computers and Electronics in Agriculture 215 (2023)
nilai adalah digunakan ke menyesuaikan itu kecerahan dari itu gambar.
Merekam parameter peningkatan data untuk setiap gambar
membantu memastikan itu menggunakan dari berbeda parameter
setiap waktu. Ini metode hasil konsisten hasil dengan lebih sedikit
diperluas data Dan singkat pelatihan waktu dibandingkan dengan
metode sebelumnya yang memerlukan pengaturan peningkatan khusus
parameter ment terlebih dahulu dan menjalankannya secara terpisah.
Gambar 3 ilustrasi- menganalisis data yang diperoleh dengan
menggunakan metode penyempurnaan ini, dimana α dan b dari itu
meja mewakili itu parameter digunakan di dalam Persamaan (1) ke
menyesuaikan itu gambar kontras.
7
S. Yang et Computers and Electronics in Agriculture 215 (2023)
Ara. 3. Acak kontras sebagian Himpunan data menampilkan. (a-1, b-1, c-1) adalah itu asli foto-foto, (a-2, a-3, b-2, b-3, c-2, c-3) adalah data yang
ditingkatkan gambar-gambar.
aktivitas dengan parameter yang dapat dipelajari dan skala normalisasi hasil. Normalisasi di dalam jaringan saraf dapat meningkatkan stabilitas
ke aslinya Babi Transformator. Ini mendekati menggabungkan itu model dan generalisasi, pengalaman memperlambat proses pelatihan, dan
kekuatan dari keduanya ulang- sidual Dan Babi Transformator, meningkatkan akurasi, serta manfaat lainnya. Itu normalisasi rumus
memfasilitasi adaptif sedang belajar dari benar- hubungan di antara fitur. adalah asalkan di bawah:
Dalam sedang belajar teknik menentukan itu pembobotan hasil untuk
aliran data dari jalur yang berbeda, sehingga mengurangi itu dampak
dari berulang fitur.
Itu dua sedang belajar parameter adalah diinisialisasi dengan semua
satu Dan dinormalisasi sebelum tertimbang penjumlahan adalah
dilakukan. Ini penskalaan metode mempertahankan itu relatif
proporsionalitas dari itu asli data, menyederhanakan komputasi, Dan
memungkinkan itu data ke menjadi berskala ke itu [0,1] rentang dengan
membagi setiap nilai dengan jumlah. Selain itu, metode ini adalah tidak
sensitif terhadap nilai outlier, artinya meskipun terdapat anomali di
dalamnya itu data, dia akan bukan secara signifikan memengaruhi itu
8
S. Yang et Computers and Electronics in Agriculture 215 (2023)
dimana: w i -Parameter yang telah dinormalisasi; xi -Tidak dinormalisasi
sedang belajar parameter.
Itu struktur dari itu ditingkatkan Babi Transformator adalah
ditampilkan di dalam Ara. 4 .
3. Hasil
sistem operasi: jendela 10, CPU: Antar (R) Inti (TM) I5-8300H,
GPU: NVIDIA
GeForce GTX 1050Ti, Dalam Sedang belajar Kerangka: PyTorch.
9
S. Yang et Computers and Electronics in Agriculture 215 (2023)
3.2.4. F1 skor
Skor F1, yang merupakan gabungan dari presisi dan perolehan,
digunakan untuk itu mengevaluasi efektivitas deteksi model . Nilai F1
diperoleh dengan cara menghitung rata-rata penjumlahan dari presisi
dan perolehan. Skor F1 yang lebih tinggi menunjukkan lebih baik deteksi
kemampuan dari itu model.
2 × ( presisi ×
mengingat ) presisi + (3)
F1
mengingat
1
S. Yang et Computers and Electronics in Agriculture 215 (2023)
Matriks kebingungan X adalah matriks X dua dimensi yang
menggambarkan ketepatan dari A klasifikasi model di dalam
mengklasifikasikan sampel dari A Himpunan data.