Anda di halaman 1dari 12

Komputer Dan Elektronik di dalam Pertanian 215 (2023) 108360

Contents lists available at ScienceDirect

Computers and Electronics in


Agriculture

Stroberi kematangan deteksi berdasarkan pada YOLOv8 algoritma tergabung

dengan
LW-Swin Transformator
Shizhong Yang , Wei Wang , Sheng Gao * , Zhaopeng Deng
Sekolah dari Informasi Dan Kontrol Rekayasa, Qingdao Universitas dari Teknologi, Qingdao 266520, Cina

A R T SAYA C L E SAYA
N F HAI A B S T R A C T

Kata kunci:
Stroberi Mengidentifikasi kematangan stroberi dapat menjadi tantangan karena lingkungan pertumbuhannya yang
LW-Swin Transformator kompleks, campur tangan ence dari intensitas cahaya, dan naungan yang disebabkan oleh agregasi stroberi.
Kematangan deteksi Untuk mengatasi permasalahan tersebut, penelitian ini Mengidentifikasi kematangan stroberi dapat menjadi
LS-YOLOv8s tantangan karena lingkungan pertumbuhannya yang kompleks, campur tangan ence dari intensitas cahaya, dan
Sisa jaringan naungan yang disebabkan oleh agregasi stroberi. . Penelitian ini mengusulkan sebuah novel Model LS-YOLOv8s
untuk mendeteksi dan menilai kematangan stroberi, yang didasarkan pada kedalaman YOLOv8s sedang belajar
algoritma dan menggabungkan LW-Swin Transformator modul. Ke memperbaiki itu pertunjukan dari itu model,
dua baru acak variabel adalah diperkenalkan di dalam itu kontras peningkatan proses ke kontrol itu efek
peningkatan. Kumpulan data diperluas dari 1089 menjadi 7515 gambar, yang meningkatkan keragaman data dan
mengurangi risiko penyesuaian model yang berlebihan. Selain itu, modul Swin Transformer telah ditambahkan
ke TopDown Layer2 selama tahap penggabungan fitur untuk menangkap ketergantungan jarak jauh dalam data
masukan dan meningkatkan kemampuan generalisasi model dengan menggunakan mekanisme perhatian
mandiri multi-kepala. Terakhir, jaringan fusi fitur yang lebih efisien dicapai dengan memperkenalkan jaringan
sisa dengan pembelajaran parameter Dan berskala normalisasi ke dalam itu asli sisa struktur dari itu Babi
Transformator. Ke evaluasi itu efektivitas LS-YOLOv8s untuk mendeteksi kematangan stroberi, kami
mengumpulkan kumpulan data gambar stroberi dari dasar penanaman stroberi. Kumpulan data dipecah
menggunakan pendekatan validasi silang 5 kali lipat, yang meningkatkan kualitas model evaluasi proses.
Eksperimental _ _ hasil menunjukkan itu LS-YOLOv8s lebih baik dibandingkan lainnya model, dengan A 1.6 %,
33.5 %, Dan 3.4 % peningkatan di dalam peta0.5 pada itu validasi mengatur dibandingkan ke YOLOv5,
PusatNet, Dan SSD,
masing-masing. Selain itu, LS-YOLOv8 mencapai presisi dan kecepatan deteksi yang lebih baik dibandingkan
YOLOv8m saja sekitar 51,93 % dari jumlah parameter yang digunakan, mencapai presisi deteksi 94,4 % dan
19,23FPS deteksi kecepatan, meningkat sebesar 0,5 % dan 6,56fps, masing-masing. Model LS-YOLOv8s dapat
memberikan keandalan dukungan teoritis untuk mendeteksi target stroberi, mengevaluasi kematangannya, dan
mengotomatisasi stroberi pemetikan proses untuk kebun buah-buahan pengelolaan.

1. Perkenalan
dan pelacakan target melalui model algoritmik. Objek tradisional metode
Pesatnya perkembangan teknologi computer vision telah deteksi menggunakan beberapa jendela geser untuk melintasi gambar
membuat deteksi objek salah satu bidang yang paling menjanjikan untuk Himpunan data, ekstrak fitur, Dan kereta A penggolong ke mengenali itu
aplikasi. Obyek deteksi sudah banyak digunakan dalam berbagai aplikasi target gambar. Mao dan He (2020) mengusulkan penggabungan penyakit
sehari-hari kehidupan, seperti pengawasan keamanan, mengemudi jagung multi-fitur pengakuan algoritma menggabungkan SVM pengakuan
otonom, dan adegan drone analisis ( Jiao et al., 2019 ). Strawberry ketepatan Dan efek pengenalan pada fitur tunggal untuk gambar penyakit
merupakan buah yang kaya akan nutrisi nilai dan fitokimia bermanfaat, daun jagung, dan itu rata-rata presisi dari ini model untuk itu
menyediakan nutrisi penting bagi tubuh manusia ( Yang et al., 2023 ). pengakuan dari tiga penyakit jagung sebesar 93,33%. Untuk pengenalan
Penerapan visi komputer teknologi untuk mengidentifikasi stroberi ( citra penyakit tomat secara kompleks lingkungan, Yang dkk. (2021)
Hu et al., 2022 ) memiliki potensi yang luas untuk digunakan, dan juga mengusulkan CCL-SVM berbasis SVM untuk tomat daun gambar penyakit
memberikan dukungan teoritis untuk pengambilan robot stroberi ( pengakuan di dalam kompleks lingkungan menggabungkan fitur tekstur
Yang et Al., 2023 ). warna untuk tiga hama dan penyakit umum tomat, dengan sebuah
Obyek deteksi adalah A teknik itu memungkinkan waktu keseluruhan pengakuan kecepatan dari 97,5 % ketika mengurangi
sebenarnya pengakuan komputasi upaya. Zhang et Al. (2014) diajukan A metode untuk

* Sesuai pengarang.
Surel alamat: ysz X lj@126.com (S. Yang), 1787899973@qq.com (W. Wang), gaosheng@qut.edu.cn (S. Gao), dengzhaopeng@qut.edu.cn (Z. Deng).

https://doi.org/10.1016/j.compag.2023.108360
Diterima 5 Juni 2023; Diterima di dalam diperbaiki membentuk 7 September 2023; Diterima 23 Oktober 2023
Tersedia on line 4 November 2023
0168-1699/© 2023 Elsevier BV Semua hak disimpan.
S. Yang et Computers and Electronics in Agriculture 215 (2023)

secara otomatis penilaian buah kematangan Dan kualitas menggunakan 90%, dan itu deteksi kecepatan Juga puas otomatis Dan efisien mesin
buah warna perbedaan- kesimpulan. Itu metode menentukan itu pemetikan. Li dkk. (2019) mengubah jaringan tulang punggung aslinya
frekuensi oleh menganalisa A dua- dimensi warna histogram untuk model deteksi objek SSD ke jaringan sisa yang dalam untuk mencapai real-
setiap nilai Dan memproyeksikan itu memasukkan warna ke indeks klasifikasi waktu dan deteksi jeruk dengan presisi rata-rata dari 87,89%,
warna tertentu. Penilaian dicapai dengan menganalisis indeks warna 0,34 % lebih tinggi dari 87,55 % dari asli SSD. Xiang dkk. (2019)
proyeksi belakang yang diperoleh. HASIL eksperimental menunjukkan hal mengembangkan sistem deteksi dan penilaian online berbasis CNN. alat
itu metode ini memiliki akurasi yang tinggi. Algoritme visi tradisional untuk mendeteksi kematangan dua sisi buah mangga. Penelitian ini
yang diandalkan fitur ekstraksi memiliki ditampilkan jelas keterbatasan dirancang A mengatur dari fleksibel berputar mekanika ke meraih
Kapan berurusan dengan tugas data yang kompleks dan berskala besar. tidak merusak berputar
Variasi posisi dan sudut pertumbuhan stroberi, saling oklusi antara
stroberi dan di antaranya stroberi, ranting Dan daun-daun, Dan
perubahan di dalam Petir kondisi Bisa pose tantangan ke itu tepat
deteksi dari stroberi menggunakan tradisional penglihatan algoritma.
Kematangan deteksi di dalam stroberi di dalam- melibatkan perubahan
warna, bentuk, ukuran dan tekstur, sehingga menyulitkan tradisional
metode ke menangkap Dan menganalisa ini berbeda fitur secara
bersamaan, yang mempengaruhi deteksi kematangan yang akurat. Lebih-
lebih lagi, penampilan stroberi sangat bervariasi antar tahap
pertumbuhan dan varietas stroberi, menghasilkan distribusi stroberi
yang kompleks kematangan data itu tradisional fitur ekstraksi Dan
klasifikasi metode berjuang ke secara akurat mengenali. Dalam sedang
belajar saraf bersih- bekerja adalah terlatih lebih tepatnya dibandingkan
diprogram, mengurangi itu membutuhkan untuk luas pakar analisis Dan
mencari setelan. Dalam sedang belajar ditawarkan
besar fleksibilitas di dalam kematangan deteksi Dan lainnya daerah,
memungkinkan
hasil yang lebih baik dapat dicapai tanpa memerlukan pengalaman
budidaya. Untuk alasan ini, deteksi kematangan berbasis pembelajaran
mendalam dipilih makalah ini. Dengan pesatnya perkembangan
pembelajaran mendalam dan pro- pos dari konvolusional saraf jaringan
( LeCun et Al., 2015; Girshick et Al., 2014; Ren et Al., 2017; Redmon et
Al., 2016; Liu et Al., 2016 ), obyek deteksi algoritma memiliki masuk A
baru panggung.
Dalam sedang belajar metode memiliki pernah secara luas digunakan
di dalam pertanian di dalam- inspeksi. Zhang dkk. (2022) mengusulkan
deteksi objek pembelajaran mendalam- metode penghitungan hasil buah
berdasarkan penghitungan buah dan diverifikasi pada a pohon yang
berbuah lebat dapat mencapai penghitungan jumlah buah yang akurat
ketahanan yang baik terhadap cahaya, bayangan, dan ketidaklengkapan.
Goyal dkk. (2022) mengusulkan model deteksi buah dan deteksi kualitas
berdasarkan sistem deteksi objek YOLOv5 untuk pemilahan buah pada
tahap pertama buah deteksi Dan di dalam itu Kedua panggung untuk
kualitas deteksi, dengan A peta sebesar 92,80 % pada tahap pertama dan
99,60 % dan 93,10 % untuk apel dan pisang masing-masing di dalam itu
Kedua panggung. Parico Dan malu (2021) digunakan itu YOLOv4 model
Dan kedalaman penyortiran untuk waktu sebenarnya pir buah deteksi
dan penghitungan untuk penghitung buah pir. Jia dkk. (2022)
mengusulkan sebuah model segmentasi YOLOF-Snake yang efisien untuk
segmentasi buah, dengan secara signifikan meningkatkan akurasi dan
efisiensi segmentasi secara efektif memperluas itu aplikasi dari pertanian
peralatan Dan menyediakan dukungan teoritis untuk segmentasi buah
dan sayuran lainnya. Lagu dan Wang (2022) mengusulkan metode untuk
mengubah Faster R-CNN yang asli jaringan saraf yang sepenuhnya
terhubung menjadi saraf biner yang sepenuhnya konvolusional jaringan.
Ini model tercapai sebuah rata-rata presisi dari 87.5 % di dalam jeruk
daun penyakit gambar pengakuan, Dan itu pengakuan waktu dulu
ditingkatkan
oleh 0,53 detik dibandingkan ke fitur ekstraksi jaringan dari yang asli
Lebih cepat R-CNN. Li et Al. (2020) ditargetkan pahit melon daun
penyakit di dalam alami lingkungan Itu fitur ekstraksi jaringan dari itu
asli Lebih cepat R-CNN dulu tergabung ke dalam A fitur piramida
jaringan untuk deteksi target gambar penyakit daun pare di lingkungan
alam catatan, Dan itu rata-rata presisi dari itu model dicapai 86.39 %.
Zhao dkk. (2019) mengusulkan jaringan saraf konvolusional mendalam
berdasarkan YOLOv3 ke meraih tepat apel pengakuan di dalam kompleks
mengepung- catatan. Rata-rata presisi rata-rata model pelatihan pada
validitas set tanggal sebesar 87,71%, presisi sebesar 97%, recall sebesar

2
S. Yang et Computers and Electronics in Agriculture 215 (2023)

selama berputar. Kekerasan daging digunakan sebagai dasar penilaian jaringan struktur itu ditingkatkan itu pertunjukan berdasarkan pada itu
mengklasifikasikan kematangan buah mangga. Hasil percobaan YOLOv8s model ke meraih lebih baik stroberi kematangan deteksi. Ini
menunjukkan hal itu itu sistem tercapai A kematangan klasifikasi belajar diajukan tiga kunci perbaikan model untuk mendeteksi
ketepatan dari 96,72 %, menghasilkan dapat diandalkan hasil. Li et Al. kematangan stroberi. Pertama, kita dipekerjakan A data augmentasi
(2022) diajukan A komputer penglihatan- algoritma berbasis untuk strategi ke memperluas itu Himpunan data oleh memperkenalkan acak
deteksi PM dan IL daun stroberi dan ditingkatkan model YOLOv4 asli variabel. Ini ditingkatkan itu nomor Dan keberagaman sampel dan
dengan memperkenalkan konvolusi mendalam dan hybrid mekanisme mengurangi risiko kesesuaian model yang berlebihan. Kedua, kita
perhatian. Model terbaik yang ditingkatkan, DAC-YOLOv4, memiliki menambahkan struktur Swin Transformer ke TopDown Layer2 dalam
rata-rata ketepatan perbaikan dari 72.7 % dibandingkan dengan itu asli fitur tersebut fusi panggung, yang ditingkatkan panjang jarak
YOLOv4, Dan memiliki A lebih besar ukuran kompresi. Di dalam ketergantungan pada pemodelan
ketentuan dari waktu sebenarnya deteksi kecepatan, DAC-YOLOv4
mencapai 43 Dan 20 FPS pada itu Jetson Xavier NX Dan Jetson nano
masing-masing, pertemuan itu persyaratan dari itu tertanam platform.
Dengan demikian, DAC-YOLOv4 memiliki Bagus pertunjukan di dalam
deteksi PM daun strawberry dan memberikan solusi efektif secara dini
deteksi dan pencegahan PM stroberi. Wang dkk. (2022) diusulkan A
model ditelepon DSE-YOLO ke mendeteksi multi-tahap stroberi buah-
buahan ke alamat itu masalah dari kecil stroberi ukuran, latar depan
kategori ketidakseimbangan dan lingkungan alam yang kompleks.
Modul DSE digunakan untuk mengekstrak berbagai fitur detail dan
semantik secara horizontal dan vertikal dimensi untuk fokus pada buah
kecil dan meningkatkan akurasi deteksi. Itu masalah ketidakseimbangan
kategori latar depan ditangani oleh konstruksi ing EBCE Dan DEMSE
kehilangan fungsi. E X perimen pada itu Himpunan data menunjukkan
itu DSE-YOLO secara signifikan berkinerja lebih baik mutakhir teknik
dengan F-1 skor nilai-nilai dari ke atas ke 81.59 % Dan peta nilai-nilai
dari 86.58 %, terutama dalam pemandangan alam di mana setiap tahap
buah stroberi dapat ditemukan secara akurat terdeteksi.
Babi Transformator adalah A novel dalam sedang belajar model
dikembangkan oleh Microsoft Riset Asia, digunakan di dalam gambar
pengakuan, alami bahasa pemrosesan dan pemrosesan ucapan. Swin
Transformer mengusulkan sebuah novel terlokalisasi sebelumnya
pengetahuan oleh menggambar pada itu keuntungan dari berbelit-belit-
jaringan saraf nasional dan mekanisme perhatian diri, yaitu
menggunakan sistem self-attention. mekanisme perhatian dalam jendela
kecil untuk menghitung fitur mengurangi kompleksitas komputasi dan
meningkatkan kinerja modelnya ( Baek dan Chung, 2023 ).
Transformator Babi ( Liu dkk., 2021 ) terdiri dari tiga utama modul: A
terlokalisasi sebelumnya pengetahuan modul, A perhatian diri modul
Dan A global A posteriori pengetahuan modul. Lingkungan setempat A
apriori pengetahuan modul adalah itu inti dari itu Babi Transformator
dan mengurangi kompleksitas komputasi dan membaik itu pertunjukan
dari itu model oleh menggunakan A perhatian diri mekanisme dalam
jendela kecil untuk menghitung fitur. Modul perhatian diri adalah
digunakan ke melakukan perhatian diri perhitungan pada itu
memasukkan urutan ke menangkap itu jarak jauh ketergantungan di
dalam itu memasukkan urutan. Itu modul pengetahuan posterior global
digunakan untuk mengekstrak fitur dari seluruh urutan untuk
menangkap informasi global dalam urutan dengan lebih baik.
Dibandingkan ke tradisional konvolusional saraf jaringan, Babi Trans-
yang pertama menawarkan kinerja yang unggul dan kompleksitas
komputasi yang lebih sedikit. Itu Babi Transformator Bisa Juga
menghasilkan fitur dari bervariasi ukuran melalui
berbeda pengumpulan operasi, dengan demikian beradaptasi lebih baik
ke kebutuhan dari aplikasi-
aplikasi di dalam berbeda domain.
Saat ini stroberi kematangan berdasarkan pada penilaian manual,
yang memiliki itu masalah dari besar pribadi subyektif faktor, tidak
konsisten standar Dan tinggi tenaga kerja intensitas. Itu menggunakan
dari komputer penglihatan untuk deteksi kematangan stroberi bisa
memastikan deteksi kematangan yang akurat, yang Bisa lebih baik
membawa keluar tepat waktu pemetikan, menghindari itu limbah dari
stroberi jatuh tempo ke sebelum waktunya pemetikan. Ini membaik itu
kualitas Dan mencicipi dari itu produk. Ini membantu ke mengurangi
itu nomor dari mentah atau terlalu masak stroberi memasuki itu pasar,
meningkat itu komoditas nilai dan daya saing stroberi secara
internasional. Berdasarkan di atas alasan, ini kertas diajukan A baru

3
S. Yang et Computers and Electronics in Agriculture 215 (2023)

kemampuan Dan generalisasi kemampuan. Akhirnya, Kami


diperkenalkan A sisa jaringan dengan dapat dipelajari parameter dan lebih banyak data pelatihan untuk meningkatkan kemampuan model
berskala normalisasi ke dalam struktur sisa asli Swin Transformer . Hal ini dalam mempelajari fitur target tures, meningkatkan kemampuan
memungkinkan model untuk mempelajari informasi fitur dari stroberi generalisasi dan ketahanannya dalam situasi yang berbeda uations, dan
target dan over- datang itu masalah dari gradien hilangnya. mengurangi risiko overfitting. Setelah menambah aslinya 1089 gambar-
gambar, Kami diperoleh 7515 gambar-gambar. Kami digunakan A 5 kali
2. Bahan Dan metode lipat menyeberang- pendekatan validasi ke memastikan itu keacakan dari
itu Himpunan data membelah. Di dalam berbeda dengan pemisahan
2.1. Gambar Himpunan data kumpulan data proporsional konvensional, validasi silang meningkatkan
evaluasi model dan menyediakan lebih komprehensif, kuat dan perkiraan
Itu dibangun sendiri Himpunan data di dalam ini kertas dulu diambil kinerja yang dapat diandalkan. Hal ini membantu mengurangi
di dalam Qingdao Hongshiya Penanaman Basis (garis bujur: 121.49 E, ketidakpastian pemilihan dan evaluasi model, sambil memanfaatkan
Garis Lintang: 36.77 N, alti- tude: 17 M), terletak di dalam Huang Dao keterbatasan yang ada secara efisien Himpunan data.
Daerah, Qingdao Kota, Shandong Provinsi, Cina, yang didirikan pada
tahun 1991 dan memiliki lebih dari 360 penanaman gudang penutup 2.2. LS-YOLOv8s keseluruhan struktur
sebuah daerah dari lagi dibandingkan 500 Ha. Itu diri sendiri- dibangun
Himpunan data dulu difoto di dalam berbeda petani ' penanaman gudang Di dalam ini belajar, Kami dibangun A LS-YOLOv8s deteksi model
dari 'miao X iang ' , ' X ueli X iang ' , 'tianbao ' , 'naiyou ' dan lainnya berdasarkan pada YOLOv8 yang digabungkan dengan algoritma
varietas ke menghapuskan itu data bias disebabkan oleh individu pembelajaran mendalam LW-Swin Transformer- ritme. Itu model
geografis lokasi Dan varietas. termasuk tiga kunci perbaikan. Pertama, Kami dipekerjakan data
Dalam penelitian ini, kami menggunakan kumpulan data 1.089 augmentasi dengan acak jumlah ke meningkatkan itu nomor Dan
gambar yang diambil pada buah stroberi pertanian di Hongshiya, keberagaman dari sampel, lebih jauh meningkatkan itu model _ _
Qingdao, Provinsi Shandong untuk kematangan stroberi pengakuan. Itu ketahanan dan kinerja. Kedua, kami memperkenalkan Swin Trans-
Himpunan data termasuk dua kategori: matang Dan mentah stroberi. struktur sebelumnya, yang meningkatkan kemampuan generalisasi model
Setiap gambar diberi label dengan cermat di bawah panduan dari dan ketergantungan jarak jauh pada kemampuan pemodelan, sehingga
pemilik peternakan, yang memanfaatkan pengalaman bertahun-tahun menghasilkan lebih baik keseluruhan penampilan. Akhirnya, kami
yang terus berkembang. Selain itu- tion, labelnya dikoreksi dengan memasukkan struktur sisa dengan bisa dipelajari parameter Dan
cermat untuk memastikan keakuratannya data. Gambar diambil di bawah berskala normalisasi ke dalam itu Babi Trans- sebelumnya,
berbagai lingkungan dan pencahayaan kondisi, termasuk pengaturan memungkinkan fusi fitur yang lebih efisien. Gambar 2 menggambarkan
dalam dan luar ruangan, cahaya terang dan redup, kompleks lingkungan jaringan struktur.
( Konstanta et Al., 2016 ), Dan naungan. Sebagai A hasil, itu Himpunan Meja 1 ditampilkan itu dua dimensi lilitan operasi
data adalah dapat digeneralisasikan Dan Bisa menjadi digunakan untuk dieksekusi oleh itu Tulang punggung LS-YOLOv8 struktur pada itu
stroberi kematangan identifikasi tugas di dalam berbeda lingkungan. memasukkan fitur peta. Itu tulang punggung struktur terdiri dari itu
Matang stroberi di dalam ini Himpunan data adalah dicirikan oleh A Modul Konv Dan itu Unit dasar CSPLayer_2Conv, yang mencakup tiga
dalam merah bagian luar, permukaan halus, dan buah besar, penuh, peta fitur yang berbeda ukuran. Ini fitur peta adalah dimanfaatkan
sedangkan stroberi masih mentah dicirikan oleh bagian luar berwarna sebagai memasukkan untuk itu fitur fusi jaringan.
merah atau hijau muda dan lebih kecil, kurang penuh buah-buahan.
Karakteristik ini sangat penting untuk mengidentifikasi kematangan
2.3. Ditingkatkan data peningkatan
stroberi. ness dan dapat membantu pengembang dalam meneliti dan
mengembangkan stroberi sistem identifikasi kematangan yang
Di bidang visi komputer, kualitas kumpulan data sangat penting itu
meningkatkan efisiensi dan kualitas industri stroberi. Gambar 1
pertunjukan Dan generalisasi kemampuan dari itu model. Data
menampilkan subset dari kumpulan data yang digunakan di dalam ini
augmentasi adalah teknik umum yang digunakan untuk meningkatkan
belajar.
kualitas kumpulan data dengan meningkat itu jumlah Dan keberagaman
Dalam penelitian ini, kami menggunakan augmentasi data untuk
dari data melalui acak trans- formasi yang diterapkan pada data asli.
melakukan serangkaian transformasi Dan manipulasi pada itu asli
Membangun berdasarkan data asli peningkatan mendekati dari YOLOv8,
gambar-gambar, menghasilkan
ini belajar diperkenalkan acak

4
S. Yang et Computers and Electronics in Agriculture 215 (2023)
Ara. 1. Sebagian Himpunan data menampilkan.

5
S. Yang et Computers and Electronics in Agriculture 215 (2023)

Gambar 2. Struktur jaringan LS-YOLOv8s. Si merah putus-putus bagian dari gambar menunjukkan perbaikan struktur yang diusulkan makalah ini, yang
menggantikan sebelumnya struktur konvolusi dengan Swin Transformer dan meningkatkan struktur sisa sebelumnya dengan memasukkan parameter yang dapat
dipelajari dan normalisasi skala. (Untuk penafsiran dari itu referensi ke warna di dalam ini angka legenda, itu pembaca adalah dirujuk ke itu web Versi: kapan
dari ini artikel.)

untuk mengatur kontras dari itu gambar; β adalah A acak bilangan bulat di
dalam itu jangkauan [8, 12] Dan ini
Meja 1
LS-YOLOv8s jaringan parameter.
Operasi Memasukkan Keluaran Melang Inti
kah
Modul Konv (640.640,3) (320.320.32) 2 (3,3)
Modul Konv (320.320.32) (160.160.64) 2 (3,3)
CSPlayer_2Konv (160.160.64) (160.160.64) 1 (1,1)
Modul Konv (160.160.64) (80,80,128) 2 (3,3)
CSPlayer_2Konv (80,80,128) (80,80,128) 1 (1,1)
Prestasi1 (80,80,128)
Modul Konv (80,80,128) (40,40,256) 2 (3,3)
CSPlayer_2Konv (40,40,256) (40,40,256) 1 (1,1)
Prestasi2 (40,40,256)
Modul Konv (40,40,256) (20,20,512) 2 (3,3)
CSPlayer_2Konv (20,20,512) (20,20,512) 1 (1,1)
SPPF (20,20,512) (20,20,512)
Prestasi3 (20,20,512)

kontras, rotasi, Dan pencerminan ke lebih jauh memperbaiki itu


kumpulan data ' s kualitas.
Menyesuaikan kontras untuk peningkatan data dapat meningkatkan
atau mengurangi itu perbedaan dari berbeda daerah dari sebuah gambar,
memungkinkan itu model ke ekstrak fitur lintas berbeda data Dan lebih
baik beradaptasi ke bermacam-macam Petir kondisi Dan pemandangan
perubahan. Oleh melamar bervariasi tingkat dari kontras peningkatan ke
sebuah gambar, banyak diubah gambar-gambar Bisa menjadi dihasilkan.
Itu kontribusi dari ini belajar dulu ke meningkatkan itu konvensional
kontras peningkatan metode oleh memperkenalkan acak variabel. Itu ide
utamanya adalah untuk lebih meningkatkan keragaman kumpulan data
dengan menggunakan metode acak berfungsi untuk mengontrol dua
parameter proses peningkatan. Itu rumus untuk itu ditingkatkan
kontras data peningkatan adalah sebagai berikut:
g ( saya , J ) = α × F ( Saya , J ) + b (1)

dimana: α ∈ [ 0 . 3 , 0 . 5 , 0 . 7 , 1 . 2 , 1 . 4 , 1 . 6 ] , nilai ini digunakan

6
S. Yang et Computers and Electronics in Agriculture 215 (2023)
nilai adalah digunakan ke menyesuaikan itu kecerahan dari itu gambar.
Merekam parameter peningkatan data untuk setiap gambar
membantu memastikan itu menggunakan dari berbeda parameter
setiap waktu. Ini metode hasil konsisten hasil dengan lebih sedikit
diperluas data Dan singkat pelatihan waktu dibandingkan dengan
metode sebelumnya yang memerlukan pengaturan peningkatan khusus
parameter ment terlebih dahulu dan menjalankannya secara terpisah.
Gambar 3 ilustrasi- menganalisis data yang diperoleh dengan
menggunakan metode penyempurnaan ini, dimana α dan b dari itu
meja mewakili itu parameter digunakan di dalam Persamaan (1) ke
menyesuaikan itu gambar kontras.

2.4. Ditingkatkan Babi Transformator

Swin Transformer adalah arsitektur Transformer baru yang


diusulkan di dalam 2021 oleh peneliti pada Microsoft Riset Asia Dan itu
Cina Universitas Hong Kong. Ini menggunakan mekanisme perhatian
hierarkis untuk memproses data gambar dan video berskala besar
secara efisien, mencapai state- kinerja canggih pada berbagai tugas visi
komputer. Babi Transformer dibedakan berdasarkan konsep desain
hierarkisnya. Berbeda dengan konvensional Transformator jaringan itu
menggunakan A tingkat datar Perhatian mekanisme, di mana setiap
lapisan perhatian mempertimbangkan global dan lokal informasi, itu
Babi Transformator mempekerjakan A hierarkis Perhatian mekanisme.
Ini mendekati menghitung Perhatian terpisah pada berbeda lapisan,
mengurangi kompleksitas komputasi, yang menjadi signifikan masalah
Kapan memasukkan data ukuran meningkat.
Swin Transformer membagi gambar atau video masukan menjadi
blok-blok dan memperlakukan setiap blok sebagai gambar kecil. Ini
menggunakan Transformer berlapis struktur, di mana setiap lapisan
berisi Transformer kecil untuk diproses informasi di tingkat blok.
Informasi dipertukarkan antar lapisan, mengakibatkan fusi informasi
global. Swin Transformer juga menggunakan- mengoptimalkan
konektivitas lintas tingkat untuk memungkinkan informasi diteruskan
berbeda tingkatan, lebih jauh meningkatkan pertunjukan. Itu Babi
Transformator menggunakan beberapa teknik untuk meningkatkan
kinerja jaringan sebagai tambahan ke itu hierarkis desain konsep.
Untuk contoh, dia memanfaatkan A lokal

7
S. Yang et Computers and Electronics in Agriculture 215 (2023)

Ara. 3. Acak kontras sebagian Himpunan data menampilkan. (a-1, b-1, c-1) adalah itu asli foto-foto, (a-2, a-3, b-2, b-3, c-2, c-3) adalah data yang
ditingkatkan gambar-gambar.

berbasis jendela posisi pengkodean mendekati itu mengurangi


komputasi- ∑ x saya
nasional kompleksitas dari posisi pengkodean. = _
di mana Saya ∈ [ 0 , 1 ] , J ∈ [ 0 , 1 ] (2)
Ini belajar berkontribusi ke itu bidang oleh memperkenalkan sisa J=
xj _
menghubungkan- 0

aktivitas dengan parameter yang dapat dipelajari dan skala normalisasi hasil. Normalisasi di dalam jaringan saraf dapat meningkatkan stabilitas
ke aslinya Babi Transformator. Ini mendekati menggabungkan itu model dan generalisasi, pengalaman memperlambat proses pelatihan, dan
kekuatan dari keduanya ulang- sidual Dan Babi Transformator, meningkatkan akurasi, serta manfaat lainnya. Itu normalisasi rumus
memfasilitasi adaptif sedang belajar dari benar- hubungan di antara fitur. adalah asalkan di bawah:
Dalam sedang belajar teknik menentukan itu pembobotan hasil untuk
aliran data dari jalur yang berbeda, sehingga mengurangi itu dampak
dari berulang fitur.
Itu dua sedang belajar parameter adalah diinisialisasi dengan semua
satu Dan dinormalisasi sebelum tertimbang penjumlahan adalah
dilakukan. Ini penskalaan metode mempertahankan itu relatif
proporsionalitas dari itu asli data, menyederhanakan komputasi, Dan
memungkinkan itu data ke menjadi berskala ke itu [0,1] rentang dengan
membagi setiap nilai dengan jumlah. Selain itu, metode ini adalah tidak
sensitif terhadap nilai outlier, artinya meskipun terdapat anomali di
dalamnya itu data, dia akan bukan secara signifikan memengaruhi itu

8
S. Yang et Computers and Electronics in Agriculture 215 (2023)
dimana: w i -Parameter yang telah dinormalisasi; xi -Tidak dinormalisasi
sedang belajar parameter.
Itu struktur dari itu ditingkatkan Babi Transformator adalah
ditampilkan di dalam Ara. 4 .

3. Hasil

3.1. Eksperimental platform

sistem operasi: jendela 10, CPU: Antar (R) Inti (TM) I5-8300H,
GPU: NVIDIA
GeForce GTX 1050Ti, Dalam Sedang belajar Kerangka: PyTorch.

3.2. Evaluasi metrik

Obyek deteksi adalah A penting tugas di dalam komputer


penglihatan, yang melibatkan mengidentifikasi posisi dan kelas
target individu dalam satu gambar. Ke evaluasi itu ketepatan Dan
efisiensi dari obyek deteksi

9
S. Yang et Computers and Electronics in Agriculture 215 (2023)

Ara. 4. Struktur dari itu ditingkatkan Babi Transformator Memblokir (LW-Swin


Transformator).

algoritma, bermacam-macam evaluasi metrik adalah diperlukan. Ini


kertas menghilangkan- juru tulis itu umumnya digunakan evaluasi Itu matri X baris mewakili itu sebenarnya kategori, ketika itu kolom
metrik di dalam obyek deteksi. mewakili itu diprediksi kategori. Itu data di dalam setiap sel
menunjukkan itu proporsi dari sampel diprediksi ke menjadi di dalam A
3.2.1. Ketepatan Dan mengingat tarif tertentu kategori itu milik ke itu kategori.
Precision dan Recall adalah salah satu evaluasi yang paling sering MATRIKS konfusi membandingkan prediksi model klasifikasi hasil
digunakan metrik di dalam obyek deteksi. Presisi adalah didefinisikan dengan label sebenarnya untuk mengevaluasi kinerjanya. Gambar 5
sebagai itu perbandingan dari itu jumlah sampel yang benar dalam mengilustrasikan matriks konfusi HASIL klasifikasi, dimana diagonalnya
suatu hasil pengujian dengan jumlah total sampel di semua hasil tes, matriks X mewakili akurasi prediksi pengklasifikasi untuk masing-masing
sedangkan Recall didefinisikan sebagai rasio jumlah sampel yang benar kategori. Nilai diagonalnya semuanya 0,99, menunjukkan prediksi yang
dalam hasil pengujian dengan jumlah total sampel yang benar. Dia perlu tinggi ketepatan dari itu model untuk semua kategori. Sebagai A hasil, itu
dicatat bahwa akurasi dan perolehan sering kali bertentangan satu sama model Bisa dengan tepat Dan andal mengenali Dan menggolongkan
lain, artinya detektor dapat meningkatkan akurasi sekaligus mengurangi bermacam-macam objek ke bertemu praktis aplikasi persyaratan.
perolehan, Dan keburukan sebaliknya.
3.3. Perbandingan eksperimen
3.2.2. Berarti rata-rata presisi
Mean Average Precision (mAP) adalah metrik evaluasi penting dalam Makalah ini mengusulkan serangkaian perbaikan baru dari aslinya
suatu objek deteksi itu menilai A model _ _ deteksi ketepatan lintas Model YOLOv8 dengan tujuan untuk meningkatkan akurasi deteksi objek
bermacam-macam kategori. Proses penghitungan peta melibatkan dan efisiensi. Makalah ini mengevaluasi kinerja jaringan baru dengan
pemeringkatan setiap kategori sesuai dengan tingkat kepercayaan melakukan eksperimen Dan perbandingan dia dengan lainnya arus
kerangka prediksi, menghitung presisi rata-rata untuk setiap kategori utama model. Data Tabel 2 dilatih dan dievaluasi menggunakan
berdasarkan kurva presisi-recall, dan kemudian rata-rata presisi rata- kumpulan data tanpa augmentasi data, dan percobaan mengikuti prinsip
rata semua kategori untuk mendapatkan terakhir peta nilai. A lebih tinggi tersebut variabel pengendali, dengan perangkat keras dan perangkat
peta nilai menunjukkan lebih baik deteksi kemampuan- kemampuan lunak eksperimental disimpan konsisten.
dari itu model.
Meja 1 menunjukkan itu pertunjukan perbandingan dari itu diajukan
baru jaringan struktur dengan YOLOv8, YOLOv8m, Dan YOLOv5s. Itu
3.2.3. Surat hutang baru struktur jaringan mencapai peningkatan 0,9%, 0,5%, dan 1,6%
Persimpangan lebih Persatuan (Surat hutang) adalah lain penting dalam peta dibandingkan ke YOLOv8, YOLOv8m, Dan YOLOv5, masing-
evaluasi metrik dalam deteksi target yang mengukur tingkat tumpang masing. Lebih-lebih lagi, itu baru jaringan struktur berkinerja lebih baik
tindih antara keduanya frame prediksi dan frame aktual. Dihitung dengan itu YOLOv8m model
membagi persimpangan luas bingkai prediksi dan aktual dengan luas
gabungannya. Ketik- tepatnya, ambang batas IoU yang lebih tinggi antara
frame yang diprediksi dan frame sebenarnya menunjukkan lebih baik
deteksi kemampuan dari itu model.

3.2.4. F1 skor
Skor F1, yang merupakan gabungan dari presisi dan perolehan,
digunakan untuk itu mengevaluasi efektivitas deteksi model . Nilai F1
diperoleh dengan cara menghitung rata-rata penjumlahan dari presisi
dan perolehan. Skor F1 yang lebih tinggi menunjukkan lebih baik deteksi
kemampuan dari itu model.

2 × ( presisi ×
mengingat ) presisi + (3)
F1
mengingat

3.2.5. Kebingungan matriks


MATRIKS kebingungan adalah alat yang umum digunakan untuk Dan adalah secara luas digunakan untuk algoritma perbandingan dan
mengevaluasi kinerja. bentuk model klasifikasi dan merupakan metrik evaluasi. Melalui kebingungan matriks X , desain dan parameter
evaluasi yang populer di tugas deteksi objek. Ini memberikan pengaturan pengklasifikasi dapat dioptimalkan, serta akurasi dan
pemahaman yang komprehensif tentang pengklasifikasi ' s pertunjukan ketahanannya dari pengklasifikasi Bisa menjadi ditingkatkan.

1
S. Yang et Computers and Electronics in Agriculture 215 (2023)
Matriks kebingungan X adalah matriks X dua dimensi yang
menggambarkan ketepatan dari A klasifikasi model di dalam
mengklasifikasikan sampel dari A Himpunan data.

Gambar 5. Matriks kebingungan standar X .

Anda mungkin juga menyukai