Bagian dari Commons Ilmu Pangan, Commons Kimia Obat dan Farmasi, Commons Farmakologi, dan
Commons Toksikologi
Artikel Asli ini dipersembahkan untuk Anda secara gratis dan akses terbuka oleh Journal of Food and Drug Analysis.
Artikel ini telah diterima untuk dimuat di Jurnal Analisis Makanan dan Obat oleh editor resmi Jurnal Analisis
Makanan dan Obat.
ARTIKEL ASLI
Penilaian kualitas jus lemon dan pemalsuan dengan
kromatografi cair berkinerja sangat tinggi /
spektrometri massa tiga kuadrupol dengan
pembelajaran mesin yang interaktif dan dapat
ditafsirkan
Weiting Lyu a,b, Bo Yuan a,c, Siyu Liu ddan James E. Simon a,b,*, Qingli Wu a,b,c,**
a Program Pertanian Penggunaan Baru dan Produk Tumbuhan Alami, Departemen Biologi Tumbuhan dan Pusat Ekosistem Pangan
Pertanian,
Institut Makanan, Nutrisi & Kesehatan, Universitas Rutgers, 59 Dudley Road, New Brunswick, NJ, 08901, AS
b Departemen Kimia Medisinal, Universitas Rutgers, 160 Frelinghuysen Road, Piscataway, NJ, 08854, AS
c Departemen Ilmu Pangan, Universitas Rutgers, 65 Dudley Road, New Brunswick, NJ, 08901, AS
d Citromax Flavors Group, Inc, 444 Washington Ave, Carlstadt, NJ, 07072, USA
Abstrak
Sebanyak 81 sampel jus lemon dideteksi menggunakan metode UHPLC-QqQ-MS/MS yang dioptimalkan dan uji
kolorimetri. Konsentrasi 3 asam organik (asam askorbat, asam malat, dan asam sitrat), 3 sakarida (glukosa, fruktosa, dan
sukrosa), dan 6 asam fenolat (asam trans-p-koumarat, asam 3-hidroksibenzoat, asam 4-hidroksibenzoat, asam 3,4-
dihidroks-ybenzoat, asam kafeat) dikuantifikasi. Total polifenol, aktivitas antioksidan, dan kekuatan antioksidan pereduksi
Ferric juga diukur. Untuk prediksi jus lemon asli dan yang dipalsukan serta minuman limun yang bersumber dari sumber
komersial berdasarkan profil metabolik y a n g diperoleh, model pembelajaran mesin termasuk analisis diskriminan
linier, Gaussian naïve Bayes, regresi logistik yang diregulasi secara lasso, random forest (RF) dan mesin vektor
pendukung dikembangkan berdasarkan alur kerja pelatihan (70%) - pengujian validasi silang (30%). Akurasi yang
diprediksi pada set pengujian adalah 73e86% untuk model yang berbeda. Analisis ekspektasi bersyarat individu
(bagaimana probabilitas yang diprediksi berubah ketika besaran fitur berubah) diterapkan untuk interpretasi model, yang
secara khusus mengungkapkan hubungan yang erat antara prediksi probabilitas RF dengan karakteristik nuansa distribusi
kepadatan fitur metabolisme. Dengan menggunakan model yang sudah ada, sebuah dasbor online sumber terbuka
dibangun untuk prediksi klasifikasi yang nyaman dan visualisasi interaktif dalam praktik nyata.
Kata kunci: Pembelajaran mesin yang dapat ditafsirkan, Jeruk limon, Kontrol kualitas, Aplikasi mengkilap R, UHPLC-
QqQ-MS/MS
Senyawa kimia: asam sitrat, PubChem CID: 311, sukrosa, PubChem CID: 5988, asam askorbat, PubChem CID: 54670067,
glukosa, PubChem CID: 5793, fruktosa, PubChem CID: 2723872, asam malat, PubChem CID: 525, asam trans-p-kou-
marat, PubChem CID: 637542, asam 3-hidroksibenzoat, PubChem CID: 7420, asam 4-hidroksibenzoat, PubChem CID:
135, asam 3, 4-dihidroksibenzoat, PubChem CID: 72, asam caffeic, PubChem CID: 689043, asam galat, PubChem CID:
370, trolox, PubChem CID: 40634
*, ** Penulis korespondensi: Departemen Biologi Tumbuhan, Universitas Rutgers, 59 Dudley Road, New Brunswick, NJ, 08901, AS. Tel: +1(848)-932-6239 (J.E.
Simon), +1(848)-932-6238 (Q. Wu).
Alamat email: jimsimon@rutgers.edu (J.E. Simon), qlwu@sebs.rutgers.edu (Q. Wu).
https://doi.org/10.38212/2224-6614.3356
2224-6614/© 2021 Badan Pengawas Obat dan Makanan Taiwan. Ini adalah artikel akses terbuka di bawah lisensi CC-BY-NC-
ND (http://creativecommons.org/licenses/by-nc-nd/4.0/).
276 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI
ARTIKEL ASLI
Pengenceran serial lebih lanjut dilakukan dengan
menggunakan pelarut yang sama hingga
1000e0,06 mg/mL.
Untuk pembuatan larutan referensi AA, MA dan
larutan sakarida (fruktosa, glukosa dan sukrosa),
sekitar 10 mg masing-masing standar ditimbang
secara akurat dan dilarutkan dalam 10 mL asam
format 0,1% dengan EDTA jenuh. Alikuot dari 100
mL larutan stok ditambahkan ke dalam 10 mL asam
format 0,1% dalam larutan EDTA jenuh untuk
membuat larutan kerja pertama. Pengenceran serial
lebih lanjut dilakukan dengan menggunakan pelarut
yang sama untuk menghasilkan larutan kerja dengan
standar 1000e0,06 mg/mL.
Untuk larutan referensi asam fenolat termasuk FA,
p-CA, 3-HBA, 4-HBA, 3,4-diHBA dan CFA, masing-
masing
standar ca. 15 mg ditimbang secara akurat dan
disiapkan dalam 10 mL asam format 0,1% dalam
larutan metanol 70%. Alikuot dari 40 mL larutan
stok dibubuhi 10 mL asam format 0,1% dalam
larutan metanol 70% untuk membuat larutan kerja
pertama, yang kemudian diencerkan secara serial
menggunakan pelarut pengenceran yang sama
hingga 4000e0,1 ng/mL sebagai larutan kerja.
bagian, nitrogen dengan kemurnian tinggi air, dan fase gerak B adalah 0,1% asam format dalam
digunakan sebagai nebulisasi, pengeringan dan gas ACN. Gradiennya adalah 100% A dari 0 hingga 2
selubung di ruang ionisasi. Nebulizer diatur pada menit, 100% hingga 60% A dari 2 hingga 5 menit,
30 psi, dan gas pengering pada 300◦ C dengan laju dan dipertahankan pada 60% A dari 5 hingga 6
aliran 13 L/menit. Gas selubung adalah 250◦ C menit. Kolom disetimbangkan dengan 100% A
dengan laju aliran 12 L/menit. Polaritas negatif selama 1 menit di antara injeksi. Laju aliran adalah
diterapkan. Mode pemindaian adalah dynamic 0,5 mL/menit. Kolom diatur pada suhu 30◦ C. Semua
multiple reaction of monitoring (dMRM) yang kondisi instrumen lainnya tetap sama dengan metode
dioptimalkan menggunakan MassHunter (a). Parameter MRM dinamis dinyatakan dalam Gbr.
Optimizer seperti yang dilaporkan sebelumnya 1C.
[11], dengan parameter yang disajikan pada
Gambar 1.1. 2.6. Uji polifenol total (TPP)
2.4.2. Metode LC-MS untuk MA, AA, dan sakarida Metode pengujian TPP didasarkan pada metode
Metode (b) digunakan untuk analisis MA, AA dan yang telah dilaporkan sebelumnya [12e14] dengan
sakarida (glukosa, fruktosa dan sukrosa). Fase gerak modifikasi. 50 mL reagen Folin Ciocalteu diencerkan
A adalah 30% ACN dalam air, dan fase gerak B dengan air suling hingga 500 mL, kemudian 900 mL
adalah 65% ACN dalam air, kedua fase gerak reagen Folin yang telah diencerkan dicampur dengan
dimodifikasi dengan 10 mM amonium asetat dengan 80 mL sampel jus yang telah diencerkan, diikuti
pH yang disesuaikan menjadi 9 menggunakan dengan penambahan 400 mL larutan natrium
amonium hidroksida. Laju alir adalah 0,5 mL/menit. karbonat jenuh. Sistem reaksi di vortex sepenuhnya
Semua kondisi instrumen lainnya tetap sama dengan dan didiamkan selama 1 jam. 200 mL larutan
metode (a). Parameter MRM dinamis ditunjukkan dipindahkan ke 96 pelat sumur ganda dan dilakukan
pada Gambar 1B. pengukuran serapan di bawah 765 nm. Untuk kurva
kalibrasi, ca. 30 mg asam galat dilarutkan dalam 5
2.5. Metode LC-MS untuk asam fenolat mL metanol 70% untuk membuat larutan stok, yang
kemudian diencerkan menjadi
Metode (c) diterapkan untuk analisis asam fenolik .
Fase gerak A adalah 0,1% asam format dalam
Gbr. 1. Kromatogram representatif Sampel No. 8 yang diperoleh dalam mode pemantauan reaksi berganda dinamis (MRM) dengan struktur
kimia analit. (A), kromatogram yang diperoleh dengan menggunakan metode (a), (B) dengan metode (b) dan (C) dengan metode (c). Waktu retensi
ditunjukkan dalam warna merah di atas setiap puncak. Transisi MRM dicatat dalam bentuk: ion prekursor (tegangan fragmen) / ion produk (energi
tumbukan). Ion kuantifier dicatat dengan warna hijau dan ion kualifikasi dengan warna oranye, dan tegangan terkait dicatat dengan warna
biru.
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 279
serial hingga 0,05e1,7 ng/mL sebagai
ARTIKEL ASLI
serangkaian larutan kerja dengan konsentrasi mulai
dari 0,02 mg/mL hingga 1,6 mg/mL. Kandungan
TPP dalam sampel dinyatakan sebagai jumlah
ekuivalen asam galat (GAE) / mg $ mL .—1
penambahan amonium hidroksida atau asam format, asetat dengan pH yang disesuaikan hingga 9 dipilih
dan masing-masing dengan EDTA jenuh (Gbr. S1). sebagai fase gerak terbaik untuk metode (a).
Secara singkat, MA dan CTA menunjukkan
intensitas sinyal sekitar 5e20 kali lebih tinggi dalam 3.2. Kalibrasi, linearitas dan sensitivitas
pelarut basa dengan 0,1% amonium hidroksida
dibandingkan dengan pelarut sampel asam dengan Parameter kurva kalibrasi, koefisien determinasi
0,1% asam format. Untuk CTA, linearitas dan (R2 ), rentang linier, batas bawah deteksi (LLOD)
sensitivitas paling baik dalam pelarut dengan asam dan batas bawah kuantifikasi (LLOQ) dari semua
format 0,1%, dan sebagai hasilnya, ini dipilih analit target ditunjukkan pada Tabel S1. Untuk
sebagai pelarut preparasi sampel yang optimal untuk kuantifikasi asam organik CTA, MA dan AA, dan
metode (a). AA menunjukkan sensitivitas yang tidak sakarida sukrosa, glukosa dan fruktosa menggunakan
terlalu terganggu dan hampir tidak ada respons metode (a), linearitas kalibrasi yang baik dicapai
linearitas pada semua pelarut basa karena degradasi dengan R2 di atas 0,993. LLOD berada pada kisaran
yang dipercepat. Dalam pelarut asam dengan 0,1% 0,06e10 ng/mL dan LLOQ pada kisaran 0,2e39,9
asam mikro, linearitas dan sensitivitas AA jauh lebih ng/mL. Untuk analisis asam fenolat menggunakan
baik, tetapi masih ada sekitar 30% kehilangan yang metode (b), R2 kalibrasi di atas 0,995 untuk senyawa
dicatat setelah penyimpanan 4 jam di bawah 4◦ C. target. LLOD dan LLOQ masing-masing berada di
Hilangnya AA dengan cepat dapat dikaitkan dengan kisaran 0,4e36,1 dan 1,2e72,2 ng/mL.
siklus oksidasi Haber-Weiss yang diawali dengan zat
pereduksi, di mana ion logam (Cu2+ atau Fe3+ dll.) 3.3. Analisis data kimiawi jus dan analisis data
Dalam sampel mereduksi oksigen dan mengeluarkan eksplorasi
pereaksi Fenton, dan menghasilkan radikal hidroksil
yang sangat reaktif [20,21]. Khelasi ion logam Kromatogram representatif dari senyawa target
mengganggu siklus oksidasi dan menjaga stabilitas yang dianalisis dalam AULJ (Sampel No. 8)
AA. Oleh karena itu, EDTA sebagai pengkelat disajikan pada Gbr. 1. Semua fitur metabolisme
logam, ditambahkan ke dalam pelarut sampel dan yang diperoleh untuk 81 sampel jus lemon dan
terbukti sangat efektif dalam menjaga stabilitas AA limun ditampilkan secara visual pada Gbr. 2
serta secara signifikan mengembalikan linearitas dengan data asli pada Lampiran C [22]. Kami
respons. Mempertimbangkan efek pada AA dan mengamati bahwa pada sampel AUJI, konsentrasi
senyawa lainnya, asam format 0,1% dalam larutan sebagian besar senyawa fenolik pada jenis jernih
EDTA jenuh akhirnya dipilih sebagai pelarut lebih rendah dibandingkan dengan jenis keruh
preparasi sampel yang optimal untuk metode (b). yang disajikan pada Gbr. S2. Hal ini kemungkinan
Selain itu, komposisi fase gerak juga dioptimalkan besar merupakan hasil dari penggunaan resin untuk
dengan menguji efek pengubah amonium format dan penyaringan jus untuk membuat jenis yang jernih,
amonium asetat secara terpisah pada 5, 10, dan 25 di mana asam fenolat dapat dengan mudah hilang
mM, masing-masing dengan atau tanpa pH yang melalui adsorpsi ke resin.
disesuaikan hingga 9 menggunakan amonium
hidroksida. Dan 10 mM amonium
Gbr. 2. Peta panas konsentrasi senyawa target dan data uji kimia dalam jus lemon. Semua data dinyatakan sebagai log10 (ng/ml). Kode sampel dicatat
di bagian atas peta panas. Singkatan senyawa mengacu pada Gbr. 1.
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 281
ARTIKEL ASLI
Tujuan utama dari penelitian ini adalah untuk
memisahkan dan memprediksi keaslian jus lemon,
AULJ vs ADLJ, menggunakan metode pembelajaran
mesin berdasarkan fitur metabolik yang diperoleh
untuk memenuhi tujuan kontrol kualitas. Sementara
itu, juga menarik untuk menyelidiki bagaimana
LMND, produk turunan jus lemon yang paling
populer, dibedakan secara kimiawi dan statistik dari
prekursornya. Sebagai bagian dari analisis
eksplorasi, PCA diterapkan pada seluruh dataset
(sebelum pemisahan uji coba) untuk visualisasi
pemisahan potensial (Gbr. S3; PCA interaktif 3D di
https://rpubs.com/ Boyuan/lemon_juice_3D_PCA).
Secara singkat, LMND sebagai produk yang enak
dan dapat diminum paling jelas dibedakan dari
produk bahan baku mereka dengan menempati arah
yang jauh positif dari komponen prinsip pertama
(PC1, 38,1% total varians yang dijelaskan), dan juga
menyajikan lebih banyak homogenitas dalam
kelompok. Dua kelompok jus lemon AULJ dan
ADLJ dioleskan di seluruh PC1, yang mencerminkan Gbr. 3. Analisis diskriminan linier (LDA) dari jus lemon referensi asli
varians antar sampel yang besar. Menggabungkan dan yang dipalsukan serta minuman limun yang bersumber dari sumber
PC1 dan PC2 (yang terakhir menghitung 13,4% dari komersial (dari seluruh dataset tanpa pemisahan uji coba). Nomor pada
total varians), AULJ dan ADLJ secara kasar plot mengacu pada kode sampel, dengan warna font yang menunjukkan
dipisahkan oleh masing-masing pendudukan di pusat kelas identitas terkait. Elips menandai batas yang berisi sekitar 80% titik
data dari kelas yang sesuai. Warna latar belakang kisi-kisi menandai
dan wilayah pinggiran ruang PC dua dimensi. batas prediksi. Sampel dengan prediksi yang salah disorot dengan
Pemisahan tambahan juga terlihat di sepanjang arah lingkaran. Sampel No. 53, misalnya, sebenarnya adalah sampel yang
PC3 (9,9% varians data dijelaskan). Berbeda dengan dipalsukan (font merah), tetapi akan diprediksi secara salah sebagai
PCA yang mencari presentasi maksimum dari total limun karena b e r a d a d i wilayah kisi-kisi hijau. Perhatikan bahwa
varians data dan agak pasif dalam pemisahan wilayah hijau yang diprediksi untuk minuman limun cukup luas
meskipun distribusi sampel limun cukup rapat, bukan karena pencilan
kelompok itu sendiri, LDA secara aktif mencari No. 74, tetapi karena matriks kovarians yang digabungkan dari jus
pemisahan kelompok maksimum dalam hal jarak lemon asli dan yang dipalsukan, yang menyebabkan prediksi yang salah
Mahalanobis dari rata-rata kelompok, atau secara di dekat batas prediksi.
ekuivalen dengan jarak Euclidean yang lebih
sederhana pada skala diskriminan setelah
transformasi LDA. Dan tidak seperti PCA yang Akurasi yang rendah sebagian besar disebabkan oleh
memiliki hampir setengah dari kehilangan informasi asumsi yang tidak beralasan mengenai matriks
dalam visualisasi 2D dan 40% kehilangan dalam plot varians-kovarians yang sama di antara ketiga kelas,
3D dalam penelitian ini, LDA menyajikan visualisasi yang jelas tidak benar seperti yang ditunjukkan oleh
yang nyaman pada plot 2D tanpa kehilangan kumpulan LMND yang padat tetapi penyebaran
informasi, dan secara visual memberikan pemisahan AULJ dan ADLJ yang luas pada plot LDA (Gbr. 3)
yang lebih baik untuk AULJ, ADLJ, dan LMND. (dan juga dengan mudah didiagnosis dengan plot
Selain itu, batas keputusan linier juga dapat dengan distribusi kepadatan univariat pada Gbr. S4). Hal ini
mudah dihitung dan divisualisasikan seperti yang secara langsung menyebabkan varians LMND yang
ditunjukkan pada Gbr. 3. Singkatnya, baik PCA dan terlalu tinggi, sehingga AULJ dan ADLJ sangat
LDA menyampaikan pesan positif tentang rentan terhadap prediksi yang salah sebagai LMND
keterpisahan ketiga kelas AULJ, ADLJ dan LMND. ketika berada di dekat batas keputusan dengan
LMND. Model yang dibangun dengan menggunakan
3.4. Model klasifikasi seluruh training set menunjukkan akurasi prediksi
pada testing set sebesar 72,7%. Perbaikan langsung
Setelah analisis eksplorasi, prediksi klasifikasi dari dari LDA adalah dengan mengevaluasi matriks
ketiga kelas kemudian diuji dengan kuat kovarian secara terpisah untuk setiap kelas, yaitu
menggunakan teknik uji validasi-silang (Gbr. 4-A- dengan menggunakan analisis diskriminan kuadratik
D). Meskipun LDA adalah model yang elegan untuk (QDA), meskipun metode ini tidak dapat dilakukan
reduksi dimensi dan visualisasi seperti yang secara matematis karena terbatasnya ukuran set data
diterapkan di atas, sebagai pengklasifikasi yang yang tersedia. NB mirip dengan LDA karena
cepat dan sederhana, LDA hanya menghasilkan keduanya merupakan algoritma pembelajaran
akurasi cross-validation (CV) sebesar 63,6 ± 12,9% generatif dan menggunakan
dalam set pelatihan. CV yang tidak diinginkan
282 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI
Gbr. 4. Prediksi klasifikasi jus lemon asli (AULJ), jus lemon yang dipalsukan (ADLJ), dan minuman limun yang bersumber dari sumber komersial
(LMND) dalam set pengujian. (A), akurasi validasi silang sebanyak lima kali lipat dalam set pelatihan. (B), akurasi pada set pelatihan. (C), akurasi
pada set pengujian. (D), matriks kebingungan. (E) label kelas aktual dan prediksi berdasarkan sampel; (F) persentase probabilitas prediksi yang
terkait dengan setiap kelas. Untuk singkatan model, LDA, analisis diskriminan linier; LR, regresi logistik lasso-teratur; NB, Gaussian naïve Bayes;
RM, hutan acak; SVM, mesin vektor pendukung. Kode sampel dan informasi terkait mengacu pada Lampiran C.
teori Bayesian, tetapi tidak seperti LDA yang hasil yang sebanding dengan LDA. RF berbeda dari
didasarkan pada distribusi normal multivariat semua model lain dalam penelitian ini karena
gabungan, NB mengestimasi probabilitas bersyarat merupakan teknik ensemble berbasis pohon
secara univariat dan secara terpisah untuk setiap klasifikasi, sangat efisien dalam menghindari over-
kelas. Dan NB mencapai akurasi CV yang lebih baik fitting, dan memungkinkan karakterisasi yang
sekitar 10% dari LDA, dan akurasi 86,4% pada set fleksibel untuk fitur-fitur yang sangat tidak linier. RF
pengujian. Sementara NB mengatasi ketidaksamaan mencapai akurasi 81,8 ± 11,1% pada set CV,
varians yang disebutkan di atas di antara kelas-kelas, memprediksi dengan benar semua set pelatihan
asumsi ketergantungan bersyarat di antara semua ketika diumpankan kembali ke algoritme, dan
variabel fitur kurang kuat (Gbr. S5). LR dibedakan mencapai akurasi 86,4% pada set pengujian. SVM
dari NB dan LDA dengan menjadi algoritma berbasis radial-kernel adalah alat lain yang kuat,
diskriminatif, dan mempelajari serta menghitung yang dibedakan dari yang sebelumnya dengan
probabilitas bersyarat secara langsung tanpa optimasi terfokus pada batas keputusan. SVM ini
ketergantungan pada teori Bayesian, dan kuat memiliki akurasi prediksi yang sebanding dengan
terhadap penyimpangan dari distribusi normal. CV dan set pengujian sebagai RF. Diukur dari
Selain itu, lasso regularisasi membantu menghindari performa prediksi pada set validasi dan set
overfitting. Namun, algoritma ini hanya mencetak pengujian, RF dan SVM merupakan dua model yang
akurasi 72,7% pada set pengujian, sebuah paling konsisten dan seimbang dengan akurasi yang
tinggi.
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 283
Banyaknya simulasi di satu sisi merupakan
banyak pseudo-representasi, yang memeriksa
konsistensi dari yang diselidiki.
ARTIKEL ASLI
Terlepas dari prediksi label kelas itu sendiri, fitur
bagus yang dimiliki oleh LDA, LR, NB, dan RF
yang tidak dimiliki oleh SVM adalah prediksi
langsung dari probabilitas untuk setiap kelas.
Hubungan langsung dengan prediksi probabilitas
tersebut merupakan nilai referensi untuk
pengambilan keputusan dalam praktik nyata. Sampel
No. 24, misalnya, meskipun sebenarnya adalah
AULJ, secara tidak langsung diprediksi oleh LR
sebagai lemondade (Gbr. 4-E). Akan tetapi, prediksi
probabilitas untuk menjadi limun hanya 51% (Gbr.
4-F), dengan indeks Gini yang besar (pengurangan
jumlah probabilitas kuadrat dari satu) yaitu 0,61.
Prediksi seperti itu bukanlah prediksi yang
menentukan karena prediksi yang benar dan
meyakinkan dari label kelas biasanya didukung oleh
probabilitas yang lebih besar dari satu kelas
dibandingkan kelas yang lain, atau setara dengan
nilai indeks Gini yang kecil yang diukur pada skala
0,67 dalam kasus pemisahan tiga kelompok dalam
penelitian ini. Oleh karena itu, hasil prediksi hanya
boleh dianggap remeh dan tidak boleh digunakan
untuk mengambil keputusan. Meskipun pengamatan
terhadap probabilitas merupakan cara yang
informatif untuk menilai kepercayaan prediksi,
penting juga untuk menginterpretasikan probabilitas
dalam konteks karakteristik masing-masing model,
karena nilai probabilitas yang sama dapat memiliki
arti yang berbeda untuk model yang berbeda.
Sebagai contoh, LR memprediksi dengan benar 6
dari 7 AULJ dan semua 7 LMND dalam set
pengujian, sementara probabilitas terkait untuk
sampel yang diprediksi dengan benar masing-masing
hanya 49e70% dan 54e55%, tingkat probabilitas
yang terlalu konservatif dan tidak jelas bagi NB
untuk mencapai prediksi yang meyakinkan.
Mengenai penetapan probabilitas untuk setiap kelas,
NB secara probabilistik adalah yang paling sensitif
dan agresif, diikuti oleh LDA dan RF, dengan LR
menjadi yang paling konservatif (Gbr. S6).
0.75 0.75
Prediksi probabilitas untuk setiap
kelas
0.25 0.25
*
0.00 0.00
0 10 20 30 0 10 20 30 0 10 20 30 0 20 40 60 80 0 20 40 60 80 0 20 40 60 80
A2 konten B2 konten
2.0 a
0.05 0.04 g
1.5 0.04 0.02
c 0.03
kepadat
kepadat
0.03
1.0
0.01
f
0.02
b 0.02
an
an
0.01 0.00
10 20 30
0.0 0.00
0 10 20 30 0 20 40 60 80
Kandungan asam malat (mg/mL) Kandungan 4 HBA (ng/mL)
Gambar 5. Interpretasi model hutan acak dengan analisis ekspektasi bersyarat individu (ICE) (A1 dan B1) dan plot densitas terkait (A2 dan B2). Yang
ditunjukkan adalah efek dari dua fitur metabolik asam malat (MA) dan asam 4-hidroksibenzoat (4-HBA) terhadap probabilitas yang diprediksi dari jus
lemon asli (AULJ), jus lemon yang dipalsukan (ADLJ), dan minuman limun yang berasal dari sumber komersial (LMND). Dalam plot ICE, setiap jejak
berasal dari satu sampel dalam set pelatihan. Besaran kandungan MA (A1) dan 4-HBA (B1) dipaksa untuk melakukan iterasi pada rentang nilai kisi-
kisi (n ¼ 100) dengan tetap menjaga semua variabel lainnya tidak berubah. Sampel baru yang diperoleh dimasukkan ke dalam model yang telah
dilatih untuk memprediksi probabilitas yang terkait dengan setiap kelas. Probabilitas menjadi ADLJ, AULJ dan LMND ditampilkan dalam faset/panel
yang terpisah (misalnya, A1-1, A1-2 dan A1-3), dan di dalam setiap faset, warna jejak mengacu pada identitas aktual sampel pelatihan dari mana jejak
simulasi diturunkan. Kode batang pada absis plot ICE mewakili distribusi densitas fitur dalam set pelatihan asli. Plot densitas (A2 dan B2)
menunjukkan densitas distribusi fitur dari seluruh dataset sebelum pemisahan train-test. Inset plot densitas menampilkan closeup untuk AULJ dan
ADLJ. Hubungan antara density proflle dan prediksi probabilitas ditandai dengan huruf kecil (aeg). Analisis ICE tambahan mengacu pada Lampiran
A2.
Sampel yang berasal dari ADLJ aktual telah Dasbor dibangun berdasarkan aplikasi R Shiny.
ditentukan sebelumnya sebagai ADLJ (probabilitas Meskipun semua pemodelan yang disebutkan di
terkait di atas setidaknya 50%), terlepas dari fitur atas didasarkan pada teknik pelatihan-pengujian,
yang diuji dan besaran yang terkait. Aturan yang untuk prediksi praktis, set pelatihan dan pengujian
sama juga diterapkan pada AULJ dan LMND. Hal sebelumnya digabungkan untuk melatih model
ini menunjukkan bahwa semua sampel dalam set akhir. Dibangun di atas model yang telah dilatih,
pelatihan asli diprediksi dengan benar, menunjukkan aplikasi R Shiny secara otomatis memprediksi
fleksibilitas yang tinggi dan kapasitas pembelajaran identitas dan probabilitas yang terkait dari sampel
model RF. Lebih penting lagi, hal ini juga yang tidak diketahui. Basis data pelatihan dapat
menunjukkan bahwa tidak ada fitur metabolik diunduh sebagai template dan kemudian diperbarui
tunggal yang semata-mata menentukan identitas dan diunggah kembali ke aplikasi untuk prediksi
sampel, dan bahwa identifikasi sampel yang tidak sampel baru.
diketahui harus didasarkan pada profil lengkap dari Selain membuat prediksi, aplikasi ini juga dapat
semua fitur metabolik yang diteliti. berfungsi sebagai alat analisis yang mudah
digunakan untuk menyelidiki kinerja model. Di
3.6. R dasbor online yang mengkilap bawah fungsionalitas prediksi sampel tunggal (tab 1),
misalnya, penyesuaian inkremental dari nilai fitur
Untuk memfasilitasi penerapan pembelajaran input melalui bilah geser secara animasi
mesin yang mudah untuk prediksi identitas di antara memperbarui probabilitas prediksi yang terkait
AULJ, ADLJ, dan LMND tanpa pengkodean, dengan setiap kelas, yang menghasilkan versi
sumber terbuka online dinamis dari
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 285
minuman limun serta memberikan
pendekatan baru yang kuat untuk mendeteksi
adulerasi dan meningkatkan kualitas produk.
ARTIKEL ASLI
analisis ICE statis. Sementara itu, realisasi dinamis
analisis ICE dapat dengan mudah diperluas ke
beberapa fitur juga. Untuk penggunaan instruktif
lainnya, aplikasi ini membantu mensimulasikan
seberapa kuat model terhadap kesalahan pengukuran
yang bersumber dari akuisisi data hulu. Di bawah
fungsionalitas prediksi batch (tab 2), sebelum
mengunggah data baru, secara default menampilkan
hasil prediksi ketika basis data pelatihan diumpankan
kembali ke model yang dibangun. Kumpulan
pelatihan dapat diunduh dan diperbarui dan
kemudian diumpankan kembali sebagai data baru ke
model. Ketika ± 20% noise acak yang terdistribusi
secara seragam ditambahkan ke basis data pelatihan
sebagai simulasi kesalahan yang terjadi selama
pengumpulan data, ca.
94,8e98,7% dari prediksi tetap sama; ketika
±50% derau agresif ditambahkan, sekitar
85,7e97,4% prediksi tetap tidak berubah. RF dan
SVM adalah y a n g p a l i n g t i d a k rentan
terhadap penambahan noise, dan 98,7 dan 97,4%
prediksi tetap tidak tersentuh dengan noise ±50%
(Gbr. S8). Simulasi ini menunjukkan bahwa model
yang dikembangkan, khususnya RF dan SVM, cukup
kuat terhadap kesalahan yang bersumber dari akuisisi
data.
4. Kesimpulan
Dalam penelitian ini, metode UHPLC- QqQ-
MS/MS yang sensitif dan dapat direproduksi
dikembangkan, dan analisis kuantatif dari 14 fitur
metabolisme menggunakan metode LC-MS yang
dioptimalkan serta uji kolorimetri telah dicapai.
Parameter yang berkaitan dengan pelarut
pengenceran, kondisi LC dan MS dioptimalkan.
Untuk kuantifikasi asam organik CTA, MA dan AA,
linearitas kalibrasi sangat meningkat ketika
menggunakan 0,1% asam format dalam larutan
EDTA jenuh untuk menyiapkan dan mengencerkan
larutan standar. Mekanisme yang mungkin dapat
diusulkan untuk menjelaskan peningkatan ini adalah
EDTA dapat menghambat siklus oksidasi Haber-
Weiss sebagai katalisator logam untuk melindungi
asam-asam organik dari degradasi. Metode analisis
yang dikembangkan kemudian diterapkan pada 81
sampel jus lemon. Untuk klasifikasi AULJ, ADLJ
dan LMND, lima model yang berbeda, LDA, NB,
LR, RF dan SVM, dengan RF dan SVM menjadi dua
model yang paling kuat. Secara khusus, RF dengan
algoritma ensembelnya secara fleksibel menangkap
nuansa karakteristik dari distribusi kepadatan fitur
metabolik setiap kelas dan mengaitkan distribusi
kepadatan dengan probabilitas yang diprediksi
seperti yang diungkapkan oleh analisis ICE. Dengan
menerapkan model yang sudah ada, dasbor online
yang dibangun akan berfungsi sebagai alat yang
nyaman dan berguna untuk memfasilitasi identifikasi
keaslian jus lemon dan perbedaannya dengan
Deklarasi kepentingan yang bersaing
Para penulis menyatakan bahwa tidak ada kepentingan
finansial yang bersaing atau hubungan pribadi yang dapat
mempengaruhi pekerjaan yang dilaporkan dalam karya
ini.
Kontribusi penulis
Weiting Lyu ikut merancang dan melaksanakan
eksperimen, melakukan analisis data dan ikut menyusun
naskah. Bo Yuan melakukan analisis data, merancang
halaman web aplikasi R-shiny dan ikut menyusun naskah.
Siyu Liu, James E. Simon dan Qingli Wu turut
merancang dan mengawasi proyek secara keseluruhan,
menyediakan dana untuk melakukan penelitian dan
merevisi naskah.
Referensi
[1] Giron´es-Vilaplana A, Mena P, García-Viguera C, Moreno DA.
Minuman baru yang kaya akan fenolat antioksidan: maqui berry
(Aristotelia chilensis) dan jus lemon. LWT-Food Sci Technol
2012;47:279e86.
[2] Mohanapriya M, Ramaswamy L, Rajendran R. Kesehatan dan khasiat
obat lemon (Citrus limonum). Int J Ayur Herb Med 2013;3:1095e100.
[3] Everstine K, Spink J, Kennedy S. Pemalsuan bermotif ekonomi (EMA)
pada makanan: karakteristik umum insiden EMA . J Food Protect
2013;76:723e35.
[4] Wang Z, Jablonski JE. Deteksi pemalsuan jus lemon yang ditargetkan
dan tidak ditargetkan dengan LC-MS dan kemometrik. Food Addit
Contam 2016;33:560e73.
[5] Cautela D, Laratta B, Santelli F, Trifiro` A, Servillo L, Castaldo D.
Memperkirakan pemalsuan jus bergamot dari jus lemon dengan analisis
kromatografi cair kinerja tinggi (KCKT) dari glikosida flavanon. J Agric
Food Chem 2008;56:5407e14.
[6] Food U, Administration D. CFR-code of federal regulations title. 2017.
p. 21.
[7] Doner LW. Rasio isotop karbon dalam asam sitrat alami dan sintetis
sebagai indikator pemalsuan jus lemon. J Agric Food Chem
1985;33:770e2.
[8] Vandercook CE, Mackey BE, Price RL. Pendekatan statistik baru untuk
evaluasi jus lemon. J Agric Food Chem 1973;21:681e3.
[9] Grandi R, Trifiro A, Gherardi S, Calza M, Saccani G. Karakterisasi
sari buah lemon berdasarkan kandungan flavonoid. Pengolahan buah
(Jerman). 1994.
[10] Mouly PP, Arzouyan CR, Gaydou EM, Estienne JM. Diferensiasi jus
jeruk dengan analisis diskriminan faktorial menggunakan kromatografi
cair glikosida flavanon. J Agric Food Chem 1994;42:70e9.
[11] Yuan B, Zhao D, Du R, Kshatriya D, Bello NT, Simon JE, dkk. Metode
spektrometri massa kroma-tografi cair / tandem berkinerja tinggi yang
sangat sensitif dengan fragmentasi dalam sumber untuk kuantifikasi
cepat keton raspberry. J Food Drug Anal 2019; 27: 778e85.
286 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI
[12] Kao F.J., Chiu Y.S., Chiang W.D. Pengaruh pemasakan dengan [17] Friedman J, Hastie T, Tibshirani R. Elemen-elemen
air terhadap kapasitas antioksidan sayuran kaya karotenoid di pembelajaran statistik. New York: Seri Springer dalam statistik;
Taiwan. J Food Drug Anal 2014;22:202e9. 2001.
[13] Singleton VL, Rossi JA. Kolorimetri fenolat total dengan [18] Johnson RA, Wichern DW. Analisis statistik multivariat
pereaksi asam fosfomolibdat-fosfotungstat. Am J Enol Vitic terapan analisis. Upper Saddle River, NJ: Prentice hall; 2002.
1965;16:144e58. [19] Ihaka R, Gentleman RR. Sebuah bahasa untuk analisis data dan
[14] Yuan B, Byrnes D, Giurleo D, Villani T, Simon JE, Wu Q. grafik . J Comput Graph Stat 1996; 5: 299e314.
Skrining cepat glikoalkaloid beracun dan mikronutrien pada [20] Mahoney JR, Graf E. Peran alfa-tokoferol, asam askorbat, asam
nightshades yang dapat dimakan (Solanum spp.). J Food sitrat dan EDTA sebagai oksidan dalam sistem model. J Food
Drug Anal 2018; 26:751e60. Sci 1986;51:1293e6.
[15] Re R, Pellegrini N, Proteggente A, Pannala A, Yang M, Rice- [21] Takano S, Ishiwata S, Nakazawa M, Mizugaki M, Tamai M.
Evans C. Aktivitas antioksidan yang menerapkan uji Penentuan asam askorbat dalam humor vitreous manusia
dekolorisasi kation radikal ABTS yang ditingkatkan. Free dengan kromatografi cair kinerja tinggi dengan detektor UV.
Radic Biol Med 1999; 26:1231e7. Curr Eye Res 1997; 16: 589e94.
[16] Benzie IF, Strain JJ. Kemampuan mereduksi besi plasma [22] Peta Panas Kompleks GZ. Membuat peta panas yang
(FRAP) sebagai ukuran "kekuatan antioksidan": uji FRAP. Anal kompleks. R pack- age versi 1.6. 0. 2015.
Biochem 1996;239:70e6. [23] Molnar C. Panduan untuk membuat model kotak hitam dapat
dijelaskan. https://christophm/github io/interpretable-ml-
book. 2021.