Anda di halaman 1dari 20

Subscribe to DeepL Pro to translate larger documents.

Visit www.DeepL.com/pro for more information.

Volume 29 Edisi 2 Pasal 7

Penilaian kualitas jus lemon dan pemalsuan dengan kromatografi cair


berkinerja sangat tinggi / spektrometri massa tiga kuadrupol dengan
pembelajaran mesin yang interaktif dan dapat ditafsirkan

Ikuti artikel ini dan karya-karya lainnya di: https://www.jfda-online.com/journal

Bagian dari Commons Ilmu Pangan, Commons Kimia Obat dan Farmasi, Commons Farmakologi, dan
Commons Toksikologi

Karya ini dilisensikan di bawah Lisensi Creative Commons Atribusi-Nonkomersial-Tanpa Karya


Turunan 4.0.

Kutipan yang Direkomendasikan


Lyu, Weiting; Yuan, Bo; Liu, Siyu; Simon, James E.; dan Wu, Qingli (2021) "Penilaian kualitas dan pemalsuan
jus lemon dengan kromatografi cair kinerja tinggi / spektrometri massa kuadrupol tiga kali lipat dengan
pembelajaran mesin yang interaktif dan dapat diinterpretasikan," Journal of Food and Drug Analysis: Vol. 29 : Iss. 2,
Artikel 7.
Tersedia di: https://doi.org/10.38212/2224-6614.3356

Artikel Asli ini dipersembahkan untuk Anda secara gratis dan akses terbuka oleh Journal of Food and Drug Analysis.
Artikel ini telah diterima untuk dimuat di Jurnal Analisis Makanan dan Obat oleh editor resmi Jurnal Analisis
Makanan dan Obat.
ARTIKEL ASLI
Penilaian kualitas jus lemon dan pemalsuan dengan
kromatografi cair berkinerja sangat tinggi /
spektrometri massa tiga kuadrupol dengan
pembelajaran mesin yang interaktif dan dapat
ditafsirkan

Weiting Lyu a,b, Bo Yuan a,c, Siyu Liu ddan James E. Simon a,b,*, Qingli Wu a,b,c,**

a Program Pertanian Penggunaan Baru dan Produk Tumbuhan Alami, Departemen Biologi Tumbuhan dan Pusat Ekosistem Pangan
Pertanian,
Institut Makanan, Nutrisi & Kesehatan, Universitas Rutgers, 59 Dudley Road, New Brunswick, NJ, 08901, AS
b Departemen Kimia Medisinal, Universitas Rutgers, 160 Frelinghuysen Road, Piscataway, NJ, 08854, AS
c Departemen Ilmu Pangan, Universitas Rutgers, 65 Dudley Road, New Brunswick, NJ, 08901, AS
d Citromax Flavors Group, Inc, 444 Washington Ave, Carlstadt, NJ, 07072, USA

Abstrak

Sebanyak 81 sampel jus lemon dideteksi menggunakan metode UHPLC-QqQ-MS/MS yang dioptimalkan dan uji
kolorimetri. Konsentrasi 3 asam organik (asam askorbat, asam malat, dan asam sitrat), 3 sakarida (glukosa, fruktosa, dan
sukrosa), dan 6 asam fenolat (asam trans-p-koumarat, asam 3-hidroksibenzoat, asam 4-hidroksibenzoat, asam 3,4-
dihidroks-ybenzoat, asam kafeat) dikuantifikasi. Total polifenol, aktivitas antioksidan, dan kekuatan antioksidan pereduksi
Ferric juga diukur. Untuk prediksi jus lemon asli dan yang dipalsukan serta minuman limun yang bersumber dari sumber
komersial berdasarkan profil metabolik y a n g diperoleh, model pembelajaran mesin termasuk analisis diskriminan
linier, Gaussian naïve Bayes, regresi logistik yang diregulasi secara lasso, random forest (RF) dan mesin vektor
pendukung dikembangkan berdasarkan alur kerja pelatihan (70%) - pengujian validasi silang (30%). Akurasi yang
diprediksi pada set pengujian adalah 73e86% untuk model yang berbeda. Analisis ekspektasi bersyarat individu
(bagaimana probabilitas yang diprediksi berubah ketika besaran fitur berubah) diterapkan untuk interpretasi model, yang
secara khusus mengungkapkan hubungan yang erat antara prediksi probabilitas RF dengan karakteristik nuansa distribusi
kepadatan fitur metabolisme. Dengan menggunakan model yang sudah ada, sebuah dasbor online sumber terbuka
dibangun untuk prediksi klasifikasi yang nyaman dan visualisasi interaktif dalam praktik nyata.

Kata kunci: Pembelajaran mesin yang dapat ditafsirkan, Jeruk limon, Kontrol kualitas, Aplikasi mengkilap R, UHPLC-
QqQ-MS/MS
Senyawa kimia: asam sitrat, PubChem CID: 311, sukrosa, PubChem CID: 5988, asam askorbat, PubChem CID: 54670067,
glukosa, PubChem CID: 5793, fruktosa, PubChem CID: 2723872, asam malat, PubChem CID: 525, asam trans-p-kou-
marat, PubChem CID: 637542, asam 3-hidroksibenzoat, PubChem CID: 7420, asam 4-hidroksibenzoat, PubChem CID:
135, asam 3, 4-dihidroksibenzoat, PubChem CID: 72, asam caffeic, PubChem CID: 689043, asam galat, PubChem CID:
370, trolox, PubChem CID: 40634

1. Pendahuluan Lemon, diklasifikasikan sebagai Citrus limon


(L.) Burm. f., adalah spesies jeruk terpenting

A erkembangan jeruk, salah satu buah yang


paling banyak dikonsumsi karena rasanya yang
ketiga setelah jeruk keprok dan mandarin, dan
telah dikaitkan dengan berbagai macam manfaat
enak, aromanya yang khas dan berbagai manfaat kesehatan dan terapeutik terkait penurunan berat
kesehatannya, terus menjadi perhatian konsumen badan, kulit, perawatan mata, dan juga terhadap
dan industri. gangguan pernapasan dan saluran kemih.

Diterima 14 Januari 2021; direvisi 12 April 2021; diterima 22 April 2021.


Tersedia secara online pada 15 Juni 2021.

*, ** Penulis korespondensi: Departemen Biologi Tumbuhan, Universitas Rutgers, 59 Dudley Road, New Brunswick, NJ, 08901, AS. Tel: +1(848)-932-6239 (J.E.
Simon), +1(848)-932-6238 (Q. Wu).
Alamat email: jimsimon@rutgers.edu (J.E. Simon), qlwu@sebs.rutgers.edu (Q. Wu).

https://doi.org/10.38212/2224-6614.3356
2224-6614/© 2021 Badan Pengawas Obat dan Makanan Taiwan. Ini adalah artikel akses terbuka di bawah lisensi CC-BY-NC-
ND (http://creativecommons.org/licenses/by-nc-nd/4.0/).
276 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI

hilangnya senyawa fenolik karena retensi


gangguan, dll [1,2]. Namun, pemalsuan yang
resin.
bermotif ekonomi (EMA) pada jus lemon telah
dan tetap menjadi masalah [3]. EMA jus tidak
hanya dapat mengurangi senyawa bioaktif tetapi
juga menimbulkan potensi risiko kesehatan bagi
konsumen [4]. Pemalsuan yang umum terjadi pada
jus lemon termasuk penambahan gula dan air yang
tidak dilaporkan, kulit dan / atau bubur kertas,
asam organik seperti asam sitrat, asam askorbat
dan asam malat, dan jus dari spesies jeruk yang
terkait secara botani [5].
Keasaman yang dapat dititrasi (4,5% b/b sebagai
asam sitrat) dan padatan terlarut, yang bersama-sama
mengacu pada nilai sukrosa refraktometri (6% berat
pada 20◦ C), merupakan satu-satunya spesifikasi
peraturan di Amerika [6]. Keasaman yang dapat
dititrasi dan padatan terlarut dimaksudkan untuk
mendeteksi penambahan air, tetapi gagal dalam
kasus pengenceran jus lemon dengan penambahan
gula dan asam sitrat yang tidak mahal secara
bersamaan [4]. Untuk meningkatkan deteksi
pemalsuan, parameter kimia dan fisik umum lainnya
dianalisis secara rutin dan kemudian dibandingkan
dengan data referensi yang dilaporkan oleh Asosiasi
Industri Jus dan Nektar (AJIN) dari Buah-buahan
dan Sayuran [4]. Terlepas dari pendekatan
tradisional, metode yang lebih canggih telah
diusulkan, seperti melalui analisis rasio isotop
karbon dalam asam sitrat dan penanda lainnya dalam
jus lemon [7]. Metode ini, meskipun terlihat efektif
dalam mendeteksi penambahan gula dan air,
membutuhkan staf yang sangat terlatih dan
instrumen khusus untuk analisis kimia. Pendekatan
lain melibatkan perhitungan rasio asam amino dan
analisis profil flavonoid [7e10] untuk menilai
keasliannya, tetapi tidak dapat membedakan keaslian
menggunakan jus dari spesies jeruk lain yang terkait
secara botani seperti jeruk bali dan jeruk nipis karena
kurangnya keunikan senyawa penanda.
Keterbatasan utama lain dari penelitian terdahulu
mengenai deteksi pemalsuan jus lemon adalah
lemahnya desain eksperimen pada penelitian-
penelitian yang hanya menggunakan jus buatan
laboratorium atau buatan sendiri yang diperas
langsung dari lemon segar, karena proses ini
sayangnya tidak mewakili limun komersial atau
jus lemon pekat. Sebagai contoh, tambahan air,
gula, dan asam sitrat biasanya ditambahkan pada
minuman limun untuk mendapatkan rasa yang
lebih enak. Untuk jus lemon pekat yang bersumber
dari industri, konsentrasi berbasis panas dan
pasteurisasi umumnya meningkatkan konsentrasi
senyawa dengan menghilangkan air tetapi
sementara itu dapat menghancurkan senyawa yang
labil secara termal. Selain itu, penggunaan resin
secara umum untuk penyaringan jus dan tujuan
pembersihan dapat dengan mudah menyebabkan
Untuk memfasilitasi identifikasi pemalsuan jus lemon
yang praktis dan kuat, kami mengusulkan metodologi baru
dan memberikan validasi untuk aplikasi dan penggunaannya.
Sebanyak 81 sampel jus lemon dianalisis, termasuk jus
lemon asli dan jus lemon yang dipalsukan yang berasal dari
industri, jus lemon buatan sendiri dan jus lemon yang
dibubuhi secara manual, serta minuman limun yang
dipasarkan. Sidik jari kimia dibuat dengan analisis
kuantitatif terhadap 14 fitur metabolik menggunakan
kromatografi cair kinerja tinggi dengan spektrum massa tiga
kuadrupol (UPLC/QqQ-MS) serta uji kolorimetri untuk total
polifenol dan antioksidan. Berdasarkan analisis hasil dari
pendekatan analitik, model pembelajaran mesin dibuat untuk
prediksi keaslian dan identitas menggunakan train-cross-
validation, dan dasbor sumber terbuka online dibuat untuk
mengotomatiskan prediksi untuk sampel baru di masa
mendatang.

2. Bahan dan metode


2.1. Bahan dan reagen kimia

Asam sitrat (CTA), sukrosa, asam askorbat (AA), glukosa,


fruktosa, asam malat (MA), asam trans-p-koumarat (p-CA),
asam 3-hidroksibenzoat (3-HBA), asam 4-hidroksibenzoat
(4-HBA), asam 3,4-dihidroksibenzoat (3,4-diHBA), asam
kafeat (CFA), asam galat (GA), standar trolox dibeli dari
Sigma-Aldrich (St. Louis, MO, AS); asam ferulic (FA)
berasal dari ChromaDex Inc (Irvine, CA, AS). Reagen kimia
(semua kelas HPLC) termasuk amonium format, amonium
asetat, amonium hidroksida, asam format, asetonitril (ACN),
dan metanol berasal dari Fisher Scientific (Fair Lawn, NJ,
USA). Reagen (semua kelas ACS) termasuk asam etil-
enediaminetetraasetat (EDTA), reagen Folin Cio- calteu,
natrium karbonat, 2, 3, 5-trifeniltetrazolium klorida (TPTZ),
2, 20 -azino-bis(3-ethylbenzothiazoline-6-sulfonic acid) dia-
mmonium salt (ABTS), kalium persulfat, so- dium asetat
trihidrat, asam asetat glasial, asam klorida berasal dari
Fisher Scientific (Fair Lawn, NJ, USA). Air Pierce™ LC-
MS berasal dari Thermo Fisher Scientific (Waltham, MA,
USA).

2.2. Persiapan standar referensi

Untuk larutan referensi CTA, sekitar 10 mg standar


ditimbang secara akurat dan diencerkan hingga 10 mL
menggunakan asam format 0,1% dalam air. Alikuot dari 100
mL larutan stok dibubuhi 10 mL asam format 0,1% dalam
air untuk membuat larutan kerja pertama.
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 277
asli. Sampel yang telah disiapkan
disentrifugasi pada 12.000 rpm

ARTIKEL ASLI
Pengenceran serial lebih lanjut dilakukan dengan
menggunakan pelarut yang sama hingga
1000e0,06 mg/mL.
Untuk pembuatan larutan referensi AA, MA dan
larutan sakarida (fruktosa, glukosa dan sukrosa),
sekitar 10 mg masing-masing standar ditimbang
secara akurat dan dilarutkan dalam 10 mL asam
format 0,1% dengan EDTA jenuh. Alikuot dari 100
mL larutan stok ditambahkan ke dalam 10 mL asam
format 0,1% dalam larutan EDTA jenuh untuk
membuat larutan kerja pertama. Pengenceran serial
lebih lanjut dilakukan dengan menggunakan pelarut
yang sama untuk menghasilkan larutan kerja dengan
standar 1000e0,06 mg/mL.
Untuk larutan referensi asam fenolat termasuk FA,
p-CA, 3-HBA, 4-HBA, 3,4-diHBA dan CFA, masing-
masing
standar ca. 15 mg ditimbang secara akurat dan
disiapkan dalam 10 mL asam format 0,1% dalam
larutan metanol 70%. Alikuot dari 40 mL larutan
stok dibubuhi 10 mL asam format 0,1% dalam
larutan metanol 70% untuk membuat larutan kerja
pertama, yang kemudian diencerkan secara serial
menggunakan pelarut pengenceran yang sama
hingga 4000e0,1 ng/mL sebagai larutan kerja.

2.3. Jus lemon dan persiapan sampel

Jus lemon asli (AULJ) [1e23] dan jus lemon yang


dipalsukan (ADLJ) (27e43) (baik yang disaring dan
jernih, atau tidak disaring dan keruh) diperoleh
secara internal dari Citromax Group (Carlstadt, NJ,
AS), termasuk 23 sampel asli yang berbeda dan 17
sampel palsu yang teridentifikasi. Untuk pembuatan
jus buatan tangan, buah lemon segar yang dibeli dari
supermarket lokal digiling dan diperas, lalu jus yang
terkumpul dicampur dengan air (1:1) sebagai AULJ
buatan sendiri. Untuk menyiapkan ADLJ buatan
tangan, jus apel buatan laboratorium ditambahkan ke
dalam AULJ secara acak, dengan rasio volume
AULJ/jus apel sebesar 90/10, 70/30, dan 50/50.
Sebanyak 3 AULJ buatan tangan (24e26) dan 10
ADLJ buatan tangan (44e53) disiapkan. Selain itu,
28 jus lemon (54e57) dan limun (LMND, 58e81)
yang berasal dari pasar komersial dikumpulkan dari
pasar komersial. Semua sampel jus disimpan dalam
suhu -20◦ C dan dikondisikan pada suhu ruangan
sebelum analisis sampel.
Untuk analisis CTA menggunakan metode LC-MS
(a), semua sampel jus lemon dicampur dengan 0,1%
asam format dalam air (1:10) dan disonikasi selama
15 menit. 100 mL setiap sampel yang diencerkan
selanjutnya diencerkan dengan 10 mL pelarut yang
sama diikuti dengan sonikasi selama 15 menit. Satu
alikuot dari 100 mL sampel yang telah diencerkan
dicampur dengan 10 mL asam format 0,1% dalam air
dan di vortex selama 30 detik. Kemudian 200 mL
larutan diencerkan menjadi 1 mL, larutan sampel
akhir sekarang 500.000 kali lebih encer dari sampel
selama 10 menit dan supernatannya langsung disuntikkan
ke dalam UHPLC.
Untuk analisis instrumental asam organik dan sakarida
menggunakan metode LC-MS (b), semua sampel jus lemon
dicampur dengan 0,1% asam format dalam larutan EDTA
jenuh (1:10) dan disonikasi selama
15 menit. Satu alikuot dari 20 mL sampel yang telah
diencerkan dicampur dengan 10 mL pelarut pengenceran
yang sama seperti di atas dan disonikasi selama 15 menit.
Kemudian 100 mL larutan diencerkan menjadi 1 mL,
yang sekarang 50.000 kali lebih encer daripada sampel
asli. Sampel yang telah disiapkan disentrifugasi pada
12.000 rpm selama 10 menit dan supernatannya langsung
disuntikkan ke dalam UHPLC.
Untuk analisis asam fenolat menggunakan metode LC-MS
(c), semua sampel jus lemon dicampur dengan 0,1% asam
format dalam larutan metanol 70% (1:1) dan disonikasi
selama 15 menit. Semua sampel disentrifugasi pada 12.000
rpm selama 10 menit dan supernatan disuntikkan langsung
ke dalam UHPLC.
Untuk uji kolorimetri (bagian 2.5, 2.6 dan 2.7), masing-
masing sampel jus lemon diencerkan menggunakan air
sebanyak tiga kali sebelum pengujian.

2.4. Metode UHPLC-QqQ-MS / MS / MS

Instrumen yang digunakan untuk analisis kimia adalah


Agilent 1290 Infinity II UHPLC (Agilent Technology, Palo
Alto, CA, USA) yang dilengkapi dengan spektrometri massa
triple quadrupole 6470 dengan sumber ionisasi elektrospray
(ESI) (Santa Clara, CA, USA). Agilent MassHunter
Optimizer (versi B.07.00) digunakan untuk optimasi
parametrik terkait senyawa standar, dan perangkat lunak
MassHunter Workstation Data Acquisition (versi B.08.00)
dan Quantitative Analysis (versi B.07.01) digunakan untuk
pemrosesan data. Kolom yang digunakan untuk pemisahan
senyawa adalah Prontosil C18 AQ (2,1 × 150 mm, 3 mm)
(untuk metode (a)) dan Prontosil C18 AQ (2,1 × 100 mm, 3
mm) (untuk metode (b) dan metode (c)) (Bischoff,
Leonberg, Jerman).

2.4.1. Metode LC-MS dari CTA


Metode (a) dikembangkan dan diterapkan untuk analisis
CTA. Untuk bagian kromatografi, fase gerak A adalah
air, dan fase gerak B adalah 65% ACN dalam air, kedua
fase gerak dimodifikasi dengan 10 mM amonium asetat
dengan pH yang disesuaikan hingga 9 menggunakan
amonium hidroksida. Laju alirnya adalah
0,3 mL/menit. Gradiennya adalah 100% A dari 0 hingga 4
menit, 100% e0% A dari 4 hingga 4,5 menit, dan 0% A dari
4,5 hingga 7,5 menit. Kolom disetimbangkan dengan 100%
A selama 3 menit di antara injeksi. Kolom diatur pada suhu
40◦ C. Autosampler diatur ke 4◦ C. Volume injeksi adalah 1
mL. Untuk MS
278 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI

bagian, nitrogen dengan kemurnian tinggi air, dan fase gerak B adalah 0,1% asam format dalam
digunakan sebagai nebulisasi, pengeringan dan gas ACN. Gradiennya adalah 100% A dari 0 hingga 2
selubung di ruang ionisasi. Nebulizer diatur pada menit, 100% hingga 60% A dari 2 hingga 5 menit,
30 psi, dan gas pengering pada 300◦ C dengan laju dan dipertahankan pada 60% A dari 5 hingga 6
aliran 13 L/menit. Gas selubung adalah 250◦ C menit. Kolom disetimbangkan dengan 100% A
dengan laju aliran 12 L/menit. Polaritas negatif selama 1 menit di antara injeksi. Laju aliran adalah
diterapkan. Mode pemindaian adalah dynamic 0,5 mL/menit. Kolom diatur pada suhu 30◦ C. Semua
multiple reaction of monitoring (dMRM) yang kondisi instrumen lainnya tetap sama dengan metode
dioptimalkan menggunakan MassHunter (a). Parameter MRM dinamis dinyatakan dalam Gbr.
Optimizer seperti yang dilaporkan sebelumnya 1C.
[11], dengan parameter yang disajikan pada
Gambar 1.1. 2.6. Uji polifenol total (TPP)

2.4.2. Metode LC-MS untuk MA, AA, dan sakarida Metode pengujian TPP didasarkan pada metode
Metode (b) digunakan untuk analisis MA, AA dan yang telah dilaporkan sebelumnya [12e14] dengan
sakarida (glukosa, fruktosa dan sukrosa). Fase gerak modifikasi. 50 mL reagen Folin Ciocalteu diencerkan
A adalah 30% ACN dalam air, dan fase gerak B dengan air suling hingga 500 mL, kemudian 900 mL
adalah 65% ACN dalam air, kedua fase gerak reagen Folin yang telah diencerkan dicampur dengan
dimodifikasi dengan 10 mM amonium asetat dengan 80 mL sampel jus yang telah diencerkan, diikuti
pH yang disesuaikan menjadi 9 menggunakan dengan penambahan 400 mL larutan natrium
amonium hidroksida. Laju alir adalah 0,5 mL/menit. karbonat jenuh. Sistem reaksi di vortex sepenuhnya
Semua kondisi instrumen lainnya tetap sama dengan dan didiamkan selama 1 jam. 200 mL larutan
metode (a). Parameter MRM dinamis ditunjukkan dipindahkan ke 96 pelat sumur ganda dan dilakukan
pada Gambar 1B. pengukuran serapan di bawah 765 nm. Untuk kurva
kalibrasi, ca. 30 mg asam galat dilarutkan dalam 5
2.5. Metode LC-MS untuk asam fenolat mL metanol 70% untuk membuat larutan stok, yang
kemudian diencerkan menjadi
Metode (c) diterapkan untuk analisis asam fenolik .
Fase gerak A adalah 0,1% asam format dalam

Gbr. 1. Kromatogram representatif Sampel No. 8 yang diperoleh dalam mode pemantauan reaksi berganda dinamis (MRM) dengan struktur
kimia analit. (A), kromatogram yang diperoleh dengan menggunakan metode (a), (B) dengan metode (b) dan (C) dengan metode (c). Waktu retensi
ditunjukkan dalam warna merah di atas setiap puncak. Transisi MRM dicatat dalam bentuk: ion prekursor (tegangan fragmen) / ion produk (energi
tumbukan). Ion kuantifier dicatat dengan warna hijau dan ion kualifikasi dengan warna oranye, dan tegangan terkait dicatat dengan warna
biru.
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 279
serial hingga 0,05e1,7 ng/mL sebagai

ARTIKEL ASLI
serangkaian larutan kerja dengan konsentrasi mulai
dari 0,02 mg/mL hingga 1,6 mg/mL. Kandungan
TPP dalam sampel dinyatakan sebagai jumlah
ekuivalen asam galat (GAE) / mg $ mL .—1

2.7. Aktivitas antioksidan

Uji aktivitas antioksidan didasarkan pada metode


yang dijelaskan oleh Re dkk. [15] dengan modifikasi.
Semua sampel diencerkan menggunakan air
sebanyak tiga kali sebelum pengujian. 31,7 mg
ABTS dan 8,6 mg kalium persulfat dilarutkan dalam
10 mL air suling. Campuran tersebut kemudian
disimpan dalam keadaan gelap di bawah suhu kamar
selama 12-16 jam untuk membentuk radikal yang
stabil dan diencerkan menggunakan air hingga
serapan ~1,3 pada 734 nm. Selanjutnya, 200 mL
larutan ABTS dicampur dengan 20 mL sampel jus
yang telah diencerkan dan direaksikan selama 15
menit pada suhu kamar. Sistem reaksi di vortex
sepenuhnya dan 200 mL supernatan dipindahkan ke
96 sumur ganda dan serapan diukur pada 734 nm.
Untuk kurva kalibrasi, ca. 12,5 mg Trolox standar
dilarutkan dalam 5 mL etanol murni sebagai larutan
stok dan diencerkan menjadi serangkaian larutan
kerja dengan konsentrasi mulai dari 0,04 mg / mL
hingga 1,5 mg / mL. Aktivitas antioksidan
dinyatakan sebagai jumlah trolox equivalent (TE) /
mg $ mL .—1

2.8. Uji daya antioksidan pereduksi besi


(FRAP)

Uji FRAP didasarkan pada metode yang


dilaporkan oleh Benzie & Strain [16] dengan
modifikasi. Setiap sampel diencerkan tiga kali
menggunakan air. Pertama,
3,1 g natrium asetat trihidrat dilarutkan dalam 16 mL
asam asetat glasial dan pH disesuaikan menjadi 3,6
menggunakan natrium hidroksida. Kemudian, larutan
diencerkan hingga 1 L dengan air suling untuk
membuat buffer asetat 300 mM. Kedua, 27 mg besi
klorida dilarutkan dalam 5 mL air untuk membuat
larutan besi klorida. Kemudian 31,2 mg TPTZ
dilarutkan dalam 4 mL
Larutan asam klorida 40 mM untuk menyiapkan
larutan TPTZ. Ketiga, 10 mL buffer asetat, 1 mL
larutan besi klorida, 1 mL larutan TPTZ dan
1,2 mL air dicampur untuk menyiapkan reagen
FRAP. Keempat, 500 mL reagen FRAP, 225 mL air,
dan 25 mL sampel direaksikan dalam tabung
sentrifugasi mikro 1,5 mL. Selanjutnya, tabung
dibiarkan dalam keadaan gelap selama 30 menit.
Sistem reaksi di vortex sepenuhnya, 200 mL
supernatan dipindahkan ke 96 sumur ganda dan
serapan diukur pada 593 nm. Untuk kurva kalibrasi,
sekitar 30 mg vitamin C dilarutkan dalam 5 mL air
sebagai larutan stok dan kemudian diencerkan secara
solusi kerja. FRAP dinyatakan sebagai jumlah setara Vitamin
C (VCE) / mg $ mL—1 .

2.9. Pembelajaran mesin

Dataset yang diperoleh berisi 14 fitur metabolik di 77


sampel, termasuk 26 AULJ (kode sampel 1e26) (empat
sampel jus lemon dengan kode 54e57 yang dibeli dari pasar
tidak termasuk dalam kategori AULJ), 27 ADLJ (27e53)
dan 24 LMND yang dibeli secara komersial dengan merek
yang berbeda (58e81), menjadi sasaran studi klasifikasi
menggunakan metode pembelajaran mesin [17,18]. Analisis
komponen prinsip (PCA) dan analisis diskriminan linier
(LDA) pertama kali diterapkan pada seluruh dataset sebagai
bagian dari prosedur analisis data eksploratif (EDA).
Kemudian kinerja prediksi klasifikasi diuji dengan lebih giat
menggunakan prosedur uji coba dengan menggunakan lima
model yang berbeda, termasuk LDA, regresi logistik lasso-
teratur (LR), Gaussian naïve Bayes (NB), random forest
(RF), dan support vector machine (SVM). Seluruh dataset
dibagi secara acak dengan rasio 70/30 menggunakan
stratified sampling ke dalam training set dan testing set. Set
pelatihan dinormalisasi ke dalam z-score sebelum
pemodelan, dan set pengujian dinormalisasi berdasarkan
rata-rata dan varian dari set pelatihan. Validasi silang lima
kali lipat diterapkan untuk penyetelan parameter hiper LR,
RF, dan SVM. Kelima model tersebut kemudian dilatih
menggunakan seluruh training set dengan hyper-parameter
yang dioptimalkan, jika ada, dan kemudian diuji
menggunakan testing set yang sudah ada sebelumnya. Selain
itu, untuk memfasilitasi aplikasi model dan pra-diksi dalam
praktiknya, dasbor sumber terbuka online di
https://boyuan.shinyapps.io/LemonClassification/ dibangun
dengan model yang dilatih pada seluruh set data. R dan
markdown terkait serta aplikasi web Shiny digunakan untuk
komputasi dan visualisasi statistik, presentasi skrip, dan
konstruksi dasbor online [19]. Skrip R yang terkait mengacu
pada https://yuanbofaith.github.io/Lemon_Juice_
Classification2/index.html.

3. Hasil dan diskusi


3.1. Optimasi metode UHPLC-QqQ-MS/MS

Pelarut yang digunakan untuk preparasi sampel jus


lemon dan standar referensi dipilih berdasarkan studi
pendahuluan yang penting untuk linearitas respons
senyawa serta bentuk puncak kromatografi, terutama
untuk tiga asam organik AA, CTA dan MA. Dengan
demikian, desain faktorial dilakukan untuk menguji
pengaruh 6 pelarut sampel yang berbeda, termasuk air
dengan atau tanpa 0,1% air.
280 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI

penambahan amonium hidroksida atau asam format, asetat dengan pH yang disesuaikan hingga 9 dipilih
dan masing-masing dengan EDTA jenuh (Gbr. S1). sebagai fase gerak terbaik untuk metode (a).
Secara singkat, MA dan CTA menunjukkan
intensitas sinyal sekitar 5e20 kali lebih tinggi dalam 3.2. Kalibrasi, linearitas dan sensitivitas
pelarut basa dengan 0,1% amonium hidroksida
dibandingkan dengan pelarut sampel asam dengan Parameter kurva kalibrasi, koefisien determinasi
0,1% asam format. Untuk CTA, linearitas dan (R2 ), rentang linier, batas bawah deteksi (LLOD)
sensitivitas paling baik dalam pelarut dengan asam dan batas bawah kuantifikasi (LLOQ) dari semua
format 0,1%, dan sebagai hasilnya, ini dipilih analit target ditunjukkan pada Tabel S1. Untuk
sebagai pelarut preparasi sampel yang optimal untuk kuantifikasi asam organik CTA, MA dan AA, dan
metode (a). AA menunjukkan sensitivitas yang tidak sakarida sukrosa, glukosa dan fruktosa menggunakan
terlalu terganggu dan hampir tidak ada respons metode (a), linearitas kalibrasi yang baik dicapai
linearitas pada semua pelarut basa karena degradasi dengan R2 di atas 0,993. LLOD berada pada kisaran
yang dipercepat. Dalam pelarut asam dengan 0,1% 0,06e10 ng/mL dan LLOQ pada kisaran 0,2e39,9
asam mikro, linearitas dan sensitivitas AA jauh lebih ng/mL. Untuk analisis asam fenolat menggunakan
baik, tetapi masih ada sekitar 30% kehilangan yang metode (b), R2 kalibrasi di atas 0,995 untuk senyawa
dicatat setelah penyimpanan 4 jam di bawah 4◦ C. target. LLOD dan LLOQ masing-masing berada di
Hilangnya AA dengan cepat dapat dikaitkan dengan kisaran 0,4e36,1 dan 1,2e72,2 ng/mL.
siklus oksidasi Haber-Weiss yang diawali dengan zat
pereduksi, di mana ion logam (Cu2+ atau Fe3+ dll.) 3.3. Analisis data kimiawi jus dan analisis data
Dalam sampel mereduksi oksigen dan mengeluarkan eksplorasi
pereaksi Fenton, dan menghasilkan radikal hidroksil
yang sangat reaktif [20,21]. Khelasi ion logam Kromatogram representatif dari senyawa target
mengganggu siklus oksidasi dan menjaga stabilitas yang dianalisis dalam AULJ (Sampel No. 8)
AA. Oleh karena itu, EDTA sebagai pengkelat disajikan pada Gbr. 1. Semua fitur metabolisme
logam, ditambahkan ke dalam pelarut sampel dan yang diperoleh untuk 81 sampel jus lemon dan
terbukti sangat efektif dalam menjaga stabilitas AA limun ditampilkan secara visual pada Gbr. 2
serta secara signifikan mengembalikan linearitas dengan data asli pada Lampiran C [22]. Kami
respons. Mempertimbangkan efek pada AA dan mengamati bahwa pada sampel AUJI, konsentrasi
senyawa lainnya, asam format 0,1% dalam larutan sebagian besar senyawa fenolik pada jenis jernih
EDTA jenuh akhirnya dipilih sebagai pelarut lebih rendah dibandingkan dengan jenis keruh
preparasi sampel yang optimal untuk metode (b). yang disajikan pada Gbr. S2. Hal ini kemungkinan
Selain itu, komposisi fase gerak juga dioptimalkan besar merupakan hasil dari penggunaan resin untuk
dengan menguji efek pengubah amonium format dan penyaringan jus untuk membuat jenis yang jernih,
amonium asetat secara terpisah pada 5, 10, dan 25 di mana asam fenolat dapat dengan mudah hilang
mM, masing-masing dengan atau tanpa pH yang melalui adsorpsi ke resin.
disesuaikan hingga 9 menggunakan amonium
hidroksida. Dan 10 mM amonium

Limun yang Referensi otentik Referensi yang


bersumber dari Jus lemon dipalsukan
CTA sumber komersial
Glukosa / Fruktosa
Sukrosa
MA
AA
3,4-di HBA
CFA
4-HBA
3-HBA
p-CA
FA
Uji antioksidan
Uji TPP
Uji FRAP

Di atas batas deteksi atas


-2 0.5 3 5.5 8
konten / log10 (ng / mL)

Gbr. 2. Peta panas konsentrasi senyawa target dan data uji kimia dalam jus lemon. Semua data dinyatakan sebagai log10 (ng/ml). Kode sampel dicatat
di bagian atas peta panas. Singkatan senyawa mengacu pada Gbr. 1.
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 281

ARTIKEL ASLI
Tujuan utama dari penelitian ini adalah untuk
memisahkan dan memprediksi keaslian jus lemon,
AULJ vs ADLJ, menggunakan metode pembelajaran
mesin berdasarkan fitur metabolik yang diperoleh
untuk memenuhi tujuan kontrol kualitas. Sementara
itu, juga menarik untuk menyelidiki bagaimana
LMND, produk turunan jus lemon yang paling
populer, dibedakan secara kimiawi dan statistik dari
prekursornya. Sebagai bagian dari analisis
eksplorasi, PCA diterapkan pada seluruh dataset
(sebelum pemisahan uji coba) untuk visualisasi
pemisahan potensial (Gbr. S3; PCA interaktif 3D di
https://rpubs.com/ Boyuan/lemon_juice_3D_PCA).
Secara singkat, LMND sebagai produk yang enak
dan dapat diminum paling jelas dibedakan dari
produk bahan baku mereka dengan menempati arah
yang jauh positif dari komponen prinsip pertama
(PC1, 38,1% total varians yang dijelaskan), dan juga
menyajikan lebih banyak homogenitas dalam
kelompok. Dua kelompok jus lemon AULJ dan
ADLJ dioleskan di seluruh PC1, yang mencerminkan Gbr. 3. Analisis diskriminan linier (LDA) dari jus lemon referensi asli
varians antar sampel yang besar. Menggabungkan dan yang dipalsukan serta minuman limun yang bersumber dari sumber
PC1 dan PC2 (yang terakhir menghitung 13,4% dari komersial (dari seluruh dataset tanpa pemisahan uji coba). Nomor pada
total varians), AULJ dan ADLJ secara kasar plot mengacu pada kode sampel, dengan warna font yang menunjukkan
dipisahkan oleh masing-masing pendudukan di pusat kelas identitas terkait. Elips menandai batas yang berisi sekitar 80% titik
data dari kelas yang sesuai. Warna latar belakang kisi-kisi menandai
dan wilayah pinggiran ruang PC dua dimensi. batas prediksi. Sampel dengan prediksi yang salah disorot dengan
Pemisahan tambahan juga terlihat di sepanjang arah lingkaran. Sampel No. 53, misalnya, sebenarnya adalah sampel yang
PC3 (9,9% varians data dijelaskan). Berbeda dengan dipalsukan (font merah), tetapi akan diprediksi secara salah sebagai
PCA yang mencari presentasi maksimum dari total limun karena b e r a d a d i wilayah kisi-kisi hijau. Perhatikan bahwa
varians data dan agak pasif dalam pemisahan wilayah hijau yang diprediksi untuk minuman limun cukup luas
meskipun distribusi sampel limun cukup rapat, bukan karena pencilan
kelompok itu sendiri, LDA secara aktif mencari No. 74, tetapi karena matriks kovarians yang digabungkan dari jus
pemisahan kelompok maksimum dalam hal jarak lemon asli dan yang dipalsukan, yang menyebabkan prediksi yang salah
Mahalanobis dari rata-rata kelompok, atau secara di dekat batas prediksi.
ekuivalen dengan jarak Euclidean yang lebih
sederhana pada skala diskriminan setelah
transformasi LDA. Dan tidak seperti PCA yang Akurasi yang rendah sebagian besar disebabkan oleh
memiliki hampir setengah dari kehilangan informasi asumsi yang tidak beralasan mengenai matriks
dalam visualisasi 2D dan 40% kehilangan dalam plot varians-kovarians yang sama di antara ketiga kelas,
3D dalam penelitian ini, LDA menyajikan visualisasi yang jelas tidak benar seperti yang ditunjukkan oleh
yang nyaman pada plot 2D tanpa kehilangan kumpulan LMND yang padat tetapi penyebaran
informasi, dan secara visual memberikan pemisahan AULJ dan ADLJ yang luas pada plot LDA (Gbr. 3)
yang lebih baik untuk AULJ, ADLJ, dan LMND. (dan juga dengan mudah didiagnosis dengan plot
Selain itu, batas keputusan linier juga dapat dengan distribusi kepadatan univariat pada Gbr. S4). Hal ini
mudah dihitung dan divisualisasikan seperti yang secara langsung menyebabkan varians LMND yang
ditunjukkan pada Gbr. 3. Singkatnya, baik PCA dan terlalu tinggi, sehingga AULJ dan ADLJ sangat
LDA menyampaikan pesan positif tentang rentan terhadap prediksi yang salah sebagai LMND
keterpisahan ketiga kelas AULJ, ADLJ dan LMND. ketika berada di dekat batas keputusan dengan
LMND. Model yang dibangun dengan menggunakan
3.4. Model klasifikasi seluruh training set menunjukkan akurasi prediksi
pada testing set sebesar 72,7%. Perbaikan langsung
Setelah analisis eksplorasi, prediksi klasifikasi dari dari LDA adalah dengan mengevaluasi matriks
ketiga kelas kemudian diuji dengan kuat kovarian secara terpisah untuk setiap kelas, yaitu
menggunakan teknik uji validasi-silang (Gbr. 4-A- dengan menggunakan analisis diskriminan kuadratik
D). Meskipun LDA adalah model yang elegan untuk (QDA), meskipun metode ini tidak dapat dilakukan
reduksi dimensi dan visualisasi seperti yang secara matematis karena terbatasnya ukuran set data
diterapkan di atas, sebagai pengklasifikasi yang yang tersedia. NB mirip dengan LDA karena
cepat dan sederhana, LDA hanya menghasilkan keduanya merupakan algoritma pembelajaran
akurasi cross-validation (CV) sebesar 63,6 ± 12,9% generatif dan menggunakan
dalam set pelatihan. CV yang tidak diinginkan
282 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI

Gbr. 4. Prediksi klasifikasi jus lemon asli (AULJ), jus lemon yang dipalsukan (ADLJ), dan minuman limun yang bersumber dari sumber komersial
(LMND) dalam set pengujian. (A), akurasi validasi silang sebanyak lima kali lipat dalam set pelatihan. (B), akurasi pada set pelatihan. (C), akurasi
pada set pengujian. (D), matriks kebingungan. (E) label kelas aktual dan prediksi berdasarkan sampel; (F) persentase probabilitas prediksi yang
terkait dengan setiap kelas. Untuk singkatan model, LDA, analisis diskriminan linier; LR, regresi logistik lasso-teratur; NB, Gaussian naïve Bayes;
RM, hutan acak; SVM, mesin vektor pendukung. Kode sampel dan informasi terkait mengacu pada Lampiran C.

teori Bayesian, tetapi tidak seperti LDA yang hasil yang sebanding dengan LDA. RF berbeda dari
didasarkan pada distribusi normal multivariat semua model lain dalam penelitian ini karena
gabungan, NB mengestimasi probabilitas bersyarat merupakan teknik ensemble berbasis pohon
secara univariat dan secara terpisah untuk setiap klasifikasi, sangat efisien dalam menghindari over-
kelas. Dan NB mencapai akurasi CV yang lebih baik fitting, dan memungkinkan karakterisasi yang
sekitar 10% dari LDA, dan akurasi 86,4% pada set fleksibel untuk fitur-fitur yang sangat tidak linier. RF
pengujian. Sementara NB mengatasi ketidaksamaan mencapai akurasi 81,8 ± 11,1% pada set CV,
varians yang disebutkan di atas di antara kelas-kelas, memprediksi dengan benar semua set pelatihan
asumsi ketergantungan bersyarat di antara semua ketika diumpankan kembali ke algoritme, dan
variabel fitur kurang kuat (Gbr. S5). LR dibedakan mencapai akurasi 86,4% pada set pengujian. SVM
dari NB dan LDA dengan menjadi algoritma berbasis radial-kernel adalah alat lain yang kuat,
diskriminatif, dan mempelajari serta menghitung yang dibedakan dari yang sebelumnya dengan
probabilitas bersyarat secara langsung tanpa optimasi terfokus pada batas keputusan. SVM ini
ketergantungan pada teori Bayesian, dan kuat memiliki akurasi prediksi yang sebanding dengan
terhadap penyimpangan dari distribusi normal. CV dan set pengujian sebagai RF. Diukur dari
Selain itu, lasso regularisasi membantu menghindari performa prediksi pada set validasi dan set
overfitting. Namun, algoritma ini hanya mencetak pengujian, RF dan SVM merupakan dua model yang
akurasi 72,7% pada set pengujian, sebuah paling konsisten dan seimbang dengan akurasi yang
tinggi.
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 283
Banyaknya simulasi di satu sisi merupakan
banyak pseudo-representasi, yang memeriksa
konsistensi dari yang diselidiki.

ARTIKEL ASLI
Terlepas dari prediksi label kelas itu sendiri, fitur
bagus yang dimiliki oleh LDA, LR, NB, dan RF
yang tidak dimiliki oleh SVM adalah prediksi
langsung dari probabilitas untuk setiap kelas.
Hubungan langsung dengan prediksi probabilitas
tersebut merupakan nilai referensi untuk
pengambilan keputusan dalam praktik nyata. Sampel
No. 24, misalnya, meskipun sebenarnya adalah
AULJ, secara tidak langsung diprediksi oleh LR
sebagai lemondade (Gbr. 4-E). Akan tetapi, prediksi
probabilitas untuk menjadi limun hanya 51% (Gbr.
4-F), dengan indeks Gini yang besar (pengurangan
jumlah probabilitas kuadrat dari satu) yaitu 0,61.
Prediksi seperti itu bukanlah prediksi yang
menentukan karena prediksi yang benar dan
meyakinkan dari label kelas biasanya didukung oleh
probabilitas yang lebih besar dari satu kelas
dibandingkan kelas yang lain, atau setara dengan
nilai indeks Gini yang kecil yang diukur pada skala
0,67 dalam kasus pemisahan tiga kelompok dalam
penelitian ini. Oleh karena itu, hasil prediksi hanya
boleh dianggap remeh dan tidak boleh digunakan
untuk mengambil keputusan. Meskipun pengamatan
terhadap probabilitas merupakan cara yang
informatif untuk menilai kepercayaan prediksi,
penting juga untuk menginterpretasikan probabilitas
dalam konteks karakteristik masing-masing model,
karena nilai probabilitas yang sama dapat memiliki
arti yang berbeda untuk model yang berbeda.
Sebagai contoh, LR memprediksi dengan benar 6
dari 7 AULJ dan semua 7 LMND dalam set
pengujian, sementara probabilitas terkait untuk
sampel yang diprediksi dengan benar masing-masing
hanya 49e70% dan 54e55%, tingkat probabilitas
yang terlalu konservatif dan tidak jelas bagi NB
untuk mencapai prediksi yang meyakinkan.
Mengenai penetapan probabilitas untuk setiap kelas,
NB secara probabilistik adalah yang paling sensitif
dan agresif, diikuti oleh LDA dan RF, dengan LR
menjadi yang paling konservatif (Gbr. S6).

3.5. Analisis ekspektasi bersyarat individu


(ICE)

Untuk membuat kotak hitam pembelajaran mesin


lebih transparan dan intuitif, analisis ICE disusun
untuk menjelaskan hubungan antara fitur
metabolisme dan hasil prediksi model. Analisis ICE
dapat dibandingkan dengan simulasi eksperimen
faktor tunggal, di mana prediksi probabilitas dibuat
sebagai respons terhadap berbagai nilai fitur yang
diminati, sambil menjaga agar nilai semua variabel
lainnya tidak berubah. Simulasi tersebut secara
intuitif mengungkapkan bagaimana besarnya fitur
yang diminati berdampak pada kemungkinan yang
diprediksi. Selain itu, simulasi dibuat untuk setiap
sampel individu dalam set pelatihan menggunakan
nilai asli fitur yang tidak terkait, sehingga ada satu
jejak simulasi untuk setiap contoh pelatihan.
Sementara itu, juga mengungkap kemungkinan interaksi
antara fitur yang diselidiki dengan fitur lain yang tidak
terkait [23].
Dalam penelitian ini, analisis ICE dilakukan untuk
menginterpretasikan model RF dan LR, yang ditunjukkan
pada Gambar 5 dan Lampiran A2. Asam malat, misalnya,
ditemukan sebagai senyawa penanda yang efektif dalam
membedakan LMND dari AULJ dan ADLJ. Ketika
kandungan MA meningkat di atas ca. 1e2 mg / mL,
probabilitas yang diprediksi RF untuk contoh pelatihan yang
disimulasikan sebagai LMND dengan cepat menurun
terlepas dari kondisi semua fitur lainnya, yang
dimanifestasikan oleh kurva bentuk-L yang hampir bulat
pada A1-3 (pada Gbr. 5, gambar yang sama untuk diskusi
berikut). Seiring dengan penurunan probabilitas LMND,
probabilitas ADLJ dan AULJ meningkat dengan cepat (A1-1
dan A1-2). Pola yang sama juga terlihat pada asam sitrat dan
asam askorbat. Hal ini diharapkan karena LMND sebagai
minuman yang menyenangkan cenderung mengandung lebih
sedikit senyawa pemicu rasa asam dibandingkan dengan jus
lemon, yang sebagai bahan baku LMND terlalu asam untuk
diminum dalam bentuk aslinya. Secara matematis,
probabilitas prediksi RF mencerminkan distribusi densitas
besaran fitur dari setiap kelas. RF tidak hanya merefleksikan
pola perubahan signifikan dalam distribusi densitas, tetapi
juga menangkap detail nuansa dan menyesuaikan prediksi
probabilitas yang sesuai. Sebagai contoh, ketika kandungan
MA lebih tinggi dari 20 mg/mL, terdapat lebih banyak
sampel AULJ daripada ADLJ (A2, daerah b), dan dengan
demikian prediksi probabilitas ADLJ turun dan probabilitas
AULJ secara bersamaan melonjak (A1-1 dan A1-2, daerah
b). Untuk senyawa 4-HBA, dengan cara yang sama,
penurunan probabilitas ADLJ di wilayah d dan e (B1-1)
masing-masing mencerminkan lembah d dan lereng geser e
dari distribusi kepadatan (B2). Penyesuaian yang sensitif
dalam prediksi probabilitas ini menunjukkan bahwa RF
memiliki kemampuan non-linear yang sangat fleksibel, fitur
yang tidak dimiliki oleh beberapa model lain seperti LR,
yang memodelkan probabilitas sebagai kurva sigmoid yang
lebih jelas (Gbr. S7).
Interaksi fitur teramati dan hal ini dapat mempersulit
interpretasi model. Pada kisaran kandungan MA 5e20
mg/mL dan untuk prediksi probabilitas ADLJ, sebagian
besar jejak simulasi yang berasal dari sampel ADLJ
aktual menunjukkan profil yang lebih datar atau sedikit
cekung ke bawah, sementara sekelompok jejak dari AULJ
aktual sedikit cekung ke atas (ditandai dengan tanda bintang,
A1-1). Perbedaan ini disebabkan oleh perbedaan variabel
lain yang secara terpisah merupakan ciri khas dari ADLJ
dan AULJ, yang mengubah cara probabilitas prediksi berubah
sebagai respons terhadap perubahan kandungan MA.
Fenomena informatif lainnya yang diungkap oleh plot RF-
ICE adalah bahwa identitas semua simulasi
284 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI

Asam malat 4-HBA


A1 ADLJ AULJ LMND B1 ADLJ AULJ LMND
A1-1 A1-2 A1-3 B1-1 B1-2 B1-3
1.00 1.00

0.75 0.75
Prediksi probabilitas untuk setiap

Prediksi probabilitas untuk setiap


0.50 0.50
a b b c d e f g
kelas

kelas
0.25 0.25

*
0.00 0.00

0 10 20 30 0 10 20 30 0 10 20 30 0 20 40 60 80 0 20 40 60 80 0 20 40 60 80
A2 konten B2 konten
2.0 a
0.05 0.04 g
1.5 0.04 0.02
c 0.03
kepadat

kepadat
0.03

1.0
0.01
f
0.02
b 0.02
an

an

0.01 0.00

0.5 0.00 0.01 d e 0 20 40 60 80

10 20 30

0.0 0.00
0 10 20 30 0 20 40 60 80
Kandungan asam malat (mg/mL) Kandungan 4 HBA (ng/mL)

Jus lemon referensi Jus lemon referensi Minuman limun yang


otentik yang dipalsukan berasal dari sumber
komersial

Gambar 5. Interpretasi model hutan acak dengan analisis ekspektasi bersyarat individu (ICE) (A1 dan B1) dan plot densitas terkait (A2 dan B2). Yang
ditunjukkan adalah efek dari dua fitur metabolik asam malat (MA) dan asam 4-hidroksibenzoat (4-HBA) terhadap probabilitas yang diprediksi dari jus
lemon asli (AULJ), jus lemon yang dipalsukan (ADLJ), dan minuman limun yang berasal dari sumber komersial (LMND). Dalam plot ICE, setiap jejak
berasal dari satu sampel dalam set pelatihan. Besaran kandungan MA (A1) dan 4-HBA (B1) dipaksa untuk melakukan iterasi pada rentang nilai kisi-
kisi (n ¼ 100) dengan tetap menjaga semua variabel lainnya tidak berubah. Sampel baru yang diperoleh dimasukkan ke dalam model yang telah
dilatih untuk memprediksi probabilitas yang terkait dengan setiap kelas. Probabilitas menjadi ADLJ, AULJ dan LMND ditampilkan dalam faset/panel
yang terpisah (misalnya, A1-1, A1-2 dan A1-3), dan di dalam setiap faset, warna jejak mengacu pada identitas aktual sampel pelatihan dari mana jejak
simulasi diturunkan. Kode batang pada absis plot ICE mewakili distribusi densitas fitur dalam set pelatihan asli. Plot densitas (A2 dan B2)
menunjukkan densitas distribusi fitur dari seluruh dataset sebelum pemisahan train-test. Inset plot densitas menampilkan closeup untuk AULJ dan
ADLJ. Hubungan antara density proflle dan prediksi probabilitas ditandai dengan huruf kecil (aeg). Analisis ICE tambahan mengacu pada Lampiran
A2.

Sampel yang berasal dari ADLJ aktual telah Dasbor dibangun berdasarkan aplikasi R Shiny.
ditentukan sebelumnya sebagai ADLJ (probabilitas Meskipun semua pemodelan yang disebutkan di
terkait di atas setidaknya 50%), terlepas dari fitur atas didasarkan pada teknik pelatihan-pengujian,
yang diuji dan besaran yang terkait. Aturan yang untuk prediksi praktis, set pelatihan dan pengujian
sama juga diterapkan pada AULJ dan LMND. Hal sebelumnya digabungkan untuk melatih model
ini menunjukkan bahwa semua sampel dalam set akhir. Dibangun di atas model yang telah dilatih,
pelatihan asli diprediksi dengan benar, menunjukkan aplikasi R Shiny secara otomatis memprediksi
fleksibilitas yang tinggi dan kapasitas pembelajaran identitas dan probabilitas yang terkait dari sampel
model RF. Lebih penting lagi, hal ini juga yang tidak diketahui. Basis data pelatihan dapat
menunjukkan bahwa tidak ada fitur metabolik diunduh sebagai template dan kemudian diperbarui
tunggal yang semata-mata menentukan identitas dan diunggah kembali ke aplikasi untuk prediksi
sampel, dan bahwa identifikasi sampel yang tidak sampel baru.
diketahui harus didasarkan pada profil lengkap dari Selain membuat prediksi, aplikasi ini juga dapat
semua fitur metabolik yang diteliti. berfungsi sebagai alat analisis yang mudah
digunakan untuk menyelidiki kinerja model. Di
3.6. R dasbor online yang mengkilap bawah fungsionalitas prediksi sampel tunggal (tab 1),
misalnya, penyesuaian inkremental dari nilai fitur
Untuk memfasilitasi penerapan pembelajaran input melalui bilah geser secara animasi
mesin yang mudah untuk prediksi identitas di antara memperbarui probabilitas prediksi yang terkait
AULJ, ADLJ, dan LMND tanpa pengkodean, dengan setiap kelas, yang menghasilkan versi
sumber terbuka online dinamis dari
JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286 285
minuman limun serta memberikan
pendekatan baru yang kuat untuk mendeteksi
adulerasi dan meningkatkan kualitas produk.

ARTIKEL ASLI
analisis ICE statis. Sementara itu, realisasi dinamis
analisis ICE dapat dengan mudah diperluas ke
beberapa fitur juga. Untuk penggunaan instruktif
lainnya, aplikasi ini membantu mensimulasikan
seberapa kuat model terhadap kesalahan pengukuran
yang bersumber dari akuisisi data hulu. Di bawah
fungsionalitas prediksi batch (tab 2), sebelum
mengunggah data baru, secara default menampilkan
hasil prediksi ketika basis data pelatihan diumpankan
kembali ke model yang dibangun. Kumpulan
pelatihan dapat diunduh dan diperbarui dan
kemudian diumpankan kembali sebagai data baru ke
model. Ketika ± 20% noise acak yang terdistribusi
secara seragam ditambahkan ke basis data pelatihan
sebagai simulasi kesalahan yang terjadi selama
pengumpulan data, ca.
94,8e98,7% dari prediksi tetap sama; ketika
±50% derau agresif ditambahkan, sekitar
85,7e97,4% prediksi tetap tidak berubah. RF dan
SVM adalah y a n g p a l i n g t i d a k rentan
terhadap penambahan noise, dan 98,7 dan 97,4%
prediksi tetap tidak tersentuh dengan noise ±50%
(Gbr. S8). Simulasi ini menunjukkan bahwa model
yang dikembangkan, khususnya RF dan SVM, cukup
kuat terhadap kesalahan yang bersumber dari akuisisi
data.

4. Kesimpulan
Dalam penelitian ini, metode UHPLC- QqQ-
MS/MS yang sensitif dan dapat direproduksi
dikembangkan, dan analisis kuantatif dari 14 fitur
metabolisme menggunakan metode LC-MS yang
dioptimalkan serta uji kolorimetri telah dicapai.
Parameter yang berkaitan dengan pelarut
pengenceran, kondisi LC dan MS dioptimalkan.
Untuk kuantifikasi asam organik CTA, MA dan AA,
linearitas kalibrasi sangat meningkat ketika
menggunakan 0,1% asam format dalam larutan
EDTA jenuh untuk menyiapkan dan mengencerkan
larutan standar. Mekanisme yang mungkin dapat
diusulkan untuk menjelaskan peningkatan ini adalah
EDTA dapat menghambat siklus oksidasi Haber-
Weiss sebagai katalisator logam untuk melindungi
asam-asam organik dari degradasi. Metode analisis
yang dikembangkan kemudian diterapkan pada 81
sampel jus lemon. Untuk klasifikasi AULJ, ADLJ
dan LMND, lima model yang berbeda, LDA, NB,
LR, RF dan SVM, dengan RF dan SVM menjadi dua
model yang paling kuat. Secara khusus, RF dengan
algoritma ensembelnya secara fleksibel menangkap
nuansa karakteristik dari distribusi kepadatan fitur
metabolik setiap kelas dan mengaitkan distribusi
kepadatan dengan probabilitas yang diprediksi
seperti yang diungkapkan oleh analisis ICE. Dengan
menerapkan model yang sudah ada, dasbor online
yang dibangun akan berfungsi sebagai alat yang
nyaman dan berguna untuk memfasilitasi identifikasi
keaslian jus lemon dan perbedaannya dengan
Deklarasi kepentingan yang bersaing
Para penulis menyatakan bahwa tidak ada kepentingan
finansial yang bersaing atau hubungan pribadi yang dapat
mempengaruhi pekerjaan yang dilaporkan dalam karya
ini.

Kontribusi penulis
Weiting Lyu ikut merancang dan melaksanakan
eksperimen, melakukan analisis data dan ikut menyusun
naskah. Bo Yuan melakukan analisis data, merancang
halaman web aplikasi R-shiny dan ikut menyusun naskah.
Siyu Liu, James E. Simon dan Qingli Wu turut
merancang dan mengawasi proyek secara keseluruhan,
menyediakan dana untuk melakukan penelitian dan
merevisi naskah.

Ucapan terima kasih


Kami berterima kasih kepada New Use Agriculture and
Natural Plant Products Lab dan New Jersey Agriculture
Experiment Station (Simon's HATCH project 12170) atas
dukungan mereka.

Referensi
[1] Giron´es-Vilaplana A, Mena P, García-Viguera C, Moreno DA.
Minuman baru yang kaya akan fenolat antioksidan: maqui berry
(Aristotelia chilensis) dan jus lemon. LWT-Food Sci Technol
2012;47:279e86.
[2] Mohanapriya M, Ramaswamy L, Rajendran R. Kesehatan dan khasiat
obat lemon (Citrus limonum). Int J Ayur Herb Med 2013;3:1095e100.
[3] Everstine K, Spink J, Kennedy S. Pemalsuan bermotif ekonomi (EMA)
pada makanan: karakteristik umum insiden EMA . J Food Protect
2013;76:723e35.
[4] Wang Z, Jablonski JE. Deteksi pemalsuan jus lemon yang ditargetkan
dan tidak ditargetkan dengan LC-MS dan kemometrik. Food Addit
Contam 2016;33:560e73.
[5] Cautela D, Laratta B, Santelli F, Trifiro` A, Servillo L, Castaldo D.
Memperkirakan pemalsuan jus bergamot dari jus lemon dengan analisis
kromatografi cair kinerja tinggi (KCKT) dari glikosida flavanon. J Agric
Food Chem 2008;56:5407e14.
[6] Food U, Administration D. CFR-code of federal regulations title. 2017.
p. 21.
[7] Doner LW. Rasio isotop karbon dalam asam sitrat alami dan sintetis
sebagai indikator pemalsuan jus lemon. J Agric Food Chem
1985;33:770e2.
[8] Vandercook CE, Mackey BE, Price RL. Pendekatan statistik baru untuk
evaluasi jus lemon. J Agric Food Chem 1973;21:681e3.
[9] Grandi R, Trifiro A, Gherardi S, Calza M, Saccani G. Karakterisasi
sari buah lemon berdasarkan kandungan flavonoid. Pengolahan buah
(Jerman). 1994.
[10] Mouly PP, Arzouyan CR, Gaydou EM, Estienne JM. Diferensiasi jus
jeruk dengan analisis diskriminan faktorial menggunakan kromatografi
cair glikosida flavanon. J Agric Food Chem 1994;42:70e9.
[11] Yuan B, Zhao D, Du R, Kshatriya D, Bello NT, Simon JE, dkk. Metode
spektrometri massa kroma-tografi cair / tandem berkinerja tinggi yang
sangat sensitif dengan fragmentasi dalam sumber untuk kuantifikasi
cepat keton raspberry. J Food Drug Anal 2019; 27: 778e85.
286 JURNAL ANALISIS MAKANAN DAN OBAT 2021;29:275e286
ARTIKEL ASLI

[12] Kao F.J., Chiu Y.S., Chiang W.D. Pengaruh pemasakan dengan [17] Friedman J, Hastie T, Tibshirani R. Elemen-elemen
air terhadap kapasitas antioksidan sayuran kaya karotenoid di pembelajaran statistik. New York: Seri Springer dalam statistik;
Taiwan. J Food Drug Anal 2014;22:202e9. 2001.
[13] Singleton VL, Rossi JA. Kolorimetri fenolat total dengan [18] Johnson RA, Wichern DW. Analisis statistik multivariat
pereaksi asam fosfomolibdat-fosfotungstat. Am J Enol Vitic terapan analisis. Upper Saddle River, NJ: Prentice hall; 2002.
1965;16:144e58. [19] Ihaka R, Gentleman RR. Sebuah bahasa untuk analisis data dan
[14] Yuan B, Byrnes D, Giurleo D, Villani T, Simon JE, Wu Q. grafik . J Comput Graph Stat 1996; 5: 299e314.
Skrining cepat glikoalkaloid beracun dan mikronutrien pada [20] Mahoney JR, Graf E. Peran alfa-tokoferol, asam askorbat, asam
nightshades yang dapat dimakan (Solanum spp.). J Food sitrat dan EDTA sebagai oksidan dalam sistem model. J Food
Drug Anal 2018; 26:751e60. Sci 1986;51:1293e6.
[15] Re R, Pellegrini N, Proteggente A, Pannala A, Yang M, Rice- [21] Takano S, Ishiwata S, Nakazawa M, Mizugaki M, Tamai M.
Evans C. Aktivitas antioksidan yang menerapkan uji Penentuan asam askorbat dalam humor vitreous manusia
dekolorisasi kation radikal ABTS yang ditingkatkan. Free dengan kromatografi cair kinerja tinggi dengan detektor UV.
Radic Biol Med 1999; 26:1231e7. Curr Eye Res 1997; 16: 589e94.
[16] Benzie IF, Strain JJ. Kemampuan mereduksi besi plasma [22] Peta Panas Kompleks GZ. Membuat peta panas yang
(FRAP) sebagai ukuran "kekuatan antioksidan": uji FRAP. Anal kompleks. R pack- age versi 1.6. 0. 2015.
Biochem 1996;239:70e6. [23] Molnar C. Panduan untuk membuat model kotak hitam dapat
dijelaskan. https://christophm/github io/interpretable-ml-
book. 2021.

Anda mungkin juga menyukai