Dwi Adi Bangkit-Fst

i
Implementasi Named-Entity Recognition

dan Optical Character Recognition untuk Aplikasi
Pendeteksi Kehalalan Bahan Makanan
Skripsi
Oleh:
Dwi Adi Bangkit
NIM: 11160910000059
PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI
SYARIF HIDAYATULLAH
JAKARTA
2022 M / 1444 H
UIN Syarif Hidayatullah Jakarta

PERNYATAAN ORISINALITAS
Dengan ini saya menyatakan bahwa:
1. Skripsi ini merupakan hasil karya asli saya yang diajukan untuk
memenuhi salah satu persyaratan memperoleh gelar Strata 1 di UIN
Syarif Hidayatullah Jakarta.
2. Semua sumber yang saya gunakan dalam penulisan ini telah saya
cantumkan sesuai dengan ketentuan yang berlaku di UIN Syarif
Hidayatullah Jakarta.
3. Jika di kemudian hari terbukti bahwa karya ini bukan hasil karya asli saya
atau merupakan jiplakan dari karya orang lain, maka saya bersedia
menerima sanksi yang berlaku di UIN Syarif Hidayatullah Jakarta.
Jakarta, Agustus 2022
Dwi Adi Bangkit

11160910000059
iv UIN Syarif Hidayatullah Jakarta

PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI
Sebagai civitas akademik UIN Syarif Hidayatullah Jakarta, saya yang

bertanda tangan di bawah ini:
Nama : Dwi Adi Bangkit
NIM : 11160910000059
Program Studi : Teknik Informatika
Fakultas : Sains dan Teknologi
Jenis Karya : Skripsi
Dengan pengembangan ilmu pengetahuan, menyetujui untuk memberikan

kepada Universitas Islam Negeri Syarif Hidayatullah Jakarta Hak Bebas Royalti
Noneksklusif (Non-exclusive Royalty Free Right) atas karya ilmiah saya yang
berjudul:
Implementasi Named-Entity Recognition

dan Optical Character Recognition untuk Aplikasi
Pendeteksi Kehalalan Bahan Makanan
Dengan Hak Bebas Royalti Non ekslusif ini Universitas Islam Negeri Syarif
Hidayatullah Jakarta berhak menyimpan, mengalih media/formatkan, mengelola
dalam bentuk pangkalan data (database), merawat, dan mempublikasikan tugas
akhir saya selama tetap mencantumkan nama saya sebagai penulis/pencipta dan
sebagai pemilik Hak Cipta. Demikian pernyataan ini saya buat dengan sebenarnya
Dwi Adi Bangkit

11160910000059
v UIN Syarif Hidayatullah Jakarta

KATA PENGANTAR
Alhamdulillah, segala puji dan syukur penulis panjatkan kepada Allah SWT,
karena atas rahmat dan karunia-Nya penulis dapat menyelesaikan penulisan,
pelaksanaan dan penyusunan skripsi ini. Sholawat serta salam semoga selalu
tercurahkan kepada Nabi Muhammad SAW beserta keluarganya, para sahabatnya
serta umatnya hingga akhir zaman. Penulisan skripsi ini disusun sebagai salah satu
syarat untuk memperoleh gelar Sarjana Komputer pada Program Studi Teknik
Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri (UIN) Syarif
Hidayatullah Jakarta . Penulis sangat menyadari bahwa skripsi ini tidak akan bisa
terselesaikan tanpa bantuan, saran, kritik, dan dukungan dari berbagai pihak. Oleh
karena itu dalam kesempatan kali ini penulis ingin mengucapkan terima kasih
kepada :
1. Nashrul Hakiem, S.Si., M.T., Ph.D selaku Dekan Fakultas Sains dan
Teknologi.
2. Dr. Imam Marzuki Shofi, M.T selaku Ketua Program Studi Teknik
Informatika Fakultas Sains dan Teknologi.
3. Dewi Khairani, M.Sc dan Nurul Faizah Rozy, M.TI selaku Dosen
Pembimbing I dan II yang senantiasa membimbing, mengarahkan,
memotivasi penulis selama penyusunan skripsi dan tak bosan mengingatkan
penulis untuk segera menyelesaikan penulisan.
4. Seluruh Dosen dan Staf Karyawan Fakultas Sains dan Teknologi,

khususnya Program Studi Teknik Informatika yang telah memberikan ilmu,
dukungan dan bantuan selama masa perkuliahan.
5. Kedua orang tua, kakak serta keluarga besar penulis yang selalu
memberikan dukungan, selalu mendoakan, selalu memberi kasih sayang
bagaimanapun kondisi penulis.
6. Isti Sukwaningsih yang selalu memberi motivasi dan semangat untuk

penulis.
vi UIN Syarif Hidayatullah Jakarta

7. Teman-teman senasib sepenanggungan Uchan, Abdul, Basit, Widi, Jimans,
Ghifary dan Amirul yang selalu ada untuk tempat bertukar pikiran dan
selalu siap untuk direpotkan.
8. Keluarga soactive dan paboya yang selalu menjadi teman-teman yang

yahud selama penulis menempuh pendidikan di TI UIN Jakarta.
9. Teman-teman Teknik Informatika Angkatan 2016.
10. Teman-teman KKN 146 2019 UIN Jakarta.
11. Teman-teman Dapur Seni FST UIN Jakarta.
12. Seluruh pihak dan teman-teman yang tidak bisa disebutkan satu persatu
yang telah membantu penulis hingga saat ini.
Penulisan skripsi ini masih jauh dari kata sempurna. Untuk itu, sangat
diperlukan kritik dan saran yang membangun bagi penulis, dan dapat disampaikan
melalui email adibangkai@gmail.com. Penulis memohon maaf atas segala
kekurangan ataupun kesalahan baik dari segi keilmuan atau penulisan. Akhir kata,
semoga skripsi ini dapat bermanfaat bagi penulis dan orang lain.
Dwi Adi Bangkit

11160910000059
vii UIN Syarif Hidayatullah Jakarta

Penulis : Dwi Adi Bangkit
Judul : Implementasi Named Entity Recognition & Optical
Character Recognition untuk Aplikasi Pendeteksi
Kehalalan Bahan Makanan
ABSTRAK
Kebutuhan seorang muslim terhadap produk halal seharusnya didukung oleh

jaminan halal. Namun dimasa sekarang konsumen dapat dengan bebas memilih
produk konsumsi yang mereka senangi termasuk produk impor maupun Ketika
masyarakat luar. Untuk menjaga konsumen muslim akan produk non-halal
ditawarkan solusi dengan menggunakan teknologi OCR dan NER untuk membaca
dan mengenali entitas bahan komposisi yang tertera di produk kemasan, pada
penelitian ini penulis mendefinisikan 3 entitas kategori makanan yaitu Halal,
Haram, Syubhat. Sistem yang dibangun menggunakan OCR untuk memindai
komposisi yang tertera pada produk kemasan dan diproses dengan Model NER
yang dilatih, evaluasi model mendapatkan nilai F-Skor sebesar 0.967 dan dalam
pengujian sistem dengan menguji 24 produk kemasan menghasilkan nilai akurasi
OCR sebesar 90% dan akurasi model NER untuk pembacaan makanan sebesar 84%
Kata Kunci : Named Entity Recognition, Optical Character

Recognition, Ingredients Recognition, Halal, Food
Ingredients.
Jumlah Pustaka : 5 e-book, 25 jurnal, 2 skripsi, 5 website.
viii UIN Syarif Hidayatullah Jakarta

Penulis : Dwi Adi Bangkit
Judul : Implementasi Named Entity Recognition & Optical
Character Recognition untuk Aplikasi Pendeteksi
Kehalalan Bahan Makanan
ABSTRACT
A Muslim's need for halal products should be supported by halal guarantees.

To protect Muslim consumers from non-halal products, a solution is offered using
Optical Character Recognition (OCR) and Named-Entity Recognition (NER). The
two technologies are combined to read and recognize the food ingredients entities
listed on packaged products, in this study the NER model was formed which can
recognize 3 categories of food in Islamic law, namely Halal, Haram, Syubhat. The
system built using OCR to scan the ingredients listed on the packaged product and
processed with the trained NER Model, the evaluation of the NER model that was
built got an F-Score evaluation value of 0.967 and in system testing by testing 24
packaged products it resulted in an OCR accuracy value of 90%. and the accuracy
of the NER model for food reading is 84%.
Keywords : Named Entity Recognition, Optical Character

Recognition, Ingredients Recognition, Halal, Food
Ingredients.
Bibliography : 5 e-book, 25 Journal, 2 skripsi, 5 website.
ix UIN Syarif Hidayatullah Jakarta

DAFTAR ISI
LEMBAR PERSETUJUAN ................................................................................. ii

LEMBAR PENGESAHAN ................................................................................. iii
PERNYATAAN ORISINALITAS ...................................................................... iv
PERNYATAAN PERSETUJUAN PUBLIKASI SKRIPSI ............................... v
KATA PENGANTAR .......................................................................................... vi
ABSTRAK .......................................................................................................... viii
ABSTRACT .......................................................................................................... ix
DAFTAR ISI .......................................................................................................... x
DAFTAR GAMBAR .......................................................................................... xiii
DAFTAR TABEL................................................................................................ xv
BAB I PENDAHULUAN ..................................................................................... 1
Latar Belakang............................................................................................... 1
Rumusan Masalah ......................................................................................... 4
Batasan Masalah ............................................................................................ 5
1.3.1 Proses ...................................................................................................... 5
1.3.2 Metode .................................................................................................... 5
1.3.3 Tools ....................................................................................................... 6
Tujuan Penelitian ........................................................................................... 6
Manfaat Penelitian ......................................................................................... 6
1.5.1 Bagi Mahasiswa ...................................................................................... 6
1.5.2 Bagi Universitas ...................................................................................... 6
1.5.3 Bagi Masyarakat ..................................................................................... 6
Metodologi Penelitian ................................................................................... 7
1.6.1 Pengumpulan Data .................................................................................. 7
1.6.2 Pengembangan Sistem ............................................................................ 7
Sistematika Penulisan .................................................................................... 7
BAB II LANDASAN TEORI .............................................................................. 9
Produk Makanan Kemasan ............................................................................ 9
2.1.1 Produk Pangan Halal ............................................................................ 10
2.1.2 Sistem Pendeteksi Makanan Halal ........................................................ 11
Natural Langauge Processing ..................................................................... 12
x UIN Syarif Hidayatullah Jakarta

Named Entity Recognition ........................................................................... 12
spaCy ........................................................................................................... 15
2.4.1 NER Tagging Spacy ............................................................................ 16
2.4.2 Rule Based ............................................................................................ 17
Visualisasi.................................................................................................... 17
Evaluasi Skor ............................................................................................... 17
Gambar ........................................................................................................ 19
Optical Character Recognition .................................................................... 19
Amazon Textract ......................................................................................... 21
2.9.1 Workflow Amazon Textract ................................................................. 21
Prototype.................................................................................................... 23
Flask .......................................................................................................... 24
REST .......................................................................................................... 24
Studi Literatur Terdahulu .......................................................................... 26
BAB III METODOLOGI PENELITIAN ........................................................ 31
Alur penelitian ............................................................................................. 31
Metode Pengumpulan Data ......................................................................... 32
3.2.1 Observasi .............................................................................................. 32
3.2.2 Studi Literatur ....................................................................................... 32
Implementasi ............................................................................................... 32
3.3.1 Pengumpulan Dataset ........................................................................... 32
3.3.2 Metode NER .......................................................................................... 34
3.3.3 Metode OCR ......................................................................................... 34
Pengujian ..................................................................................................... 35
BAB IV IMPLEMENTASI ............................................................................... 36
Gambaran Umum Sistem ............................................................................ 36
4.1.1 Flow Chart ............................................................................................ 37
4.1.2 Rancangan Antarmuka .......................................................................... 40
4.1.3 Sequence Diagram ................................................................................ 41
Dataset ......................................................................................................... 41
4.2.1 Text Preprocessing ................................................................................ 42
Proses Penerapan NER dengan Spacy ......................................................... 44
xi UIN Syarif Hidayatullah Jakarta

4.3.1 Generatate Anotasi Kalimat Training ................................................... 45
4.3.2 Generate Kalimat Umum ...................................................................... 46
4.3.3 Proses Training ..................................................................................... 47
4.3.4 Rule Based Matching ............................................................................ 50
4.3.5 Visualisasi ............................................................................................. 54
Implementasi AWS Textract ....................................................................... 55
Implementasi Aplikasi ................................................................................. 58
4.5.1 Pembuatan REST API .......................................................................... 58
4.5.2 Implementasi Antarmuka ...................................................................... 60
4.5.3 Pengujian UAT ...................................................................................... 61
BAB V HASIL DAN PEMBAHASAN ............................................................. 62
Evaluasi ....................................................................................................... 62
5.1.1 Dataset Uji ............................................................................................ 62
5.1.2 Hasil Uji model dengan Data Test ........................................................ 63
Hasil Akhir Sistem ...................................................................................... 65
Pengujian Sistem ......................................................................................... 68
5.3.1 Pengujian Produk Non-Halal ................................................................ 85
BAB VI Kesimpulan Dan Saran ....................................................................... 87
Kesimpulan .................................................................................................. 87
Saran ............................................................................................................ 87
xii UIN Syarif Hidayatullah Jakarta

DAFTAR GAMBAR
Gambar 1.0.1 Data BPOM 2022 ............................................................................. 1

Gambar 2.1 Contoh Produk Kemasan ..................................................................... 9
Gambar 2.2 label produk halal .............................................................................. 10
Gambar 2.3 Contoh Implementasi NER ............................................................... 13
Gambar 2.4 aristektur spaCy ................................................................................. 16
Gambar 2.5 konsep gambar pada komputer .......................................................... 19
Gambar 2.6 Proses pengenalan oleh OCR secara umum Sumber: (Mollah et al.,
2011) ..................................................................................................................... 20
Gambar 2.7 Alur AWS Textract ........................................................................... 21
Gambar 2.8 Struktur Blok Objek .......................................................................... 23
Gambar 2.9 Model Prototype ................................................................................ 23
Gambar 2.10 Arsitektur REST API ...................................................................... 25
Gambar 3.1 Kerangka Berfikir ............................................................................. 31
Gambar 3.2 Halaman Web halal.addi.is.its.ac.id .................................................. 33
Gambar 3.3 Halaman Web Halal Advisocy COMSATS ...................................... 34
Gambar 4.1 Gambaran Umum Aplikasi............................................................... 36
Gambar 4.2 Flow Chart Pengumpulan Dataset .................................................... 37
Gambar 4.3 Flowchart Implementasi OCR dengan AWS Textract ..................... 38
Gambar 4.4 Flowchart Pembentukan Model NER .............................................. 39
Gambar 4.5 Rancangan Antarmuka ..................................................................... 40
Gambar 4.6 Sequence Diagram Aplikasi ............................................................. 41
Gambar 4.7 template kalimat ................................................................................ 45
Gambar 4.8 Template yang telah di generate........................................................ 46
Gambar 4.9 data kalimat umum ............................................................................ 47
Gambar 4.10 Pipeline training NER ..................................................................... 47
Gambar 4.11 Proses Training Berjalan ................................................................. 50
Gambar 4.12 Diagram Rule .................................................................................. 52
Gambar 4.13 Output Sebelum diterapkan Rule Ingredients ................................. 54
Gambar 4.14 Output Setelah Model diberi Rule ................................................... 54
Gambar 4.15 Policy yang digunakan untuk Penelitian ini ................................... 56
Gambar 4.16 Penjelasan Visual dari Respon API AWS Textract ........................ 56
Gambar 4.17 Respon AWS Textract ..................................................................... 57
Gambar 4.18 Gambar Yang di baca AWS ............................................................ 58
Gambar 4.19 Kode mengambil teks ...................................................................... 58
Gambar 4.20 API utama aplikasi .......................................................................... 59
Gambar 4.21 Respon API dari kode gambar 4.18 ................................................ 60
Gambar 4.22 Tampilan Antarmuka Aplikasi ........................................................ 61
Gambar 5.1 Template Data Test ........................................................................... 62
Gambar 5.2 Hasil Generate Data Testing ............................................................. 63
Gambar 5.3 Skor evaluasii Entitas yang dilatih .................................................... 63
xiii UIN Syarif Hidayatullah Jakarta

Gambar 5.4 Evaluasi Entitas Default Spacy ......................................................... 64
Gambar 5.5 Perbandingan Evaluasi Entitas Makanan dan Entitas Umum ........... 65
Gambar 5.6 Hasil Akhir Aplikasi.......................................................................... 65
Gambar 5.7 Halaman Informasi ............................................................................ 66
Gambar 5.8 Tampilan Halaman Saran .................................................................. 66
Gambar 5.9 Contoh Hasil Sistem Berjalan ........................................................... 67
xiv UIN Syarif Hidayatullah Jakarta

DAFTAR TABEL
Tabel 2.1 Contoh Tipe Entitas NER ..................................................................... 13

Tabel 2.2 Entitas Makanan .................................................................................... 15
Tabel 2.3 Penelitian Terdahulu Topik Pencarian Makanan Halal ........................ 26
Tabel 2.4 Tabel Perbandingan Penelitian.............................................................. 29
Tabel 4.1 Case Folding ......................................................................................... 42
Tabel 4.2 Filtering ................................................................................................. 43
Tabel 4.3 Hasil FIltering ....................................................................................... 43
Tabel 4.4 Tabel Entitas Bahan Makanan .............................................................. 44
Tabel 4.5 pipeline yang digunakan untuk training ................................................ 48
Tabel 4.6 visualisasi Spacy ................................................................................... 55
Tabel 4.7 Visualisasi Entitas Makanan ................................................................. 55
Tabel 4.8 User Acceptance Test............................................................................ 61
Tabel 5.1 Tabel Uji 1 ............................................................................................ 69
Tabel 5.2 Tabel Uji 2 ............................................................................................ 77
Tabel 5.3 Tabel Hasil Uji ...................................................................................... 84
Tabel 5.4 Tabel Uji non-halal ............................................................................... 85
xv UIN Syarif Hidayatullah Jakarta

DAFTAR LAMPIRAN
Lampiran 1 Gambar Produk Uji Dengan Kamera Iphone X................................. 93

Lampiran 2 Gambar Produk Uji Dengan Kamera Iphone X (Non Halal) ............ 95
Lampiran 3 Gambar Produk Uji Dengan Kamera Infinix Smart 6 ....................... 96
Lampiran 4 Gambar Produk Uji Dengan Kamera Infinix Smart 6 (non halal) ..... 98
Lampiran 5 User Acceptance Test ........................................................................ 99
xvi UIN Syarif Hidayatullah Jakarta

1
BAB I
PENDAHULUAN
Latar Belakang
Saat ini, konsumen Muslim dihadapkan pada berbagai pilihan produk bahkan
di Indonesia sendiri di tahun 2022 terdapat kurang lebih 148 ribu produk makanan
yang beredar (lihat gambar 1.1). Dalam masa perdagangan bebas dan era globalisasi
seperti sekarang ini, produk-produk makanan kemasan dari luar negeri pun relatif
mudah untuk masuk ke pasar Indonesia. Bagi muslim, ada konsep yang
menggambarkan sesuatu yang 'diizinkan' oleh hukum Syariah. Konsep tersebut
biasa disebut “halal” yang dapat diartikan hal yang diperbolehkan atau diizinkan
bagi umat Islam. Halal berlaku untuk makanan apa yang bisa dimakan oleh Muslim
(Sam, 2018) disini para konsumen harus jeli dan cermat dalam memilih produk
makanan kemasan yang pilihanya semakin beragam. menurut Mira dalam jurnalnya
kurangnya informasi tentang status halal suatu produk telah mengharuskan seorang
Muslim untuk lebih lanjut memeriksa rincian bahan. (Kartiwi et al., 2019)
Data BPOM 2022
5…
1% 4%
Produk Pangan :
148.714
37% Kosmetika :
217.077
Suplemen Makanan :
4.235
Obat Tradisional :
14.718
53% Obat-Obatan :
21.355
Gambar 1.1.1 Data BPOM 2022

Sumber: https://cekbpom.pom.go.id/

Merujuk pada catatan RISSC edisi 2022 (The Royal Islamic Strategic Studies
Centre), Indonesia memiliki 231,06 juta penduduk Muslim (86,7% dari seluruh
penduduk), sehingga menjadikan Indonesia negara berpenduduk Muslim terbesar
di dunia (Kusnandar, 2021) Aturan seorang Muslim dalam mengonsumsi makanan
dan minuman secara jelas dan tegas diatur dalam Al Qur’an Surat Al Baqarah (2):
ayat 168 , yakni makanan yang memenuhi syarat halal dan baik (Afrianty, 2020).
Kebutuhan seorang muslim terhadap produk halal seharusnya didukung oleh

jaminan halal. Sampai saat ini LPPOM MUI menyediakan website halalmui.org di
mana pengguna dapat mencari sertifikat halal suatu produk berdasarkan nama
produk atau nama perusahaan. Namun dimasa sekarang konsumen dapat dengan
bebas memilih produk konsumsi yang mereka senangi termasuk produk impor dan
produk yang belum tersertifikasi oleh pihak yang terkait. Menurut Faridah dalam
jurnalnya “Sertifikasi Halal Di Indonesia: Sejarah, Perkembangan, Dan
Implementasi” menunjukan data pada periode 2011-2018 dari 727.617 produk,
hanya 69 985 produk saja yang telah tersertifikasi halal (LPPOM MUI). Hal ini
berarti hanya 9,6 persen produk telah tersertifikasi, sedangkan sisanya belum
memiliki sertifikat halal. Bukan berarti haram, namun bisa jadi produk tersebut
belum diajukan untuk sertifikasi halal (Faridah, 2019).
Guna membantu umat muslim menjaga kehalalan produk yang mereka

konsumsi di era globalisasi kini peneliti dan akademisi telah melakukan penelitian
yang berkaitan dengan sistem pembaca kehalalan bahan makanan, menurut Askomi
saat ini sistem yang dibangun terbagi menjadi 4 jenis yaitu Halal Geo-Locator,
Halal Scanner, Halal Directories & Halal Recipes (Askomi et al., 2016). selain
halal geo-locator, halal scanner adalah teknologi yang sering dimanfaatkan umat
muslim untuk mengetahui kehalalan suatu produk, metode yang digunakan adalah
lewat barcode dan OCR, seperti penelitian dari Widya & Salsabila pada
penelitianya mereka memanfaatkan barcode untuk mencari kode registrasi produk
ke dalam database untuk dicari tahu halal atau tidaknya produk tersebut (Widya &
Salsabila, 2019). Penelitian terkait informasi kehalalan lainya oleh Yuniarti
penelitianya menggunakan OCR untuk membaca nama produk makanan dan
2 UIN Syarif Hidayatullah Jakarta

mengecek apakah produk tersebut terdaftar dalam produk halal atau tidak (Yuniarti
et al., 2018). Namun dari kedua penelitian tersebut memiliki keterbatasan yaitu
hanya bisa mengecek produk yang terdaftar di database. Pendekatan lain adalah
oleh Mira pada jurnalnya Mobile Application for Halal Food Ingredients
Identification using Optical Character Recognition dengan menerapkan OCR untuk
membaca komposisi makananan dan mencari informasinya (Kartiwi et al., 2019).
NER merupakan bidang ilmu dari ekstraksi informasi yang digukan untuk
pengklasifikasi teks dari sebuah dokumen atau korpus yang dikategorikan seperti
nama orang, lokasi, organisasi, tanggal, waktu dan sebagainya. NER
diimplementasikan dalam banyak bidang, antara lain dalam machine translation,
question-answering machine system, indexing pada information retrieval,
klasifikasi dan juga dalam automatic summarization. Tujuan yang diharapkan dari
proses dalam NER adalah untuk melakukan ekstraksi dan klasifikasi nama ke dalam
beberapa kategori dengan mengacu kepada makna yang tepat (Dirgantara et al.,
2018). Dan juga untuk mengenali dan mengidentifikasi entitas bernama dan
mengklasifikasikannya ke dalam kategori yang telah ditentukan (Sinta Wahyuni &
Sanjaya ER, 2021)
Pada umumnya NER memiliki tiga pendekatan yang digunakan, yaitu rule-
based method, learning-based method, dan hybrid approach. Pendekatan rule-
based bergantung pada aturan dan pola entitas bernama yang terdapat dalam
kalimat dan didefinisikan secara manual menggunakan regular ekspresi
berdasarkan pengetahuan linguistik dan karakteristik entitas. Pengetahuan
linguistik dapat mencakup tata bahasa, kontekstual, leksikon, dan algoritma untuk
menentukan setiap operasi yang terlibat (Sinta Wahyuni & Sanjaya ER, 2021),
Dalam penelitian ini akan dikembangkan NER untuk mengidentifikasi dan
mengenali entitas makanan pada komposisi produk kemasan dengan penerapan
rule-based. Aturan dibuat berdasarkan pengamatan langsung terhadap objek
penelitian, dengan memperhatikan pola dan bentuk komposisi yang umum terdapat
pada produk kemasan. Evaluasi dilakukan dengan metode Confusion Matrix.

Dari masalah diatas sebelumnya sudah terdapat penelitian yang berfokus
dengan sistem pembaca kehalalan bahan makanan berdasarkan komposisi
bahannya, karena pada sistem barcode dan nama produk memeiliki kekuarnagan
Ketika data produk tidak ada di database maka pengguna tidak bisa mengetahui
bahwa produk tersebut haram karena ada kandungan haram atau sebatas tidak
terdaftar saja, Adapun penelitian yang menurut penulis lebih baik adalah dari
Kartiwi dengan judul Mobile Application for Halal Food Ingredients Identification
using Optical Character Recognition (Kartiwi et al., 2019) yang mengidentifikasi
bahan haram yang terdapat pada komposisi yang tertera pada kemasan produk
makanan. Adapun kekurangan dari penelitian kartiwi adalah data bahan dan
informasi yang masih dimasukan manual, yang menyebabkan banyak bahan yang
tidak diketahui statusnya, dari penelitian yang sudah ada penulis
mencobapendekatan lain dengan mengimplementasikan NER didalam aplikasi
guna mendeteksi status bahan yang tertulis dan mengenali apakah bahan tersebut
termasuk dalam kategori haram, syubhat atau halal
Berdasarkan hasil analisis, studi pustaka/literatur, maka pada penelitian ini

diusulkan sebuah aplikasi yang dapat membaca teks pada komposisi makanan di
kemasan produk kemudian menampilkan entitas bahan makanan dan entitas bahan
haram yag terkandung didalamnya. Dengan mengimplementasikan teknologi
Optical Character Recognition sebagai untuk membaca teks dan Named Entity
Recognition untuk mengetahui entitas bahan makanan dan entitas haram dari teks
yang telah di terima. Dengan demikian penulis melakukan penelitian berjudul
“Implementasi Named Entity Recognition & Optical Character Recognition untuk
Aplikasi Pendeteksi Kehalalan Bahan Makanan”.
Rumusan Masalah
Berdasarkan latar belakang permasalahan yang telah diuraikan di atas, maka

penulis menetapkan rumusan masalah pada penelitian ini adalah:
“Bagaimana mengkombinasikan OCR dan Named Entity Recognition guna

mengetahui entitas bahan makanan yang tertulis pada produk kemasan?.”

Batasan Masalah
Sebagai pembatasan penelitian dan aplikasi untuk tetap fokus dan sesuai
dengan tujuan yang ditetapkan, maka penulis memberikan ruang lingkup batasan
masalah sebagai berikut:
1.3.1 Proses
Berikut ini adalah proses yang terdapat pada penelitian,yaitu:
1. Dataset bahan makanan diambil dari “USDA’s FoodData” dan

untuk bahan Indonesia diambil dari Buku “Resep Masakan
Indonesia A-Z” dan “Daftar Belanja Produk Halal LPPOM
MUI”
2. Informasi bahan makanan yang haram diambil dari
halal.addi.is.its.ac.id
3. Informasi bahan makanan yang haram diambil dari Halal
Advisory Service lahore.comsats.edu.pk
4. Penggunaan aplikasi ini untuk membaca komposisi yang tertera
di produk kemasan
5. Bahasa yang diolah dan diproses oleh sistem hanya Inggris &
Indonesia
6. Sistem yang dibangun berbasis web
1.3.2 Metode
Berikut ini merupakan metode yang digunakan penulis dalam penelitian:
1. Metode pengumpulan data yang digunakan dalam penelitian ini

adalah studi pustaka, dan observasi
2. Metode pengembangan sistem yang digunakan adalah metode
Prototype
3. Penelitian ini menggunakan AWS Texract untuk mengkonversi
image to text
4. Menggunakan Pustaka spaCy sebagai library untuk model Named
Entity Recognition

1.3.3 Tools
Berikut ini adalah tools yang digunakan pada penelitian,yaitu:
1. AWS Texract
2. Google Collab
3. spaCy
4. Python Flask
Tujuan Penelitian
Tujuan penelitian ini adalah sebagai berikut
1. Membuat model NER yang dapat mengidentifikasi entitas status

makanan
2. Mengimplementasikan Optical Character Recognition dan Named

Entity Recognition guna membaca dan mengenali entitas pada tulisan
komposisi pada kemasan produk guna mengetahui halal tidaknya
kandungan yang ada pada komposisi produk tersebut.
Manfaat Penelitian
1.5.1 Bagi Mahasiswa
Memperluas wawasan penulis dalam penggunaan teknologi cloud dan Named

Entity Recognition
1.5.2 Bagi Universitas
Menjadi landasan penelitian terkait berikutnya yang berkaitan dengan Named

Entity Recognition dan OCR dan menyempurnakan penelitian yang sudah
dilakukan sebelumnya.
1.5.3 Bagi Masyarakat
Masyarakat yang menggunakan aplikasi dari penelitan ini dapat mencari tahu
kandungan makanan yang mereka konsumsi dan menyeleksi halal tidaknya
kandungan yang terdapat pada produk kemasan yang mereka ingin konsumsi

Metodologi Penelitian
Penulis menggunakan metodologi penelitian agar dapat dijadikan sebagai

pedoman penulis dalam melaksanakan penelitian dari perumusan masalah sampai
kesimpulan.
1.6.1 Pengumpulan Data
Dalam melakukan pengumpulan data kebutuhan sistem dan data kebutuhan

penulisan skripsi ini, serta data kebutuhan penelitian penulis menggunakan 2
metode pengumpulan data, yaitu:
• Studi Pustaka
• Observasi
1.6.2 Pengembangan Sistem
Guna mendukung hasil peneletian ini dibangun aplikasi prototype berbasis

web, aplikasi mengimplementasikan OCR dan NER yang dapat membantu
pengguna untuk mengidentifikasi status makanan pada komposisi produk kemasan,
berikut adalah tahapan prototype (Setia, 2015):
1. Pengumpulan Kebutuhan.
2. Perancangan
3. Evaluasi dan perbaikan.
Sistematika Penulisan
Sistematika yang dibuat pada skripsi ini akan dibagi dalam enam bagian,
yaitu:
BAB I PENDAHULUAN
Dalam bab ini membahas mengenai latar belakang penulisan,

perumusan masalah, batasan masalah, tujuan dan manfaat penulisan,
metode dan sistematika penulisan yang merupakan gambaran
menyeluruh dari penulisan skripsi ini.
BAB II LANDASAN TEORI DAN STUDI LITERATUR

Dalam bab ini akan dibahas mengenai berbagai teori yang mendasari
analisis permasalahan dan berhubungan dengan topik yang dibahas
serta literatur yang memiliki kemiripan topik dengan penelitian ini.
BAB III METODOLOGI PENELITIAN
Bab ini berisi pembahasan atau pemaparan metode yang penulis

pakai dalam pencarian data maupun perancangan sistem yang
dilakukan pada penelitian.
BAB IV IMPLEMENTASI
Bab ini akan diuraikan mengenai penyelesaian permalasahan

dengan menggunakan metodologi yang dipilih, serta memuat unsur-
unsur pengumpulan data, serta pelaksanaan implementasi.
BAB V HASIL DAN PEMBAHASAN
Bab ini akan diuraikan mengenai hasil analisa dari eskperimen yang
telah dilakukan, melakukan pencatatan kekurangan dari hasil analisa
yang telah dilakukan, melakukan pencatatan kekurangan dari hasil
analisa yang mungkin harus mendapat perhatian
BAB VI KESIMPULAN DAN SARAN
Pada bab ini berisi kesimpulan dari hasil pembahasan seluruh bab
serta saran-saran yang kiranya dapat diperhatikan serta
dipertimbangkan untuk pengembangan penelitian atau sistem
dimasa mendatang

9
BAB II
LANDASAN TEORI
Produk Makanan Kemasan
Indonesia memiliki populasi penduduk muslim terbesar didunia yaitu sekitar

229 juta jiwa, atau sekitar 87.20% (worldpopulationreview.com), kebutuhan akan
produk halal sudah tentu menjadi prioritas masyarakat Indonesia, di Indonesia
Sendiri ada Lembaga yang mengatur Halal tidaknya produk pangan yang beredar
yaitu Majelis Ulama Indonesia (MUI) Adapun demikian menurut Helma Widya,
Beberapa produk makanan impor yang berasal dari luar negeri, biasanya masuk ke
Indonesia tetapi tidak atau belum bisa di beri label halal oleh MUI (Majelis Ulama
Indonesia) karena belum ada pabrik atau izin resmi dari MUI itu sendiri. Beberapa
produk makanan yang banyak sekali beredar di supermarket-supermarket di
Indonesia (Widya & Salsabila, 2019)
Gambar 2.1 Contoh Produk Kemasan
Produk makanan kemasan adalah produk makanan yang disiapkan secara

komersial untuk kemudahan konsumsi. menurut J.E. Tillotson Tillotson, pada buku
Encyclopedia of Food Sciences and Nutrition (Second Edition), 2003 Makanan ini
yang diklasifikasikan sebagai produk kemasan adalah yang melalui teknologi
pemrosesan seperti: pengalengan, pembekuan, dehidrasi, pendinginan, pengawetan
bahan kimia, dll (Tillotson, n.d.). di Indonesia sendiri untuk produk kemasan sudah

diatur pada UU No.18 Tahun 2012 tentang Pangan, disebutkan bahwa setiap
produsen yang memproduksi pangan untuk diperdagangkan di dalam negeri harus
mencantumkan label yang minimum berisikan informasi mengenai:
1. Nama produk
2. Daftar bahan yang digunakan
3. Berat bersih / isi bersih
4. Nama dan alamat pihak produksi dan atau pengimpor
5. Logo halal bagi pangan yang dipersyaratkan
6. Tanggal dan kode produksi
7. Tanggal, bulan, dan tahun kedaluwarsa
8. Nomor izin edar bagi pangan olahan
9. Asal usul bahan bagi pangan tertentu
2.1.1 Produk Pangan Halal
Gambar 2.2 label produk halal

Islam mengatur dalam Alquran dan Hadist mengenai halal dan haram.
Sehingga halal menjadi poin yang sangat penting dalam Islam (Nasyi’ah 2018).
Tidak hanya menjadi hubungan antar sesama manusia namun juga menyangkut
hubungan dengan Tuhan. Mengonsumsi yang halal dan menghindari yang haram
merupakan bagian dari ibadah seorang muslim dan menunjukkan ketaatan terhadap
agama yang dianut (Karimah 2015). DI Indonesia sendiri sertifikasi halal tidaknya
produk makanan dikeluarkan oleh Majelis Ulama Indonesia lewat Lembaga

Pengkajian Pangan Obat-obatan dan Kosmetika Majelis Ulama Indonesia. Adapun
menurut MUI pada Fatwa Majelis Ulama Indonesia Nomor 4 Tahun 2003 Tentang
‘Standarisasi Fatwa Halal’ bahan yang dianggap haram antara lain adalah
Khamr,Ethanol, makanan yang mengandung bahan campuran an yang menimbukan
rasa/aroma (flavour) benda-benda atau binatang yang diharamkan, seperti mie
instan rasa babi, bacon flavour dan juga minuman yang diharamkan seperti whisky,
brandy, beer (MUI, 2003)
2.1.1.1 Bahan non Halal

Konsep islam mengenai makanan sama dengan konsep yang lain yaitu dalam
rangka menjaga keselamatan jiwa, raga, dan akal. Makanan memiliki dampak yang
besar dalam kehidupan seseorang, baik itu makanan halal maupun yang haram.
Berikut ini ayat Al-Quran yang menerangkan diharamkannya beberapa jenis
makanan dan minuman
“Sesungguhnya Allah hanya mengharamkan atasmu bangkai, darah, daging

babi, dan (hewan) yang disembelih dengan (menyebut nama) selain Allah”
(An-Nahl: 115)
Menurut Syukriya dan Faridah danya klasifikasi makanan halal dan haram,
kewajiban untuk mengonsumsi yang halal dan larangan untuk memakan yang
haram selain sebagai ujian keimanan bagi umat muslim juga merupakan aturan
demi kemaslahatan hidup manusia. (Jauharotus Syukriya & Faridah, n.d.)
2.1.2 Sistem Pendeteksi Makanan Halal
Guna membantu umat muslim menjaga kehalalan produk yang mereka

konsumsi di era globalisasi kini, akademisi dan peneliti telah membuat beberapa
metode untuk membangun sistem pendeteksi kehalalan suatu produk, diantaranya
menggunakan barcode dan OCR, Helma Widya dalam penelitianya menggunakan
sistem barcode, menurutnya barcode dapat dimanfaatkan untuk mengetahui
informasi produk yang ingin di konsumsi, karena kode unik dari barcode dapat
dijadikan kode untuk pencarian informasi dari nomor sertifikat yang sudah terdaftar
di Lembaga terkait.(Widya & Salsabila, 2019)

Adapun metode dan pendekatan lain untuk sistem pendeteksi kehalalan
adalah dengan metode OCR, Anny Yuniarti dalam penelitianya menjelaskan bahwa
OCR dapat diterapkan untuk sebuah sistem pendeteksi kehalalan suatu produk
dengan membaca nama produk dan membangun sistem database yang berisikan
daftarproduk halal didalamnya,(Yuniarti et al., 2018) lain dengan Yuniarti, pada
penelitianya Kartiwi menerapkan pendekatan lain dengan OCR pada penelitianya
OCR untuk membaca daftar komposisi yang tertera pada produk kemudian
menampilkan informasi keterangan bahan tersebut kepada user (Kartiwi et al.,
2019).
Natural Langauge Processing
Natural Language Processing (Pemrograman Bahasa Alami) adalah

pembuatan program yang memiliki kemampuan untuk memahami bahasa manusia.
Pada prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan
yang ingin dikomunikasikan antar manusia. Menurut Subaeki NLP dapat dikatakan
upaya untuk mengekstrak lebih jauh representasi dari suatu teks bebas. Hal ini dapat
dimasukkan secara kasar seperti mencari siapa melakukan apa kepada siapa, kapan,
di mana, bagaimana dan mengapa. NLP biasanya membuat penggunaan konsep-
konsep linguistik seperti kata benda, kata kerja, kata sifat, dan lainnya dan struktur
gramatikal (baik direpresentasikan sebagai ungkapan-ungkapan seperti frase
nomina atau frase preposisional, atau hubungan ketergantungan seperti subjek dari-
atau objek-dari). (Wangsanegara & Subaeki, 2015)
Named Entity Recognition
Named Entity Recognition (NER) merupakan bagian dari Information

Extraction (IE) pada Natural Language Processing (NLP). Named Entity
Recognition merupakan langkah awal pada information extraction dimana Named
Entity Recognition menstrukturkan teks menjadi data. Named Entity Recognition
digunakan untuk mengidentifikasi dan mengklasifikasi kata atau frasa ke dalam

jenis entitasnya. Named Entity Recognition dapat diimplementasikan pada machine
translation, question answering dan semantic web (Dirgantara et al., 2018)
Gambar 2.3 Contoh Implementasi NER
Dapat dilihat dari gambar 2.3 menunjukan ciri utama dari tugas NER adalah
melakukan identifikasi dan membuat tag konteks pada kata-kata yang tersedia
berdasarkan pada kemungkinan kombinasi atas kata-kata tersebut, seperti
penentuan panjang minimal kata word yang akan diidentifikasi sebagai nama
entitas, kata awal, dan sebagainya, entitas seperti Person, Organization, Position,
dan Location dalam proses identifikasi akan membutuhkan ciri (feature) yang
merefleksikan properti dari sebuah nama entitas, seperti tipe, kemunculan dan
berbagai ukuran umum, baik untuk skala dokumen maupun korpus. Salah satu
contoh penggunaan fitur dalam penentuan nama entiti adalah fitur kemunculan
sebuah kata pada urutan pertama (first sentence occurence), karena urutan
kemunculan kata dapat menentukan tingkat kepentingan dari kata tersebut
(Pramiyati et al., 2015). NER mendukung beberapa jenis entitas yang dapat dilihat
pada tabel 2.1
Tabel 2.1 Contoh Tipe Entitas NER
Tipe Deskripsi
Person Orang, termasuk fiksi.

Norp Kebangsaan atau agama atau kelompok politik.
FAC Gedung, bandara, jalan raya, dll.
ORG Perusahaan, instansi, institusi, dll.
GPE Negara, kota, negara bagian.
LOC Lokasi non-GPE, pegunungan, badan air.
PRODUCT Benda, kendaraan, makanan, dll.
EVENT Kejadian, pertempuran, perang, dll.
WORK_OF_ART Judul buku, lagu, dll.
LAW Dokumen hukum.
LANGUAGE Bahasa.
DATE Tanggal atau periode absolut atau relative.
TIME Waktu.
PERCENT Persentase, termasuk "%".
MONEY Nilai moneter, termasuk unit.
QUANTITY Pengukuran, seperti berat atau jarak.
ORDINAL "pertama", "kedua", dll.
CARDINAL Angka tidak termasuk dalam tipe lain
dan pada penelitian ini berikut adalah entitas yang akan digunakan untuk
mengenali entitas makanan, dalam muslim ada tiga kategori hukum dari bahan yang
boleh uamt konsumsi yaitu Haram, Halal dan Syubhat lihat tabel 2.2

Tabel 2.2 Entitas Makanan
Tipe Deskripsi
Makanan halal adalah makanan yang boleh dikomsumsi,

Halal
diproduksi dan dikomersialkan oleh muslim
Makanan yang tidak diperbolehkan di konsumsi oleh umat

Haram
muslim
Syubhat artinya samar atau kurang jelas. Maksudnya disini

Syubhat ialah setiap perkara/persoalan yang tidak begitu jelas antara
halal dan haramnya bagi manusia.
(Zamakhsyari, 2018)
spaCy
spaCy adalah open source library untuk Natural Language Processing

berbasis Python. spaCy digunakan untuk membangun ekstraksi informasi atau
sistem Natural Language Processing untuk memproses teks untuk pembelajaran
yang mendalam. spaCy menampilkan sistem pengenalan entitas statistik yang
sangat cepat, yang memberikan label ke rentang token yang berdekatan. spaCy
disertai dengan satu algoritma Parts-of-Speech dan Named-entity Recognition. Ini
juga berarti bahwa paket tersebut tidak dipenuhi dengan fitur yang tidak perlu.
Beberapa fitur yang disediakan oleh spaCy adalah Tokenization, Parts-of-Speech
(PoS) Tagging, Text Classification, dan Named Entity Recognition. (Spacy, 2022)
SpaCy menerapkan neural models baru untuk tagging, parsing, dan entity
recognition. Model telah dirancang dan di implementasikan dari awal khusus untuk
spaCy, untuk memberi keseimbangan kecepatan, size, dan accuracy yang stabil.
Strategi bloom embedding baru dengan fitur subword digunakan untuk mendukung
kosakata besar dalam tabel kecil. Convolutional layer dengan residual connections,
layer normalization and maxout non-linearity memberikan efisiensi yang jauh lebih
baik daripada solusi Bi-LSTM standar. The parser dan NER menggunakan tujuan
pembelajaran imitasi untuk memberikan akurasi yang sejalan dengan sistem

penelitian terbaru, bahkan ketika dievaluasi dari raw text. Dengan inovasi ini,
model spaCy model terbaru 20% lebih akurat, dan bahkan lebih murah untuk
dijalankan daripada generasi sebelumnya. (Atika, 2021)
en de fr es pt
it nl sv fi nb
Custom
hu he bn ja ... Components
TextCategorizer
Dependency
Parser
Tokenizer nlp.make_doc() Language nlp.pipeline Tagger
Entity
Recognizer
nlp.tokenizer.vocab nlp.vocab
nlp.pipeline[i].vocab
MAKES
Vocab nlp.vocab.strings StringStore
doc.vocab
nlp.vocab.morphology
Doc
MAKES
Morphology
lexeme.vocab
MAKES MAKES
token.doc span.doc
Token Span Lexeme
Gambar 2.4 aristektur spaCy

2.4.1 NER Tagging Spacy
NER-Tagging adalah bagian dari spaCy, hanya dengan memproses dokumen

dengan pipeline berarti bahwa selain diberi token dan diberi tag POS, dokumen
tersebut telah diberi tag NER, tag NER dapat mengacu pada objek atau orang
tertentu. Misalnya, jika kita menandai kalimat dengan NER, Emmanuel Macron
adalah presiden Prancis saat ini., Kita akan mengenali Emmanuel Macron sebagai
pribadi, dan Prancis sebagai negara – tetapi bukan presiden karena dapat merujuk
pada banyak objek, seperti presiden di berbagai negara atau bahkan organisasi.,
(Srinivasa-desikan, 2018)
("Walmart adalah perusahaan e-Commerce terkemuka",

{"entities": [(0, 7, "ORG")]})

kutipan diatas adalah contoh teks yang telah diberi anotasi NER-Tagging dari
index entitasnya.
2.4.2 Rule Based
Rule based adalah sebuah metode dimana aturan yang ada di dalam sistem
dibuat sendiri berdasarkan pengetahuan linguistik. Selain menggunakan kamus dan
klasifikasi, NER juga bisa menggunakan aturan-aturan tertentu (Wulandari et al.,
2018). Dalam penelian ini, berdasarkan dokumen latih beberapa named entity
memiliki pola-pola tertentu, sehingga bisa dibuat polanya yang akan menjadi aturan
dalan rule-based NER. dalam spacy selain menemukan kata dan frasa yang dicari
rule-based juga memberi akses ke token di dalam dokumen dan hubungannya. Ini
berarti mesin dapat dengan mudah mengakses dan menganalisis token di sekitarnya,
menggabungkan rentang menjadi satu token, atau menambahkan entri ke entitas
tersebut(Spacy, 2022)
Visualisasi
Visualisasi data adalah teknik untuk menyajikan data dalam format gambar
atau grafik. Visualisasi juga dapat mengilustrasikan data berupa pengetahuan untuk
berekspresi secara visual dimana suatu data dapat terstruktur dan bermakna, serta
bagaimana ide tersebut dapat bisa terhubung. Dengan demikian dapat menunjukkan
bahwa visualisasi informasi secara grafis dapat meningkat keterampilan selama
data dapat diproses dengan baik seperti untuk peringkasan teks, penggunaan
pengatur grafik (dalam format khususnya peta konsep) terbukti efektif metode
terkait erat dengan pemahaman teks (Reategui et al, 2012). Dalam penelitian ini
visualisasi dilakukan menunjukan warna entitas bahan makanan., yang akan
ditampilkan dengan dependensi displacy yang merupakan bawaan dari library
spacy
Evaluasi Skor
Matriks yang biasa digunakan dalam evaluasi pada sistem Information

Extraction adalah precision dan recall. Precision merupakan jumlah item yang telah
di identifikasi dengan benar atau relevan dari jumlah total item yang di identifikasi,

sedangkan recall yaitu rasio jumlah item relevan yang ditemukan dengan total
jumlah item dalam kumpulan item yang dianggap relevan. F-score adalah
pengukuran kiNERja yang merupakan kombinasi nilai precision dan recall.
Perhitungan Untuk mengukur keakuratan dari sistem, Penulis menggunakan 6 jenis
parameter, yaitu TP (True Positive), FP (False Positive), FN (False Negative),
precision, recall dan F1. (Drovo et al., 2019)
!"
1) !"#$%&%'( =
!"#$"
!"
2) Recall =
!"#$%
"&'()*)+, . /'(011
3) F1 =
2 . ("&'()*)+,#/'(011)
• TP adalah jumlah entitas yang berhasil di tag dengan benar oleh

model.
• FP adalah jumlah entitas yang berhasl di tag oleh model tetapi bernilai
salah.
• FN adalah jumlah entitas yang tidak berhasil di tag oleh model.
• Precision merupakan perbandingan antara jumlah entitas yang

berhasil di tag dengan benar oleh model dengan jumlah entitas yang
berhasil di tag. Persamaaan dari nilai precision dapat dilihat pada
persamaan (1).
• Recall merupakan perbandingan antara jumlah entitas yang berhasil

di tag dengan benar dengan jumlah entitas yang memiliki entitas
tersebut. Persamaan dari nilai recall dapat dilihat pada persamaan (2).
• F1 merupakan nilai untuk mengukur keakuratan data model yang

dihasilkan. Persamaan F1 dapat dilihat pada persamaan (3).

Gambar
Furht dalam bukunya menjelaskan bahwa gambar adalah susunan array atau
piksel dua dimensi seperti yang ditunjukan gambar 2.2. Setiap piksel terdiri dari
jumlah bit. Berdasarkan jumlah bit per pixel, gambar diklasifikasikan menjadi
empat kategori: biner, grafik komputer, graysclae, dan gambar berwarna. Gambar
digital hadir dalam berbagai rasa. Gambar dapat terdiri dari piksel yang sepenuhnya
hitam atau sepenuhnya putih, yang disebut gambar biNER. Gambar skala abu-abu
mengandung piksel di mana nilai warna piksel bervariasi antara kisaran hitam, abu-
abu, dan putih. Gambar berwarna dapat menangkap nilai piksel dari warna apa pun
seperti merah, biru, dan hijau. (Furht et al., 2018)
Gambar 2.5 konsep gambar pada komputer

Sumber: Digital Image Processing: Practical Approach(2018)
Representasi gambar warna yang paling umum, representasi RGB (Merah,

Hijau, Biru) didasarkan pada teori trikromatik bahwa sensasi warna dihasilkan oleh
tiga kelas reseptor yang menarik di mata.
Optical Character Recognition
Optical Character Recognition (OCR) adalah bagian dari cabang ilmu

komputer yang melibatkan membaca teks dari kertas dan menerjemahkan gambar
ke dalam bentuk yang dapat dimanipulasi oleh computer. Sistem OCR
memungkinkan untuk mengambil buku atau artikel majalah, mengumpankannya

langsung ke file komputer elektronik, dan kemudian mengedit file menggunakan
pengolah kata. memungkinan mesin untuk mengklasifikasi pola optik yang
terkandung dalam gambar digital yang sesuai dengan karakter alfanumerik atau
lainnya, Pengenalan karakter dicapai melalui langkah-langkah segmentasi,
ekstraksi fitur dan klasifikasi (Chaudhuri et al., 2017)
Menurut Mollah(2011) proses pengenalan karakter yang dilakukan oleh OCR

secara garis besar dibagi jadi empat disajikan pada diagram di bawah ini
Gambar 2.6 Proses pengenalan oleh OCR secara umum

Sumber: (Mollah et al., 2011)
Proses boundary selection bertujuan untuk memisahkan wilayah (region)
objek dengan wilayah latar belakang agar objek dalam citra mudah dianalisis dalam
rangka mengenali objek. Dengan demikian citra yang besar terdiri dari objek
karakter dapat disegmentasi menjadi masing-masing karakter.
Proses selanjutnya adalah normalisasi, yang di dalamnya masih terdapat 2

proses lagi yaitu:
• Scalling, adalah fungsi untuk mengubah ukuran suatu gambar dimana

scalling merupakan istilah yang cenderung untuk memperbesar
gambar, dan shrink untuk memperkecil gambar.

• Thinning, adalah operasi morfologi yang digunakan untuk menghapus
piksel foreground yang terpilih dari gambar biNER, biasanya
digunakan untuk proses mencari tulang dari sebuah objek.
Langkah selanjutnya adalah Template Matching yaitu proses analisis citra

dalam mengidentifikasi sifat-sifat yang melekat dari tiap-tiap karakter atau disebut
juga dengan fitur dari sebuah objek yang terdapat dalam citra. Karakteristik ini
digunakan dalam mendeskripsikan sebuah objek atau atribut dari sebuah obyek,
kemudian fitur yang dimiliki oleh karakter dapat digunakan sebagai proses
recognition (Mollah et al., 2011).
Amazon Textract
AWS Textract adalah layanan dari amazon yang memungkinkan pengguna

untuk mendeteksi teks dalam berbagai jenis dokumen seperti dokumen laporan,
gambar dan formulir, dengan menggunakan API Amazon Textract, Amazon
Textract didasarkan pada teknologi highly scalable deep-learning dari Amazon
yang menganalisis miliaran gambar dan video setiap hari, Amazon Textract selalu
belajar dari data baru yang membuat Ekstraksi data Amazon Textract dapat
memberikan nilai akurasi yang tinggi di berbagai kasus penggunaan (Amazon Web
Services Inc., 2020)
2.9.1 Workflow Amazon Textract
Gambar 2.7 Alur AWS Textract

Sumber: aws.amazon.com
Amazon Textract menyediakan operasi sinkron untuk memproses dokumen

kecil, satu halaman dengan respons hampir real-time dan operasi asinkron yang

dapat digunakan untuk memproses dokumen multi halaman. Amazon Textract
dapat mendeteksi baris teks dan kata-kata yang membentuk satu baris teks. Input
dapat berupa dokumen maupun gambar dengan format JPEG atau PNG, dengan
fungsi DetectDocumentText Amazon Textract memproses dokumen, hasil proses
dikembalikan dalam bentuk JSON objek Block. Objek Blok berisi informasi yang
terdeteksi tentang item, termasuk lokasinya di dokumen dan hubungannya dengan
item lain di dokumen informasi berikut dikembalikan dalam beberapa objek Blok.
1. Garis dan kata dari teks yang terdeteksi
2. Hubungan antara garis dan kata dari teks yang terdeteksi
3. Halaman tempat teks yang terdeteksi muncul
4. Lokasi baris dan kata teks pada halaman dokumen
Teks terdeteksi yang dikembalikan oleh operasi Amazon Textract

dikembalikan dalam list objek Blok. Objek ini mewakili baris teks atau kata tekstual
yang terdeteksi pada halaman dokumen. Teks yang terdeteksi dikembalikan di
bidang Teks dari objek Blok. Bidang BlockType menentukan apakah teks itu
sebaris teks (LINE) atau kata (WORD). WORD adalah satu atau beberapa karakter
skrip Latin dasar ISO yang tidak dipisahkan oleh spasi. A LINE adalah rangkaian
kata yang dibatasi tab dan bersebelahan.
Properti Blok lainnya adalah umum untuk semua jenis blok, seperti ID,
confidence, dan informasi geometri. Blok PAGE, LINE, dan WORD terikat satu
sama lain dalam hubungan parent-to-child. Blok PAGE adalah induk untuk semua
objek blok LINE pada halaman dokumen. Karena LINE dapat memiliki satu atau
lebih kata, array Hubungan untuk blok LINE menyimpan ID untuk blok WORD
turunan yang membentuk baris teks.
Pada gambar 2.6 menunjukan bagaimana line “Hello, world.” Memiliki kata
‘Hello’ dan ‘world’ yang direpresentasikan lewat blok objek

Gambar 2.8 Struktur Blok Objek
Prototype
Model Prototype adalah metode proses pembuatan sistem yang dibuat secara
terstruktur dan memiliki beberapa tahap-tahap yang harus dilalui pada
pembuatannya, namun jika tahap final dinyatakan bahwa sistem yang telah dibuat
belum sempurna atau masih memiliki kekurangan, maka sistem akan dievaluasi
kembali dan akan melalui proses dari awal. Pendekatan Prototyping adalah proses
iterative yang melibatkan hubungan kerja yang dekat antara perancang dan
pengguna(Setia, 2015).
Gambar 2.9 Model Prototype

Dalam gambar diatas terdapat proses-proses dalam model prototyping secara
umum adalah sebagai berikut (Setia, 2015):
1. Pengumpulan kebutuhan Developer dan klien atau user akan

bertemu terlebih dahulu dan kemudian menentukan tujuan umum,
kebutuhan yang diketahui dan gambaran bagian-bagian yang akan
dibutuhkan berikutnya.
2. Perancangan dilakukan dengan cepat dan rancangan tersebut

mewakili semua aspek software yang diketahui, dan rancangan ini
menjadi dasar pembuatan prototype
3. Evaluasi Prototype Pada proses ini klien atau user akan

mengevaluasi prototype yang dibuat untuk memperjelas kebutuhan
software.
Flask
Flask adalah microframework dari bahasa python yang menyediakan,

libraries dan kumpulan kode yang bisa di gunakan untuk membangun website,
tanpa perlu melakukan semuanya dari nol. Karena fiturnya yang sederhana, flask
akan lebih ringan dan tidak tergantung dengan banyak library luar yang perlu
diperhatikan. Secara umum flask menyediakan 'Wekzeug' yang berguna untuk
menerima request (url) dan memberikan respon dan ada Jinja2, template engine
yang digunakan untuk menampilkan data dan menulis logika pada tampilannya
(Relan, 2019)
REST
REST (Representational State Transfer) merupakan standar arsitektur

komunikasi berbasis web yang sering diterapkan dalam pengembangan layanan
berbasis web. Umumnya menggunakan HTTP (Hypertext Transfer Protocol)

sebagai protocol untuk komunikasi data. REST pertama kali diperkenalkan oleh
Roy Fielding pada tahun 2000.
Gambar 2.10 Arsitektur REST API
Menurut Sinha REST memiliki aturan seperti antar muka yang seragam,
sehingga jika aturan tersebut diterapkan pada web services akan dapat
memaksimalkan kinerja web services terutama pada performa, skalabilitas, dan
kemudahan untuk dimodifikasi. Pada arsitektur REST, data dan fungsi dianggap
sebagai sumber daya yang dapat diakses lewat Uniform Resource Identifier (URI),
biasanya berupa tautan pada web (Sinha et al., 2014)

Studi Literatur Terdahulu
Tabel 2.3 Penelitian Terdahulu Topik Pencarian Makanan Halal

Metode Pencarian
Metode Pindai Objek
Informasi Informasi
Judul Keterangan
Barco Komp Nama Sertifika Databas Halal
OCR NER
de osisi Produk t e
1 Design of Integrated Latext: Halal Aplikasi membaca nama produk dan
Detection Text using OCR (Optical mengeceknya ke database, data produk
Character Recognition) and Web Service, diambil langsung dari buku/ebook data ✓ ✓ -
✓ LPPOM
- - -
Institut Teknologi Sepuluh Nopember produk halal terbitan MUI MUI
(Yuniarti et al., 2018)
2 Aplikasi Barcode Scanner Food Halal Aplikasi membaca barcode produk dan
Pada Produk Makanan Impor Berbasis mengeceknya ke database,lalu ✓
Android (Widya & Salsabila, 2019) menampilkan detail produk bila terdata - ✓ - - ✓ -
LPPOM
pada database MUI
3 Mobile Application for Halal Food Aplikasi menyeleksi setiap bahan

Ingredients Identification using Optical didalamnya kemudian memberikan ✓ ✓ ✓
- - - - -
Character Recognition informasi kepada user
(Kartiwi et al., 2019)
4 Development of Mobile Application to Aplikasi memindai barcode untuk Persatuan
Recognition Muslim Products (Wahab et membaca nomor sertifikat pada produk
✓ ✓ ✓
Pengguna
al., 2020) kemudian mencari kedatabase apakah - - - - Islam
produk itu sudah terdaftar atau belum Malaysia
(PPIM).
5 OCR and Barcode based Halal and Health Aplikasi pembaca komposisi dan
Analyzer (Akram et al., 2020) mampu memindai lewat barcode, dan
mengecek datanya di database,
penelitian ini juga mampu menghitung ✓ ✓ ✓ - ✓ ✓ - -
kalori kebutuhan pengguna
6 Asking Chatbot for Food Ingredients Halal Aplikasi chatbot yang bisa menjawab
Status (Suardi et al., 2021) apakah suatu bahan itu halal atau non-
- - ✓ - - ✓ -
halal

7 Implementasi Named Entity Recognition Memanfaatkan OCR dan NER untuk
dan Optical Character Recognition untuk memindai dan mengekstrakk informasi
Halal
Aplikasi Pendeteksi Kehalalan Bahan bahan makanan pada kemasan produk
Nutrition
Makanan dengan evaluasi f-score sebesar 0.967 ✓ - ✓ - - ✓ ✓ Food dari
(Bangkit, 2022) serta akurasi OCR 90% dan pengujian
ITS
manual NER terhadap produk nyata
Surabaya
sebesar 84%
Tabel 2.3 Penelitian Terdahulu NER
Tools /
Judul Keterangan Dataset
Metode
1 Named Entity Recognition On A Dalam penelitian ini, Penulis mengembangkan
Collection Of Research Titles teknik ekstraksi informasi untuk mengenali dan
(Mariyah, 2017) mengekstrak masalah, metode, dan domain
671 jurnal diambil secara Naïve
penelitian yang terdapat dalam judul. menguji fitur
online dan lokal(archive) Bayes
kontekstual, fitur sintaksis, dan fitur bag of words
menggunakan Naïve Bayes dan Maximum Entropy.
Classifier
2 Penerapan Named Entity Recognition Penelitian ini NER yang dilakukan menggunakan
Untuk Mengenali Fitur Produk Pada E- metode Hidden Markov Model dan Rule Template Hidden
Commerce Menggunakan Rule Template dengan 6 entitas yaitu MEREK, TIPE, HARGA, 120 Data produk & 30 data Markov
Dan Hidden Markov Model (Dirgantara SPEK, N_SPEK dan N_TAG. testing Model,
et al., 2018) Rule Base
3 Foodie: A rule-based named-entity Penelitian ini memanfaatkan teknologi NER untuk

recognition method for food information mengekstrasi informasi data bahan makanan 200 Resep masakan diambil
extraction (Popovski et al., 2019) berdasarkan resep, menggunakan metode POS dari web allrecipes.com dan Rule Based
Tagging, myrecipes.com

4 Application of Named Entity Penelitian ini dibuat dengan tujuan membangun
Recognition via Twitter on SpaCy in model NER berbahasa indonesia terkait gangguan
5995 twet dari
Indonesian (Case Study: Power Failure listrik di Provinsi D. I. Yogyakarta dengan SpaCy,
Scrapping via twitter dengan
in the Special Region of Yogyakarta) mengetahui hasil evaluation metric dari model yang
keyword spaCy
(Yanti et al., 2021) telah dibangun, dan memetakan persebaran serta
(‘gangguan listrik’, ‘mati
mengetahui perbandingan lokasi yang tersebutkan
lampu’, lokasi: jogja)
di tweet terkait gangguan listrik di Provinsi D. I.
Yogyakarta pada tahun 2020.
4 Rule-based Named Entity Recognition Penelitian ini mengembangkan NER yang mampu
(NER) to Determine Time Expression mengidentifikasi entitas ekspresi waktu dalam
for Balinese Text Document dokumen teks bahasa Bali. NER dibangun 50 teks berbahasa bali Rule Based
(Sinta Wahyuni & Sanjaya ER, 2021) menggunakan pendekatan Rule Based.

Tabel 2.4 Tabel Perbandingan Penelitian
Judul Metode Keterangan Hasil
1 Mobile Application for Halal Memanfaatkan OCR untuk Hasil penelitan ini berupa
Food Ingredients membaca komposisi makanan aplikasi berbasis android yang
Identification using Optical • Optical Character dan mengetahui status mampu membaca komposisi
Character Recognition Recognition kehalalannya makanan, tidak dijelaskan tools
(Kartiwi et al., 2019) ocr maupun evaluasinya, lebih
ke pengembangan prototipe
aplikasinya
2 Foodie: A rule-based named- Menggunakan NER untuk Hasil dari penelitian ini adalah
entity recognition method ekstrasi teks makanan dalam model yang mampu
• Named-Entity Recognition
for food information suatu kalimat, menggunakan mengekstrak informasi bahan
extraction (Popovski et al., • POS-Tagging POS-Tagging dan Rule-Based makanan, dengan evaluasi nilai
2019) • Rule-Based confusion matrix sebesar F-
Score 0.95, Recall 0.94 dan
Precision 0.97
3 Implementasi Named Entity Aplikasi membaca komposisi Memanfaatkan OCR dan NER
Recognition dan Optical yang tertera pada produk untuk memindai dan
• Optical Character
Character Recognition untuk kemasan dan memproses tulisan mengekstrakk informasi bahan
Recognition
Aplikasi Pendeteksi dengan model NER untuk makanan pada kemasan produk
Kehalalan Bahan Makanan • Named-Entity Recognition mengetahui jenis entitas bahan dengan evaluasi f-score sebesar
(Bangkit, 2022) • spacy 0.967 serta akurasi OCR 90%
• Rule-Based dan pengujian manual NER
terhadap produk nyata sebesar
84%
Berdasarkan analisis penulis membandingkan studi literatur dengan penelitian penulis, kelebihan penelitian penulis dengan literatur
sebelumnya yaitu:

1. Dari membaca komposisi, nomor sertifikat dan barcode untuk mencari tahu kehalalan bahan makanan, penulis memilih menggunakan
metode OCR untuk membaca komposisi bahan makanan yang tertlulis pada produk
2. Adapun yang ingin penulis kembangkan dari penelitian sebelumnya adalah dengan mengimplementasikan NER didalam aplikasi
guna mendeteksi bahan makanan yang tertulis dan ada tidaknya bahan haram di diantara bahan yang ada
3. Alasan digunakanya NER karena pada penelitian sebelumnya bila ada produk atau bahan yang tidak ada di database maka aplikasi
tidak dapat memberikan informasi apa-apa, dengan NER dan metode Rule Based, diharapkan bisa membuat model yang dapat
membaca bahan makanan tanpa bergantung dengan database

31
BAB III
METODOLOGI PENELITIAN
Alur penelitian
Gambar 3.1
Kerangka Berfikir

Metode Pengumpulan Data
3.2.1 Observasi
Penulis melakukan observasi untuk mengumpulkan data berupa

memperhatikan gambar komposisi atau ingredients baik di internet maupun secara
langsung. Guna mempelajari pola-pola dan bentuk penulisan komposisi yang
umum tertera pada produk kemasan
3.2.2 Studi Literatur
Pada tahapan pengumpulan data dengan cara studi pustaka, penulis mencari
referensi-referensi yang relevan dengan objek yang akan diteliti. Pencarian
referensi dilakukan di perpustakaan, maupun secara online melalui internet. Setelah
mendapatkan referensi-referensi yang relevan tersebut, penulis lalu mencari
berbagai informasi yang dibutuhkan dalam penelitian ini. Adapun informasi yang
didapat digunakan dalam penyusunan landasan teori, metodologi penelitian serta
pengembangan aplikasi secara langsung.
Implementasi
3.3.1 Pengumpulan Dataset
Dalam penelitian ini ada tiga jenis entitas yang akan di Kembangan untuk di
kenali entitasnya yaitu Halal, Haram dan Syubhat adapun data yang digunakan
sebagai diambil dari beberapa sumber diantaranya:
3.3.1.1 Data Jenis-jenis Bahan Makanan

Dataset utama dari penelitian ini adalah mencari data bahan makanan
sebanyak-banyaknya untuk di training data diambil dari beberapa sumber yaitu
1. Dataset USDA’s FoodData yang diambil dari web FoodData Central
2. e-book berjudul “Resep Masakan Indonesia A-Z” penulis mengambil

data jenis bahan makanan Indonesia dari buku resep masakan tersebut
3. e-book “Daftar Belanja Produk Halal LPPOM MUI”, ini berisi rilisan
produk-produk MUI, pada buku ini Penulis mengambil beberapa zat-

zat yang umum didapat di komposisi produk kemasan yang tidak
terdapat di buku masak.
3.3.1.2 Data Bahan Haram

Untuk dataset entitas haram dan Syubhat penulis mengambil dari Halal
Nutrition Food halal.addi.is.its.ac.id yang merupakan badan riset produk halal dari
Institut Teknologi Sepuluh November, mereka menyediakan rilisan produk halal
yang tersebar di Indonesia dan merilis bahan-bahan haram yang umum di temui di
produk makanan yang terangkum dari berbagai sumber (lihat gambar 3.2), (Aini
Rakhmawati et al., 2019). di penelitian ini penulis hanya mengambil data bahan
haramnya saja dari situs tersebut
Gambar 3.2 Halaman Web halal.addi.is.its.ac.id
3.3.1.3 Data Bahan Syubhat

Untuk data ini penulis belum bisa menemukan Lembaga local yang merilis
daftar Syubhat di Indonesia, Adapun yang penulis temukan adalah di situs Halal
Advisory Service lahore.comsats.edu.pk, yang merukapan Lembaga dari
COMSATS University Islamabad di Pakistan, situs tersebut menyediakan daftar zat-
zat Syubhat yang umum ditemui di produk kemasan. (Islamabad, n.d.)

Gambar 3.3 Halaman Web Halal Advisocy COMSATS
3.3.2 Metode NER
Tahapan berupa pembuatan Model untuk mengklasifikasi entitas Halal,

Haram dan Syubhat. Adapun Library yang penulis gunakan di penelitian ini adalah
Spacy untuk proses dalam metode ini meliputi Training Data, Testing Data,
Evaluasi Model dan menerapkan Rule Base untuk mengklasifikasi Entitas Haram
dan Syubhat, Karena data dari kedua entitas tersebut tidak banyak maka penulis
hanya menerapkan Rule Base tanpa melakukan training data lagi.
3.3.3 Metode OCR
Optical Character Recognition disini digunakan untuk membaca komposisi

lewat foto atau gambar sebelum diproses Model NER, Pada Penelitian ini penulis
menggunakan Sistem AWS Textract. Sistem dipilih karena pada penelitian ini objek
yang digunakan beragam dari bentuk dan warnanya, pada bagian ini penulis akan
menjelaskan instalasi dan implementasi AWS Textract di sistem yang akan dibuat
nanti

Pengujian
Tahap ini berisi Evaluasi Model yang telah dibangun, evaluasi akurasi OCR
dan bagaimana kemampuan sistem mengenali entitas bahan makanan pada produk
kemasa

36
BAB IV
IMPLEMENTASI
Gambaran Umum Sistem
Aplikasi yang dirancang pada penelitian ini merupakan alat bantu alternatif
bagi pengguna untuk mencari tau ada tidaknya kandungan non halal dari produk
kemasan yang ingin di konsumsi melalui komposisi yang tertera pada kemasan
produk. Aplikasi ini dirancang untuk menjadi sebuah web yang menerapkan
teknologi Optical Character Recognition melaui layanan AWS Textract dan Named
Entity Recognition dengan library Spacy, aplikasi mampu mengambil gambar dan
membaca daftar komposisi yang tertera pada produk kemudian aplikasi dapat
menunjukan entitas makanan yang tertera pada kemasan dan mana dari entitas
tersebut yang haram.
Gambar 4.1
Gambaran Umum Aplikasi

4.1.1 Flow Chart
Membuat alur yang akan menggambarkan proses penelitian

berlangsung, berikut adalah alur dari beberapa segmen utama dalam
penelitian ini:
1. Pengumpulan Dataset
Gambar 4.2
Flow Chart Pengumpulan Dataset

2. Implementasi OCR dengan AWS textract
Gambar 4.3
Flowchart Implementasi OCR dengan AWS Textract

3. Alur NER
Gambar 4.4
Flowchart Pembentukan Model NER

4.1.2 Rancangan Antarmuka
Pada tahap perancangan antarmuka sistem ini menjelaskan tentang proses

ekstraksi komposisi bahan makanan pada kemasan produk untuk memberikan
kemudahan pengguna dalam menggunakan aplikasi tersebut. Perancangan
antarmuka sistem dibuat sebagai alat penghubung aplikasi dengan pengguna.
Adapun penjelasan rancangan antarmuka sistem yang akan diterapkan pada sistem
adalah sebagai berikut lihat gambar
Gambar 4.5
Rancangan Antarmuka
Untuk penelitian ini hanya diperlukan satu halaman yang akan penulis
jelaskan sebagai berikut:
A. Panel Upload gambar berfungsi untuk mengupload Gambar yang ingin

diproses OCR menggunakan AWS Textract, setelah proses OCR berhasil
maka teks hasil scan akan tampil di panel B
B. Panel ini adalah tempat dimana hasil Model NER ditampilkan

4.1.3 Sequence Diagram
Sequence diagram menggambarkan interaksi antar objek di dalam dan sekitar

objek berupa message yang digambarkan terhadap waktu, berikut adalah sequence
diagram dari sistem yang berjalan lihat gambar 4.6
Gambar 4.6
Sequence Diagram Aplikasi
Dataset
Pada penelitian ini penulis ingin melakukan percobaan terhadap dataset yang
dimiliki untuk mendapatkan model yang dapat mengidentifikasi entitas makanan
yang tertera pada kemasan produk dan apakah entitas tersebut tergolong haram
atau tidak. Pada tahap ini, penulis merencanakan segala persiapan yang akan
dilakukan untuk membentuk dataset
Dalam proses ini, entitas diidentifikasi dan diklasifikasikan secara semantik

ke dalam kelas yang ditandai. Ini adalah langkah pra-pemrosesan yang penting
dalam Natural Language Processing (NLP) untuk mendapatkan informasi
mengenai entitas. Enititas yang diambil pada penelitian ini yaitu nama penyakit,

lokasi kejadian, waktu, dan jumlah korban dari artikel portal berita terkait penyakit
tropis di Indonesia dapat dilihat pada contoh entitas pada NER pada tabel 2.2
4.2.1 Text Preprocessing
Dalam penelitian ini dataset yang digunakan diambil dari beberapa sumber
diantaranya yang utama dari web USDA’s FoodData, e-book berjudul “Resep
Masakan Indonesia A-Z” dan “Daftar Belanja Produk Halal LPPOM MUI” data
yang akan dikelompokkan menjadi data makanan yang berjumlah 39.565 data.
Karena dataset diambil dari beberapa sumber maka harus dilakukan teks
preprocessing untuk membentuk dataset text Preprocessing Data merupakan proses
mengubah data menjadi sesuatu yang dapat dipahami.Adapun Langkah yang
dilakukan yaitu:
4.2.1.1 Case Folding

Case Folding adalah proses dalam menghapus semua perbedaan case atau
huruf besar yang ada dalam string. Metode ini digunakan untuk melakukan
perbandingan string case-sensitive antara dua string. Proses ini dilakukan untuk
mengubah setiap huruf menjadi huruf kecil (lowercase). Contoh proses case folding
dapat dilihat pada tabel 3.3 berikut
Tabel 4.1 Case Folding
Teks Yang Akan di Proses Hasil Case Folding
STRAWBERRY CHEESECAKE strawberry cheesecake
SPAGHETTI AND MEATBALLS spaghetti and meatballs
PUTIH TELUR AYAM putih telur ayam
BAWANG MERAH GORENG bawang merah goreng
4.2.1.2 Filtering
Filtering adalah proses menghilangkan tautan url, tanda titik berulang,
hashtag, mention, tanda baca, angka, tambahan spasi dan stopword. Dalam proses

ini digunakan NLTK python libraries dengan memanfaatkan korpus stopwords
untuk Natural Language Processing. NLTK mendukung penghapusan kata yang
tidak memiliki makna tertentu dalam suatu kalimat seperti kata hubung dan kata
depan. Contoh proses filtering dapat dilihat pada tabel 4.2
Tabel 4.2 Filtering
Teks Yang Akan di Proses Hasil Filtering
strawberry cheesecake strawberry cheesecake
spaghetti and meatballs spaghetti meatballs
putih telur ayam putih telur ayam
bawang merah goreng bawang merah goreng
Setelah melakukan kedua proses diatas terbentuklah data yang akan dijadikan
dataset untuk dilakukan training untuk pemodelah NER dengan library spacy
Berikut adalah dataset yang siap digunakan untuk membentuk model entitas bahan
makanan lihat tabel 4.3
Tabel 4.3 Hasil FIltering
Dataset Food Entity
strawberry cheesecake
spaghetti meatballs
putih telur ayam
bawang merah goreng

Proses Penerapan NER dengan Spacy
Pada tahapan ini, dataset yang telah melewati tahapan pre-processing akan
menjadi input untuk proses pelatihan, dalam proses ekstraksi informasi digunakan
Library spaCy untuk Named Entity Recognition (NER). Named entity adalah objek
yang diberi nama, dalam penelitian seluruh dataset dijadikan objek untuk
mendapatkan ekstraksi informasi entitas makanan. spaCy dapat mengenali berbagai
jenis entitas bernama dalam dokumen, dengan meminta model untuk mengenali
entitas tersebut.
Pada penelitian ini akan dibentuk beberapa entitas untuk memdukung

pembuatan sistem pendeteksi kehalalan makanan pada produk kemasan, entitas
yang akan dibentuk pada penelitian ini adalah sebgai berikut lihat tabel.
Tabel 4.4 Tabel Entitas Bahan Makanan
Tipe Deskripsi Contoh
Menandakan bahan atau Ayam, Garam, Gula,

Halal komposisi yang aman dan dapat Kentang
dikonsumsi
Entitas yang ditandai label ini Daging Babi, Darah,

menandakan bahan tersebut Alkohol, Wine
Haram
haram dan dilarang dikonsumsi
oleh umat muslim
Syubhat untuk menandakan Potassium

entitas yang masih meragukan
Syubhat kehalalanya karena dapat
berpotensi haram tergantung
sumber asalnya
K-Key adalah entitas pendukung Komposisi, Ingridients

K-Key
yang diterapkan pada model untuk

mengetahui tanda komposisi bahan
dimulai
S-Key adalah entitas pendukung Allergen, Information

yang diterapkan pada model untuk
S-Key
mengetahui tanda akhir dari tulisan
daftar komposisi bahan,
Berikut beberapa proses Named Entity Recognition (NER) menggunakan

Library spaCy:
4.3.1 Generatate Anotasi Kalimat Training
Untuk menandai suatu entitas spaCy menggunakan list sebagai data training.
Setiap list harus berisi teks dan dict. dict harus menyimpan indeks awal dan akhir
dari entitas bernama dalam teks, dan kategori atau label entitas bernama. Misalnya,
("Facebook adalah Sosial Media terkemuka",

{"entities": [(0, 7, "ORG")]})
kutipan diatas adalah contoh teks yang telah diberi anotasi NER-Tagging dari
index entitasnya, Untuk penelitian ini penulis menerapkan anotasi dengan
membentuk template dari kalimat-kalimat yang terdapat pada komposisi yang
tertera pada kemasan produk dari observasi penulis lakukan maka terbentuklah
template-template berikut lihat gambar 4.7:
Gambar 4.7 template kalimat

Dari template yang telah disiapkan di gambar 4.7 akan di generate data
anotasi untuk di training dengan mengacak data entitas makanan pada dataset
kedalam template, hasil dari generate data diatas kurang lebih lihat gambar 4.8, data
berupa list dengan kalimat serta posisi index yang telah di beri anotasi
Gambar 4.8 Template yang telah di generate
Gambar 4.8 diatas menunjukan anotasi NER-Tagging dari template kalimat

yang di generate dan telah dimasukan entitas halal secara acak,
4.3.2 Generate Kalimat Umum
Untuk menghindari bias entitas ketika situasi di mana model NER mampu
mengidentifikasi entitas makanan, tetapi lupa bagaimana mengklasifikasikan
entitas lain seperti ORG atau PERSON. Meskipun ORG atau PERSON, entitas lain
akan membantu mengaitkan makanan relasi lainya, maka model perlu ditraining
dengan kalimat umum agar mampu mengenali entitas lain meski telah dilatih
khusus untuk mengenali entitas Bahan makanan untuk datasetnya peneliti
menggunakan base model en-core dari spacy dan dataset NPR.CSV yang berisi
artikel-artikel umum contohnya lihat gambar.

Gambar 4.9 data kalimat umum
Gambar 4.9 diatas adalah contoh NER-Tagging sebagian data yang telah
digenerate dan entitasnya dengan model spacy.
4.3.3 Proses Training
Dari data yang diolah sebelumnya sudah siap untuk di training, data yang
ditrain adalah data yang di generate dengan entitas halal digabungkan dengan data
generati dari revisi entitas tadi agar tidak terjadi bias entitas yang menyebabkan
model cenderung menebak setiap entitas menjadi entitas halal, Berikut beberapa
proses Named Entity Recognition (NER) menggunakan Library SpaCy
TEXT NER tok2vec ........ DOC
Gambar 4.10 Pipeline training NER

spaCy terlebih dahulu membuat token teks tersebut untuk menghasilkan objek
Doc. Doc kemudian diproses dalam beberapa langkah berbeda, ini juga disebut

sebagai processing pipeline. Setiap komponen pipeline dapat dilihat pada tabel 4.4
mengembalikan Doc yang telah diproses, yang kemudian diteruskan ke komponen
berikutnya
Tabel 4.5 pipeline yang digunakan untuk training

Komponen Deskripsi
NER Deteksi label dan nama entitas
trf_tok2vec komponen, yang menjalankan transformator di

dokumen, dan menyimpan hasilnya ke dalam atribut
doc.tensor
! python -m spacy init config config.cfg --lang en --pipeline
ner --optimize efficiency
Untuk mengatur konfigurasi Training data pada spaCy digunakan skrip diatas
yang secara otomatis spaCy akan menggenerate file config.cfg yang berisikan
beberapa konfigurasi sebagai berikut:
[paths]
train = null
dev = null
vectors = null
init_tok2vec = null
[system]
gpu_allocator = null
seed = 0
[nlp]
lang = "en"
pipeline = ["tok2vec","ner"]
batch_size = 1000
disabled = []

before_creation = null
after_creation = null
after_pipeline_creation = null
tokenizer = {"@tokenizers":"spacy.Tokenizer.v1"}
Langkah selanjutnya sebelum dilakukan proses training adalah

menggabungkan dataset makanan dengan dataset revisi entitas umum, kedua data
tersebut disatukan dan dibentuk file train.spacy yang merupakan format file
pelatihan spaCy v3
db = DocBin() # membuat objek docbin

TRAIN_DATA = TRAIN_REVISION_DATA + TRAIN_FOOD_DATAD
for text, annot in tqdm(TRAIN_DATA): #

doc = nlp.make_doc(text) # membentuk objek dari teks
train data
for start, end, label in annot["entities"]: #memberikan
index anotasi
span = doc.char_span(start, end, label=label,
alignment_mode="contract")
if span is None:
print("Skipping entity")
else:
ents.append(span)
doc.ents = ents #memberi entitas pada tiap objeknya
db.add(doc)
db.to_disk("./train.spacy")
#menyimpan data dalam format train.spacy, data inilah yang
dapat dibaca spacy untuk dilatih modelnya
Setelah proses diatas dijalankan dan penulis sudah menyiapkan data training
sesuai format yang dapat dibaca spaCy, proses training sudah dapat dijalankan
dengan menjalankan skrip berikut:
! python -m spacy train config.cfg --output./output --

paths.train./train.spacy --paths.dev./train.spacy

Proses training dilakukan kurang lebih 40 menit dengan menggunakan
platform google colab, proses jalanya training model dapat dilihat di gambar
berikut:
Gambar 4.11 Proses Training Berjalan
4.3.4 Rule Based Matching
4.3.4.1 Rule Menambahkan Entitas Haram, Syubhat, K-Key dan S-Key

Disini penulis ingin menjelaskan Rule Base untuk mengidentifikasi entitas
haram dan Syubhat. Penulis tidak menambahkan kedua entitas tersebut lewat
training karena kedua entitas tersebut bersifat pasti dan ada hukumnya maka dari
itu penggunaan rule base lebih tepat guna dibandingkan training entitas baru
Untuk dataset entitas haram dan Syubhat penulis mengambil dari Halal
Nutrition Food halal.addi.is.its.ac.id dan juga dari Halal Advisory Service
ahore.comsats.edu.pk, Berikut penerapan Rules-Based pada penelitian ini dapat
dilihat pada pseudocode Rules-Based dibawah ini:

SET harams TO jenisIngridientsList
SET ruleEntity TO nlp.add_pipe(nlp, overwrite_ents=True)
FOR libarst IN entityList:
ruleEntity.add_patterns([{"label": "entitas",
"pattern": jenisEntity}])
SET rulerEntitas.name TO 'rulerEntitas'
nlp.add_pipe(rulerEntitas)
berikut adalah penjelasan dari pseudocode rules-based yang dimasukan

kedalam model
• Set jenisEntity dengan daftar entitas haram,Syubhat, K-key dan S-Key

ditulis dalam bentuk list
• Entity ruler adalah aturan yang akan diterapkan dimodel untuk kedua
entitas diatas, disini peneliti menerapkan Overwrite yang artinya
Ketika model NER bertemu dengan kata yang ada didalam list maka
beri atau ubah entitasnya menjadi entitas baru yaitu
‘haram’,‘Syubhat’,’ K-Key’ dan ‘S-Key’ secara mutlak
• Rules for diatas adalah melakukan overwrite dari semua yang data
yang ada dilist
• Nlp.add_pipe(rule) adalah fungsi untuk memasukan aturan yang

diterapkan tadi kedalam model
4.3.4.2 Rule Komposisi

Proses selanjutnya adalah memberi Rule untuk mengelompokan entitas
makanan yang terdapat pada komposisi, untuk meningkatkan akurasi bilamana
ditemukan kata bahan makanan dalam teks namun bukan termasuk bagian dari
komposisi, untuk itu diterapkan fungsi untuk mengelompokan bahan yang ada
didalam komposisi, berikut adalah diagram dari fungsi rule yang akan dibuat:

Gambar 4.12 Diagram Rule
Dari diagram diatas setiap entitas halal, Syubhat dan haram masuk akan
diseleksi apakah ditemukan setelah entitas K-Key atau setelah entitas S-Key, bila
DEFINE FUNCTION ingredients_rule(doc):
new_ents=[]
detected_entities=[]
not_ing=[]
other_entities=[]
SET komposisi TO False
FOR ent IN doc.ents:

#K-KEY adalah kode entitas untuk kata seperti "komposisi", "ingredients"
IF ent.label_ EQUALS 'K-KEY':

SET komposisi TO True
// Memasukan kata bahan didalam komposisi kedalam array
ELSEIF ent.label_ IN ('halal', 'haram', 'Syubhat') and
(komposisi==True):
detected_entities.append(ent)
// membuang kata bahan yang tidak didalam komposisi
ELSEIF ent.label_ IN ('halal', 'haram', 'Syubhat') and
(komposisi!=True):
not_ing.append(ent)
//mengelompokan entitas lain selain bahan

ELSE:
other_entities.append(ent)
//menggabungkan entitas bahan dalam komposisi dan entitas lainya
SET new_ents TO detected_entities + other_entities
SET doc.ents TO new_ents
RETURN doc
nlp.add_pipe(ingredients_rule)
berikut adalah penjelasan dari pseudocode rules-based dari gambar 4.14
• Define nama fungsi Ingredient_Rules
• Define array kosong untuk mengelompokan entitas
• Set variable komposisi = false, variable ini akan jadi penanda sudah
ditemukan atau belum kata kunci “komposisi” dan “ingredients”
• Looping setiap katanya
• IF yang pertama adalah mencari entitas K-KEY yang merupakan kode

entitas untuk kata seperti "komposisi", "ingredients"
• Selanjutnya masukan entitas yang berlabel haram, halal dan Syubhat

bahan didalam komposisi kedalam array, jika variable komposisi =
True makan akan masuk ke array Detected_entities jika entitas
makanan ditemukan saat variable komposisi = False makan bahan
tersebut tidak dimasukan kedalam dokumen
Berikut adalah perbedaan sebelum dan sesudah diterapkanya ingredients_rule

sebagai contoh disini penulis memiliki teks berikut

“babi merukapakan hewan yang diharamkan dalam islam
untuk dikonsumsi lebih baik mengkonsumsi makanan seperti:
ayam, sapi, kentang, wortel, daripada makan babi komposisi:
sugar, milk, ayam goreng, cocoa butter”
Sebelum rule diterapkan kedalam model maka berikut adalah output yang
dikeluarkan
Gambar 4.13 Output Sebelum diterapkan Rule Ingredients
Dari output diatas terlihat model membaca beberapa entitas yang tidak
terdapat di dalam komposisi seperti kata “babi” diatas ataupun entitas “ayam”,
“sapi”,”kentang” meski kata tersebut merupakan bahan makanan namun dalam
konteks teks di atas kata tersebut adalah informasi umum bukan bahan yang
terdapat pada komposisi, jika salah mesin tetap membaca entitas tersebut haram
padahal entitas tersebut tidak terdapat dalam komposisi. Maka akan terjadi
misinformasi dari yang seharusnya pengguna terima.
Gambar 4.14 Output Setelah Model diberi Rule

Gambar 4.14 menunjukan hasil yang keluar setelah diterapkan rule untuk
memasukan bahan yang ada didalam komposisi, terlihat bahwa model tidak lagi
membaca bahan babi sebagai haram, karena babi disini tidak termasuk dalam
komposisi melainkan hanya sebuah informasi
4.3.5 Visualisasi
Pada proses ini dilakukan visualisasi pada entitas dengan fungsi ent yang
memberi warna entitas dan labelnya dalam teks proses ini bertujuan untuk

mempermudah pengguna saat menerima informasi jenis entitas pada komposisi
bahan makanan. Visualisasi entitas tersebut dapat disesuaikan dengan opsi berikut:
Tabel 4.6 visualisasi Spacy
Argument Deskripsi
ents Jenis entitas yang akan di highlight
colors Warna yang akan menandakan entitas.
Secara default, displaCy hadir dengan warna untuk semua tipe entitas yang
didukung oleh spaCy dan dapat menggunakan setelan warna untuk menambahkan
warna untuk perbedaan setiap entity. Untuk penelitian ini peneliti menggunakan
warna berikut dan entitasnya
Tabel 4.7 Visualisasi Entitas Makanan
Entitas Warna Contoh Visual
Halal Hijau
Haram Merah
Syubhat Krem
Lainya Hitam
Implementasi AWS Textract
Pada bagian ini penulis ingin menjelasakan proses implenentasi Optical

Character Recognition dengan menggunakan layanan AWS Textract, AWS Textract
sendiri merupakan layanan dari amazon yang memungkinkan pengguna untuk

melakukan ekstraksi data dan teks yang diambil dari beberapa format gambar,
dokumen dan pdf, untuk menjalankan layanan ini penulis terlebih dahulu
Gambar 4.15
Policy yang digunakan untuk Penelitian ini
mengaktifkan policy dari AWS Textract, policy disini merupakan aturan dari aws
agar pengguna bisa memilih layanan mana yang bisa dijalankan.untuk penelitian
ini penulis hanya menggunakan layanan AWS Textract dan policy yang digunakan
adalah AmazonTextractFullAccess setelah policy di aktifkan makan AWS Textract
bisa dijalankan pengguna.
Untuk penelitian ini penulis menggunakan operasi DetectDocumentText yang

menerima input berupa gambar dalam format JPEG atau PNG.
DetectDocumentText mengembalikan teks yang terdeteksi dalam array Blok Objek.
Setiap halaman dokumen memiliki Blok tipe PAGE untuk setiap satu halaman,
LINE untuk setiap baris kalimat & WORD untuk setiap kata untuk penjelasan visual
dari respon API AWS Textract dapat di lihat di gambar 4.16
Gambar 4.16 Penjelasan Visual dari Respon API AWS Textract

Langkah untuk menggunakan perintah DetectDocumentText pada aplikasi,
disini penulis menggunakan Bahasa pemograman Python, Dari data json tersebut
penulis bisa menerima hasil OCR dari Textract untuk di proses selanjutnya
Gambar 4.17 Respon AWS Textract
Gambar diatas merupakan respon dari api textract yang telah mengolah
gambar yang diupload, berupa objek JSON yang memberikan beberapa parameter
didalamanya
1. BlockType : jenis block yang diterima, aws memberikan

beberapa opsi seperti gambar 4.16 yaitu Page, Line, Word. Pada
penelitan ini peneliti menggunakan block Line untuk mendapatkan
kalimat yang utuh beserta tanda bacanya, karena model yang dibuat
telah menggunakan format tulisan komposisi yang umum terdapat
pada produk kemasan
2. Confidence : Tingkat akurasi yang diperkirakan AWS
3. Text : Teks dari block yang diterima, gambar
4. BoundingBox : titik kordinat dari line yang dibaca dari gambar yang
di pindai
5. Relationships : berisi key penghubung relasi antar blok
Sebagai contoh dari response yang ditunjukan gambar 4.18 Peneliti mengolah
data block Line dan mengambil Objek ‘text’ untuk diolah dengan model

Gambar 4.18 Gambar Yang di baca AWS
Implementasi Aplikasi
4.5.1 Pembuatan REST API
Untuk menampilkan model yang telah dibuat kedalam aplikasi penulis

menggunakan metode REST API sebagai penghubung model dan halaman web
Gambar 4.19 Kode mengambil teks
antarmuka yang dibuat, disini ada dua fungsi utama yang dibuat yang pertama
adalah fungsi detect-text. Fungsi detect_text yang ditunjukan gambar 4.18 adalah
penghubung antara aplikasi dan layanan aws textract, fungsi menerima gambar
kemudian diteruskan ke fungsi aws textract, seperti yang sebelumyna dijelaskan

pada sub bab 4.4 disini penulis mengambil text berdasarkan blok LINE, fungsi
selanjutnya adalah lihat gambar
Fungsi yang ditunjukan gambar 4.19 adalah fungsi utama dalam aplikasi ini,
disini, yang berjalan dalam fungsi ini adalah
• fungsi menerima post berupa gambar, dari gambar yang diterima

diteruskan ke fungsi detect_text (gambar 4.18)
• detect text akan menerima respon berupa text yang telah diproses aws
textract
• berikutnya sebelum dibaca model NER text terlebih dahulu di

rapihkan dengan menghilangkan garis baru dan mengubahnya ke
lowercase guna meningkatkan akurasi NER agar mendekati template
yang dilatih ke model
Gambar 4.20 API utama aplikasi
• selanjutnya proses NER di jalankan dan disini peneliti menggunakan

visualisasi “displacy” yang telah disediakan spacy.
• dari hasil yang diterima peneliti mengelompokan hasil menjadi dua

yaitu ‘detected_entities’ dan ‘other_entities,

• detected_entities berisi entitas bahan komposisi yang terdeteksi
• other_entities berisi entitas lainya yang bukan bahan termasuk

komposisi, untuk hasilnya dalam bentuk json dapat dilihat di gambar
4.20
Gambar 4.21 Respon API dari kode gambar 4.18

4.5.2 Implementasi Antarmuka
Pada bagian ini merupakan penampakan hasil akhir aplikasi yang dibuat
penulis, model yang telah dilatih diimplementasikan kedalam bentuk web dan
dipadukan dengan AWS Textract, penulis membangun web menggunakan
framework python Flask untuk API dari model yang sebelumnya dibuat dan
diterapkan ke dalam web yang dibangun dengan html dan javascript gambar 4.22
merupakan hasil implenatasi sesuai rancangan antarmuka yang telah dijelaskan

pada subbab 4.1.2 pada halaman utama ini terdapat tombol Browse untuk memilih
file gambar yang akan di olah dan infomasi warna entitas yang akan dihasilkan,
Gambar 4.22 Tampilan Antarmuka Aplikasi
4.5.3 Pengujian UAT
Pada tahapan pengujian ini dilakukan untuk mengetahui kinerja setiap fungsi
yang ada pada sistem aplikasi yang telah melalui tahapan coding sesuai dengan
perancangan yang sudah dibuat. Tahap pengujian dilakukan dengan menggunakan
user acceptance test:
Tabel 4.8 User Acceptance Test
Hasil
No Deskripsi Hasil yang diharapkan
sebenarnya
1 Pengujian Sistem Sistem berhasil menampilkan daftar bahan Sesuai

Pendeteksi makanan yang tertera pada komposisi
produk
2 Pengujian Menu Berhasil menampilkan bahan yang dicari Sesuai

daftar Bahan Non-
halal
3 Pengujian Pemberian Berhasil menampilkan menu login dan Sesuai

Saran berhasil keluar (tidak memiliki otentikasi
dan otorisasi)

BAB V
HASIL DAN PEMBAHASAN
Evaluasi
Pada tahap ini, penulis melakukan evaluasi dari hasil tahapan proses yang
telah dilakukan dilakukan sebelumnya, evaluasi bertujuan untuk memastikan hasil
yang didapat desuai dengan tujuan penelitian, setelah model dilatih dan divalidasi
didapatka hasil berupa skor F.
5.1.1 Dataset Uji
Karena entitas Haram dan Syubhat ditambahkan kedalam model tidak lewat
proses training, jadi penulis akan menggenerate data test yang ada kedua entitas
tersebut didalamnya, berikut adalah template yang digunakan untuk menggenerate
kalimat testing
Gambar 5.1 Template Data Test
Dari template yang telah disiapkan di gambar 4.7 akan di generate data
anotasi untuk di testing dengan mengacak data entitas makanan, data bahan haram
dan mushboh, pada template diatas terdapat simbol sebagai tanda tempat entitas di
generate simbol {} tanda untuk data halal, symbol – untuk data haram dan symbol
@@ untuk data Syubhat, hasil dari generate data diatas kurang lebih lihat gambar
4.8, data berupa list dengan kalimat serta posisi index yang telah di beri anotasi

Gambar 5.2 Hasil Generate Data Testing
5.1.2 Hasil Uji model dengan Data Test
Berikut adalah hasil kinerja model yang telah ditrain yang diuji dengan data
testing sebanyak 586 yang sebelumnya dibentuk:
Gambar 5.3 Skor evaluasii Entitas yang dilatih

Dari hasil evaluasi kinerja model menunjukan bahwa hasil yang memuaskan
dari tiga kategori entitas makanan dengan nilai dari entitas Halal menadapat nilai
F1 sebesar 0.95, nilai F1 Haram 0.97 dan nilai F1 dari entitas Syubhat 0.99.

Sedangkan untuk evaluasi kinerja model terhadap entitas umum dari spaCy
mendapatkan hasil sebagai berikut:
Gambar 5.4 Evaluasi Entitas Default Spacy
Terlihat dari gambar diatas kemampuan baca terhadap entitas umum jauh
lebih lemah karena model yang dilatih diprioritaskan untuk pembacaan entitas
makanan, hasil yang didapatkan adalah nilai Precision sebesar 0.646 nilai Recall
0.582 dan F1-Score sebesar 0.613

Perbandingan Evaluasi Entitas Makanan Dan Umum
1,2
0,8
0,6
0,4
0,2
0
Precision Recall F1-Score
Entitas Makanan Entitas Umum spaCy
Gambar 5.5 Perbandingan Evaluasi Entitas Makanan dan Entitas Umum
Hasil Akhir Sistem
1. Halaman Depan
Gambar 5.6 Hasil Akhir Aplikasi

Gambar 5.6 diatas menunjukan tampilan antarmuka utama aplikasi, terdapat
box input untuk mengupload gambar yang akan di proses untuk mengetahui
informasi kehalalan makanan di dalamnya

2. Halaman Informasi
Gambar 5.7 Halaman Informasi
Gambar 5.7 diatas menunjukan tampilan menu informasi, pada halaman ini
pengguna dapat mencari tahu bahan-bahan yang haram dan syubhat, terdapat kolom
pencarian untuk mempermudah pengguna mencari tahu bahan yang ingin mereka
cari.
3. Halaman Saran
Gambar 5.8 Tampilan Halaman Saran

Gambar 5.8 menampilkan halaman saran, halaman ini bertujuan agar
pengguna dapat memberi informasi bilamana ada bahan non-halal yang belum
terbaca pada aplikasi atau juga bila pengguna memiliki informasi tambahan lainya,
terdapat form yang berisi nama bahan dan keteranganya
4. Halaman Hasil
Gambar 5.9 Contoh Hasil Sistem Berjalan

Gambar 5.9 menunjukan hasil akhir sistem, sebagai contoh pengguna
mencoba mencari tahu informasi bahan dari produk minuman ‘peach pink’, dari
foto yang di input selanjutnya sistem memberi informasi entitas makanan apa saja
yang terdapat pada di informasi yang tertera dan juga entitas lainya yang terdapat
pada bagian yang terfoto.

Pengujian Sistem
Disini penulis melakukan pengujian berupa membandingkan secara manual

hasil scan OCR dan hasil pembacaan bahan yang terdeteksi, pada pengujian ini
digunakan 24 gambar dari 12 jenis produk makanan kemasan dengan jenis warna
dan bentuk yang berbeda pengujian dilakukan dengan menggunakan 2 jenis gawai
dengan kemampuan kamera yang berbeda, tujuanya adalah untuk mengetahui
pengaruh kualitas kamera terhadap hasil bacaan dan hasilnya akan dihitung dengan
persamaan sebagai berikut:
!"#$#%& #()*%+% ,(("#$#%& #%. #()*%+%/("#$#%& &%0%1 *%+%)

!"#$%&' = x 100
!"#$#%& 3%"4 *("%)
!"#$#%& #()*%+%
!"#$%&' *+,',%& -.+%$ = !"#$#%& 3%"4 *("%) x 100
(Rosidy et al., 2020)

69
Tabel 5.1 Tabel Uji 1
IPHONE X
Produk TEKS TERTERA PERBA
Teks tak
Hasil scan OCR NDING Bahan Terdeteksi Hasil
terbaca
AN
Komposisi: Mi: Pati Kentang, Pati Kacang

komposisi:
Hijau. Bumbu Pasta: Kecap Bubuk
mi: pati kentang, pati kacang hijau.
(mengandung kedelal), Frukto
bumbu pasta: kecap bubuk (mengandung
Oligosakarida, Bumbu jamur Gula
kedelai), frukto oligosakarida, bumbu
(mengendung pengawet sulfit), Bawang
jamur, gula (mengandung pengawet
Bombay, Ekstrak Tulang Babi, Ekstrak
sulfit), bawang bombay, ekstrak tulang
Ragi, Bawang Putih, Minyak Wijen, Garam,
babi, ekstrak ragi, bawang putih, minyak
Glukosa (mengandung pengawet suifit),
wijen, garam, glukosa (mengandung
SOHUN Maltodekstrin, Bumbu ikan tuna: Minyak natrium
pengawet sulfit), maltodekstrin, bumbu 87/87 30/31
CELLOPHANE Jagung, Ekstrak Kelp, Penguat Rasa benzoat
ikan tuna, minyak jagung, ekstrak kelp,
(Dinatrium 5'-inosinat dan Dinatrium 5-
penguat rasa (dinatrium 5'-inosinat dan
guaniiat), Lada Hitam, Pewarna alami
dinatrium 5'-guanilat), lada hitam,
karamel IV, Penstabil Gom Guar. Minyak
pewarna alami karamel iv, penstabil gom
Bambu: Minyak Wijen Sayuran Kering:
guar. minyak bumbu: minyak wijen
Jamur (Mengandung Pengawet Sulfit),
sayuran kering: jamur (mengandung
Wortel, Kol, Hidrolisat Protein* Nabati,
pengawet sulfit), wortel, kol, hidrolisat
Jemur Kuping Mengandung Pengawet:
protein* nabati, jamur kuping
Natrium Benzoat
mengandung pengawet natrium benzoat

(BOURBON Hello Kitty Mitk Soft Cookie)
Komposisi: Tepung terigu, gula, lemak
(bourbon hello kitty milk soft cookie)
reroti nabati. (mengandung antioksidan
komposisi: tepung terigu, gula, lemak
BHA), pasta kacang putih (6.2%) (meng
reroti nabati (mengandung antioksidan
andung pemanis alami maititol), glukosa,
bha), pasta kacang putih (6.2%) (meng-
sirup jagung tinggi fruktosa
BOURBON andung pemanis alami maltitol), glukosa,
penstabil hidroksipropil dipati fosfat, susu
sirup jagung tinggi fruktosa, penstabil Perisa
kental manis (1,1%), susu 49/49 15/16
hidroksipropil dipati fosfat, susu kental sintetik
bubuk (0.95%), kuning telur bubuk, garam,
manis (1.1%), susu bubuk (0.95%)
pengembang(natrium
kuning telur bubuk, garam, pengembang
bikarbonat, amonium bikarbonat),
(natrium bikarbonat, amonium
pengemulsi lesitin kedelai,
bikarbonat), pengemulsi lesitin kedelai,
perisa sintetik
perisa sintetik mengandung alergen,
Mengandung alergen, lihat daftar bahan
yang dicetak tebal
BISKUIT ISI KRIM RASA COKELAT

biskuit isi krim rasa cokelat
Komposisi: Cokelat Compound Susu
komposisi: cokelat compound susu
(60.68%), Tepung Terigu, Pati Jagung,
(60.68%), tepung terigu, pati jagung, Pengemba
Lemak Reroti Nabati
lemak reroti nabati (mengandung ng,
KOALA (Mengandung Antioksidan Tokoferol),
antioksidan tokoferol), gula, telur, gula 38/38 Ammoniu 15/17
Gula, Telur, Gula Invert, Penstabil Kalsium
invert, penstabil kalsium karbonat, m
Karbonat, Pengembang
pengembang (ammonium bikarbonat, bikarbonat
(Ammonium Bikarbonat, Natrium
natrium bikarbonat), garam, pewarna
Bikarbonat), Garam, Pewarna Alami
alami karamel kelas i/e.150a, perisa
Karamel Kelas 1/E.150a,
sintetik (cokelat, susu, vanilla).
Perisa Sintetik (Cokelat, Susu, Vanilla).

Komposisi ; Minyak (lemak sapi, lemak
komposisi: minyak (lemak sapi, lemak
babi, minyak palm), tepung terigu, gula,
babi, minyak palm), tepung terigu, gula,
garam, pati jagung, kari bubuk, keju, pasta
garam, pati jagung, kari bubuk, keju,
pisang, madu (4.25%), ekstrak babi, pasta
pasta pisang, madu (4.25%), ekstrak
VERMONT wijen, ekstrak ragi, kecap bubuk, susu
babi, pasta wijen, ekstrak ragi, kecap Lemak
CURRY bubuk, kakao bubuk, buttermilk bubuk, 59/59 27/28
bubuk, susu bubuk, kakao bubuk, sapi
pasta apel (0.70%), bawang bubuk, tepung
buttermilk bubuk, pasta apel (0.70%),
kedelai, rempah, bumbu, pewarna alami
bawang bubuk, tepung kedelai, rempah,
karamel
bumbu, pewarna alami karamel iii,
lll, pengatur keasaman asam sitrat, perisa
pengatur keasaman asam sitrat, perisa
sintetik daging sapi, ekstrak rempah
Komposisi: komposisi: air, sirup jagung tinggi

Air, Sirup Jagung Tinggi Fruktosa, Susu fruktosa, susu skim bubuk (0.61%), sari
Skim Bubuk (0.615), Sari Buah Persik buah persik (0.56%), penstabil kalsium Asam
(0.56%), Penstabil Kalsium Laktat, laktat, maltodekstrin, pengatur keasaman sintrat,
PEACH PINK
Maltodekstrin, pengatur Keasaman (Asam (asam sitrat, trinatrium sitrat), perisa 31/31 Penstabil 9/11
Sitrat, Trinatrium, Sitrat), Perisa Sintetik sintetik persik, pemanis buatan kalsium
Persik, Pemanis Buatan Sukralosa sukralosa. laktat
Mengandung Alergen mengandung alergen,

ingredients. enriched wheat flour, corn ingredients: enriched wheat flour, corn
starch rice bran oil, modified tapioca starch, starch. rice bran oil, modified tapioca
Ribovlavin
palm oil, onion juice concentrate, sugar, starch, palm oil, onion juice concentrate,
RING KOREA 31/31 , onion 12/14
cellulose powder, salt, dextain, onion extract sugar, cellulose powder, salt, dextrin,
extract
powder, potato granules, artificial flavor, onion extract powder, potato granules,
powder
riboflavin (color). artificial flavor, riboflavin (color).
ingredients: Sugar, Glucose, Vegetable Oil, ingredients: sugar, glucose, vegetable

KOPIKO Coffee Extract (4.90%). Butter, Emulsifier oil, coffee extract Butter,
20/20 8/10
(Soy Lecithin), Natural Food Color Caramel (4.90%).butter,emulsifier (soy lecithin), emulfisier
IV, Salt, Synthetic Flavor. natural food color caramel iv, salt,
synthetic flavor.

komposisi: jagung (61.45%), minyak
Komposisi: jagung (61.45%),Minyak Nabati
nabati (mengandung antioksidan tbhq),
(mengandung Antioksidan TBHQ), Burnbu
bumbu rasa bbq ({7.52%}, mengandung
Rasa BBQ ((7.52%), mengandung Ekstrak
ekstrak daging sapi {0.4%}, penguat rasa
Daging Sapi (0.4%), Penguat Rasa
mononatrium glutamat, dinatrium 5'-
TORTILLA Mononatrium Gtutamat, Dinatrium 5-
ribonukleotida), gula, cabe bubuk, keju 44/44 11/11
Ribonuldeotida), Gula, Cabe Bubuk, Keju
bubuk (mengandung antioksidan
Bubuk (mengandung Antioksidan Tokoferot
tokoferol campuran pekat), bubuk
Campuran Pekat), Bubuk Bawang Putih, dan
bawang putih, dan perisa sintetik jagung
Perisa Sintetik Jagung (mengandung
(mengandung antioksidan dl-alfa
Antioksidan dl-Alfa Tokoferol).
tokoferol).
Komposisi: Singkong (63%), Minyak Olein komposisi: singkong (63%), minyak

Kelapa Sawit, Bumbu Rasa Barbeque olein kelapa sawit, bumbu rasa barbeque
(mengandung Gula, Garam, Penguat Rasa (mengandung gula, garam, penguat rasa
Mononatrium Glutamat, Kecap Bubuk, mononatrium glutamat, kecap bubuk,
Rempah-rempah, Pewarna Alami Karmin CI rempah-rempah, pewarna alami karmin
75470 dan Karamel III, Pemanis Alami ci 75470 dan karamel iii, pemanis alami
Glikosida Steviol), Daging Sapi Bubuk glikosida steviol), daging sapi bubuk Gula,
(0.001%). (0.001%). daging
QTELA 68/68 sapi 21/24
Mengandung alergen, lihat daftar bahan mengandung alergen, lihat daftar bahan bubuk,cara
yang dicetak tebal. yang dicetak tebal. mel
INGREDIENTS: Cassava (63%), Palm ingredients: cassava (63%), palm olein

Olein Oil, Barbeque Seasoning (contains oil, barbeque seasoning (contains sugar,
Sugar, Salt, Flavour Enhancer Monosodium salt, flavour enhancer monosodium
Glutamate, Soy Sauce Powder, Spices, glutamate, soy sauce powder, spices,
Natural Coloring Carmine CI 75470 and natural coloring carmine ci 75470 and

Caramel III, Natural Sweetener Steviol caramel iii, natural sweetener steviol
Glycosides), Beef Powder (0.001)• glycosides), beef powder (0.001%).
Contains allergens, refer to highlighted contains allergens, refer to highlighted

words. words. informasi nilai gizi takaran saji
20g 9 sajian per kemasan
KOMPOSISI:Tepung Terigu, Air, Pati komposisi: tepung terigu, air, pati
Jagung, Pati Kentang (2,16%), Gula jagung, pati kentang (2,16%), gula
(Mengandung Pengawet Sulfit), Garam, (mengandung pengawet sulfit), garam,
Penstabil Kalsium Karbonat, Minyak Kelapa penstabil kalsium karbonat, minyak
Sawit, Bumbu Rasa Rumput taut kelapa sawit, bumbu rasa rumput laut
(Mengandung Udang, Penguat Rasa (mengandung udang, penguat rasa
(Mononatrium Glutamat, Dinatrium 5'- (mononatrium glutamat, taka dinatrium
Ribonukleotida), Pemanis Buatan Aspartam, 5'-ribonukleotida), pemanis buatan
Gula,
Rempah yang Diiradiasi) Maltotiekstrin, aspartam, rempah yang diiradiasi)
Sirup Glukosa (Mengandung Pengawet maltodekstrin, sirup glukosa
Sulfit), Dekstrosa Monohidrat (Mengandung (mengandung pengawet sulfit), dekstrosa
sulfite
Pengawet Su!fit), Pengatur Keasaman Asam monohidrat 1 saj (mengandung pengawet Indo:
preservativ
Sitrat. Mengandung Alergen, lihat daftar sulfit), pengatur keasaman asam sitrat. 65/65 18/19
LIFE RUMPUT es), salt,
bahan yang dicetak tebal jun mengandung alergen, lihat daftar
LAUT calcium
bahan yang dicetak tebal Eng: 13/19
carbonate
INGREDIENTS: Wheat Flour, Water, Corn 47/60
stabilizer,
Starch, Potato Starch (2.16%), Sugar ingredients: wheat flour, water, corn
palm oil,
(Contains Sulfite Preservatives), Salt, starch, potato starch (2.16%), sugar
seaweed
Calcium Carbonate Stabilizer, Palm Oil, (contains seasoning (contains shrimp,
flavour
Seaweed Flavour Seasoning (Contains flavor enhancer (mononatrium
Shrimp, Flavor Enhancer (Mononatrium glutamate, disodium lem glucose 5'-
Glutamate, Disodium 51-Ribonucleotide), ribonucleotide), artificial sweeteners
Artificial Sweeteners Aspartame, Irradiated aspartame, irradiated herbs),
Herbs), Maltodextrin, Glucose Syrup maltodextrin, lem sulfite syrup
(Containing Sulfite Preservatives), Dextrose (containing sulfite preservatives),
Monohydrate (Containing Sulfite dextrose monohydrate (containing prot
Preservatives), Acidity Regulating Acetic preservatives), acidity regulating acetic

Acid. Containing allergens, see the list of acid. karb containing allergens, see the
materials in bold list of materials in bold
ingredients: wheat flour, modified

starch(tapioca potato), palm oil, salt,
ingredients: wheat flour, modified
potato starch, red pepper seasoning*(soy
starch(tapioca,potato) palm oil, salt, potato
sauce, yeast extract, red pepper paste,
starch, red pepper seasoning (soy sauce),
soybean paste, red pepper, dextrin, salt,
yeast extract, red pepper paste, soybeay
garlica,wheat gluten, sugar, glucose,
paste, red pepper, dextrin salt garlic. wheat
monosodium glutamate, soy
gluten, sugar, glucose monosodium
sauce*(soybean, wheat), soy sauce
glutamate, soy sauce (soybean wheat) soy
seasoning*(soy sauce, onion, yeast
sauce seasoning*(soy sauce, onion, yeast
extract, glucose), yeast extract", red
extract, glucose), yeast extract, red
pepper", dried chinese cabbage, dried
OTTOGI pepper`,dried chinese cabbage, dried green
green onion, garlic*, dried carrot, kelp Potassium
RAMEN onion, garlic, dried carrot,kelp extract`(kelp, 110/112 47/51
extract*(kelp, salt, glucose), dried
salt, glucose), dried mushroom, seasoned
mushroom, seasoned yeast extract(yeast
yeast extract (yeast extract, dextrin, salt,
extract, dextrin, salt, hydrolyzed wheat
hydrolyzed, wheat gluten), acidity
gluten), acidity regulators(sodium
regulatorsi sodium carbormte. potassium
carbonate, potassium carbonate,
carbonate, pentasodium triphosphate,
pentasodium triphosphate, disodium
disodium dnphosphate), black pepper‘, dried
diphosphate), black pepper", dried red
red pepper, roasted rice, chili extract`(chilli
pepper, roasted rice', chilli extract, chilli
extract chilli extract, glucose), disodium
extract*(chilli extract, glucose),
inosinate, disodium glanylate, riboflavin,
disodium inosinate, disodium guanylate,
green tea extract powdered contains wheat
riboflavin, green teaextract *powdered
contains wheat

Komposisi: Cabai (37%), Gula komposisi: cabai (37%), gula
(mengandung pengawet sulfit), Rumput (mengandung pengawet sulfit), rumput
Laut Kering (12%), Bawang Merah Goreng laut kering (12%), bawang merah goreng
(11%), Minyak Jagung, Biji Wijen (8%), (11%), minyak jagung, biji wijen (8%),
Garam Gurih (mengandung penguat rasa garam gurih (mengandung penguat rasa
BON NORI Mononatrium Glutamat, Dinatrium Inosinat mononatrium glutamat, dinatrium
48/49 13/14
dan Dinatrium Guanilat), Bawang Putih inosinat dan dinatrium guanilat), bawang
Goreng, Minyak Wijen, Penguat Rasa putih goreng, minyak wijen, penguat
(Mononatrium Glutamat, Dinatrium Inosinat rasa (mononatrium glutamat, dinatrium
dan Dinatrium Guanilat), Perisa Sintetik inosinat dan dinatrium guanilat), perisa
Hickory Smoke, Antioksidn dl-Alfa sintetik hickory smoke, antioksidan dl-
Tokoperol alfa tokoperol.
Rata-rata OCR = 697/713=97% NER: 241/274=87%

Tabel 5.2 Tabel Uji 2
INFINIX
Produk TEKS TERTERA PERBA
Teks tak
OCR NDING Bahan Terdeteksi HASIL
Terbaca
AN
Komposisi:
Mi: Pati Kentang, Pati Kacang Hijau.
Bumbu Pasta: Kecap Bubuk komposisi: mi: pati kentang, pati kacang
(mengandung kedelal), Frukto hijau. bumbu pasta: kecap bubuk
Oligosakarida, Bumbu jamur (mengandung kedelai), frukto
Gula (mengendung pengawet sulfit), oligosakarida, bumbu jamur, gula
Bawang Bombay, Ekstrak Tulang Babi, (mengandung pengawet sulfit), bawang
Ekstrak Ragi, bombay, ekstrak tulang babi, ekstrak
Bawang Putih, Minyak Wijen, Garam, ragi, bawang putih, minyak wijen,
SOHUN
Glukosa (mengandung pengawet suifit), garam, glukosa (mengandung pengawet
CELLOPHANE Ekstrak
Maltodekstrin, sulfit), maltodekstrin, bumbu ikan tuna,
85/85 Tulang 31/31
Bumbu ikan tuna: Minyak Jagung, minyak jagung, ekstrak kelp, penguat
Babi
Ekstrak Kelp, Penguat Rasa (Dinatrium rasa (dinatrium 5'-inosinat dan dinatrium
5'-inosinat dan Dinatrium 5-guaniiat), 5'-guanilat), lada hitam, pewarna alami
Lada Hitam, Pewarna alami karamel IV, karamel iv, penstabil gom guar. minyak
Penstabil Gom Guar. bumbu: minyak wijen sayuran kering:
Minyak Bambu: Minyak Wijen jamur (mengandung pengawet sulfit),
Sayuran Kering: Jamur (Mengandung wortel, kol, hidrolisat protein nabati,
Pengawet Sulfit), Wortel, Kol, Hidrolisat jamur kuping mengandung pengawet
Protein,Nabati,Jemur Kuping natrium benzoat
Mengandung Pengawet: Natrium
Benzoat

(BOURBON Hello Kitty Mitk Soft
Cookie) (bourbon hello kitty milk soft cookie)
Komposisi: Tepung terigu, gula, lemak komposisi tepung terigu, gula, lemak
reroti nabati. (mengandung antioksidan reroti nabati (mengandung antioksidan
BHA), pasta kacang putih (6.2%) bha), pasta kacang putih (6.2%) (meng-
(mengandung pemanis alami maititol), andung pemanis alami maltitol), glukosa,
BOURBON
glukosa, sirup jagung tinggi fruktosa sirup jagung tinggi fruktosa, penstabil
Perisa
penstabil hidroksipropil dipati fosfat, hidroksipropil dipati fosfat, susu kental 52/54 15/16
sintetik
susu kental manis (1,1%), susu bubuk manis (1.1%), susu bubuk(0.95%)kuning
(0.95%), kuning telur bubuk, garam, telur bubuk, garam, pengembang
pengembang(natrium bikarbonat, (natrium bikarbonat, amonium
amonium bikarbonat), pengemulsi lesitin bikarbonat), pengemulsi lesitin kedelai,
kedelai, perisa sintetik Mengandung mengandung alergen, lihat daftar bahan
alergen, lihat daftar bahan yang dicetak yang dicetak tebal
tebal
BISKUIT ISI KRIM RASA COKELAT
biskuit isi krim rasa cokelat komposisi:
Komposisi: Cokelat Compound Susu cokelat compound susu (60.68%),
(60.68%), Tepung Terigu, Pati Jagung, tepung terigu, pati jagung, lemak reroti
Lemak Reroti Nabati (Mengandung nabati (mengandung antioksidan
Antioksidan Tokoferol), Gula, Telur, tokoferol), gula, telur, gula invert, Pengemba
Gula Invert, Penstabil Kalsium penstabil kalsium karbonat, pengembang ng,
KOALA
Karbonat, Pengembang (Ammonium (ammonium bikarbonat, natrium ammoniu
57/57 15/17
Bikarbonat, Natrium Bikarbonat), bikarbonat), garam, pewarna alami m
Garam, Pewarna Alami Karamel Kelas karamel kelas i/e.150a, perisa sintetik bikarbonat
1/E.150a, Perisa Sintetik (Cokelat, (cokelat, susu, vanilla). mengandung ,
Susu, Vanilla). Mengandung alergen, alergen, lihat daftar bahan yang dicetak
lihat daftar Dahan yang dicetak tebal tebal mengandung alergen: susu, gluten,
Mengandung Alergen: Susu, Gluten, telur dapat mengandung alergen: kacang
Telur Dapat Mengandung Alergen: pohon
Kacang pohon

Bumbu Kari Rasa Manis (HOUSE
bumbu kari rasa manis (house foods
FOODS Vermont Curry Mild) Komposisi
vermont curry mild) komposisi: minyak
; Minyak (lemak sapi, lemak babi,
(lemak sapi, lemak babi, minyak palm),
minyak palm), tepung terigu, gula,
tepung terigu, gula, garam, pati jagung.
garam, pati jagung, kari bubuk, keju,
kari bubuk, keju, pasta pisang, madu
pasta pisang, madu (4.25%), ekstrak
(4.25%), ekstrak babi, pasta wijen,
babi, pasta wijen, ekstrak ragi, kecap
ekstrak ragi, kecap bubuk, susu bubuk,
bubuk, susu bubuk, kakao bubuk,
kakao bubuk, buttermilk bubuk, pasta
VERMONT buttermilk bubeuk, pasta apel (0.70%),
apel (0.70%), bawang bubuk, tepung Lemak
CURRY bawang bubuk, tepung kedelai, rempah, 58/58 27/28
kedelai, rempah, bumbu, pewama alami sapi
bumbu, pewarna alami karamel lll,
karamel iii, pengatur keasaman asam
pengatur keasaman asam sitrat, perisa
sitrat, perisa sintetik daging sapi, ekstrak
rempah mengandung alergen, lihat daftar
Mengandung alergen, lihat daftar bahan
bahan yang dicetak tebal diimpor oleh:
yang dicetak tebal Diimpor Oleh: PT.
pt. indomaru lestari, jakarta 11720.
Indomaru Lestari, Jakarta 11720.
indonesia diproduksi oleh: house foods
Indonesia Diproduksi Oleh: House
corporation 6-3, kioi cho, chiyoda-ku,
Foods Corporation 6-3, Kioi Cho,
tokyo 102-8560 japan
Shiyoda-Ku, Tokyo 102-8560 Japan
Air,
Komposisi: maltodekst
Air, Sirup Jagung Tinggi Fruktosa, Susu komposisi: air sirup jagung tinggi in
Skim Bubuk(0.615), Sari Buah Persik fruktosa, susu skim bubuk (0.61%), sari tergabung
(0.56%). buah persik (0.56) penstabil kalsium dengan
PEACH PINK Penstabil Kalsium Laktat, Maltodekstrin, laktat, maltodekstin pengatur keasaman 31/31 komposisi 7/11
pengatur Keasaman (Asam Sitrat, (asam sitrat, trinatrium sitrat), perisa lain, Asam
Trinatrium, Sitrat, Perisa Sintetik Persik, sintetik persik, pemanis buatan sintrat,
Pemanis Buatan Sukralosa sukralosa. Penstabil
kalsium
laktat

ingredients: enriched wheat flour, corn
starch. rice bran oil, modified tapioca
ingredients. enriched wheat flour, corn
starch, palm oil, onion juice concentrate,
starch rice,bran oil, modified tapioca starch,
sugar, cellulose powder, salt, dextrin,
palm oil, onion juice concentrate, sugar,
onion extract powder, potato granules,
cellulose powder, salt, dextain, onion extract
artificial flavor, riboflavin (color). Ribovlavin
RING KOREA powder, potato granules, artificial flavor,
31/31 , onion 12/14
riboflavin (color).
contains wheat. manufactured in a extract
facility that also processes milk, soy, powder
contains wheat. manufactured in a facility
peanut, fish, crustacean shellfish, and
that also processes milk, soy, peanut ish,
egg. manufactured by nongshim co.,ltd.
crustacean shellfish, and egg.
112, yeouidaebang-ro, dongjak-gu,
seoul, korea
salt
tergabung
KOPIKO ingredients: Sugar, Glucose, Vegetable Oil, ingredients: sugar, glucose, vegetable
dengan
Coffee | Extract (4.90%). Butter, Emulsifier oil, coffee extract (4.90% butter,
21/21 syntetic 6/10
(Soy Lecithin), Natural Food emulsifier (soy lecithin). natural food
flavour,
Color Caramel IV, Salt, Synthetic Flavor. color caramel iv, salt synthetic flavor.
butter,
emulfisier

komposisi: jagung (61.45%), minyak
komposisi: jagung (61.45%), minyak nabati
nabati (mengandung antioksidan tbhq),
(mengandung antioksidan tbhq), bumbu rasa
bumbu rasa bbq ({7.52%}, mengandung
bbq ({7.52%}, mengandung ekstrak daging
ekstrak daging sapi {0.4%}, penguat rasa Salah baca
sapi {0.4%}, penguat rasa mononatrium
TORTILLA mononatrium glutamat, dinatrium 5'- sebanyak 4
glutamat, dinatrium 5'-ribonukleotida), gula,
ribonukleotida), gula, cabe bubuk, keju 44/44 bahan 11/11
cabe bubuk, keju bubuk (mengandung
bubuk (mengandung antioksidan Seharusny
antioksidan tokoferol campuran pekat),
tokoferol campuran pekat), bubuk a tidak ada
bubuk bawang putih, dan perisa sintetik
bawang putih, dan perisa sintetik jagung
jagung (mengandung antioksidan dl-alfa
(mengandung antioksidan dl-alfa
tokoferol).
tokoferol).
Komposisi: Singkong (63%), Minyak komposisi: singkong (63%), minyak

Olein Kelapa Sawit, Bumbu Rasa olein kelapa sawit, bumbu rasa barbeque
Barbeque (mengandung Gula, Garam, (mengandung gula, garam, penguat rasa
Penguat Rasa Mononatrium Glutamat, mononatrium glutamat, kecap bubuk,
Kecap Bubuk, Rempah-rempah, rempah-rempah, pewarna alami karmin
Pewarna Alami Karmin CI 75470 dan ci 75470 dan karamel iii, pemanis alami
Karamel III, Pemanis Alami Glikosida glikosida steviol), daging sapi bubuk
Steviol), Daging Sapi Bubuk (0.001%). (0.001%). mengandung alergen, lihat
Mengandung alergen, lihat daftar bahan daftar bahan yang dicetak tebal.
Gula,dagin
yang dicetak tebal.
QTELA 84/84 g sapi 18/24
ingredients: cassava (63%), palm olein
bubuk
INGREDIENTS: Cassava (63%), Palm oil, barbeque contains sugar, salt, flavour
Olein Oil, Barbeque Seasoning enhancer glutamate, soy sauce powder,
(contains Sugar, Salt, Flavour Enhancer spices, natura coloring carmine ci 75470
Monosodium Glutamate, Soy Sauce and caramel iii, natura sweetener steviol
Powder, Spices, Natural Coloring glycosides). beef powder (0.001%)
Carmine CI 75470 and Caramel III, contains allergens. reler to highlighted
Natural Sweetener Steviol Glycosides), words. informasi nilai gizi takaran saji
Beef Powder (0.001%). Contains 209 9 sajian per kemasam juml ah per
allergens, refer to highlighted words. sajian energi total energi dari

KOMPOSISI:Tepung Terigu, Air, Pati
Jagung, Pati Kentang (2,16%), Gula pengawet sulfit), garam, penstabil
(Mengandung Pengawet Sulfit), Garam, kalsium karbonat, minyak kelapa sawit,
Penstabil Kalsium Karbonat, Minyak Kelapa bumbu komposisi: tepung teargu, air,
Sawit, Bumbu Rasa Rumput taut pati jagung, pati kentang (2,16%), gula
(Mengandung Udang, Penguat Rasa (mengandung rasa rumput laut lengandur
(Mononatrium Glutamat, Dinatrium 5'- a udang, penguat rasa (mononatrium
Ribonukleotida), Pemanis Buatan Aspartam, glutamat, dinatrium pemani: buatan
Rempah yang Diiradiasi) Maltotiekstrin, aspartam, rempah yang diiradiasi)
Sirup Glukosa (Mengandung Pengawet maltodekstrin, sirup glukosa Minyak
Sulfit), Dekstrosa Monohidrat (Mengandung (mengandung pengawet sulfit), dekstrosa kelapa,
Pengawet Su!fit), Pengatur Keasaman Asam monohidrat (mengandung pengawet garam,
Sitrat. Mengandung Alergen, lihat daftar suite). pengatur keasaman asam sitrat. kalsium
LIFE RUMPUT bahan yang dicetak tebal mengandung alergen, lihat daftar banaii karbonat, 12/19
LAUT yang dicetak tebal ingredients: wheat 114/119 bumbu,
INGREDIENTS: Wheat Flour, Water, Corn flour, water, com starch, potato starch pengawet 19/19
Starch, Potato Starch (2.16%), Sugar (2.16%), sugar (contains sulfite sulfit,
(Contains Sulfite Preservatives), Salt, preservatives), salt, calcium carb tate pengatur
Calcium Carbonate Stabilizer, Palm Oil, stabilizer, palm oil, seaweed flavour keasaman
Seaweed Flavour Seasoning (Contains seasoning (contains shrimp, flavor asam sitrat
Shrimp, Flavor Enhancer (Mononatrium ennancer (mononatrium glutamate,
Glutamate, Disodium 51-Ribonucleotide), disodium 5'-ribonucleotide), artificial
Artificial Sweeteners Aspartame, Irradiated sweeteners aspartame, irradiated herbs),
Herbs), Maltodextrin, Glucose Syrup maltodextrin, glucose syrun c altaining
(Containing Sulfite Preservatives), Dextrose sulfite preservatives), dextrose
Monohydrate (Containing Sulfite monohydrate (containing sulfit: vatives),
Preservatives), Acidity Regulating Acetic acidity regulating acetic acid. containing
Acid. Containing allergens, see the list of allergens, see the list of materials in bold
materials in bold

ingredients: seasoning*(soy sauce, yeast
ingredients: wheat flour, modified extract, red pepper paste, soybean paste,
starch(tapioca potato), palm oil, salt, potato
red pepper dexr wheat flour, modified
starch, red pepper seasoning*(soy sauce, starch(tapioca,potato), palm oil, salt,
yeast extract, red pepper paste, soybean potato starch, red wheat), soy sauce
paste, red pepper, dextrin, salt, garlica,wheat
seasoning" (soy sauce, onion, yeast
gluten, sugar, glucose, monosodium extract, glucose), yeast extract salt,
glutamate, soy sauce*(soybean, wheat), soygarlic),wheat gluten, sugar, glucose,
sauce seasoning*(soy sauce, onion, yeast monosodium glutamate, soy sauce
extract, glucose), yeast extract", red pepper",
soyben red pepper", dried chinese
OTTOGI dried chinese cabbage, dried green onion, cabbage, dried green onion, garlic",
RAMEN garlic*, dried carrot, kelp extract*(kelp, salt,
dried carrot, kel extract*(kelp, salt, 80/104 40/51
glucose), dried mushroom, seasoned yeast glucose), dried mushroom, seasoned
extract(yeast extract, dextrin, salt, yeast extract(yeast extract dextrin, salt,
hydrolyzed wheat gluten), acidity hydrolyzed wheat gluten), acidity
regulators(sodium carbonate, potassium regulators(sodium carbonate, potassun
carbonate, pentasodium triphosphate, carbonate, pentasodium triphosphate,
disodium diphosphate), black pepper", dried
disodium diphosphate), black pepper",
red pepper, roasted rice', chilli extract, chilli
dred 6 pepper, roasted rice', chilli
extract*(chilli extract, glucose), disodium
extract, chilli extract*(chilli extract,
inosinate, disodium guanylate, riboflavin,glucose) discoun inosinate, disodium
green teaextract *powdered contains wheat,guanylate, riboflavin, green teaextract
'powdered contains wheat,
Komposisi: Cabai (37%), Gula komposisi: cabai (37%), gula
(mengandung pengawet sulfit), Rumput (mengandung pengawet sulfit), rumput
Laut Kering (12%), Bawang Merah Goreng laut kering (12%), bawang merah goreng
(11%), Minyak Jagung, Biji Wijen (8%), (11%), minyak jagung, biji wijen (8%),
BON NORI
Garam Gurih (mengandung penguat rasa garam gurih (mengandung penguat rasa
53/53 14/14
Mononatrium Glutamat, Dinatrium Inosinat mononatrium glutamat, dinatrium
dan Dinatrium Guanilat), Bawang Putih inosinat dan dinatrium guanilat), bawang
Goreng, Minyak Wijen, Penguat Rasa putih goreng, minyak wijen, penguat
(Mononatrium Glutamat, Dinatrium Inosinat rasa (mononatrium glutamat, dinatrium
dan Dinatrium Guanilat), Perisa Sintetik inosinat aan dinatrium guanilat), perisa

Hickory Smoke, Antioksidn dl-Alfa sintetik hickory smoke, antioksidan dl-
Tokoperol alfa tokoperol
Rata-rata OCR = 596/713 =83% NER = 227/274=81%
Dari hasil hitung manual yang ditunjukan oleh tabel 5.2 dan 5.3 dengan menguji 12 produk makanan kemasan dan menggunakan
2 jenis gawai yang berbeda didapatkan rincian berikut (lihat tabel 5.4).
Tabel 5.3 Tabel Hasil Uji
Gawai Hasil OCR (per kata) Hasil pembacaan model (per bahan)
IPHONE X 97% 87%
83%
INFINIX SMART 6 81%
Rata 90% 84%

5.3.1 Pengujian Produk Non-Halal
Penulis melakukan uji sistem terhadap tiga produk non halal, dari ketiga produk tersebut dua diantaranya berhasil diketahui
bahan-bahan apa yang haram dikonsumsi, dan satu produk lainya meski berlabel non-halal yang artinya dalam proses pembuatanya
bersinggungan dengan bahan non-halal namun disini sistem tidak menemui bahan haram, hanya ditemukan satu bahan syubhat
Tabel 5.4 Tabel Uji non-halal

Bahan Non
Produk Bahan Terdeteksi Hasil
Halal
Vermont Curry
Lemak Babi,
Berhasil
Ekstrak Babi

Ottogi
Potassium
Berhasil
SOHUN CELLPHANE
Ekstrak Tulang
Babi

87
BAB VI
Kesimpulan Dan Saran
Kesimpulan
Berdasarkan hasil pembahasan penelitian yang telah penulis lakukan,

diperoleh kesimpulan bahwa Penelitian ini berhasil menggunakan OCR dan NER
untuk membaca dan mendeteksi kehalalan bahan makanan pada produk kemasan,
dengan membangun model NER dan mengimplementasikan model yang dibangun
dengan Service OCR dari AWS Textract, Berdasarkan Pengujian dengan nilai
Confusion matrix dan hitung manual didapatkan rincian sebagai berikut:
1. Model Named Entity Recognition yang dibangun pada penelitian mampu

untuk membaca entitas Halal, Haram, dan Syubhat dengan rata-rata skor F
0.967 yang menandakan akurasi pembacaan model sudah sangat baik.
2. Hasil kinerja OCR dari AWS Textract juga mampu membaca komposisi
pada produk kemasan dengan sangat baik, dengan skor akurasi 90%.
3. Dalam uji kasusnya kemampuan OCR dan NER juga mampu untuk
menganalisa dan membaca entitas makanan yang tertera pada kemasan
produk. Dengan skor akurasi 84% yang berarti cukup baik
Meski masih ditemukan kesalahan penamaan entitas aplikasi sudah mampu

membaca Sebagian besar entitas yang diharapkan dan yang terpenting aplikasi
mampu membaca entitas Haram dan Syubhat yang merupakan tujuan utama
penelitian ini.
Saran
Penulis berharap agar penelitian ini dapat dikembangkan lebih lanjut sehingga
mendapatkan hasil yang lebih baik. Berdasarkan penelitian yang telah dilakukan,
penulis dapat memberikan beberapa saran sebagai berikut:
• Pada penelitian ini penulis menggunakan AWS Textract yang merupakan

platform berbayar jika digunakan dalam skala besar, maka dari itu perlu
dikembangkan model OCR sendiri untuk membaca tulisan pada kemasan

produk, agar pada nantinya aplikasi ini bisa digunakan secara umum dan
bermanfaat bagi masyarakat.
• Dataset haram dan Syubhat dapat dilengkapi dan diperbanyak.
• Dalam penelitian ini belum diterapkan metode atau teknologi untuk

menampilkan informasi dari setiap entitas yang terdeteksi
• Untuk penelitian sejenis dapat diperluas dibidang lainya seperti untuk

klasifikasi makanan khusus vegetarian ataupun untuk klasifikasi bahan
makanan beralergi

DAFTAR ISI
Afrianty, N. (2020). Pengaruh Islamic Branding dan Product Ingredients

Terhadap Minat Beli Produk PT.HNI HPAI Kota Bengkulu. Journal of
Islamic Economics and Finance Studies, 1(2), 121.
https://doi.org/10.47700/jiefes.v1i2.2057
Aini Rakhmawati, N., Fatawi, J., Choirun Najib, A., & Adi Firmansyah, A.
(2019). Linked open data for halal food products.
https://doi.org/10.1016/j.jksuci.2019.04.004
Akram, T., Rizvi, H. H., Ali, S. A., Hamza, S. M., & Ifthikhar, A. (2020). OCR
and Barcode based Halal and Health Analyzer. ICISCT 2020 - 2nd
International Conference on Information Science and Communication
Technology. https://doi.org/10.1109/ICISCT49550.2020.9080036
Amazon Web Services Inc. (2020). Amazon Textract.
https://aws.amazon.com/es/textract/
Askomi, A. H., Yusop, F. D., & Kamarulzaman, Y. (2016). Combating Halal
misconceptions among Muslims and Non-Muslims : The potential use of
mobile learning application. International Halal Conference (INHAC),
November, 1–10.
Atika, D. (2021). EKSTRAKSI INFORMASI BERITA ONLINE DENGAN NAMED
ENTITY RECOGNITION (NER) DAN RULE-BASED UNTUK VISUALISASI
PENYAKIT TROPIS DI INDONESIA.
Chaudhuri, A., Mandaviya, K., Badelia, P., & K Ghosh, S. (2017). Optical
Character Recognition Systems for Different Languages with Soft Computing
(Vol. 352, Nomor December). https://doi.org/10.1007/978-3-319-50252-6
Dirgantara, M. Y. S., Fauzi, M. A., & Perdana, R. S. (2018). Penerapan Named
Entity Recognition Untuk Mengenali Fitur Produk Pada E-Commerce
Menggunakan Rule Template Dan Hidden Markov Model. Jurnal
Pengembangan Teknologi Informasi dan Ilmu Komputer, 2(10), 3912–3920.
Drovo, M. D., Chowdhury, M., Uday, S. I., & Das, A. K. (2019). Named Entity
Recognition in Bengali Text Using Merged Hidden Markov Model and Rule
Base Approach. In 2019 7th International Conference on Smart Computing
and Communications, ICSCC 2019.
https://doi.org/10.1109/ICSCC.2019.8843661
Faridah, H. D. (2019). Halal certification in Indonesia; history, development, and
implementation. Journal of Halal Product and Research, 2(2), 68.
https://doi.org/10.20473/jhpr.vol.2-issue.2.68-78
Furht, B., Akar, E., & Andrews, W. A. (2018). Digital Image Processing:
Practical Approach. https://doi.org/10.1007/978-3-319-96634-2

Islamabad, comsats university. (n.d.). Halal Advisory Service.
Jauharotus Syukriya, A., & Faridah, H. D. (n.d.). KAJIAN ILMIAH DAN
TEKNOLOGI SEBAB LARANGAN SUATU MAKANAN DALAM
SYARIAT ISLAM SCIENCE AND TECHNOLOGY STUDIES OF THE
CAUSES OF PROHIBITED FOODS IN ISLAMIC LAW. Journal of Halal
Product and Research.
Kartiwi, M., Gunawan, T. S., Anwar, A., & Fathurohmah, S. S. (2019). Mobile
Application for Halal Food Ingredients Identification using Optical Character
Recognition. 2018 IEEE 5th International Conference on Smart
Instrumentation, Measurement and Application, ICSIMA 2018, November,
1–4. https://doi.org/10.1109/ICSIMA.2018.8688756
Kusnandar, V. B. (2021). RISSC: Populasi Muslim Indonesia Terbesar di Dunia.
Mariyah, S. (2017). Named Entity Recognition on a Collection of. 61–72.
Mollah, A. F., Majumder, N., Basu, S., & Nasipuri, M. (2011). Design of an
Optical Character Recognition System for Camera- based Handheld Devices
Ayatullah. IJCSI International Journal of Computer Science Issues, Vol. 8,
Issue 4, No 1, July 2011, 8(4).
MUI. (2003). Standardisasi fatwa halal. Himpunan Fatwa MUI, 1–4.
Popovski, G., Kochev, S., Seljak, B. K., & Eftimov, T. (2019). Foodie: A rule-
based named-entity recognition method for food information extraction.
ICPRAM 2019 - Proceedings of the 8th International Conference on Pattern
Recognition Applications and Methods, Icpram, 915–922.
https://doi.org/10.5220/0007686309150922
Pramiyati, T., Supriana, I., & Purwarianti, A. (2015). Pengenalan Entitas User
Profile Pada Twitter. Jurnal INKOM, 8(2), 103.
https://doi.org/10.14203/j.inkom.411
Relan, K. (2019). Building REST APIs with Flask. In Building REST APIs with
Flask. Apress. https://doi.org/10.1007/978-1-4842-5022-8
Rosidy, A. S., Akhriza, T. M., & Husni, M. (2020). Combining the NER-OCR
methods to improve information retrieval efficiency in the Indonesian
posters. Jurnal Teknologi dan Sistem Komputer, 8(4), 263–269.
https://doi.org/10.14710/jtsiskom.2020.13686
Sam, B. (2018). What is halal? September 11, 2018.
https://www.halalguide.info/what-is-halal/
Setia, R. (2015). Rancangan Bangun Multimedia Pembelajaran Dengan Berbantu
Metode Explicit Instruction. Universitas Pendidikan Indonesia, 53(9), 1689–
1699.
Sinha, R., Khatkar, M., & Gupta, S. C. (2014). Design & Development of a REST
based Web Service Platform for Applications Integration on Cloud. IJISET -

International Journal of Innovative Science, Engineering & Technology,
1(7), 385–389.
Sinta Wahyuni, N. M., & Sanjaya ER, N. A. (2021). Rule-based Named Entity
Recognition (NER) to Determine Time Expression for Balinese Text
Document. JELIKU (Jurnal Elektronik Ilmu Komputer Udayana), 9(4), 555.
https://doi.org/10.24843/jlk.2021.v09.i04.p14
Spacy. (2022). Spacy 101. https://spacy.io/usage/spacy-101
Srinivasa-desikan, B. (2018). Arabic Language and Computational Linguistics. In
International Journal on Studies in English Language and Literature (Vol. 6,
Nomor 11). https://doi.org/10.20431/2347-3134.0611002
Suardi, C., Anggeani, D., Wibawa, A. P., Murtadlo, N., Zaeni, I. A. E., & Jabari,
N. A. M. (2021). Asking a chatbot for food ingredients halal status. Halal
Development: Trends, Opportunities and Challenges, 14–20.
https://doi.org/10.1201/9781003189282-3
Tillotson, J. E. (n.d.). Learn more about Convenience Food Convenience Food.
https://www.sciencedirect.com/topics/immunology-and-
microbiology/convenience-food
Wahab, S. N., Aqil, M., Rosli, H., & Aziz, N. A. (2020). Development of Mobile
Application to Recognition Muslim Products. 1(2), 54–61.
Wangsanegara, N. K., & Subaeki, B. (2015). Implementasi Natural Language
Processing Dalam Pengukuran Ketepatan Ejaan Yang Disempurnakan (Eyd)
Pada Abstrak Skripsi Menggunakan Algoritma Fuzzy Logic. Jurnal Teknik
Informatika, 8(2). https://doi.org/10.15408/jti.v8i2.3185
Widya, H., & Salsabila, R. (2019). Aplikasi Barcode Scanner Food Halal Pada
Produk Makanan Impor Berbasis Android. 1099, 14–17.
Wulandari, D. W., Adikara, P. P., & Adinugroho, S. (2018). Named Entity
Recognition (NER) Pada Dokumen Biologi Menggunakan Rule Based dan
Naïve Bayes Classifier. Jurnal Pengembangan Teknologi Informasi dan Ilmu
Komputer, 2(11), 4555–4563.
Yanti, R. M., Santoso, I., & Suadaa, L. H. (2021). Application of Named Entity
Recognition via Twitter on SpaCy in Indonesian ( Case Study : Power
Failure in the Special Region of Yogyakarta ). 4(1), 76–86.
Yuniarti, A., Kuswardayan, I., Hariadi, R. R., Arifiani, S., & Mursidah, E. (2018).
Design of integrated latext: Halal detection text using OCR (Optical
character recognition) and web service. Proceedings - 2017 International
Seminar on Application for Technology of Information and Communication:
Empowering Technology for a Better Human Life, iSemantic 2017, 2018-
Janua, 137–141. https://doi.org/10.1109/ISEMANTIC.2017.8251858
Zamakhsyari. (2018). Halal, Haram Dan Syubhat Dalam Syari’At Islam.

Repository.Dharmawangsa.Ac.Id, 1–15.

DAFTAR LAMPIRAN
Lampiran 1 Gambar Produk Uji Dengan Kamera Iphone X
Nama Bourbon Koala Chocolate Olatte Peach Pink
Gambar

Nama O-Ring Onion Tortilla Q-Tela
Gambar
Nama Life Rumput Laut Bon Nori Kopiko

Gambar

Lampiran 2 Gambar Produk Uji Dengan Kamera Iphone X (Non Halal)
Nama Vermont Curry Ottogi Ramen Sohun Cellophane
Gambar

Lampiran 3 Gambar Produk Uji Dengan Kamera Infinix Smart 6
Nama Bourbon Koala Chocolate Olatte Peach Pink
Gambar

Nama O-Ring Onion Tortilla Q-Tela
Gambar
Nama Life Rumput Laut Bon Nori Kopiko

Gambar

Lampiran 4 Gambar Produk Uji Dengan Kamera Infinix Smart 6 (non halal)
Nama Vermont Curry Ottogi Ramen Sohun Cellophane
Gambar

Lampiran 5 User Acceptance Test
DOKUMEN USER ACCEPTANCE TEST Penguji: Ahmad Ruslan
Deskripsi dan Hasil Uji Modul Akses

Hasil Uji
Keluaran Diterima
Deskripsi Prosedur Data yang Hasil yang dengan
ID Pengujian Pengujian Masukan Diharapkan Didapat Diterima Syarat Ditolak
A.1 Pengujian Aplikasi
Gambar Sistem Sistem berhasil
Komposisi Menampilkan menampilkan
-Klik Tombol
Pengujian yang tertera daftar bahan daftar bahan
Upload -
Sistem pada bagian makanan yang makanan yang v
Masukan
Pendeteksi belakang tertera pada tertera pada
Gambar
produk komposisi komposisi
Kemasan produk produk
-User
Pengujian mengetik
Berhasil
Menu keyword Menampilkan
Kata bahan menampilkan
daftar bahan yang bahan yang v
makanan bahan yang
Bahan dicari pada dicari
dicari
Non-halal kolom
"search"
-User
memasukan Berhasil
Data nama Menampilkan
Informasi menampilkan
bahan, status menu login
Pengujian pada form menu login dan
bahan dan dan tidak
Pemberian "nama", berhasil keluar v
keterangan memiliki
Saran "status" dan (tidak memiliki
inforamasi otentikasi dan
"deskripsi - otentikasi dan
didalamnya otorisasi
Klik tombol otorisasi)
input
Basit Tri
DOKUMEN USER ACCEPTANCE TEST Penguji:
Anggoro

Hasil Uji
Keluaran Diterima
Pengujian Gambar Sistem Sistem berhasil
-Klik Tombol
Sistem Komposisi Menampilkan menampilkan v
Upload -
Pendeteksi yang tertera daftar bahan daftar bahan

Masukan pada bagian makanan yang makanan yang
Gambar belakang tertera pada tertera pada
-User
Pengujian mengetik
Berhasil
makanan bahan yang
dicari
Non-halal kolom
"search"
-User
memasukan Berhasil
Data nama Menampilkan
Informasi menampilkan
bahan, status menu login
Pengujian pada form menu login dan
bahan dan dan tidak
Pemberian "nama", berhasil keluar v
keterangan memiliki
Saran "status" dan (tidak memiliki
inforamasi otentikasi dan
didalamnya otorisasi
input
DOKUMEN USER ACCEPTANCE TEST Penguji: Rahmat Aziman

Hasil Uji
Keluaran Diterima
Gambar Sistem Sistem berhasil
Komposisi Menampilkan menampilkan
-Klik Tombol
Pengujian yang tertera daftar bahan daftar bahan
Upload -
Sistem pada bagian makanan yang makanan yang v
Masukan
Pendeteksi belakang tertera pada tertera pada
Gambar
-User
Pengujian mengetik
Berhasil
makanan bahan yang
dicari
Non-halal kolom
"search"
-User Data nama Menampilkan
Berhasil
memasukan bahan, status menu login
Pengujian menampilkan
Informasi bahan dan dan tidak
Pemberian menu login dan v
pada form keterangan memiliki
Saran berhasil keluar
"nama", inforamasi otentikasi dan
(tidak memiliki
"status" dan didalamnya otorisasi

input

Dwi Adi Bangkit-Fst

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Dwi Adi Bangkit-Fst

Diunggah oleh

Hak Cipta:

Format Tersedia

i

Implementasi Named-Entity Recognition

PROGRAM STUDI TEKNIK INFORMATIKA

UIN Syarif Hidayatullah Jakarta

Dengan ini saya menyatakan bahwa:

Jakarta, Agustus 2022

Dwi Adi Bangkit

iv UIN Syarif Hidayatullah Jakarta

Sebagai civitas akademik UIN Syarif Hidayatullah Jakarta, saya yang

Nama : Dwi Adi Bangkit

Program Studi : Teknik Informatika

Fakultas : Sains dan Teknologi

Jenis Karya : Skripsi

Dengan pengembangan ilmu pengetahuan, menyetujui untuk memberikan

Implementasi Named-Entity Recognition

Jakarta, Agustus 2022

Dwi Adi Bangkit

v UIN Syarif Hidayatullah Jakarta

4. Seluruh Dosen dan Staf Karyawan Fakultas Sains dan Teknologi,

6. Isti Sukwaningsih yang selalu memberi motivasi dan semangat untuk

vi UIN Syarif Hidayatullah Jakarta

8. Keluarga soactive dan paboya yang selalu menjadi teman-teman yang

9. Teman-teman Teknik Informatika Angkatan 2016.

10. Teman-teman KKN 146 2019 UIN Jakarta.

11. Teman-teman Dapur Seni FST UIN Jakarta.

Jakarta, Agustus 2022

Dwi Adi Bangkit

vii UIN Syarif Hidayatullah Jakarta

Kebutuhan seorang muslim terhadap produk halal seharusnya didukung oleh

Kata Kunci : Named Entity Recognition, Optical Character

viii UIN Syarif Hidayatullah Jakarta

A Muslim's need for halal products should be supported by halal guarantees.

Keywords : Named Entity Recognition, Optical Character

ix UIN Syarif Hidayatullah Jakarta

LEMBAR PERSETUJUAN ................................................................................. ii

x UIN Syarif Hidayatullah Jakarta

xi UIN Syarif Hidayatullah Jakarta

xii UIN Syarif Hidayatullah Jakarta

Gambar 1.0.1 Data BPOM 2022 ............................................................................. 1

xiii UIN Syarif Hidayatullah Jakarta

xiv UIN Syarif Hidayatullah Jakarta

Tabel 2.1 Contoh Tipe Entitas NER ..................................................................... 13

xv UIN Syarif Hidayatullah Jakarta

Lampiran 1 Gambar Produk Uji Dengan Kamera Iphone X................................. 93

xvi UIN Syarif Hidayatullah Jakarta

Data BPOM 2022

Gambar 1.1.1 Data BPOM 2022

UIN Syarif Hidayatullah Jakarta

Kebutuhan seorang muslim terhadap produk halal seharusnya didukung oleh

Guna membantu umat muslim menjaga kehalalan produk yang mereka

2 UIN Syarif Hidayatullah Jakarta

3 UIN Syarif Hidayatullah Jakarta

Berdasarkan hasil analisis, studi pustaka/literatur, maka pada penelitian ini

Berdasarkan latar belakang permasalahan yang telah diuraikan di atas, maka

“Bagaimana mengkombinasikan OCR dan Named Entity Recognition guna

4 UIN Syarif Hidayatullah Jakarta

Berikut ini adalah proses yang terdapat pada penelitian,yaitu:

1. Dataset bahan makanan diambil dari “USDA’s FoodData” dan

Berikut ini merupakan metode yang digunakan penulis dalam penelitian:

1. Metode pengumpulan data yang digunakan dalam penelitian ini

5 UIN Syarif Hidayatullah Jakarta

Berikut ini adalah tools yang digunakan pada penelitian,yaitu:

Tujuan penelitian ini adalah sebagai berikut