AlvinoAldotama 41518120034 NLP MERUYA

KERTAS KERJA UJIAN
Semester : Gasal / Genap / Pendek*) Tahun Akademik : . . .

Nomor Induk Mahasiswa 41518120034 Nomor Ujian : 7 Paraf Mahasiswa

Nama Alvino Aldotama
Fakultas / Program
Teknik Informatika Paraf Pengawas
Studi
Mata Kuliah NLP
Nilai Ujian (00-
Dosen Afiyati, S.Si, MT
100)
Waktu Hari Tanggal Jam Ruang
Pelaksanaan Ujian Sabtu 02 Juli 2022 12.00-14.29 D-303
1. Preprocessing adalah teknik awal data mining untuk mengubah raw data (data mentah)
menjadi format dan informasi yang lebih efisien dan bermanfaat. Format pada raw data
yang diambil dari berbagai macam sumber seringkali mengalami error, missing value, dan
tidak konsisten. Sehingga, perlu dilakukan pembenahan format agar hasil data mining tepat
dan akurat.
 Stopword adalah prosespembuangan term yang tidak memiliki arti atau tidak
relevan. Term yangdiperoleh dari tahap tokenisasi dicek dalam suatu daftar
stopword, apabila sebuahkata masuk di dalam daftar stopword maka kata tersebut
tidak akan diproses lebihlanjut.
 Stemming merupakan sebuah proses yang bertujuan untuk mereduksi jumlah variasi
dalam representasi dari sebuah kata.
2. Jelaskan konsep algoritma-algoritma berikut ini :

a. Neural Network adalah sebuah cabang dari kecerdasan buatan (artificial intelligence)
yang cara kerjanya meniru cara kerja syaraf-syaraf otak manusia. Dengan cara ini, Neural
Network memberikan program komputer sebuah kemampuan untuk bisa mengenali
pola dan menyelesaikan berbagai masalah. konsep neural network, yaitu menerima
input, memproses input tersebut, kemudian menghasilkan output. Konsep ini membuat
mesin dapat memproses sesuatu kemudian melakukan suatu hal dari input-input yang
telah diproses.
b. recurrent neural network (RNN) adalah jenis arsitektur jaringan saraf tiruan yang
pemrosesannya dipanggil berulang-ulang untuk memroses masukan yang biasanya
adalah data sekuensial. RNN masuk dalam kategori deep learning karena data diproses
melalui banyak lapis (layer). Konsep RNN adallah Recurrent neural network dapat
mengingat input dan selanjutnya memberikan output sesuai dengan yang diinginkan.
Memori internal menjadi poin penting dalam Recurrent neural networkkarena dapat
memprediksi hal berikutnya. Sehingga, Recurrent neural network sangat cocok untuk
diaplikasikan pada deret waktu, mesin pencarian, teks, audio, video, bahkan mesin
keuangan.
c. Long Short Term Memory (LSTM) merupakan salah satu jenis dari Recurrent Neural
Network (RNN) dimana dilakukan modifikasi pada RNN dengan menambahkan memory
cell yang dapat menyimpan informasi untuk jangka waktu yang lama (Manaswi, 2018).
LSTM diusulkan sebagai solusi untuk mengatasi terjadinya vanishing gradient pada RNN
saat memproses data sequential yang panjang. Konsep LSTM adallah LSTM mampu
mengingat kumpulan informasi yang telah disimpan dalam jangka waktu panjang,
sekaligus menghapus informasi yang tidak lagi relevan. LSTM lebih efisien dalam
memproses, memprediksi, sekaligus mengklasifikasikan data berdasarkan urutan waktu
tertentu.
3. Terdapat beberapa kriteria untuk mengevaluasi hasil text classification

a. Akurasi adalah performance measure paling sederhana dan sering digunakan saat
mengevaluasi kinerja model. Akurasi didefinisikan sebagai proporsi prediksi yang benar
dibagi dengan banyaknya sampel
b. Presisi Merupakan rasio prediksi benar positif dibandingkan dengan keseluruhan hasil
yang diprediksi positf.
c. Recall merupakan rasio prediksi benar positif dibandingkan dengan keseluruhan data
yang benar positif.
d. F1 Score merupakan perbandingan rata-rata presisi dan recall yang dibobotkan
F1 Score = 2 * (Recall*Precission) / (Recall + Precission).
4. Named-Entity Recognition (NER) merupakan bagian dari riset Natural Language Processing
(NLP) yang digunakan untuk mengekstrak informasi seperti nama orang, organisasi, lokasi,
dan waktu. NER bertujuan untuk menemukan dan menentukan jenis named entity pada
teks. NER dapat digunakan untuk mengetahui relasi antar named entity dan question
answering system. Tugas utama NER adalah untuk mencari named entiy dan menentukan
tipe named entity. Cara dasar untuk mengenali named entity adalah dengan mencari jenis
dari setiap kata pada teks menggunakan kamus. Namun penggunaan kamus dalam
menentukan named entity memiliki beberapa permasalahan, salah satunya yaitu
ambiguitas.
Contoh :
“Suparto, supir saya bertanya mengapa saya lebih senang diundang acara di desa daripada
undangan acara elit saya karena warga desa sering terabaikan mereka butuh disapa juga
karena saya butuh memahami kondisi warga di lapisan terbawah indonesia tapi yang tidak
kalah penting”.
Suparto = person
Supir saya = person
Desa = place
Warga desa = person
Lapisan terbawah Indonesia = place.

AlvinoAldotama 41518120034 NLP MERUYA

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

AlvinoAldotama 41518120034 NLP MERUYA

Diunggah oleh

Hak Cipta:

Format Tersedia

KERTAS KERJA UJIAN

Semester : Gasal / Genap / Pendek*) Tahun Akademik : . . .

Nomor Induk Mahasiswa 41518120034 Nomor Ujian : 7 Paraf Mahasiswa

2. Jelaskan konsep algoritma-algoritma berikut ini :

3. Terdapat beberapa kriteria untuk mengevaluasi hasil text classification

Anda mungkin juga menyukai