NATURAL LANGUAGE
PROCESSING
PRE-PROCESSING
Fakultas
AFIYATI SSi., MT.
FAKULTAS ILMU
KOMPUTER
Program Studi
INFORMATIKA
MATERI
1. Pengenalan NLP
2. Pre-processing
3. Word Embedding
4. Klasifikasi teks dengan perceptron
5. Pemodelan bahasa (dasar dan lanjut)
6. Part-of-speech tagging (HMM)
7. Context Free Grammar dan Parsing
8. Neural Network (NN) / Recurrent Neural Network (RNN)
9. Named Entity Recognition (NER)
10.Text Summarization
11.Long Short-Term Memory (LSTM)
12.Presentasi Final Project
PENGENALAN NLP
• Kualitas data
• Membersihkan data
• Dasar-dasar pemrosesan data teks
• Implementasi pemrosesan data teks
KUALITAS DATA (1)
Sebuah data dikatakan berkualitas jika,
• Akurat : menggambarkan Proses Dan hasil akhir Pelayanan
yang diukur secara benar
• Lengkap : mencangkup seluruh kekhususan pasien Dan sistem
yang dibutuhkan dalam analisis hasil ukuran
• Terpercaya : dapat digunakan dalam Berbagai kepentingan
• Valid (sah) : sesuai dengan gambaran proses atau produk hasil
akhir yang diukur
• Tepat waktu , dikaitkan dengan episode Pelayanan yang
terjadi.
• Dapat digunakan untuk kajian , Analisis dan pengambilan
keputusan.
KUALITAS DATA (2)
• Seragam : batasan Sebutan tentang elemen data yang
dibakukan Dan konsisten penggunaannya di dalam Maupun di
luar organisasi.
• Dapat dibandingkan dengan standar yang ditetapkan.
• Terjamin kerahasiaannya.
• Mudah diperoleh melalui sistem komunikasi antar yang
berwewenang
CONTOH DATA
• Pre-processing
PEMROSESAN DATA TEKS