Definisi
NLP adalah cabang dari Artificial Intelligence yang berhubungan dengan interaksi antara mesin dan
manusia menggunakan bahasa natural. Apa yang dimaksud dengan bahasa natural? Contohnya, ketika
kamu sedang jalan-jalan di mall dan kamu menelpon temanmu untuk menanyakan lokasi mereka,
mereka menjawab “di sebelah Starbucks” atau “di depan McD”. Jawaban-jawaban tersebut
mendeskripsikan lokasinya dengan bahasa natural, alias bahasa yang kita sering gunakan sehari-hari.
NLP menggunakan data yang bersifat tidak terstruktur / tidak berupa tabel, yakni data teks. Data teks
dan bahasa dapat memiliki isi dan ukuran yang sangat beragam sehingga lebih menantang dibandingkan
data tabular biasa.
1. Stemming – Proses yang melibatkan pemotongan akhir atau awal kata yang diubah ke bentuk
akarnya dengan tujuan menghilangkan imbuhan. e.g. “bi” di awal kata “bicycle”, “er” di akhir
kata “lighter”.
2. Lemmatization – Proses pengurangan berbagai bentuk kata yang berubah menjadi satu bentuk
untuk memudahkan analisis. e.g. kata dari “swim”, “swimming”, “swims”, “swam”, adalah
semua bentuk dari “swim”. Nah jadi lemma dari semua kata-kata tersebut adalah “swim”.
3. Tokenization – Proses pembagian sebagian besar teks berkelanjutan menjadi unit-unit yang
berbeda. e.g. “Kalimat ini adalah sebuah contoh tokenization”. Setiap katanya akan dipisah
menjadi 1 unit masing-masing. “Kalimat”, “ini”, “adalah”, “sebuah”, “contoh”, “tokenization”.
Unit-unit ini biasanya disebut sebagai token.
4. Parsing – Proses analisis teks menjadi komponen sintaksis logis, biasanya untuk menguji
kesesuaian dengan tata bahasa. Contoh dari parsing adalah memecah kalimat untuk
menjelaskan setiap elemen kepada seseorang. Atau seperti yang kita sering dengar sebagai
contoh, “Budi”. Ketika kita ingin mengajar anak kecil, kita sering kali memecahkan kalimat atau
kata per elemennya. “B, U, BU”. “D, I, DI”, “Budi”.
Penamaan lokasi. Aplikasi seperti Gojek dan Grab sudah menguasai NLP sehingga dapat memberi nama
yang terdengar sangat natural di telinga manusia untuk sebuah lokasi. Misalnya saat kamu memesan
Gojek di Menara Standard Chartered, akan muncul lagi pilihan titik jemput yang lebih mendetail, seperti
lobby atas atau parkir motor.
Aplikasi terjemahan bahasa seperti Google Translate juga menggunakan NLP untuk menerjemahkan
bukan lagi kata per kata tetapi sesuai konteks dan grammar bahasa.
Aplikasi Email seperti Gmail, Hotmail, Ymail memfilter dan mengklasifikasikan email kamu dengan NLP
sebelum ada email masuk ke dalam inbox sehingga bisa mendeteksi spam dan memindahkannya ke
folder spam agar kamu tidak perlu membacanya.
Aplikasi Interactive Voice Response (IVR) yang digunakan di call center untuk menanggapi permintaan
user tertentu. Contohnya ketika kita menelpon customer service Telkomsel, kita akan diberi petunjuk
dari awal seperti “Tekan 1 untuk menggunakan Bahasa Inggris,” dan nanti akan terputar recorder untuk
bahasa inggris.
Sumber: https://algorit.ma/blog/natural-language-processing/