Anda di halaman 1dari 14

PERCOBAAN I

NATURAL LANGUAGE PROCESSING PYTHON DAN


JUPYTER
I. TUJUAN
1. Mahasiswa mengetahui apa itu Natural Language Processing
2. Mahasiswa mampu melakukan pemrograman dasar pada
Natural Language Processing dengan menggunakan
Python dan Jupyter.

II. ALAT DAN BAHAN


1. Laptop/PC
2. Modul (softcopy)
3. Phyton dan Jupyter
4. Command Prompt

III. TEORI DASAR


Natural Language Processing (NLP) atau Pengolahan Bahasa
Alami (PBA) merupakan salah satu bidang ilmu kecerdasan buatan
(artificial intelligence) yang mempelajari komunikasi antara
manusia dengan komputer. Natural Languange Processing adalah
sebuah bahasa yang diucapkan, ditulis oleh manusia untuk
berkomunikasi. Bahasa adalah sebuah sistem yang terdiri atas
kumpulan simbol dan aturan (grammar). NLP mencakup semua
yang diperlukan komputer untuk mengerti Bahasa Alami baik yang
ditulis maupun diucapkan dan menghasilkan sebuah bahasa alami.
NLP terdiri terdiri dari dua yaitu:
1. Natural Language Understanding (NLU). Tugas NLU adalah
memahami input (bahasa alami).
2. Natural Language Generation (NLG). NLG adalah salah satu
bagian dari NLP, NLG sering juga disebut text generation.
Berikut ini dijelaskan bidang-bidang pengetahuan yang
berhubungan dengan NLP:
1. Fonetik dan Fonologi berhubungan dengan suara yang
menghasilkan kata yang dapat dikenali. Bidang ini menjadi
penting dalam proses aplikasi yang memakai metode speech
based system.
2. Morfologi yaitu pengetahuan tentang kata dan bentuknya
dimanfaatkan untuk membedakan suatu kata dengan lainnya.
Pada tingkat ini juga dapat dipisahkan antara kata dan elemen lain
seperti tanda baca.
3. Sintaksis yaitu pemahaman tentang urutan kata dalam
pembentukan kalimat dan hubungan antar kata tersebut dalam
proses perubahan bentuk dari kalimat menjadi bentuk yang
sistematis.
4. Semantik yaitu pemetaan bentuk struktur sintaksis dengan
memanfaatkan tiap kata ke dalam bentuk yang lebih mendasar
dan tidak tergantung struktur kalimat. Semantik mempelajari arti
suatu kata dan bagaimana dari arti kata tersebut membentuk
suatu arti dari kalimat yang utuh. Dalam tingkatan ini belum
tercakup konteks dari kalimat tersebut.
5. Pragmatik pengetahuan pada tingkatan ini berkaitan dengan
masing- masing konteks yang berbeda tergantung pada situasi
dan tujuan pembuatan sistem.
6. Discourse Knowledge melakukan pengenalan apakah suatu
kalimat yang sudah dibaca dan dikenali sebelumnya akan
mempengaruhi arti dari kalimat selanjutnya. Informasi ini
penting diketahui untuk melakukan pengolahan arti terhadap
kata ganti orang dan untuk mengartikan aspek sementara dari
informasi.
7. World Knowledge mencakup arti sebuah kata secara umum dan
apakah ada arti khusus bagi suatu kata dalam suatu percakapan
dengan konteks tertentu.
IV. LANGKAH KERJA
1. Sebelum kita mulai coding pasrtikan bahwa kita sudah
menginstal python dan jupyter dalam perangkat komputer yang
praktikan punya.

2. Open Command Prompt pada laptop/Pc anda lalu ketik seperti


yang ada di gambar bawah ini.

3. Setelah kalian sudah menginstal python dan jupyter maka


tampilan pada halaman browser anda akan seperti ini.

4. Selanjutnya buatlah proyek baru dengan menekan New lalu pilih


Python 3 (ipykernal) seperti pada gambar dibawah ini.
5. Setelah kita klik New Project, maka tampilannya akan seperti
gambar di bawah ini, lalu pilih Rename seperti pada gambar
dibawah ini.

6. Selanjutnya isi nama project yang akan kita buat maka


tampilannya akan seperti ini.

7. Setelah kita Rename maka akan terbuka file python di tab baru
seperti ini.

8. Selanjutnya untuk memulai coding klik tanda Plus seperti pada


gambar dibawah ini.
9. Selanjutnya ketikkan codingnya seperti berikut. Sebelum bisa
membuat regex di python terlebih dahulu kita import modul re
atau regular expression (regex).

10. Selanjutnya ketikkan code seperti gambar dibawah ini.

11. Selanjutnya ketikkan code seperti gambar dibawah ini


untuk mengetahui berapa jumlah kata pada codenya.

12. Yang terakhir ketikkan code berikut untuk mengetahui berapa


banyak jumlah setiap katanya.
V. HASIL PERCOBAAN
1. Output Pemanggilan variabe tex.

2. Output pemisahan kata-kata pada text

3. Output fungsi len().


4. Output perhitungan Frekuensi Kata .

VI. KESIMPULAN
Pada percobaan diatas dapat dianalisis bahwa pada project ini
kita dapat membuat aplikasi sederhana untuk menghitung frekuensi
kata berdasarkan pola menggunakan reguler expression. Pada
project ini kita menggunakan python dan jupyter. Jupyter adalah
organisasi non-profit untuk mengembangkan software interaktif
dalam berbagai bahasa pemrograman. Notebook adalah satu
software buatan Jupyter, adalah aplikasi web open-source yang
memungkinkan Anda membuat dan berbagi dokumen interaktif
yang berisi kode live, persamaan, visualisasi, dan teks naratif yang
kaya. Jupyter Notebook menyatukan semua ini, baik itu teks/narasi,
kode hidup, persamaan, tampilan hasil, gambar statis, dan
visualisasi grafis, dalam satu file interaktif. Dan, kelebihan lainnya,
notebook dapat dijalankan ulang oleh siapapun yang membukanya,
untuk mereproduksi eksekusi kode di dalamnya. Setelah kita
menginstall python dan jupyter di laptop/Pc kita maka
selanjutnya kita membukan Command Prompant (CMD) terlebih
dahulu lalu mengetikkan jupyter notebook sebelum kita membuat
project baru di jupyter .Untuk membuat regex di python, terlebih
dahulu kita import modul re atau Reguler Expression (regex).
dimana Regex adalah deretan karakter yang digunakan untuk
pencarian string atau teks dengan menggunakan pola (pattern).
Kemudian untuk melihat apakah variabel “text” sudah berjalan
dengan benar maka kita panggil variabel “text” di line selanjutnya
dengan mengklik Cell – Run All. Maka hasilnya akan menujukkan
bahwa variabel “text” sudah terbaca.Didalam project ini pula kita
menggunakan code “text.lower ()” dimana fungsi dari “text.lower
()” ini adalah untuk mengubah Hurufnya menjadi Kecil.
Selanjutnya kita menggunakan code “re.sub(r’([^A-Za-z0-
9\/\.]+)’,’’,ubahHurufKecil)” dimana berfungsi untuk memfilter
text agar yang tampil hanya A-Z, a-z, 0-9, serta titik pada text.
Kemudian kita menggunakan code “re.split(r’\s+’,
hapusSelainHuruf)” yang berfungsi untuk memisahkan tiap kata
berdasarkan spasi. Dan yang terakhir kita menggunakan code
“token” untuk memanggil variabel “token”. Untuk menghitung
frekuensi kata pada text maka kita menggunakan code
“frekuensiKata= {}For kata in token:Hitung=
frekuensiKata.get(kata,0) frekuensiKata[kata]=
hitung+1list_frekuensi= frekuensiKata.keys() for kata in
list_frekuensi:print(kata, frekuensiKata[kata])”tujuan dari code
adalah untuk melihat berapa banyak frekuensi keluarnya setiap
huruf pada text yang kita punya.

VII. KESIMPULAN.
Pada percobaan kali ini dapat disimpulkan bahwa Natural
Language Processing ( NLP ) atau Pengolahan Bahasa Alami
( PBA ) merupakan salah satu bidang ilmu kecerdasan buatan
(artificial intelligence) yang memperlajari komunikasi antara manusia
dengan komputer. Natural Language Processing adalah sebuah bahasa
yang diucapkan dan ditulis manusia untuk berkomunikasi. Bahasa
adalah sebuah sistem yang terdiri atas kumpulan simbol dan aturan
(grammar). NLP mencakup semua yang diperlukan komputer untuk
mengerti bahasa alami baik yang ditulis maupun yang diucapkan dan
menghasilkan sebuah bahasa alami. NLP terdiri dari dua yaitu :
1. Natural Language Understanding (NLU) untuk memahami
input (bahasa alami)
2. Natural Language Generation (NLG) salah satu bagian dari
NLP, NLG sering disebut text Generation.
salah satu bidang ilmu kecerdasan buatan (artificial intelligence) yang memperlajari
komunikasi antara manusia dengan komputer. Natural Language Processing adalah
sebuah bahasa yang diucapkan dan ditulis manusia untuk berkomunikasi. Bahasa
adalah sebuah sistem yang terdiri atas kumpulan simbol dan aturan (grammar). NLP
mencakup semua yang diperlukan komputer untuk mengerti bahasa alami baik yang
ditulis maupun yang diucapkan dan menghasilkan sebuah bahasa alami. NLP terdiri
dari dua yaitu :
3. Natural Language Understanding (NLU) untuk memahami input
(bahasa alami)
4. Natural Language Generation (NLG) salah satu bagian dari NLP, NLG
sering disebut text Generation.

Anda mungkin juga menyukai