216210524
S2 Teknologi Informasi Email: syaifuddin.skm@gmail.com
Kelas Non-Reguler
Banyak kata-kata yang umum digunakan sering tidak signifikan dalam hal
membedakan makna sebuah frase/kalimat. Misalnya, dalam kalimat "the movie was
terrible", kata yang paling signifikan adalah "movie" dan "terrible", sementara "the"
dan "was" hampir tidak berguna. Kita bisa mendapatkan arti yang sama jika kita
membawa kata yang tidak signifikan keluar, seperti "movie terrible" atau " terrible
movie ". Cara yang baik, sentimen adalah sama. Dalam cara ini, kita akan belajar
bagaimana menghapus kata-kata tidak signifikan, dan menjaga yang signifikan,
dengan melihat part-of-speech tag mereka.
a. Pertama, memutuskan bagian part-of-speech tag yang signifikan dan yang tidak.
Contoh: semua tag diakhiri dengan DT. Ini berarti kita bisa menyaring kata-kata
yang tidak signifikan dengan melihat akhiran tag.
c. Sekarang kita dapat menggunakannya pada versi part-of-speech dengan tag dari "
the movie was terrible ".
Seperti yang kita lihat, kata "the" dihilangkan dari potongan tersebut.
filter_insignificant() mengiterasi kata-kata yang ditandai dalam potongan
tersebut. Untuk setiap tag, ia akan memeriksa apakah tag yang berakhir dengan
salah satu tag_suffixes. Jika tidak, maka kata dengan tag dilewati. Namun jika tag
disetujui, maka kata dengan tag akan ditambahkan ke potongan yang baru tersebut
akan dikembalikan.
Hal ini cukup sering terjadi untuk mencari bentuk-bentuk kata kerja yang salah dalam
bahasa di dunia nyata. Misalnya, bentuk yang benar "is our children learning?"
adalah "are our children learning?". Kata kerja "is" hanya boleh digunakan dengan
kata benda tunggal, sementara "are" adalah untuk kata benda jamak, seperti
"children". Kita dapat memperbaiki kesalahan ini dengan menciptakan pemetaan
koreksi kata kerja yang digunakan tergantung pada apakah ada benda jamak atau
tunggal di potongan tersebut.
Ketika kita menyebutnya pada part-of-speech tag "is our children learning"
sepotong, kita kembali pada format yang tepat, "are our children learning".
b. Berdasarkan hasil percobaan dengan bahasa pemrograman python, menerapkan
import correct_verbs. Berikut screenshoot dari hasil percobaan:
c. Kita juga dapat mencoba fungsi ini dengan kata benda tunggal dan kata kerja
jamak yang salah.
Dalam hal ini, "were" menjadi "was" karena "child" adalah kata benda tunggal.
b. Sekarang kita dapat melihat cara kerjanya pada part-of-speech pada kalimat "the
book was great".
d. Hasilnya adalah "great the book". Kalimat ini secara jelas bukanlah tata bahasa
yang benar, begitu membaca belajar bagaimana untuk memperbaikinya.
Penyaringan kata signifikan membuat hasil akhir lebih mudah dibaca. Dengan
menyaring baik sebelum atau setelah swap_verb_phrase (), kita mendapatkan
"fantastic gripping book" bukannya "fantastic this gripping book".
Cara baik, kita mendapatkan sepotong tata bahasa yang lebih pendek tanpa
kehilangan makna.
b. Mari kita coba pada tanggal, misalnya "10 Desember", dan kalimat umum lainnya
"top 10".
Kita mulai dengan mencari tag CD di potongan tersebut. Jika tidak ada CD
ditemukan, atau jika CD adalah pada awal potongan, maka potongan
dikembalikan seperti. Ada juga harus menjadi benda segera sebelum CD. Jika kita
menemukan sebuah CD dengan kata benda yang mendahuluinya, maka kita
menukar benda dan kardinal di tempat.