NPM : 140810170019
Kelas : A
1. Informasi Paper
Judul Paper : Using Text Mining Techniques for Extracting Information from
Research Articles
2. Tujuan Penelitian
Terdapat dua tujuan utama pada paper yang penulis pelajari, yaitu:
antara topik-topik tersebut, untuk membantu user dalam mencari topik terkait.
Selain itu penelitian ini diharapkan dapat menjawab pertanyaan peneliti yang
sebagai berikut:
1. Keyword apa yang paling sering muncul pada artikel yang telah
dikumpulkan?
2. Istilah apa yang paling sering muncul pada artikel yang telah dikumpulkan?
3. Topik apa yang paling umum yang terdapat pada artikel yang telah
dikumpulkan?
3. Text Mining
Text mining dilakukan untuk mengolah data text yang semi terstruktur dan
dokumen dari berbagai sumber. Lalu format dan kumpulan karakter pada
dokumen yang telah didapatkan tersebut akan dicek dan diolah menggunakan
instrumen text mining, tahap ini disebut juga dengan pre-processing. Setelah itu
mencocokan teks pada dokumen dan juga teks yang telah didefinisikan. Teknik ini
post-processing.
terlebih dahulu untuk mengubah data yang tidak terstruktur menjadi data yang
lebih terstruktur. Setelah itu pengetahuan dapat diketahui dari data yang sudah
lebih terstruktur.
Dalam text mining terdapat tiga tahap utama, yaitu pre-processing, text
data, yang akan dibahas pada bagian selanjutnya. Setelah itu dapat dilakukan
berbagai macam teknik text mining, seperti term frequency, clustering, dan
Artikel yang digunakan diambil dari enam scientific database, yaitu Springer
Wiley, Science Direct, SAGE, IEEE, dan Cambridge. Kata kunci yang digunakan
education”. Terdapat 300 artikel yang dikumpulkan dan dibagi ke dalam folder
Dokumen akan dipecah menjadi token. Kemudian akan dilakukan filtering stop
25 karakter.
7. Progress Tugas
karena RapidMiner merupakan tool yang digunakan pada paper yang penulis
pelajari. Selain itu RapidMiner memiliki modul yang lengkap untuk melakukan
dinyatakan pada paper (50 data dari masing- masing sumber), namun hanya
SAGE yang terdapat akses gratis, sehingga penulis hanya dapat mengumpulkan
Kemudian tahap pre-processing dilakukan sesuai tahapan yang ada pada paper.