BAB I
PENDAHULUAN
impor dapat dikatakan sebagai bagian atau jenis dari pakaian. Baju bekas impor
adalah baju – baju sisa penjualan dari pabrik garmen dan department store yang
dikumpulkan selama beberapa tahun di gudang, baju-baju inilah yang kemudian
dijual kembali oleh pihak – pihak tertentu [3].
Permasalahan muncul karena banyak nya pro dan kontra masyarakat
indonesia terkait peraturan menteri perdagangan NO.20/2022 tentang larangan
impor pakaian bekas ke indonesia dilihat dari komentar (sentimen) masyarakat
pada media sosial twitter, sehingga menimbulkan banyak perbedaan pendapat.
Algoritma text mining dan tf-idf merupakan alternatif yang cocok dalam
melakukan analisis sentimen. Text mining secara umum memiliki 5 tahapan yaitu
case folding (mengubah huruf menjadi kecil), tokenizing (mengubah kalimat
menjadi kata), filtering (mengambil kata penting), stemming ( proses mengubah
kata menjadi kata dasar untuk mencari root kata) dan analyzing ( penentuan
keterhubungan kata). Term Frequency Inverse Document Frequency (Tf Idf)
digunakan sesudah melakukan tahapan text mining untuk menghitung nilai atau
bobot kata dengan mengubah kata menjadi numerik untuk mengetahui ketarkaitan
kata dengan memberi bobot di setiap kata.
Untuk mengatasi permasalahan diatas, maka penulis akan melakukan
analisis sentimen dengan dua kombinasi metode yakni algoritma text mining dan
Tf-idf. Tujuannya untuk mengetahui apakah masyarakat mendukung atau
menentang aturan tersebut.
Penelitian sebelumnya dilakukan oleh Moh. Afif Rofiqi, Abd Charis
Fauzan, Afivatu Pratama Agustin, Ahmad Agung Saputra dan Hinayu Diniatul
Fahma pada (Journal of Computer Science and Applied Informatics
(ILKOMNIKA)) Vol.1, No.2 (Desember 2019) dengan Judul “Implementasi
Term-Frequency Inverse Document Frequency (TF-IDF) Untuk Mencari
Relevansi Dokumen Berdasarkan Query”. Menyatakan pembobotan kata didalam
sebuah dokumen dengan mengalikan nilai TF dan IDF bedasarkan hasil query
nya dan dari tiga artikel yang mengasilakan rank score untuk dokumen satu yang
berscore 3,90847 dapat disimpulkan bahwa artikel berita pada dokumen satu
adalah yang paling relevan dari pada dua artikel lainnya [4].
3
Penelitian juga dilakukan oleh Pradita Eko Prasetyo Utomo, Manaar, Ulfa
Khaira dan Tri Suratnopada (Jurnal Sains dan Sistem Informasi (JUSS)) Vol. 2,
No.2 (Desember 2019) dengan judul “Analisis Sentimen Online Review
Pengguna Bukalapak Menggunakan Metode Algoritma Tf-Idf”. Menyatakan hasil
analisis menggunakan algoritma TF-IDF dapat di simpulkan bahwa berdasarkan
ulasan review pelanggan di bukalapak mempunyai penilaian ataupun presepsi
yang baik terhadap produk sepatu ini. Dapat dilihat dari hasil sentimen,
Visualisasi Sentimen dan Visualisasi WordCloud yang menunjukkan bahwa
ulasan positifnya memiliki frekuensi yang lebih tinggi yaitu 70% [5].
Penelitian selanjutnya dilakukan oleh Pratama djodi pada (Informasi dan
Teknologi Ilmiah (INTI)) Volume 10, No 1, (Oktober 2022), dengan judul
“Implementasi Algoritma Text Mining TF-IDF Untuk Fitur Autoresponder”. Pada
metode ini menjelaskan tentang berapa persentase yang dihasilkan dari gejala-
gejala yang terjadi pada kerusakan printer. Maka berdasarkan perhitungannya
didapatlah total persentase sifat positif bernilai 56.2651 atau 56%, sedangkan
persentase sifat negatif bernilai 43.7349 atau 44% [6].
Berdasarkan beberapa uraian latar belakang masalah di atas, maka penulis
ingin mencoba Analisa sentimen masyarakat terhadap Larangan impor pakaian
bekas dengan algoritma Text Mining dan Term Frequency Inverse Document
Frequency (TF-IDF). Atas dasar ilmiah, Penulis tertarik untuk mengambil judul
“Analisa Sentimen Masyarakat Pada Media Sosial Twitter Tentang
Larangan Impor Pakaian Bekas Ke Indonesia Dengan Menerapkan
Algoritma Text Mining Dan Term Frequency Inverse Document Frequency
(Tf Idf)”.
4
Ada pun yang menjadi batasan masalah yang dibahas dalam penelitian
ini adalah sebagai berikut:
1. Data yang di analisis diambil dari media sosial twitter dengan 2 kata kunci
yaitu pakaian dan bekas.
2. Jumlah data yang akan di kelola sebanyak 30 komentar
3. Pengambilan data sentimen dilakukan dengan link Node.js kemudian di olah
dengan algoritma Text Mining dan dilakukan pembobotan mengunakan Tf- Idf .
4. Pengujian hasil akhir dilakukan menggunakan aplikasi Rapid miner.
BAB II
KAJIAN PUSTAKA
Text mining merupakan sebuah metode atau teknik yang digunakan untuk
mengolah dan menganalisis teks dalam bentuk kumpulan dokumen dengan tujuan
untuk mengubahnya menjadi data numerik yang dapat dikomputasikan. Text
mining merupakan bagian dari data mining yang khusus fokus pada analisis teks.
Dalam buku "The Text Mining Handbook", text mining didefinisikan sebagai
proses menggali informasi di mana seorang pengguna atau penggunaan alat
analisis berinteraksi dengan sekumpulan dokumen. Alat analisis ini merupakan
komponen-komponen dari data mining, salah satunya adalah peringkatan
dokumen.Fungsi utama dari text mining biasanya digunakan dalam klasifikasi
dokumen tekstual [7].
Beberapa tahapan yang dilakukan secara umum dalam text mining, yaitu
Analyzing Stemming
1. Case folding adalah tahap mengubah semua huruf menjadi normal yaitu semua
dokumen menjadi huruf kecil. Hanya huruf a sampai z yang diterima, karakter
selain selain huruf akan di hilangkan dan dianggap delimiter ( karakter yang
digunakan untuk memisah text ).
2. Tokenizing adalah proses penguraian deskripsi semula berupa kalimat menjadi
bentuk kata dengan cara dipotong berdasarkan kata yang menyusunnya.
7
Keterangan :
𝑊𝑑𝑡 = Nilai pembobotan TF-IDF atau W dari term t dikategorikan c
𝑡𝑓𝑑𝑡 = Jumlah kemunculan term t dalam dokumen d
N = Jumlah dokumen secara keseluruhan
𝑑𝑓𝑡 = Jumlah dokumen yang mengandung term t [9].
Keterangan :
W(d, t) = W dari term t dikategorikan.
TF(d, t) =frekuensi dari term t pada teks d.
Pada Term Frequency (TF), terdapat beberapa jenis formula yang dapat
digunakan antara lain :
1. TF biner (binary TF), hanya memperhatikan apakah suatu kata atau term ada
atau tidak dalam dokumen, jika ada diberi nilai satu (1), jika tidak diberi nilai
nol (0).
2. TF murni (raw TF), nilai TF diberikan berdasarkan jumlah kemunculan suatu
term di dokumen. Misalnya, jika muncul lima (5) kali maka kata tersebut akan
bernilai (5).
3. TF normalisasi, menggunakan perbandingan antara frekuensi sebuah term
dengan nilai maksimum dari keseluruhan atau kumpulan frekuensi term yang
ada pada suatu dokumen [9].
9
2. Penelitian juga dilakukan oleh Musfiroh Nurjannah, Hamdani dan Inda Fitri
Astuti pada (Jurnal Informatika Mulawarman Vol. 8 No. 3) dengan judul
“Penerapan Algoritma Term Frequency-Inverse Document Frequency (Tf-
Idf) Untuk Text Mining”. Menyatakan penerapkan algoritma term frequency
inverse-document frequency untuk text mining sangat membantu pengguna.
untuk mendapatkan informasi pada kumpulan dokumen. Dengan format file
txt berdasarkan kata kunci yang dimasukan oleh pengguna pada sistem.
Dengan koleksi uji kata „upaya‟ pada query maka didapatkan keluaran
dengan bobot nilai 8.65441 yang merupakan jumlah kata terbanyak sesuai
dengan query [12].
3. Penelitian selanjutnya dilakukan oleh Rudhi Ardi Sasmita dan Achmad Zakki
Falani pada (Jurnal Link Vol. 27/No. 1/Februari 2018) dengan Judul
“Pemanfaatan Algoritma Tf/Idf Pada Sistem Informasi Ecomplaint
Handling”. Menyatakan bahwa algoritma TF-IDF (Term Frequency Inverse
Document Frequency) dapat digunakan untuk mengukur tingkat similaritas
dokumen dengan kata kunci sehingga bisa memberikan kemudahan bagi para
pelanggan dalam mengajukan permasalahannya dan perusahaan dapat segera
menangani permasalahan tersebut [13].
4. Penilitian juga dilakukan oleh Bening Herwijayanti1, Dian Eka Ratnawati
dan Lailil Muflikhah pada (Jurnal Pengembangan Teknologi Informasi dan
Ilmu Komputer Vol. 2, No. 1, Januari 2018) dengan Judul “Klasifikasi Berita
Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity”.
Menyatakan bahwa klasifikasi berita online dengan menggunakan tf-idf dan
cosine similarity, memerlukan preprocessing yaitu tokenizing, stopword dan
stemming dapat memperkecil term sehingga mempercepat proses perhitungan
pembobotan term menggunakan tf-idf dan mempercepat proses cosine
similarity.. klasifikasi mampu mengelompokkan berita dengan tingkat akurasi
sebesar 91.25% [14].
5. Penelitian selanjutnya dilakukan oleh Chindy Amalia dan Yuliant Sibaroni
pada (e-Proceeding of Engineering : Vol.7, No.2 Agustus 2020) dengan Judul
“Analisis Sentimen Data Tweet Menggunakan Model Jaringan Saraf Tiruan
11
DAFTAR PUSTAKA