Anda di halaman 1dari 13

1

BAB I
PENDAHULUAN

1.1 Latar Belakang Masalah

Media sosial telah menjadi suatu kebutuhan penting bagi masyarakat di


seluruh dunia. Kehidupan manusia tak bisa terlepas dari adanya media digital
seperti telepon genggam yang mempermudah akses informasi, interaksi,
sosialisasi, dan aktivitas bisnis. Dalam proses komunikasi, media sosial menjadi
sarana utama untuk menyampaikan pesan, terutama dalam komunikasi massa
yang berpengaruh terhadap hubungan dan aktivitas manusia. Perkembangan
teknologi internet juga diiringi oleh pertumbuhan media sosial yang kian pesat,
memfasilitasi komunikasi antar pengguna. Menurut laporan katadata.co.id,
penelitian pada Januari 2019 mengungkapkan bahwa pengguna media sosial di
Indonesia mencapai 150 juta orang atau 56% dari total populasi [1].
Sentimen masyarakat adalah ekspresi sikap, pendapat, dan perasaan umum
yang dimiliki oleh individu-individu dalam suatu komunitas terhadap isu,
peristiwa atau objek tertentu. Sentimen ini mencerminkan pandangan yang dapat
berupa positif dan negatif terhadap topik yang dibahas dan memberikan wawasan
tentang persepsi dan kecenderungan umum yang ada dalam masyarakat terkait hal
tersebut. Analisis sentimen masyarakat memiliki kepentingan yang signifikan
karena dapat memberikan pemahaman yang lebih baik tentang pandangan dan
opini yang tersebar di masyarakat terkait isu-isu yang relevan. Informasi ini
sangat berharga dalam mengarahkan kebijakan publik, mengidentifikasi tren
sosial, merancang kampanye pemasaran yang efektif, dan memahami preferensi
konsumen [2].
Pakaian bekas merupakan bagian dari fashion, pakaian adalah kebutuhan
pokok manusia selain makanan dan tempat berteduh / rumah. Manusia
membutuhkan pakaian untuk melindungi dan menutupi dirinya. Namun, seiring
dengan perkembangan kehidupan manusia, pakaian juga digunakan sebagai
simbol status, maupun kedudukan seseorang yang memakainya. Pakaian bekas
2

impor dapat dikatakan sebagai bagian atau jenis dari pakaian. Baju bekas impor
adalah baju – baju sisa penjualan dari pabrik garmen dan department store yang
dikumpulkan selama beberapa tahun di gudang, baju-baju inilah yang kemudian
dijual kembali oleh pihak – pihak tertentu [3].
Permasalahan muncul karena banyak nya pro dan kontra masyarakat
indonesia terkait peraturan menteri perdagangan NO.20/2022 tentang larangan
impor pakaian bekas ke indonesia dilihat dari komentar (sentimen) masyarakat
pada media sosial twitter, sehingga menimbulkan banyak perbedaan pendapat.
Algoritma text mining dan tf-idf merupakan alternatif yang cocok dalam
melakukan analisis sentimen. Text mining secara umum memiliki 5 tahapan yaitu
case folding (mengubah huruf menjadi kecil), tokenizing (mengubah kalimat
menjadi kata), filtering (mengambil kata penting), stemming ( proses mengubah
kata menjadi kata dasar untuk mencari root kata) dan analyzing ( penentuan
keterhubungan kata). Term Frequency Inverse Document Frequency (Tf Idf)
digunakan sesudah melakukan tahapan text mining untuk menghitung nilai atau
bobot kata dengan mengubah kata menjadi numerik untuk mengetahui ketarkaitan
kata dengan memberi bobot di setiap kata.
Untuk mengatasi permasalahan diatas, maka penulis akan melakukan
analisis sentimen dengan dua kombinasi metode yakni algoritma text mining dan
Tf-idf. Tujuannya untuk mengetahui apakah masyarakat mendukung atau
menentang aturan tersebut.
Penelitian sebelumnya dilakukan oleh Moh. Afif Rofiqi, Abd Charis
Fauzan, Afivatu Pratama Agustin, Ahmad Agung Saputra dan Hinayu Diniatul
Fahma pada (Journal of Computer Science and Applied Informatics
(ILKOMNIKA)) Vol.1, No.2 (Desember 2019) dengan Judul “Implementasi
Term-Frequency Inverse Document Frequency (TF-IDF) Untuk Mencari
Relevansi Dokumen Berdasarkan Query”. Menyatakan pembobotan kata didalam
sebuah dokumen dengan mengalikan nilai TF dan IDF bedasarkan hasil query
nya dan dari tiga artikel yang mengasilakan rank score untuk dokumen satu yang
berscore 3,90847 dapat disimpulkan bahwa artikel berita pada dokumen satu
adalah yang paling relevan dari pada dua artikel lainnya [4].
3

Penelitian juga dilakukan oleh Pradita Eko Prasetyo Utomo, Manaar, Ulfa
Khaira dan Tri Suratnopada (Jurnal Sains dan Sistem Informasi (JUSS)) Vol. 2,
No.2 (Desember 2019) dengan judul “Analisis Sentimen Online Review
Pengguna Bukalapak Menggunakan Metode Algoritma Tf-Idf”. Menyatakan hasil
analisis menggunakan algoritma TF-IDF dapat di simpulkan bahwa berdasarkan
ulasan review pelanggan di bukalapak mempunyai penilaian ataupun presepsi
yang baik terhadap produk sepatu ini. Dapat dilihat dari hasil sentimen,
Visualisasi Sentimen dan Visualisasi WordCloud yang menunjukkan bahwa
ulasan positifnya memiliki frekuensi yang lebih tinggi yaitu 70% [5].
Penelitian selanjutnya dilakukan oleh Pratama djodi pada (Informasi dan
Teknologi Ilmiah (INTI)) Volume 10, No 1, (Oktober 2022), dengan judul
“Implementasi Algoritma Text Mining TF-IDF Untuk Fitur Autoresponder”. Pada
metode ini menjelaskan tentang berapa persentase yang dihasilkan dari gejala-
gejala yang terjadi pada kerusakan printer. Maka berdasarkan perhitungannya
didapatlah total persentase sifat positif bernilai 56.2651 atau 56%, sedangkan
persentase sifat negatif bernilai 43.7349 atau 44% [6].
Berdasarkan beberapa uraian latar belakang masalah di atas, maka penulis
ingin mencoba Analisa sentimen masyarakat terhadap Larangan impor pakaian
bekas dengan algoritma Text Mining dan Term Frequency Inverse Document
Frequency (TF-IDF). Atas dasar ilmiah, Penulis tertarik untuk mengambil judul
“Analisa Sentimen Masyarakat Pada Media Sosial Twitter Tentang
Larangan Impor Pakaian Bekas Ke Indonesia Dengan Menerapkan
Algoritma Text Mining Dan Term Frequency Inverse Document Frequency
(Tf Idf)”.
4

1.2 Perumusan Masalah

Berdasakan latar belakang masalah diatas maka yang menjadi perumusan


masalah penelitian ini adalah:
1. Bagaimana menganalisa sentimen masyarakat pada media sosial twitter ?
2. Bagaimana menerapkan algoritma text Mining dan tf-Idf untuk mengetahui
sentimen masyarakat tentang larangan impor pakaian bekas ?
3. Bagaimana menguji sentimen masyarakat pada media sosial twitter mengenai
larangan impor pakaian bekas ?

1.3 Batasan Masalah

Ada pun yang menjadi batasan masalah yang dibahas dalam penelitian
ini adalah sebagai berikut:
1. Data yang di analisis diambil dari media sosial twitter dengan 2 kata kunci
yaitu pakaian dan bekas.
2. Jumlah data yang akan di kelola sebanyak 30 komentar
3. Pengambilan data sentimen dilakukan dengan link Node.js kemudian di olah
dengan algoritma Text Mining dan dilakukan pembobotan mengunakan Tf- Idf .
4. Pengujian hasil akhir dilakukan menggunakan aplikasi Rapid miner.

1.4 Tujuan Penelitian

Adapun beberapa tujuan yang dilakukan dalam penelitian ini adalah


sebagai berikut :
1. Menganalisa sentimen masyarakat pada media sosial twitter.
2. Menerapkan algoritma Text Mining dan Tf-Idf dalam menganalisi sentimen
masyarakat tentang larangan impor pakaian bekas.
3. Pengujian sentimen dilakukan melalui aplikasi rapid miner.

1.5 Manfaat Penelitian

Adapun beberapa manfaat yang diharapkan dari peneliti ini adalah


sebagai berikut:
5

1. Menambah pengetahuan dalam menganalisa sentimen masyarakat pada media


sosial twitter.
2. Dari hasil penerapan algoritma text mining dan tf-Idf dapat mengetahui apakah
masyarakat mendukung atau menentang larangan impor pakaian bekas ke
indonesia .
3. Dapat memahami pengujian hasil akhir sentimen dengan menggunakan
aplikasi rapid miner.
6

BAB II
KAJIAN PUSTAKA

2.1. Text Mining

Text mining merupakan sebuah metode atau teknik yang digunakan untuk
mengolah dan menganalisis teks dalam bentuk kumpulan dokumen dengan tujuan
untuk mengubahnya menjadi data numerik yang dapat dikomputasikan. Text
mining merupakan bagian dari data mining yang khusus fokus pada analisis teks.
Dalam buku "The Text Mining Handbook", text mining didefinisikan sebagai
proses menggali informasi di mana seorang pengguna atau penggunaan alat
analisis berinteraksi dengan sekumpulan dokumen. Alat analisis ini merupakan
komponen-komponen dari data mining, salah satunya adalah peringkatan
dokumen.Fungsi utama dari text mining biasanya digunakan dalam klasifikasi
dokumen tekstual [7].
Beberapa tahapan yang dilakukan secara umum dalam text mining, yaitu

Case folding Tokenizing Filtering

Analyzing Stemming

Gambar 2.1 Tahapan Text Mining

1. Case folding adalah tahap mengubah semua huruf menjadi normal yaitu semua
dokumen menjadi huruf kecil. Hanya huruf a sampai z yang diterima, karakter
selain selain huruf akan di hilangkan dan dianggap delimiter ( karakter yang
digunakan untuk memisah text ).
2. Tokenizing adalah proses penguraian deskripsi semula berupa kalimat menjadi
bentuk kata dengan cara dipotong berdasarkan kata yang menyusunnya.
7

3. Filtering adalah mengabil kata-kata penting dari proses token, dengan


menggunakan metode stop list (membuang kata yang tidak penting) atau word
list ( menyimpan kata yang penting ) atau stopwords ( kata unik ). Pada proses
filtering ini menggunakan stopwords.
4. Stemming adalah tahapan mencari root kata dari hasil filtering. Stemming dapat
diartikan sebagai proses membetuk suatu kata menjadi kata dasar. Proses
pencarian mencari root kata disini menyesuaikan dengan kamus besar baha
indonesia (KBBI).
5. Analyzing adalah tahap penentuan seberapa jauh keterhubungan antar kata-kata
terhadap suatu dokumen dengan menghitung nilai atau bobot yang saling
keterhubungan [8].

2.3 Term Frequency Inverse Document Frequency (TF-IDF)

TF-IDF adalah salah satu metode yang umum digunakan dalam


information retrieval untuk menghitung bobot setiap kata. Metode ini terkenal
efisien, mudah digunakan, dan memberikan hasil yang akurat. Metode Term
Frequency-Inverse Document Frequency (TF-IDF) digunakan untuk memberikan
bobot pada hubungan antara kata (term) dengan dokumen. TF-IDF merupakan
sebuah ukuran statistik yang digunakan untuk mengevaluasi seberapa penting
sebuah kata dalam sebuah dokumen atau dalam sekelompok kata. Setiap kalimat
dalam dokumen tunggal dianggap sebagai dokumen terpisah. Frekuensi
kemunculan kata dalam dokumen menunjukkan seberapa penting kata tersebut
dalam dokumen tersebut. Sementara itu, frekuensi dokumen yang mengandung
kata tersebut menunjukkan seberapa umum kata tersebut. Bobot kata akan
semakin besar jika kata tersebut sering muncul dalam suatu dokumen, dan
bobotnya akan semakin kecil jika kata tersebut muncul dalam banyak dokumen.

Dalam perhitungan bobot menggunakan tf-idf, dibawah ini merupakan


rumus pembobotannya.

𝑊𝑑𝑡 = 𝑡𝑓𝑑𝑡 x 𝑖𝑑𝑓𝑡 = 𝑡𝑓𝑑𝑡 x log( )


8

Keterangan :
𝑊𝑑𝑡 = Nilai pembobotan TF-IDF atau W dari term t dikategorikan c
𝑡𝑓𝑑𝑡 = Jumlah kemunculan term t dalam dokumen d
N = Jumlah dokumen secara keseluruhan
𝑑𝑓𝑡 = Jumlah dokumen yang mengandung term t [9].

2.3.1 Term Frequency (TF)

Term-Frequency atau TF murni merupakan metode yang paling sederhana.


Metode ini didasarkan pada jumlah kemunculan term atau kata dalam dokumen.
Berikut adalah persamaan dari Term Frequency:

W(d, t) = TF(d, t) (1)

Keterangan :
W(d, t) = W dari term t dikategorikan.
TF(d, t) =frekuensi dari term t pada teks d.

Pada Term Frequency (TF), terdapat beberapa jenis formula yang dapat
digunakan antara lain :

1. TF biner (binary TF), hanya memperhatikan apakah suatu kata atau term ada
atau tidak dalam dokumen, jika ada diberi nilai satu (1), jika tidak diberi nilai
nol (0).
2. TF murni (raw TF), nilai TF diberikan berdasarkan jumlah kemunculan suatu
term di dokumen. Misalnya, jika muncul lima (5) kali maka kata tersebut akan
bernilai (5).
3. TF normalisasi, menggunakan perbandingan antara frekuensi sebuah term
dengan nilai maksimum dari keseluruhan atau kumpulan frekuensi term yang
ada pada suatu dokumen [9].
9

2.3.2 Inverse Document Frequency (IDF)

Inverse Document Frequency merupakan metode untuk menghitung


penyebaran term pada dokumen. Dengan penyebaran term yang tidak merata
memngaruhi optimasi perhitungan bobot pada dokumen. Peran dari Inverse
Document Frequency adalah meredam penyebaran term yang terlalu bias. Jika
terdapat nilai document frequency (DF) yang berada dibawah threshold, maka
term tidak dihitung. Sehingga disimpulkan bahwa rendahnya nilai document
frequency (DF) akan semakin tinggi nilai Inverse Document Frequency (IDF).
Berikut adalah persamaan dari Inverse Document Frequency (IDF)

𝑖𝑑𝑓𝑡 = 𝐿𝑜𝑔10 𝑁 𝑑𝑓𝑡 (2)

Dimana 𝑑𝑓𝑡 adalah banyaknya dokumen yang memuat t dan N merupakan


jumlah total dokumen [10].

2.4 Penelitian Terkait

Dalam proses penyusunan skripsi ini, penulis sedikit banyak mengambil


inspirasi dan referensi dari penelitian penelitian sebelumnya yang berkaitan
dengan latar belakang skripsi ini. Penelitian yang berkaitan antara lain

1. Penelitian yang dilakukan oleh Yohanes Hans Kristian, Kestrilia Rega


Prilianti dan Paulus Lucky Tirma Irawan pada (Jurnal simantec Vol. 7, No. 2
Juni 2019) dengan judul “Implementasi Text Mining Untuk Analisis
Preferensi Masyarakat Terhadap Tempat Wisata Di Indonesia”. Menyatakan
dalam penelitiannya Dari penelitian yang sudah dilakukan didapatkan hasil
akurasi klasifikai sebesar 100% untuk topik candi Borobudur, 80.59% untuk
topik candi Prambanan, dan 90.48% untuk akurasi rata-rata menggunakan
algoritma Tf-Idf. Metode PCA menghasilkan 10 faktor positif dan 7 faktor
negatif untuk topik candi Borobudur, sedangkan untuk topik candi
Prambanan didapatkan 8 faktor positif dan 3 faktor negatif. Seluruh faktor
yang terbentuk telah divalidasi dan diinterpretasikan oleh pakar. Dapat
disimpulkan jika aplikasi yang dibuat dapat digunakan untuk mengetahui
informasi preferensi masyarakat terhadap tempat wisata di Indonesia [11].
10

2. Penelitian juga dilakukan oleh Musfiroh Nurjannah, Hamdani dan Inda Fitri
Astuti pada (Jurnal Informatika Mulawarman Vol. 8 No. 3) dengan judul
“Penerapan Algoritma Term Frequency-Inverse Document Frequency (Tf-
Idf) Untuk Text Mining”. Menyatakan penerapkan algoritma term frequency
inverse-document frequency untuk text mining sangat membantu pengguna.
untuk mendapatkan informasi pada kumpulan dokumen. Dengan format file
txt berdasarkan kata kunci yang dimasukan oleh pengguna pada sistem.
Dengan koleksi uji kata „upaya‟ pada query maka didapatkan keluaran
dengan bobot nilai 8.65441 yang merupakan jumlah kata terbanyak sesuai
dengan query [12].
3. Penelitian selanjutnya dilakukan oleh Rudhi Ardi Sasmita dan Achmad Zakki
Falani pada (Jurnal Link Vol. 27/No. 1/Februari 2018) dengan Judul
“Pemanfaatan Algoritma Tf/Idf Pada Sistem Informasi Ecomplaint
Handling”. Menyatakan bahwa algoritma TF-IDF (Term Frequency Inverse
Document Frequency) dapat digunakan untuk mengukur tingkat similaritas
dokumen dengan kata kunci sehingga bisa memberikan kemudahan bagi para
pelanggan dalam mengajukan permasalahannya dan perusahaan dapat segera
menangani permasalahan tersebut [13].
4. Penilitian juga dilakukan oleh Bening Herwijayanti1, Dian Eka Ratnawati
dan Lailil Muflikhah pada (Jurnal Pengembangan Teknologi Informasi dan
Ilmu Komputer Vol. 2, No. 1, Januari 2018) dengan Judul “Klasifikasi Berita
Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity”.
Menyatakan bahwa klasifikasi berita online dengan menggunakan tf-idf dan
cosine similarity, memerlukan preprocessing yaitu tokenizing, stopword dan
stemming dapat memperkecil term sehingga mempercepat proses perhitungan
pembobotan term menggunakan tf-idf dan mempercepat proses cosine
similarity.. klasifikasi mampu mengelompokkan berita dengan tingkat akurasi
sebesar 91.25% [14].
5. Penelitian selanjutnya dilakukan oleh Chindy Amalia dan Yuliant Sibaroni
pada (e-Proceeding of Engineering : Vol.7, No.2 Agustus 2020) dengan Judul
“Analisis Sentimen Data Tweet Menggunakan Model Jaringan Saraf Tiruan
11

Dengan Pembobotan Delta Tf-Idf”. Menyatakan bahwa algoritma text mining


dan term frequency-inverse document frequency(TF-IDF). Semakin tinggi
nilai learnimg rate semakin besar nilai akurasi dapat dilihat dari hasil seluruh
skenario. Pembobotan delta TF-IDF lebih baik dibandingkan dengan TF-IDF
biasa, terlihat dari hasil akurasi seluruh skenario, Delta TF-IDF mendapat
hasil akurasi tertinggi yaitu 70,6% dan TF-IDF sebesar 68,5%. Besarnya
hidden layer tidak menjamin akurasi menjadi lebih baik dibandingkan dengan
jumlah hidden layer yamg lebih sedikit [15].
12

DAFTAR PUSTAKA

[1] N. Angela and M. G. Yoedtadi, “Pemanfaatan Media Sosial Oleh


Komunitas Historia Indonesia,” Prologia, vol. 3, no. 2, p. 393, 2019, doi:
10.24912/pr.v3i2.6371.
[2] S. Bhatia, M. Sharma, and K. K. Bhatia, “Sentiment Analysis and Mining
of Opinions,” Stud. Big Data, vol. 30, no. May, pp. 503–523, 2018, doi:
10.1007/978-3-319-60435-0_20.
[3] R. M. Djami, Heni M. Sauw, and Maria M.K. Tino, “Analisis Faktor-faktor
Pendorong Pembelian Baju Bekas „Rombengan‟ Melalui Media Sosial
(Facebook) di Kota,” J. Pendidik. Ilmu Pengetah. Sos., vol. 14, no. 2, pp.
293–297, 2022, doi: 10.37304/jpips.v14i2.7741.
[4] M. A. Rofiqi, A. C. Fauzan, A. P. Agustin, and A. A. Saputra,
“Implementasi Term-Frequency Inverse Document Frequency (TF-IDF)
Untuk Mencari Relevansi Dokumen Berdasarkan Query,” Ilk. J. Comput.
Sci. Appl. Informatics, vol. 1, no. 2, pp. 58–64, 2019, doi:
10.28926/ilkomnika.v1i2.18.
[5] P. Eko, P. Utomo, U. Khaira, T. Suratno, and U. Jambi, “Analisis Sentimen
Online Review Pengguna Bukalapak Menggunakan Metode Algoritma TF-
IDF,” J. Sains dan Sist. Inf., vol. 2, no. 2, pp. 35–39, 2019.
[6] P. Djodi, “Implementasi Algoritma Text Mining TF-IDF Untuk Fitur
Autoresponder,” vol. 10, no. 1, pp. 31–38, 2022.
[7] H. Sari, G. L. Ginting, and T. Zebua, “Penerapan Algoritma Text Mining
dan TF-IDF Untuk Pengelompokan Topik Skripsi Pada Aplikasi
Repository STMIK Budi Darma,” Terap. Inform. Nusant., vol. 2, no. 7, pp.
414–432, 2021.
[8] R. Siringoringo and J. Jamaludin, “Text Mining dan Klasterisasi Sentimen
Pada Ulasan Produk Toko Online,” J. Teknol. dan Ilmu Komput. Prima,
vol. 2, no. 1, pp. 41–48, 2019, doi: 10.34012/jutikomp.v2i1.456.
[9] V. Amrizal, “Penerapan Metode Term Frequency Inverse Document
13

Frequency (Tf-Idf) Dan Cosine Similarity Pada Sistem Temu Kembali


Informasi Untuk Mengetahui Syarah Hadits Berbasis Web (Studi Kasus:
Hadits Shahih Bukhari-Muslim),” J. Tek. Inform., vol. 11, no. 2, pp. 149–
164, 2018, doi: 10.15408/jti.v11i2.8623.
[10] F. N. Rozi and D. H. Sulistyawati, “Klasifikasi Berita Hoax Pilpres
Menggunakan Metode Modified K-Nearest Neighbor Dan Pembobotan
Menggunakan Tf-Idf,” Konvergensi, vol. 15, no. 1, 2019, doi:
10.30996/konv.v15i1.2828.
[11] Y. H. Kristian, K. R. Prilianti, and P. L. Tirma Irawan, “Implementasi Text
Mining Untuk Analisis Preferensi Masyarakat Terhadap Tempat Wisata Di
Indonesia,” J. Simantec, vol. 7, no. 2, pp. 72–81, 2019, doi:
10.21107/simantec.v7i2.6710.
[12] M. Nurjannah and I. Fitri Astuti, “PENERAPAN ALGORITMA TERM
FREQUENCY-INVERSE DOCUMENT FREQUENCY (TF-IDF)
UNTUK TEXT MINING Mahasiswa S1 Program Studi Ilmu Komputer
FMIPA Universitas Mulawarman Dosen Program Studi Ilmu Komputer
FMIPA Universitas Mulawarman,” J. Inform. Mulawarman, vol. 8, no. 3,
pp. 110–113, 2013.
[13] R. A. Sasmita and A. Z. Falani, “Pemanfaatan Algoritma TF/IDF pada
sistem Informasi Ecomplaint Handling,” J. Ilm. Lintas Sist. Inf. dan
Komput., vol. 27, no. 1, pp. 27–33, 2018, [Online]. Available:
https://jurnal.narotama.ac.id/index.php/link/article/view/1700
[14] B. Herwijayanti, D. E. Ratnawati, and L. Muflikhah, “Klasifikasi Berita
Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity,”
Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 1, pp. 306–312, 2018,
[Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-
ptiik/article/view/796
[15] C. Amalia and Y. Sibaroni, “Analisis Sentimen Data Tweet Menggunakan
Model Jaringan Saraf Tiruan Dengan Pembobotan Delta Tf-idf,”
eProceedings …, vol. 7, no. 2, pp. 7810–7820, 2020, [Online]. Available:
https://openlibrarypublications.telkomuniversity.ac.id/index.php/engineeri.

Anda mungkin juga menyukai