1, Mei 2018
ABSTRAK
Teknologi komunikasi dan informasi merupakan sektor yang paling pesat berkembang
di era digital saat ini. Hal tersebut tidak lepas dari kebutuhan mendasar manusia sebagai
makhluk sosial, dimana akses terhadap informasi dan keragaman bentuk dalam
berkomunikasi menjadi lahan basah bagi para penyedia layanan, salah satunya Twitter.
Layanan jejaring sosial Twitter menjadi wadah dalam menyampaikan berbagai macam
opini, termasuk kasus miras oplosan yang viral disampaikan para penggunanya selama
bulan April 2018. Penelitian ini bertujuan untuk menganalisi opini pengguna Twitter
terhadap kasus mira oplosan di bulan April 2018 tersebut menggunakan metode K-
means. Hasil dari penelitian ini menunjukan klaster paling optimum terbentuk sebanyak
tiga klaster berdasarkan nilai dunn index sebesar 0.8312. Dari ketiga klaster tersebut,
dapat diasumsikan opini pengguna Twitter dari tanggal 1 April 2018 hingga 23 April
2018 terhadap kasus miras oplosanmasih terpusat pada sosok pengedar miras oplosan,
pihak berwenang, dan korban.
Kata kunci : Text Mining, Klaster, K-means,Twitter
49
Statistika, Vol. 6, No. 1, Mei 2018
dengan sesama pengguna. Informasi- tinggi satu sama lainnya tetapi memiliki
informasi yang biasa dibagikan di tingkat ketidakmiripan yang tinggi
layanan jejaring sosial Twitter sangat dengan objek di klaster lain. Metode
beragam bentuknya. Salah satu bentuk clustering dibagi menjadi dua kelompok,
informasi antara lain adalah opini yaitu metode hierarki dan metode non-
terhadap suatu fenomena. Twitter hierarki [3]. Pada metode non-
menyediakan fitur hashtag (#), dimana hierarkijumlah klaster (k) sudah
fitur tersebut berfungsi untuk menjadikan ditentukan diawal pengelompokan.
suatu kata sebagai kata kunci dalam suatu Metode non-hierarkidapat diaplikasikan
opini dengan topik yang sama. Salah satu untuk set data yang sangat lebih besar
opini yang sedang ramai disampaikan jika dibandingkan dengan metode
selama bulan April 2018 melalui tweet hierarki. Menurut [4], teknik clustering
dan hashtag antara lain mengenai non-hierarkidirancang untuk
fenomena miras oplosan di Indonesia. mengelompokan item bukan variabel.
Banyaknya korban dan mulai Salah satu algoritma pada metode
terungkapnya bisnis miras oplosan di clutering non-hierarki yaitu K-means.
Indonesia, mengakibatkan layanan K-means merupakan salah satu
jejaring sosial Twitter menjadi wadah metode non-hierarkiyang paling sering
bagi para penggunanya untuk digunakan [4]. Pada metode ini sebuah
menyampaikan beragam opini dengan set data diklasifikasikan ke dalam
topik tersebut. Beragamnya opini pada beberapa klaster yang sudah ditentukan,
topik miras oplosan di layanan jejaring dimana klaster tersebut diasumsuikan
sosial Twitter selama April 2018,menjadi fix.K-means menggunakan centroid
suatu kumpulan data berupa teks yang sebagai pusat klasternya, centroid
dapat dianalisa lebih dalam melalui tersebut biasanya berupa nilai rata-rata.
pendekatan statistika. K-means membagi objek kedalam k
Dari kumpulan data teks berupa opini klaster, kemudian menempatkan objek
tersebut, salah satu informasi yang bisa kedalam klaster yang memiliki jarak
didapatkan adalah kata apa yang sering centroid terdekat. Setelah itu dilakukan
muncul pada kumpulan opini tersebut, perhitungan kembali nilai centroid yang
dan kata-kata tersebut dapat terbagi baru, dan dilakukan kembali penempatan
kedalam beberapa klaster. Oleh objek kedalam klaster yang memiliki
karenanya, pada penelitian ini peneliti jarak terekat dengan nilai centroid yang
bermaksud untuk mengaplikasikan Text baru. Proses tersebut terus dilakukan
Mining pada kumpulan data teks berupa sampai tidak ada centroid yang
opini pengguna layanan jejaring sosial berpindah. Pengukuran jarak dilakukan
Twitter terhadap miras oplosan selama untuk menunjukan kedekatan antara dua
bulan April 2018. Sedangkan tujuan buah objek. Pada penelitian ini, ukuran
dalam penelitian ini adalah mengetahui jarak yang akan digunakan adalah
kata-kata yang sering muncul, dan Euclidean distance, hal ini dikarenakan
mendapatkan klaster-klaster kata yang Euclidean distance merupakan
terbentuk berdasarkan kumpulan opini dissimilarity measure yang paling umum
pengguna Twitter terhadap miras oplosan digunakan untuk data yang berskala
selama bulan April 2018. interval atau rasio [6].
Analisis klaster atau clustering
merupakan suatu proses mengelompokan
data ke dalam sebuah kelas atau cluster,
dimana objek yang berada di dalam
klaster memiliki tingkat kemiripan yang
50
Statistika, Vol. 6, No. 1, Mei 2018
51
Statistika, Vol. 6, No. 1, Mei 2018
52
Statistika, Vol. 6, No. 1, Mei 2018
53
Statistika, Vol. 6, No. 1, Mei 2018
54
Statistika, Vol. 6, No. 1, Mei 2018
55