TESIS
SITI MASTUROH
14002167
TESIS
Diajukan sebagai salah satu syarat untuk memperoleh gelar Magister
Ilmu Komputer (M.Kom)
SITI MASTUROH
14002167
v
KATA PENGANTAR
Tujuan penulisan tesis ini dibuat sebagai salah satu untuk mendapatkan
gelar Ilmu Komputer (S2) (M.Kom) pada Program Studi Ilmu Komputer (S2)
Sekolah Tinggi Manajemen Informatika dan Komputer Nusa Mandiri.
1. Orang tua, aa dan adik tercinta yang telah memberikan dukungan moral
maupun spritual.
2. Ibu Dr. Dwiza Riana, S.Si, M.M, M.Kom, Selaku Ketua STMIK Nusa Mandiri
Jakarta.
3. Bapak Arif Hidayat, S.S, M.Hum, Selaku Plt. Wakil Ketua II Bidang Non
Akademik STMIK Nusa Mandiri Jakarta.
4. Bapak Dr. Hilman Ferdinandus Pardede, M.Eng selaku Ketua Program Studi
Magister Ilmu Komputer STMIK Nusa Mandiri Jakarta.
5. Bapak Dr. Lindung Parningotan Manik, M.T.I selaku Dosen Pembimbing
Tesis.
6. Bapak/ibu dosen STMIK Nusa Mandiri Jakarta yang telah memberikan
ilmu kepada Penulis selama menempuh pendidikan S2.
7. Julid, Siti Nurlela, Yulianti, Staf Waket II (Risca, Rangga dan Taopik), dan
Shofwan Zamzami yang selalu memberikan Semangat.
Serta semua pihak yang terlalu banyak untuk disebut satu persatu
sehingga terwujudnya penulisan ini. Penulis menyadari bahwa penulisan tesis ini
masih jauh sekali dari sempurna, untuk itu penulis mohon kritik dan saran yang
bersifat membangun demi kesempurnaan penulisan dimasa yang akan datang.
Akhir kata semoga tesis ini dapat berguna bagi penulis khususnya dan bagi
para pembaca yang berminat pada umumnya.
Siti Masturoh
Penulis
viii
DAFTAR GAMBAR
Halaman
Halaman
xiii
4.28. Hasil Review Pengguna OVO 5 Kelas Dengan Nilai K 300 .................. 54
4.29. Hasil Review Pengguna OVO 5 Kelas Dengan Nilai K 400 .................. 54
4.30. Hasil Review Pengguna OVO 5 Kelas Dengan Nilai K 500 .................. 54
4.31. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 1 ...................... 55
4.32. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 2 ...................... 55
4.33. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 3 ...................... 55
4.34. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 4 ...................... 56
4.35. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 5 ...................... 56
4.36. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 6 ...................... 56
4.37. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 7 ...................... 57
4.38. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 8 ...................... 57
4.39. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 9 ...................... 57
4.40. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 10 .................... 58
4.41. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 20 .................... 58
4.42. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 30 .................... 58
4.43. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 40 .................... 59
4.44. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 50 .................... 59
4.45. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 60 .................... 59
4.46. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 70 .................... 60
4.47. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 80 .................... 60
4.48. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 90 .................... 60
4.49. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 100 .................. 61
4.50. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 200 .................. 61
4.51. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 300 .................. 61
4.52. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 400 .................. 62
4.53. Hasil Review Pengguna OVO 2 Kelas Dengan Nilai K 500 .................. 62
4.54. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 1 ...................... 62
4.55. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 2 ...................... 63
4.56. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 3 ...................... 63
4.57. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 4 ...................... 63
4.58. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 5 ...................... 64
4.59. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 6 ...................... 64
4.60. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 7 ...................... 64
4.61. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 8 ...................... 65
4.62. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 9 ...................... 65
4.63. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 10 .................... 65
4.64. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 20 .................... 66
4.65. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 30 .................... 66
4.66. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 40 .................... 66
4.67. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 50 .................... 67
4.68. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 60 .................... 67
4.69. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 70 .................... 67
4.70. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 80 .................... 68
4.71. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 90 .................... 68
4.72. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 100 .................. 68
4.73. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 200 .................. 69
4.74. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 300 .................. 69
4.75. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 400 .................. 69
xiv
4.76. Hasil Review Pengguna OVO 3 Kelas Dengan Nilai K 500 .................. 70
4.77. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 1 ................... 70
4.78. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 2 ................... 71
4.79. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 3 ................... 71
4.80. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 4 ................... 71
4.81. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 5 ................... 72
4.82. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 6 ................... 72
4.83. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 7 ................... 73
4.84. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 8 ................... 73
4.85. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 9 ................... 73
4.86. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 10 ................. 74
4.87. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 20 ................. 74
4.88. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 30 ................. 75
4.89. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 40 ................. 75
4.90. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 50 ................. 75
4.91. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 60 ................. 76
4.92. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 70 ................. 76
4.93. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 80 ................. 76
4.94. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 90 ................. 77
4.95. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 100 ............... 77
4.96. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 200 ............... 78
4.97. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 300 ............... 78
4.98. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 400 ............... 78
4.99. Hasil Review Pengguna DANA 5 Kelas Dengan Nilai K 500 ............... 79
4.100. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 1 ................. 79
4.101. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 2 ................. 79
4.102. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 3 ................. 80
4.103. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 4 ................. 80
4.104. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 5 ................. 81
4.105. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 6 ................. 81
4.106. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 7 ................. 81
4.107. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 8 ................. 82
4.108. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 9 ................. 82
4.109. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 10 ............... 82
4.110. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 20 ............... 83
4.111. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 30 ............... 83
4.112. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 40 ............... 83
4.113. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 50 ............... 83
4.114. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 60 ............... 84
4.115. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 70 ............... 84
4.116. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 80 ............... 84
4.117. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 90 ............... 85
4.118. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 100 ............. 85
4.119. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 200 ............. 85
4.120. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 300 ............. 86
4.121. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 400 ............. 86
4.122. Hasil Review Pengguna DANA 2 Kelas Dengan Nilai K 500 ............. 86
4.123. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 1 ................. 87
xv
4.124. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 2 ................. 87
4.125. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 3 ................. 87
4.126. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 4 ................. 88
4.127. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 5 ................. 88
4.128. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 6 ................. 88
4.129. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 7 ................. 89
4.130. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 8 ................. 89
4.131. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 9 ................. 89
4.132. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 10 ............... 90
4.133. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 20 ............... 90
4.134. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 30 ............... 90
4.135. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 40 ............... 91
4.136. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 50 ............... 91
4.137. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 60 ............... 91
4.138. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 70 ............... 92
4.139. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 80 ............... 92
4.140. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 90 ............... 93
4.141. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 100 ............. 93
4.142. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 200 ............. 93
4.143. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 300 ............. 94
4.144. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 400 ............. 94
4.145. Hasil Review Pengguna DANA 3 Kelas Dengan Nilai K 500 ............. 94
4.146. Hasil Rangkuman Pengujian OVO .................................................... 95
4.147. Hasil Rangkuman Pengujian DANA .................................................. 96
xvi
DAFTAR ISI
Halaman
HALAMAN SAMPUL ............................................................................. i
HALAMAN JUDUL ............................................................................... ii
HALAMAN PERNYATAAN ORISINALITAS ..................................... iii
HALAMAN PENGESAHAN .................................................................. iv
HALAMAN LEMBAR KONSULTASI ................................................. v
KATA PENGANTAR ............................................................................. vi
HALAMAN PE RNYATAAN PERSETUJUAN PUBLIKASI KARYA
ILMIAH UNTUK KEPENTINGAN AKADEMIS ................................. viii
ABSTRAK. ............................................................................................... ix
ABSTRACT ............................................................................................. x
DAFTAR ISI ............................................................................................ xi
DAFTAR TABEL .................................................................................... xiii
DAFTAR GAMBAR. ............................................................................... xvii
xi
3.2. Pengumpulan Data Awal ............................................................ 32
3.3. Pengolahan Data Awal ............................................................... 32
3.4. Metode yang di Usulkan............................................................. 33
3.5. Eksperimen dan Hasil Pengujian ................................................ 34
3.6. Evaluasi dan Hasil Validasi ....................................................... 34
E-wallet atau dikenal juga dengan istilah dompet digital belakangan popularitasnya
makin menanjak, penetrasi pembayaran lewat mobile ini pun hampir menginjak
angka 30%, berdasarkan hasil studi dari lembaga riset independen FT Confidential
Research. Banyak orang mulai merasakan manfaat dompet digital seperti
menawarkan kepraktisan, efisiensi, keamanan, hingga promo dan diskon layaknya
kartu kredit. Dari beberapa produk E-Wallet peneliti mengambil studi kasus yaitu
produk OVO dan DANA dengan mengambil hasil ulasan pada Google Play. Ulasan
dari pengguna sering digunakan sebagai alat yang efektif dan efisien dalam
menemukan informasi terhadap suatu produk atau jasa. Para pengguna internet
biasanya akan melihat ulasan suatu produk terlebih dahulu sebelum menggunakan
suatu produk, karena review dari pengguna lain dapat menyediakan informasi
terbaru dari produk tersebut. Namun untuk memantau dan mengorganisir opini
masyarakat bukanlah hal yang mudah. Opini yang dimuat di media sosial
jumlahnya terlalu banyak untuk diproses secara manual. Oleh sebab itu peneliti
ingin mengetahui sejauh mana analisis review pengguna aplikasi E-Wallet
berdasarkan pemberian bintang (*) setelah menggunakan aplikasi tersebut. Metode
yang digunakan dalam penelitian ini menggunakan algoritma K-Nearest Neighbor
pada klasifikasi 3 kelompok kelas, kelas pertama terdiri dari lima kelas yaitu dari
rating 1 sampai dengan rating 5, kelas kedua terdiri dari dua kelas yaitu rating 1 dan
rating 5, terakhir kelas ketiga terdiri dari tiga kelas dengan mengelompokan rating
1 dan 2 sebagai status negatif, rating 3 netral dan rating 4 5 kedalam status positif,
dan mencari nilai accuray terbaik dari aplikasi E-Wallet OVO dan DANA, serta
mencari nilai k terbaik. Hasil dari penelitian ini dengan metode K-Neaarest
Neighbor dengan nilai k=1 pada OVO/DANA mendapatkan nilai akurasi yang
paling tinggi karena menghasilkan Accuracy pada OVO dengan menggunakan 2
kelas 84.86 % sedangkan pada DANA dengan menggunakan 2 kelas 86.64%.
Kata kunci:
E-Wallet, OVO dan DANA, Ulasan, K-Nearest Neighbor
E-wallet, also known as digital wallet, has recently gained popularity, the
penetration of payments via mobile has almost reached 30%, based on the results
of a study by an independent research institute, FT Confidential Research. Many
people are starting to feel the benefits of digital wallets such as offering
practicality, efficiency, security, to promos and discounts like a credit card. From
some E-Wallet products, researchers took case studies, namely OVO and DANA
products by taking the results of reviews on Google Play. User reviews are often
used as an effective and efficient tool in finding information about a product or
service. Internet users will usually see a product review first before using a product,
because reviews from other users can provide the latest information from the
product. But to monitor and organize public opinion is not easy. Opinions posted
on social media are too numerous to be processed manually. Therefore the
researcher wants to know the extent of the analysis of user reviews of the E-Wallet
application based on giving a star (*) after using the application. The method used
in this study uses the K-Nearest Neighbor algorithm in the classification of 3 class
groups, the first class consists of five classes, namely from rating 1 to rating 5, the
second class consists of two classes namely rating 1 and rating 5, finally the third
class consists of the three classes by classifying ratings 1 and 2 as negative status,
neutral 3 rating and rating 4 5 into positive status, and finding the best accuracy
value from the OVO and FUN E-Wallet application, and looking for the best k
value. The results of this study with the K-Neaarest Neighbor method with a value
of k = 1 on OVO / DANA get the highest accuracy value because it produces
Accuracy on OVO by using 2 classes 84.86% while in DANA using 2 classes
86.64%.
Keywords:
E-Wallet, OVO and DANA, Review, K-Nearest Neighbor
1
2
Ulasan dari pengguna sering digunakan sebagai alat yang efektif dan
efisien dalam menemukan informasi terhadap suatu produk atau jasa. Para
pengguna internet biasanya akan melihat ulasan suatu produk terlebih dahulu
sebelum menggunakan suatu produk, karena review dari pengguna lain dapat
menyediakan informasi terbaru dari produk tersebut. Namun untuk memantau
dan mengorganisir opini masyarakat bukanlah hal yang mudah. Opini yang
dimuat di media sosial jumlahnya terlalu banyak untuk diproses secara manual.
Oleh sebab itu peneliti ingin mengetahui sejauh mana analisis review pengguna
aplikasi E-Wallet berdasarkan pemberian bintang (*) setelah menggunakan
aplikasi tersebut.
Untuk penelitian ini fokus utamanya adalah analisa sentimen e-wallet
pengguna aplikasi OVO dan DANA yang ada di situs google play dimana untuk
pengambilan datanya pada 03 oktober 2019 – 03 desember 2019 (kurun waktu 2
bulan). Citra merek yang baik tentunya akan membentuk opini yang baik pula
dari konsumen tentang suatu produk/jasa, dan diharapkan akan mendorong
terjadinya proses penggunaan oleh konsumen, dan begitu sebaliknya. analisa
sentimen e-wallet pengguna OVO dan DANA bisa dipengaruhi oleh beberapa
hal yang belum menjadi perhatian baik dari pihak OVO dan DANA. Hal ini
mungkin terjadi karena adanya beberapa faktor yang harus diperbaiki dan belum
diketahui oleh pihak OVO dan DANA.
1.5 Hipotesis
Dalam penelitian ini, penulis mengambil hipotesis dalam proses analisis
sentimen e-wallet OVO dan DANA pada ulasan google play penyeleksian
perubahan signifikan hasil perhitungan dari nilai k pada Algoritma algoritma K-
nearest neighbor (KNN).
H0 = Penyeleksian perubahan signifikan hasil perhitungan antara 5 kelas, 2
kelas dan 3 kelas pada ulasan OVO dan DANA
H1 = Penyeleksian tidak ada perubahan signifikan hasil perhitungan antara 5
kelas, 2 kelas dan 3 kelas pada ulasan OVO dan DANA
BAB V PENUTUP
Membahas kesimpulan dan kekurangan penelitian, serta
kelebihan dari model yang digunakan.
1. Case Folding
Case Folding adalah mengubah semua huruf dalam dokumen menjadi huruf
kecil. Hanya huruf ‘a’ sampai dengan ‘z’ yang diterima. Karakter selain huruf
dihilangkan dan dianggap delimiter.
2. Tokenizing
Tokenizing yaitu proses penguraian deskripsi yang semula berupa kalimat-
kalimat menjadi kata-kata dan menghilangkan delimiter-delimiter seperti tanda
titik (.), koma (,), tanda kutip (“), tanda kurung (()), spasi dan karakter angka
yang ada pada kata tersebut.
3. Stopword removal atau Filtering
Tahap filtering adalah tahap mengambil kata-kata penting dari hasil token. Bisa
menggunakan algoritma stoplist (membuang kata yang kurang penting) atau
wordlist (menyimpan kata penting). Stoplist / stopword adalah kata-kata yang
tidak deskriptif yang dapat dibuang. Contoh stopword adalah “yang”, “dan”,
“di”, dan lain-lain.
2.1.5. Klasifikasi
Klasifikasi merupakan suatu proses yang bertujuan untuk menentukan suatu
obyek kedalam suatu kelas atau kategori yang sudah ditentukan sebelumnya.
Menurut (Susilowati et al. 2015) klasifikasi adalah proses dari pembangunan
terhadap suatu model yang mengklasifikan suatu objek sesuai dengan atribut-
atributnya. Klasifikasi data ataupun dokumen juga dapat dimulai dari membangun
aturan klasifikasi tertentu yang menggunakan data training yang sering disebut
sebagai tahapan pembelajaran dan pengujian digunakan sebagai data testing
(Raharjo and Winarko, 2014).
Klasifikasi adalah salah satu pembelajaran yang paling umum di data
mining. Klasifikasi didefinisikan sebagai bentuk analisis data untuk mengekstrak
model yang akan digunakan untuk memprediksi label kelas. Kelas dalam klasifikasi
merupakan atribut dalam satu set data yang paling unik yang merupakan variabel
bebas dalam statistik (Sartika and Indra, 2017).
Klasifikasi data terdiri dari dua proses yaitu tahap pembelajaran dan tahap
pengklasifikasian. Tahap pembelajaran merupakan tahapan dalam pembentukan
Keterangan:
𝐶𝑜𝑠𝑆𝑖𝑚(𝑞, 𝑑𝑗 ) : Nilai kemiripan antara dokumen (q) dengan dokumen latih ke j (
𝑑1 )
t : Jumlah term (kata)
d : dokumen
q : kata kunci (query)
𝑤𝑖𝑗 : Bobot term (kata) ke i pada dok.latih j
𝑤𝑖𝑞 : Bobot term (kata) ke i pada dok.uji q
2.1.8. RapidMiner
RapidMiner merupakan perangakat lunak yang bersifat terbuka (open
source). RapidMiner adalah sebuah solusi untuk melakukan analisis terhadap data
mining, text mining dan analisis prediksi. RapidMiner menggunakan berbagai
teknik deskriptif dan prediksi dalam memberikan wawasan kepada pengguna
sehingga dapat membuat keputusan yang paling baik. RapidMiner memiliki kurang
lebih 500 operator data mining, termasuk operator untuk input, output, data
preprocessing dan visualisasi. RapidMiner merupakan software yang berdiri sendiri
untuk analisis data dan sebagai mesin data mining yang dapat diintegrasikan pada
produknya sendiri. RapidMiner ditulis dengan munggunakan bahasa java sehingga
dapat bekerja di semua sistem operasi (C, 2013).
RapidMiner sebelumnya bernama YALE (Yet Another Learning
Environment), dimana versi awalnya mulai dikembangkan pada tahun 2001 oleh
RalfKlinkenberg, Ingo Mierswa, dan Simon Fischer di Artificial Intelligence Unit
dari University of Dortmund. RapidMiner didistribusikan di bawah lisensi AGPL
(GNU Affero General Public License) versi 3. Hingga saat ini telah ribuan aplikasi
Dengan menggunakan rumus dibawah ini akan di dapatkan akurasi dari matriks
yang mengukur tentang rasio kebenaran dari prediksi dari seluruh data yang
dievaluasi
𝑇𝑃+𝑇𝑁
(2.2)
𝑇𝑃+𝐹𝑁+𝑇𝑃+𝐹𝑁
Precission
Dengan menggunakan rumus dibawah akan mengukur pola positif yang
diprediksi dengan benar dari total pola yang diprediksi dikelas positif.
𝑇𝑃
(2.3)
𝑇𝑃+𝐹𝑃
Recall
Dengan menggunakan rumus dibawah akan mengukur fraksi positif yang
diklasifikasi dengan benar.
𝑇𝑃
(2.4)
𝑇𝑃+𝐹𝑁
Keterangan:
TP = jumlah true positive
TN = jumlah true negative
FP = jumlah false positive
FN = jumlah false negative
non-tunai aja, DANA juga bisa Anda gunakan untuk beli token listrik, beli pulsa,
kirim saldo sampai bayar BPJS. Dengan menggunakan aplikasi DANA pengguna
bisa mendapatkan banyak bonus seperti voucher dan cashback tak terduga dan tentu
saja menguntungkan.
terdapat struktur teks yang tidak baik. Untuk itu, dalam pengolahan data awal, text
mining harus melalui beberapa tahapan yang disebut dengan preprocessing.
Tahapan preprocessing yang dapat dilakukan, yaitu :
1. Tokenize
Tokenize merupakan proses untuk memisah-misahkan kata. Proses memotong
setiap kata dalam teks dan mengubah huruf dalam dokumen menjadi huruf kecil.
Hanya huruf yang diterima, sedangkan karakter khusus atau tanda baca akan
dihilangkan.
2. Indonesian Stemming
Proses untuk mencari kata dasar (root) dari tiap kata hasil dari proses filtering
yang terdapat dalam suatu dokumen. Pencarian root sebuah kata dapat
memperkecil hasil indeks tanpa harus menghilangkan makna
3. Transformation : Not (Negative)
Pada tahapan ini dilakukan untuk menghilangkan kata-kata ambigu seperti kata
tidak konsisten yang mengandung arti positif
4. Stopwords Removal
Proses menghilangkan kata-kata yang sering muncul namun tidak memiliki
pengaruh apapun dalam ekstraksi sentimen suatu review. Kata yang termasuk
seperti kata penunjuk waktu, kata tanya.
5. Filter Tokens (By Length)
Menurut Langgeni bahwa filter token (by length) merupakan proses mengambil
kata-kata penting dari hasil token. Dalam proses ini, kata-kata yang memiliki
panjang tertentu akan dihapus.
tinggi, namun KNN juga memiliki masalah pada penentuan parameter. Hal ini dapat
dilakukan dengan uji coba terhadap nilai parameter dan memilih nilai yang
menghasilkan akurasi terbaik. Untuk itu penulis melakukan klasifikasi
menggunakan algorima K-Nearest Neighbor (KNN).
4.1. Pembahasan
Data training yang digunakan pada saat pengujian data diambil dari ulasan
Pengujian data dilakukan dengan menggunakan opini public tentang aplikasi E-
Wallet OVO dan DANA. Data yang diambil sebanyak 1.000 data training, dengan
masing-masing 500 data untuk OVO dan DANA. Kemudian data tersebut
dilakukan training dataset sehingga didapatkan accuracy dan kappa. Dibawah ini
akan dijelaskan lebih rinci mengenai hasil penelitian yang di peroleh.
4.1.1. Klasifikasi Text menggunakan K-Nearest Neighbor (K-NN)
Berikut merupakan tahapan-tahapan dalam melakukan pengolahan data:
1. Pengumpulan Data
Review mengenai ulasan pada google play terhadap aplikasi E-Wallet OVO dan
DANA kemudian di kelompokan ke dalam 3 kelompok kelas, kelas pertama
terdiri dari 5 kelas yaitu rating 1 sampai dengan rating 5, kelas kedua terdiri
dari 2 kelas yaitu rating 1 dan 5, kelas ke tiga yaitu terdiri dari 3 kelas dengan
mengelompokan rating 1 dan 2 sebagai label negatif, rating 3 sebagai label
netral dan rating 4 dan 5 sebagai label positif.
2. Data Preprocessing
Tahap data preparation merupakan tahap dengan proses penyiapan data yang
bertujuan untuk mendapatkan data yang bersih dan siap untuk digunakan dalam
penelitian. Dalam text minning tahapan awal yang akan dilakukan adalah tahap
text preprocesing, pada tahap ini peneliti menggunakan tools Gata framework
dan Rapidminer. Berikut merupakan tahapan yang dilakukan dalam text
preprocessing :
a. Tokenization Regular Expression (Regexp)
Dalam proses tokenisasi ini, semua kata yang ada di dalam tiap dokumen
akan dikumpulkan dan dihilangkan tanda baca, serta dihilangkan juga
simbol, serta karakter khusus ataupun bukan huruf. Tabel 4.3. menunjukan
perbandingan teks sebelum dan sesudah dilakukannya proses Tokenization
Regexp.
b. Indonesian Stemming
Proses Indonesian Stemming adalah proses untuk mencari kata dasar (root)
dari tiap kata hasil dari proses filtering yang terdapat dalam suatu dokumen.
Pencarian root sebuah kata dapat memperkecil hasil indeks tanpa harus
menghilangkan makna. Tabel 4.2 menunjukan perbandingan teks sebelum
dan sesudah dilakukannya proses Indonesian Stemming.
Tabel 4.2. perbandingan teks sebelum dan sesudah dilakukannya proses
Indonesian Stemming.
Proses Indonesian Stemming
Data Sebelum Data Sesudah
susah kalau mau top up atau isi susah kalau mau top up atau isi
saldo hanya bisa melalui atm atau saldo hanya bisa lalu atm atau
mbanking promo yang disediakan mbanking promo yang sedia
kadang tidak dapat digunakan kadang tidak dapat guna cashback
cashback yang diberikan kadang yang beri kadang juga tidak sesuai
juga tidak sesuai nominalnya nominal komplain via email juga
komplain via email juga tidak tidak segera cari solusi atau tidak
segera dicarikan solusi atau tidak ada tindak lanjut
ada tindak lanjutnya
e. Tokenazation
Hasil dari indonesian stop word removal dilanjutkan oleh proses
tokenazation dari RapidMiner yaitu semua kata yang ada didalam tiap
dokumen dikumpulkan dan dihilangkan tanda baca, serta dihilangkan jika
terdapat simbol, karakter khusus atau apapun yang bukan huruf dan
memecah kalimat menjadi perkata. Tabel 4.6. menunjukan perbandingan
teks sebelum dan sesudah dilakukan proses tokenization pada rapidminer.
Tabel 4.6. Perbandingan teks sebelum dan sesudah dilakukan proses
tokenization pada rapidminer.
Proses Tokenization pada Rapidminer
Data Sebelum Data Sesudah
susah top up isi saldo hanya atm Susah
mbanking promo sedia kadang Top
tidak_dapat cashback kadang Up
tidak_sesuai nominal komplain via Saldo
email tidak_segera cari solusi Hanya
tidak_ada tindak Atm
Mbangking
Promo
Sedia
Kadang
Tidak_dapat
Cashback
Kadang
Tidak_sesuai
Nominal
Komplain
Via
Email
Tidak_segera
Cari
Solusi
Tidak_ada
Tindak
jika dipisahkan dengan kata yang lain dan tidak terkait dengan kata sifat
yang berhubungan dengan sentimen. Tabel 4.7. menunjukan perbandingan
teks sebelum dan sesudah dilakukan proses filter token by
Tabel 4.7. Perbandingan teks sebelum dan sesudah dilakukan proses filter
token by length
Proses Filter Token (by Length)
Data Sebelum Data Sesudah
Hanya Hanya
Atm Mbangking
Mbangking Promo
Promo Sedia
Sedia Kadang
Kadang Tidak_dapat
Tidak_dapat Cashback
Cashback Kadang
Kadang Tidak_sesuai
Tidak_sesuai Nominal
Nominal Komplain
Komplain Email
Via Tidak_segera
Email Cari
Tidak_segera Solusi
Cari Tidak_ada
Solusi Tindak
Tidak_ada
Tindak
baris kosong dan kolom kosong. Nilai data yang hilang di Excel harus
ditunjukkan oleh sel kosong atau oleh sel yang hanya berisi "?".
b. Sample Bootsrapping, Operator ini berbeda dari operator pengambilan sampel
lainnya karena menggunakan pengambilan sampel dengan penggantian. Dalam
pengambilan sampel dengan penggantian, pada setiap langkah semua contoh
memiliki probabilitas yang sama untuk dipilih. Setelah contoh dipilih untuk
sampel, sampel tetap menjadi kandidat untuk diseleksi dan dapat dipilih
kembali pada langkah selanjutnya yang akan datang. Jadi sampel dengan
penggantian dapat memiliki contoh yang sama beberapa kali. Lebih penting
lagi, sampel dengan penggantian dapat digunakan untuk menghasilkan sampel
yang ukurannya lebih besar dari ContohSet asli. Jumlah contoh dalam sampel
dapat ditentukan secara absolut atau relatif tergantung pada pengaturan
parameter sampel.
c. Multiply, mengambil Objek RapidMiner dari port input dan mengirimkan
salinannya ke port output. Setiap port yang terhubung membuat salinan
independen. Jadi mengubah satu salinan tidak berpengaruh pada salinan
lainnya.
d. Select Attributes, menyediakan berbagai jenis filter untuk mempermudah
pemilihan atribut. Kemungkinannya adalah misalnya: Pemilihan Atribut secara
langsung. Seleksi dengan ekspresi reguler atau hanya memilih Atribut tanpa
nilai yang hilang. Lihat tipe filter atribut atribut untuk deskripsi terperinci dari
berbagai jenis filter.
e. Set Role, setiap data yang ada terbagi menjadi beberapa baris data prediksi
sesuai posisi pada saat diambilnya data tersebut, masing-masing data prediksi
juga memiliki kolom atribut koordinat sesuai dengan kasus. Set Role berfungsi
untuk membedakan baris penamaan atribut koordinat dan prediksi posisi yang
akan di masukan kedalam kategori ‘label’ agar pada saat pengkategorian data
‘label’ tidak ikut serta terhitung dan merubah hasil.
f. Process Documents, merupakan pre processing pada RapidMiner
g. Remove Correlated Attributes, dapat digunakan untuk menghapus atribut
berkorelasi atau tidak berkorelasi tergantung pada pengaturan parameter
khususnya parameter hubungan filter.
Class
True 1 True 2 True 3 True 4 True 5
precision
Pred. 1 110 15 32 30 27 51.40%
Pred. 2 2 83 1 0 1 95.40%
Pred. 3 0 1 79 2 0 96.34%
Pred. 4 0 2 0 58 0 96.67%
Pred. 5 2 5 2 2 75 87.21%
Class
96.49% 78.30% 69.30% 63.04% 72.82%
Recall
2. Nilai k 2
Untuk hasil analisis review pengguna OVO dengan nilai k 1 sebagai berikut :
Accuracy : 53.50%
Kappa : 0.705 Kuat (Good)
Tabel 4.9. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 2
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 112 56 73 49 45 33.43%
Pred. 2 0 45 1 2 1 91.84%
Pred. 3 0 0 38 4 2 86.36%
Pred. 4 0 0 0 35 2 94.59%
Pred. 5 2 5 2 2 53 82.81%
Class
98.25% 42.45% 33.33% 38.04% 51.46%
Recall
3. Nilai k 3
Untuk hasil analisis review pengguna OVO dengan nilai k 3 sebagai berikut :
Accuracy : 46.88%
Kappa : 0.329 Lumayan (Fair)
Tabel 4.10. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 3
4. Nilai k 4
Untuk hasil analisis review pengguna OVO dengan nilai k 4 sebagai berikut :
Accuracy : 40.65%
Kappa : 0.249 Lumayan (Fair)
Tabel 4.11. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 4
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 113 56 83 52 62 30.87%
Pred. 2 0 29 0 2 3 85.29%
Pred. 3 0 0 19 4 3 73.08%
Pred. 4 0 2 1 19 0 86.36%
Pred. 5 1 19 11 15 35 43.21%
Class
99.12% 27.36% 16.67% 20.65% 33.98%
recall
5. Nilai k 5
Untuk hasil analisis review pengguna OVO dengan nilai k 5 sebagai berikut :
Accuracy : 41.78%
Kappa : 0.262 Lumayan (Fair)
Tabel 4.12. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 5
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 112 75 92 65 50 28.43%
Pred. 2 0 26 0 2 3 83.87%
Pred. 3 0 0 16 4 1 76.19%
Pred. 4 0 2 1 18 0 85.71%
Pred. 5 2 3 5 3 49 79.03%
Class
98.25% 24.53% 14.04% 19.57% 47.57%
recall
6. Nilai k 6
Untuk hasil analisis review pengguna OVO dengan nilai k 1 sebagai berikut :
Accuracy : 34.79%
Kappa : 0.172 Rendah (Poor)
Tabel 4.13. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 6
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 113 83 99 67 70 26.16%
Pred. 2 0 17 0 1 3 80.95%
Pred. 3 0 0 8 4 0 66.67%
Pred. 4 0 0 3 16 0 84.21%
Pred. 5 1 6 4 4 30 66.67%
Class
99.12% 16.04% 7.02% 17.39% 29.13%
Recall
7. Nilai k 7
Untuk hasil analisis review pengguna OVO dengan nilai k 7 sebagai berikut :
Accuracy : 34.40%
Kappa : 0.168 Rendah (Poor)
Tabel 4.14. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 7
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 110 85 101 70 64 25.58%
Pred. 2 0 14 0 0 3 82.35%
Pred. 3 0 0 7 3 0 70.00%
Pred. 4 2 0 4 15 0 71.43%
Pred. 5 2 7 2 4 36 70.59%
Class
96.49% 13.21% 6.14% 16.30% 34.95%
Recall
8. Nilai k 8
Untuk hasil analisis review pengguna OVO dengan nilai k 8 sebagai berikut :
Accuracy : 29.30%
Kappa : 0.102 Rendah (Poor)
Tabel 4.15. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 8
9. Nilai k 9
Untuk hasil analisis review pengguna OVO dengan nilai k 9 sebagai berikut :
Accuracy : 28.72%
Kappa : 0.094 Rendah (Poor)
Tabel 4.16. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 9
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 113 93 109 79 81 23.79%
Pred. 2 0 8 0 0 3 72.73%
Pred. 3 0 0 2 0 0 100.00%
Pred. 4 0 0 0 10 0 100.00%
Pred. 5 1 5 3 3 19 61.29%
Class
99.12% 7.55% 1.75% 10.87% 18.45%
recall
10. Nilai k 10
Untuk hasil analisis review pengguna OVO dengan nilai k 10 sebagai berikut :
Accuracy : 24.76%
Kappa : 0.043 Rendah (Poor)
Tabel 4.17. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 10
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 114 101 111 83 90 22.85%
Pred. 2 0 1 0 0 3 25.00%
Pred. 3 0 0 0 0 0 0.00%
Pred. 4 0 0 0 6 0 100.00%
Pred. 5 0 4 3 3 10 50.00%
Class
100.00% 0.94% 0.00% 6.52% 9.71%
Recall
11. Nilai k 20
Untuk hasil analisis review pengguna OVO dengan nilai k 20 sebagai berikut :
Accuracy : 21.55%
Kappa : 0.000 Rendah (Poor)
Tabel 4.18. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 20
12. Nilai k 30
Untuk hasil analisis review pengguna OVO dengan nilai k 30 sebagai berikut :
Accuracy : 21.55%
Kappa : 0.000 Rendah (Poor)
Tabel 4.19. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 30
Class
True 1 True 2 True 3 True 4 True 5
Precision
Pred. 1 114 106 114 92 103 21.55%
Pred. 2 0 0 0 0 0 0.00%
Pred. 3 0 0 0 0 0 0.00%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 0 0 0 0 0.00%
Class
100.00% 0.00% 0.00% 0.00% 0.00%
Recall
13. Nilai k 40
Untuk hasil analisis review pengguna OVO dengan nilai k 40 sebagai berikut :
Accuracy : 21.93%
Kappa : 0.005 Rendah (Poor)
Tabel 4.20. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 40
14. Nilai k 50
Untuk hasil analisis review pengguna OVO dengan nilai k 50 sebagai berikut :
Accuracy : 21.74%
Kappa : 0.003 Rendah (Poor)
Tabel 4.21. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 50
Class
True 1 True 2 True 3 True 4 True 5
precision
Pred. 1 114 106 114 90 102 21.67%
Pred. 2 0 0 0 0 0 0.00%
Pred. 3 0 0 0 0 0 0.00%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 0 0 2 1 33.33%
Class
100.00% 0.00% 0.00% 0.00% 0.97%
Recall
15. Nilai k 60
Untuk hasil analisis review pengguna OVO dengan nilai k 60 sebagai berikut :
Accuracy : 22.30%
Kappa : 0.010 Rendah (Poor)
Tabel 4.22. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 60
16. Nilai k 70
Untuk hasil analisis review pengguna OVO dengan nilai k 70 sebagai berikut :
Accuracy : 22.68%
Kappa : 0.015 Rendah (Poor)
Tabel 4.23. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 70
Class
True 1 True 2 True 3 True 4 True 5
precision
Pred. 1 114 102 113 88 97 22.18%
Pred. 2 0 0 0 0 0 0.00%
Pred. 3 0 0 0 0 0 0.00%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 4 1 4 6 40.00%
Class
100.00% 0.00% 0.00% 0.00% 5.83%
Recall
17. Nilai k 80
Untuk hasil analisis review pengguna OVO dengan nilai k 80 sebagai berikut :
Accuracy : 23.62%
Kappa : 0.027 Rendah (Poor)
Tabel 4.24. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 80
Class
True 1 True 2 True 3 True 4 True 5
precision
Pred. 1 114 103 110 87 92 22.53%
Pred. 2 0 0 0 0 0 0.00%
Pred. 3 0 0 0 0 0 0.00%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 3 4 5 11 47.83%
Class
100.00% 0.00% 0.00% 0.00% 10.68%
Recall
18. Nilai k 90
Untuk hasil analisis review pengguna OVO dengan nilai k 90 sebagai berikut :
Accuracy : 23.44%
Kappa : 0.025 Rendah (Poor)
Tabel 4.25. Hasil Review Pengguna OVO 5 Kelas dengan Nilai k 90
True 1 True 2 True 3 True 4 True 5 Class precision
Pred. 1 114 104 107 87 93 22.57%
Pred. 2 0 0 0 0 0 0.00%
Pred. 3 0 0 0 0 0 0.00%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 2 7 5 10 41.67%
Class Recall 100.00% 0.00% 0.00% 0.00% 9.71%
Class
True 1 True 2 True 3 True 4 True 5
precision
Pred. 1 95 84 87 74 76 22.84%
Pred. 2 0 0 0 0 0 0.00%
Pred. 3 19 21 27 18 27 24.11%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 1 0 0 0 0.00%
Class
83.33% 0.00% 23.68% 0.00% 0.00%
Recall
3. Nilai k 3
Untuk hasil analisis review pengguna OVO dengan nilai k 3 sebagai berikut :
Accuracy : 79.12%
Precision : 89.16%
Recall : 68.13%
AUC : 0.875
Tabel 4.33. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 3
True 1 True 5 Class Precision
Pred. 1 92 32 74.19%
Pred. 5 11 71 86.59%
Class Recall 89.32% 68.93%
4. Nilai k 4
Untuk hasil analisis review pengguna OVO dengan nilai k 4 sebagai berikut :
Accuracy : 71.33%
Precision : 97.83%
Recall : 42.73%
AUC : 0.860
Tabel 4.34. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 4
7. Nilai k 7
Untuk hasil analisis review pengguna OVO dengan nilai k 7 sebagai berikut :
Accuracy : 66.93%
Precision : 84.96%
Recall : 37.00%
AUC : 0.815
Tabel 4.37. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 7
True 1 True 5 Class Precision
Pred. 1 99 64 60.74%
Pred. 5 4 39 90.70%
Class Recall 96.12% 37.86%
8. Nilai k 8
Untuk hasil analisis review pengguna OVO dengan nilai k 8 sebagai berikut :
Accuracy : 60.17%
Precision : 82.17%
Recall : 23.82%
AUC : 0.788
Tabel 4.38. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 8
True 1 True 5 Class Precision
Pred. 1 99 78 55.93%
Pred. 5 4 25 86.21%
Class Recall 96.12% 24.27%
9. Nilai k 9
Untuk hasil analisis review pengguna OVO dengan nilai k 9 sebagai berikut :
Accuracy : 61.17%
Precision : 79.00%
Recall : 27.64%
AUC : 0.766
Tabel 4.39. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 9
10. Nilai k 10
Untuk hasil analisis review pengguna OVO dengan nilai k 10 sebagai berikut :
Accuracy : 58.76%
Precision : 95.00%
Recall : 18.27%
AUC : 0.760
Tabel 4.40. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 10
True 1 True 5 Class Precision
Pred. 1 102 84 54.84%
Pred. 5 1 19 95.00%
Class Recall 99.03% 18.45%
11. Nilai k 20
Untuk hasil analisis review pengguna OVO dengan nilai k 20 sebagai berikut :
Accuracy : 52.45%
Precision : 85.71%
Recall : 5.91%
AUC : 0.831
Tabel 4.41. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 20
True 1 True 5 Class Precision
Pred. 1 102 97 51.26%
Pred. 5 1 6 85.71%
Class Recall 99.03% 5.83%
12. Nilai k 30
Untuk hasil analisis review pengguna OVO dengan nilai k 30 sebagai berikut :
Accuracy : 51.50%
Precision : 100.00%
Recall : 2.91%
AUC : 0.796
Tabel 4.42. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 30
True 1 True 5 Class Precision
Pred. 1 103 100 50.74%
Pred. 5 0 3 100.00%
Class Recall 100.00% 2.91%
13. Nilai k 40
Untuk hasil analisis review pengguna OVO dengan nilai k 40 sebagai berikut :
Accuracy : 52.93%
Precision : 100.00%
Recall : 5.93%
AUC : 0.820
Tabel 4.43. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 40
True 1 True 5 Class Precision
Pred. 1 103 97 51.50%
Pred. 5 0 6 100.00%
Class Recall 100.00% 5.83%
14. Nilai k 50
Untuk hasil analisis review pengguna OVO dengan nilai k 50 sebagai berikut :
Accuracy : 57.76%
Precision : 100.00%
Recall : 15.55%
AUC : 0.755
Tabel 4.44. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 50
True 1 True 5 Class Precision
Pred. 1 103 87 54.21%
Pred. 5 0 16 100.00%
Class Recall 100.00% 15.53%
15. Nilai k 60
Untuk hasil analisis review pengguna OVO dengan nilai k 60 sebagai berikut :
Accuracy : 56.90%
Precision : 69.44%
Recall : 24.79%
AUC : 0.705
Tabel 4.45. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 60
True 1 True 5 Class Precision
Pred. 1 92 78 54.12%
Pred. 5 11 25 69.44%
Class Recall 89.32% 24.27%
16. Nilai k 70
Untuk hasil analisis review pengguna OVO dengan nilai k 70 sebagai berikut :
Accuracy : 56.45%
Precision : 66.67%
Recall : 25.77%
AUC : 0.688
Tabel 4.46. Hasil Review Pengguna OVO 2 Kelas dengan Nilai k 70
2. Nilai k 2
Untuk hasil analisis review pengguna OVO dengan nilai k 1 sebagai berikut :
Accuracy : 73.32%
Kappa : 0.599 Cukup (Moderate)
Tabel 4.55. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 2
True True True Class
Negative Netral Positif Precision
Pred.
133 14 26 76.88%
Negative
Pred. Netral 22 174 50 70.73%
Pred. Positif 36 7 119 73.46%
Class Recall 69.63% 89.23% 61.03%
3. Nilai k 3
Untuk hasil analisis review pengguna OVO dengan nilai k 3 sebagai berikut :
Accuracy : 72.63%
Kappa : 0.588 Cukup (Moderate)
Tabel 4.56. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 3
True Negative True Netral True Positif Class Precision
Pred. Negative 96 12 26 71.64%
Pred. Netral 16 169 12 85.79%
Pred. Positif 79 14 157 62.80%
Class Recall 50.26% 86.67% 80.51%
4. Nilai k 4
Untuk hasil analisis review pengguna OVO dengan nilai k 4 sebagai berikut :
Accuracy : 71.26%
Kappa : 0.568 Cukup (Moderate)
Tabel 4.57. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 4
True Negative True Netral True Positif Class Precision
Pred. Negative 138 26 55 63.01%
Pred. Netral 25 161 25 76.30%
Pred. Positif 28 8 115 76.16%
Class Recall 72.25% 82.56% 58.97%
5. Nilai k 5
Untuk hasil analisis review pengguna OVO dengan nilai k 5 sebagai berikut :
Accuracy : 72.12%
Kappa : 0.581 Cukup (Moderate)
Tabel 4.58. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 5
True Negative True Netral True Positif Class Precision
Pred. Negative 147 24 58 64.19%
Pred. Netral 25 161 26 75.94%
Pred. Positif 19 10 111 79.29%
Class Recall 76.96% 82.56% 56.92%
6. Nilai k 6
Untuk hasil analisis review pengguna OVO dengan nilai k 6 sebagai berikut :
Accuracy : 71.08%
Kappa : 0.566 Cukup (Moderate)
Tabel 4.59. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 6
True Negative True Netral True Positif Class Precision
Pred. Negative 140 31 39 66.67%
Pred. Netral 17 149 32 75.25%
Pred. Positif 34 15 124 71.68%
Class Recall 73.30% 76.41% 63.59%
7. Nilai k 7
Untuk hasil analisis review pengguna OVO dengan nilai k 7 sebagai berikut :
Accuracy : 71.25%
Kappa : 0.568 Cukup (Moderate)
Tabel 4.60. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 7
True True
True Negative Class Precision
Netral Positif
Pred.
115 7 16 83.33%
Negative
Pred. Netral 32 167 47 67.89%
Pred. Positif 44 21 132 67.01%
Class Recall 60.21% 85.64% 67.69%
8. Nilai k 8
Untuk hasil analisis review pengguna OVO dengan nilai k 8 sebagai berikut :
Accuracy : 67.46%
Kappa : 0.511 Cukup (Moderate)
Tabel 4.61. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 8
True True True Class
Negative Netral Positif Precision
Pred.
116 7 19 81.69%
Negative
Pred. Netral 53 177 77 57.65%
Pred. Positif 22 11 99 75.00%
Class Recall 60.73% 90.77% 50.77%
9. Nilai k 9
Untuk hasil analisis review pengguna OVO dengan nilai k 9 sebagai berikut :
Accuracy : 69.52%
Kappa : 0.542 Cukup (Moderate)
Tabel 4.62. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 9
True True Class
True Negative
Netral Positif Precision
Pred.
121 9 16 82.88%
Negative
Pred. Netral 49 173 69 59.45%
Pred. Positif 21 13 110 76.39%
Class Recall 63.35% 88.72% 56.41%
10. Nilai k 10
Untuk hasil analisis review pengguna OVO dengan nilai k 10 sebagai berikut :
Accuracy : 58.35%
Kappa : 0.373 Lumayan (Fair)
Tabel 4.63. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 10
True Negative True Netral True Positif Class Precision
Pred. Negative 77 6 6 86.52%
Pred. Netral 87 182 109 48.15%
Pred. Positif 27 7 80 70.18%
Class Recall 40.31% 93.33% 41.03%
11. Nilai k 20
Untuk hasil analisis review pengguna OVO dengan nilai k 20 sebagai berikut :
Accuracy : 41.99%
Kappa : 0.126 Rendah (Poor)
Tabel 4.64. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 20
True True Class
True Negative
Netral Positif Precision
Pred.
19 1 4 79.17%
Negative
Pred. Netral 155 192 158 38.02%
Pred. Positif 17 2 33 63.46%
Class Recall 9.95% 98.46% 16.92%
12. Nilai k 30
Untuk hasil analisis review pengguna OVO dengan nilai k 30 sebagai berikut :
Accuracy : 36.14%
Kappa : 0.039 Rendah (Poor)
Tabel 4.65. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 30
True True True Class
Negative Netral Positif Precision
Pred.
4 1 2 57.14%
Negative
Pred. Netral 177 194 181 35.14%
Pred. Positif 10 0 12 54.55%
Class Recall 2.09% 99.49% 6.15%
13. Nilai k 40
Untuk hasil analisis review pengguna OVO dengan nilai k 40 sebagai berikut :
Accuracy : 34.76%
Kappa : 0.018 Rendah (Poor)
Tabel 4.66. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 40
True Negative True Netral True Positif Class Precision
Pred. Negative 0 0 1 0.00%
Pred. Netral 187 195 187 34.27%
Pred. Positif 4 0 7 63.64%
Class Recall 0.00% 100.00% 3.59%
14. Nilai k 50
Untuk hasil analisis review pengguna OVO dengan nilai k 50 sebagai berikut :
Accuracy : 35.79%
Kappa : 0.033 Rendah (Poor)
Tabel 4.67. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 50
True True True Class
Negative Netral Positif Precision
Pred.
0 0 1 0.00%
Negative
Pred. Netral 190 195 181 34.45%
Pred. Positif 1 0 13 92.86%
Class Recall 0.00% 100.00% 6.67%
15. Nilai k 60
Untuk hasil analisis review pengguna OVO dengan nilai k 60 sebagai berikut :
Accuracy : 35.28%
Kappa : 0.026 Rendah (Poor)
Tabel 4.68. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 60
True True Class
True Negative
Netral Positif Precision
Pred.
0 0 1 0.00%
Negative
Pred. Netral 188 195 184 34.39%
Pred. Positif 3 0 10 76.92%
Class Recall 0.00% 100.00% 5.13%
16. Nilai k 70
Untuk hasil analisis review pengguna OVO dengan nilai k 70 sebagai berikut :
Accuracy : 35.11%
Kappa : 0.023 Rendah (Poor)
Tabel 4.69. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 70
True Negative True Netral True Positif Class Precision
Pred. Negative 0 0 0 0.00%
Pred. Netral 191 194 185 34.04%
Pred. Positif 0 1 10 90.91%
Class Recall 0.00% 99.49% 5.13%
17. Nilai k 80
Untuk hasil analisis review pengguna OVO dengan nilai k 80 sebagai berikut :
Accuracy : 34.59%
Kappa : 0.016 Rendah (Poor)
Tabel 4.70. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 80
True True Class
True Negative
Netral Positif Precision
Pred.
0 0 0 0.00%
Negative
Pred. Netral 189 194 188 33.98%
Pred. Positif 2 1 7 70.00%
Class Recall 0.00% 99.49% 3.59%
18. Nilai k 90
Untuk hasil analisis review pengguna OVO dengan nilai k 90 sebagai berikut :
Accuracy : 33.73%
Kappa : 0.003 Rendah (Poor)
Tabel 4.71. Hasil Review Pengguna OVO 3 Kelas dengan Nilai k 90
True True True Class
Negative Netral Positif Precision
Pred.
0 0 0 0.00%
Negative
Pred. Netral 191 195 194 33.62%
Pred. Positif 0 0 1 100.00%
Class Recall 0.00% 100.00% 0.51%
2. Nilai k 2
Untuk hasil analisis review pengguna dengan nilai k 1 sebagai berikut :
Accuracy : 54.82%
Kappa : 0.428 Kuat (Good)
Tabel 4.78. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 2
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 94 10 9 4 13 72.31%
Pred. 3 17 101 59 52 58 35.19%
Pred. 4 1 0 22 0 0 95.65%
Pred. 5 2 2 2 48 9 76.19%
Pred. 2 0 1 0 0 25 96.15%
Class
82.46% 88.60% 23.91% 46.15% 23.81%
Recall
3. Nilai k 3
Untuk hasil analisis review pengguna DANA dengan nilai k 3 sebagai berikut :
Accuracy : 57.08%
Kappa : 0.459 Cukup (Moderate)
Tabel 4.79. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 3
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 93 11 16 8 21 62.42%
Pred. 3 8 79 33 13 38 46.20%
Pred. 4 0 0 20 2 0 90.91%
Pred. 5 12 18 20 81 17 54.73%
Pred. 2 1 6 3 0 29 74.36%
Class
81.58% 69.30% 21.74% 77.88% 27.62%
Recall
4. Nilai k 4
Untuk hasil analisis review pengguna DANA dengan nilai k 4 sebagai berikut :
Accuracy : 52.37%
Kappa : 0.401 Cukup (Moderate)
Tabel 4.80. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 4
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 77 11 10 4 22 62.10%
Pred. 3 6 74 14 15 18 58.27%
Pred. 4 1 0 21 2 0 87.50%
Pred. 5 27 25 43 82 42 37.44%
Pred. 2 3 4 4 1 23 65.71%
Class
67.54% 64.91% 22.83% 78.85% 21.90%
Recall
5. Nilai k 5
Untuk hasil analisis review pengguna DANA dengan nilai k 5 sebagai berikut :
Accuracy : 48.20%
Kappa : 0.349 Lumayan (Fair)
Tabel 4.81 Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 5
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 81 16 11 6 17 61.83%
Pred. 3 6 53 14 9 18 53.00%
Pred. 4 0 0 18 3 0 85.71%
Pred. 5 25 43 45 85 52 34.00%
Pred. 2 2 2 4 1 18 66.67%
Class
71.05% 46.49% 19.57% 81.73% 17.14%
Recall
6. Nilai k 6
Untuk hasil analisis review pengguna DANA dengan nilai k 1 sebagai berikut :
Accuracy : 44.22%
Kappa : 0.300 Lumayan (Fair)
Tabel 4.82 Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 6
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 69 12 8 8 22 57.98%
Pred. 3 5 47 14 7 16 52.81%
Pred. 4 0 0 16 1 0 94.12%
Pred. 5 39 54 51 87 52 30.74%
Pred. 2 1 1 3 1 15 71.43%
Class
60.53% 41.23% 17.39% 83.65% 14.29%
Recall
7. Nilai k 7
Untuk hasil analisis review pengguna DANA dengan nilai k 7 sebagai berikut :
Accuracy : 41.77%
Kappa : 0.270 Lumayan (Fair)
Tabel 4.83 Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 7
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 75 19 17 9 24 52.08%
Pred. 3 2 35 8 9 12 53.03%
Pred. 4 0 0 14 1 1 87.50%
Pred. 5 36 58 53 84 55 29.37%
Pred. 2 1 2 0 1 13 76.47%
Class
65.79% 30.70% 15.22% 80.77% 12.38%
Recall
8. Nilai k 8
Untuk hasil analisis review pengguna DANA dengan nilai k 8 sebagai berikut :
Accuracy : 38.75%
Kappa : 0.231 Lumayan (Fair)
Tabel 4.84. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 8
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 71 22 18 10 28 47.65%
Pred. 3 2 32 10 9 12 49.23%
Pred. 4 0 0 10 0 0 100.00%
Pred. 5 40 57 54 81 54 28.32%
Pred. 2 1 3 0 4 11 57.89%
Class
62.28% 28.07% 10.87% 77.88% 10.48%
Recall
9. Nilai k 9
Untuk hasil analisis review pengguna DANA dengan nilai k 9 sebagai berikut :
Accuracy : 39.12%
Kappa : 0.236 Lumayan (Fair)
Tabel 4.85. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 9
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 76 24 24 11 30 46.06%
Pred. 3 2 27 11 9 12 44.26%
Pred. 4 0 0 10 0 0 100.00%
Pred. 5 35 59 47 82 51 29.93%
Pred. 2 1 4 0 2 12 63.16%
Class
66.67% 23.68% 10.87% 78.85% 11.43%
Recall
10. Nilai k 10
Untuk hasil analisis review pengguna DANA dengan nilai k 10 sebagai berikut:
Accuracy : 39.13%
Kappa : 0.235 Lumayan (Fair)
Tabel 4.86. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 10
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 76 30 27 16 38 40.64%
Pred. 3 2 26 11 8 14 42.62%
Pred. 4 0 0 9 0 1 90.00%
Pred. 5 31 56 44 78 34 32.10%
Pred. 2 5 2 1 2 18 64.29%
Class
66.67% 22.81% 9.78% 75.00% 17.14%
Recall
11. Nilai k 20
Untuk hasil analisis review pengguna DANA dengan nilai k 20 sebagai berikut:
Accuracy : 31.58%
Kappa : 0.131 Rendah (Poor)
Tabel 4.87. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 20
True True True Class
True 1 True 5
3 4 2 Precision
Pred. 1 111 95 69 57 89 26.37%
Pred. 3 0 11 9 4 8 34.38%
Pred. 4 0 0 2 0 0 100.00%
Pred. 5 0 3 10 41 6 68.33%
Pred. 2 3 5 2 2 2 14.29%
Class Recall 97.37% 9.65% 2.17% 39.42% 1.90%
12. Nilai k 30
Untuk hasil analisis review pengguna DANA dengan nilai k 30 sebagai berikut:
Accuracy : 27.04%
Kappa : 0.072 Rendah (Poor)
Tabel 4.88. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 30
13. Nilai k 40
Untuk hasil analisis review pengguna DANA dengan nilai k 40 sebagai berikut:
Accuracy : 25.52%
Kappa : 0.052 Rendah (Poor)
Tabel 4.89. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 40
True True True Class
True 1 True 5
3 4 2 Precision
Pred. 1 113 106 85 82 102 23.16%
Pred. 3 0 3 4 3 1 27.27%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 2 3 19 2 73.08%
Pred. 2 1 3 0 0 0 0.00%
Class Recall 99.12% 2.63% 0.00% 18.27% 0.00%
14. Nilai k 50
Untuk hasil analisis review pengguna DANA dengan nilai k 50 sebagai berikut:
Accuracy : 25.34%
Kappa : 0.050 Rendah (Poor)
Tabel 4.90. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 50
True 1 True 3 True 4 True 5 True 2 Class Precision
Pred. 1 113 107 86 82 98 23.25%
Pred. 3 1 3 4 5 4 17.65%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 1 2 17 2 77.27%
Pred. 2 0 3 0 0 1 25.00%
15. Nilai k 60
Untuk hasil analisis review pengguna DANA dengan nilai k 60 sebagai berikut:
Accuracy : 28.36%
16. Nilai k 70
Untuk hasil analisis review pengguna DANA dengan nilai k 70 sebagai berikut:
Accuracy : 27.04%
Kappa : 0.071 Rendah (Poor)
Tabel 4.92 Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 70
True 1 True 3 True 4 True 5 True 2 Class Precision
Pred. 1 109 96 73 73 82 25.17%
Pred. 3 5 13 13 9 19 22.03%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 1 4 19 2 73.08%
Pred. 2 0 4 2 3 2 18.18%
Class Recall 95.61% 11.40% 0.00% 18.27% 1.90%
17. Nilai k 80
Untuk hasil analisis review pengguna DANA dengan nilai k 80 sebagai berikut:
Accuracy : 29.31%
Kappa : 0.100 Rendah (Poor)
Tabel 4.93 Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 80
True 1 True 3 True 4 True 5 True 2 Class Precision
Pred. 1 112 88 76 79 87 25.34%
Pred. 3 1 23 12 8 13 40.35%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 0 4 15 0 78.95%
Pred. 2 1 3 0 2 5 45.45%
Class Recall 98.25% 20.18% 0.00% 14.42% 4.76%
18. Nilai k 90
Untuk hasil analisis review pengguna DANA dengan nilai k 90 sebagai berikut:
Accuracy : 27.23%
Kappa : 0.073 Rendah (Poor)
Tabel 4.94. Hasil Review Pengguna DANA 5 Kelas dengan Nilai k 90
True Class
True 1 True 3 True 4 True 2
5 Precision
Pred. 1 111 91 71 84 91 24.78%
Pred. 3 3 20 17 9 11 33.33%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 0 3 10 0 76.92%
Pred. 2 0 3 1 1 3 37.50%
Class
97.37% 17.54% 0.00% 9.62% 2.86%
Recall
Class
True 1 True 3 True 4 True 5 True 2
Precision
Pred. 1 106 93 66 69 82 25.48%
Pred. 3 8 21 26 19 23 21.65%
Pred. 4 0 0 0 0 0 0.00%
Pred. 5 0 0 0 16 0 100.00%
Pred. 2 0 0 0 0 0 0.00%
Class
92.98% 18.42% 0.00% 15.38% 0.00%
Recall
2. Nilai k 2
Untuk hasil analisis review pengguna DANA dengan nilai k 1 sebagai berikut :
Accuracy : 77.98%
Precision : 92.33%
Recall : 62.96%
AUC : 0.851
Tabel 4.101. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 2
3. Nilai k 3
Untuk hasil analisis review pengguna DANA dengan nilai k 3 sebagai berikut :
Accuracy : 82.31%
Precision : 78.90%
Recall : 92.64%
AUC : 0.893
Tabel 4.102. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 3
True 1 True 5 Class Precision
Pred. 1 75 8 90.36%
Pred. 5 29 96 76.80%
Class Recall 72.12% 92.31%
4. Nilai k 4
Untuk hasil analisis review pengguna DANA dengan nilai k 4 sebagai berikut :
Accuracy : 81.36%
Precision : 96.67%
Recall : 65.69%
AUC : 0.896
Tabel 4.103. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 4
True 1 True 5 Class Precision
Pred. 1 101 36 73.72%
Pred. 5 3 68 95.77%
Class Recall 97.12% 65.38%
5. Nilai k 5
Untuk hasil analisis review pengguna DANA dengan nilai k 5 sebagai berikut :
Accuracy : 80.83%
Precision : 86.16%
Recall : 75.34%
AUC : 0.871
Tabel 4.104. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 5
6. Nilai k 6
Untuk hasil analisis review pengguna DANA dengan nilai k 1 sebagai berikut :
Accuracy : 0.871
Precision : 92.99%
Recall : 58.85%
AUC : 0.869
Tabel 4.105. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 6
True 1 True 5 Class Precision
Pred. 1 98 43 69.50%
Pred. 5 6 61 91.04%
Class Recall 94.23% 58.65%
7. Nilai k 7
Untuk hasil analisis review pengguna DANA dengan nilai k 7 sebagai berikut :
Accuracy : 78.48%
Precision : 87.03%
Recall : 68.60%
AUC : 0.887
Tabel 4.106. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 7
True 1 True 5 Class Precision
Pred. 1 92 33 73.60%
Pred. 5 12 71 85.54%
Class Recall 88.46% 68.27%
8. Nilai k 8
Untuk hasil analisis review pengguna DANA dengan nilai k 8 sebagai berikut :
Accuracy : 75.62%
Precision : 94.50%
Recall : 55.12%
AUC : 0.885
Tabel 4.107. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 8
10. Nilai k 10
Untuk hasil analisis review pengguna DANA dengan nilai k 10 sebagai berikut:
Accuracy : 76.57%
Precision : 98.75%
Recall : 54.12%
AUC : 0.883
Tabel 4.109. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 10
True 1 True 5 Class Precision
Pred. 1 103 48 68.21%
Pred. 5 1 56 98.25%
Class Recall 99.04% 53.85%
11. Nilai k 20
Untuk hasil analisis review pengguna DANA dengan nilai k 20 sebagai berikut:
Accuracy : 65.00%
Precision : 91.89%
Recall : 32.86%
AUC : 0.888
Tabel 4.110 Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 20
12. Nilai k 30
Untuk hasil analisis review pengguna DANA dengan nilai k 30 sebagai berikut:
Accuracy : 66.90%
Precision : 100.00%
Recall : 33.59%
AUC : 0.931
Tabel 4.111. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 30
True 1 True 5 Class Precision
Pred. 1 101 70 59.06%
Pred. 5 3 34 91.89%
Class Recall 97.12% 32.69%
13. Nilai k 40
Untuk hasil analisis review pengguna DANA dengan nilai k 40 sebagai berikut:
Accuracy : 61.67%
Precision : 100.00%
Recall : 23.33%
AUC : 0.892
Tabel 4.112. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 40
True 1 True 5 Class Precision
Pred. 1 104 80 56.52%
Pred. 5 0 24 100.00%
Class Recall 100.00% 23.08%
14. Nilai k 50
Untuk hasil analisis review pengguna DANA dengan nilai k 50 sebagai berikut:
Accuracy : 60.71%
Precision : 100.00%
Recall : 21.42%
AUC : 0.904
Tabel 4.113. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 50
15. Nilai k 60
Untuk hasil analisis review pengguna DANA dengan nilai k 60 sebagai berikut:
Accuracy : 60.71%
Precision : 100.00%
Recall : 21.31%
AUC : 0.912
Tabel 4.114. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 60
True 1 True 5 Class Precision
Pred. 1 104 82 55.91%
Pred. 5 0 22 100.00%
Class Recall 100.00% 21.15%
16. Nilai k 70
Untuk hasil analisis review pengguna DANA dengan nilai k 70 sebagai berikut:
Accuracy : 55.86%
Precision : 100.00%
Recall : 11.57%
AUC : 0.910
Tabel 4.115. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 70
True 1 True 5 Class Precision
Pred. 1 104 92 53.06%
Pred. 5 0 12 100.00%
Class Recall 100.00% 11.54%
17. Nilai k 80
Untuk hasil analisis review pengguna DANA dengan nilai k 80 sebagai berikut:
Accuracy : 54.90%
Precision : 100.00%
Recall : 9.55%
AUC : 0.936
Tabel 4.416. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 80
True
True 1 Class Precision
5
Pred. 1 104 94 52.53%
Pred. 5 0 10 100.00%
Class Recall 100.00% 9.62%
18. Nilai k 90
Untuk hasil analisis review pengguna DANA dengan nilai k 90 sebagai berikut:
Accuracy : 54.43%
Precision : 100.00%
Recall : 8.73%
AUC : 0.886
Tabel 4.117. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 90
True 1 True 5 Class Precision
Pred. 1 104 95 52.26%
Pred. 5 0 9 100.00%
Class Recall 100.00% 8.65%
19. Nilai k 100
Untuk hasil analisis review pengguna DANA dengan nilai k 100 sebagai berikut:
Accuracy : 55.38%
Precision : 100.00%
Recall : 10.55%
AUC : 0.909
Tabel 4.118. Hasil Review Pengguna DANA 2 Kelas dengan Nilai k 100
True 1 True 5 Class Precision
Pred. 1 104 93 52.79%
Pred. 5 0 11 100.00%
Class Recall 100.00% 10.58%
2. Nilai k 2
Untuk hasil analisis review pengguna DANA dengan nilai k 1 sebagai berikut :
Accuracy : 65.82%
Kappa : 0.486 Cukup (Moderate)
Tabel 4.124. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 2
True Negative True Netral True Positif Class Precision
Pred.
126 0 3 97.67%
Negative
Pred. Netral 63 196 132 50.13%
Pred. Positif 1 0 61 98.39%
Class Recall 66.32% 100.00% 31.12%
3. Nilai k 3
Untuk hasil analisis review pengguna DANA dengan nilai k 3 sebagai berikut :
Accuracy : 57.05%
Kappa : 0.353 Lumayan (Fair)
Tabel 4.125. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 3
4. Nilai k 4
Untuk hasil analisis review pengguna DANA dengan nilai k 4 sebagai berikut :
Accuracy : 48.98%
Kappa : 0.232 Lumayan (Fair)
Tabel 4.126. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 4
True Negative True Netral True Positif Class Precision
Pred.
55 4 2 90.16%
Negative
Pred. Netral 133 192 156 39.92%
Pred. Positif 2 0 38 95.00%
Class Recall 28.95% 97.96% 19.39%
5. Nilai k 5
Untuk hasil analisis review pengguna DANA dengan nilai k 5 sebagai berikut :
Accuracy : 46.91%
Kappa : 0.200 Lumayan (Fair)
Tabel 4.127. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 5
True Negative True Netral True Positif Class Precision
Pred. Negative 30 2 1 90.91%
Pred. Netral 154 194 146 39.27%
Pred. Positif 6 0 49 89.09%
Class Recall 15.79% 98.98% 25.00%
6. Nilai k 6
Untuk hasil analisis review pengguna DANA dengan nilai k 6 sebagai berikut :
Accuracy : 44.67%
Kappa : 0.166 Rendah (Poor)
Tabel 4.128. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 6
7. Nilai k 7
Untuk hasil analisis review pengguna DANA dengan nilai k 7 sebagai berikut :
Accuracy : 4.16%
Kappa : 0.158 Rendah (Poor)
Tabel 4.129. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 7
True Negative True Netral True Positif Class Precision
Pred. Negative 12 0 1 92.31%
Pred. Netral 167 195 145 38.46%
Pred. Positif 11 1 50 80.65%
Class Recall 6.32% 99.49% 25.51%
8. Nilai k 8
Untuk hasil analisis review pengguna DANA dengan nilai k 8 sebagai berikut :
Accuracy : 40.03%
Kappa : 0.096 Rendah (Poor)
Tabel 4.130. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 8
True Negative True Netral True Positif Class Precision
Pred.
12 0 3 80.00%
Negative
Pred. Netral 174 196 168 36.43%
Pred. Positif 4 0 25 86.21%
Class Recall 6.32% 100.00% 12.76%
9. Nilai k 9
Untuk hasil analisis review pengguna DANA dengan nilai k 9 sebagai berikut :
Accuracy : 41.58%
Kappa : 0.119 Rendah (Poor)
Tabel 4.131. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 9
10. Nilai k 10
Untuk hasil analisis review pengguna DANA dengan nilai k 10 sebagai berikut:
Accuracy : 38.83%
Kappa : 0.077 Rendah (Poor)
Tabel 4.132. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 10
True Negative True Netral True Positif Class Precision
Pred.
7 0 3 70.00%
Negative
Pred. Netral 181 196 170 35.83%
Pred. Positif 2 0 23 92.00%
Class Recall 3.68% 100.00% 11.73%
11. Nilai k 20
Untuk hasil analisis review pengguna DANA dengan nilai k 20 sebagai berikut:
Accuracy : 35.91%
Kappa : 0.034 Rendah (Poor)
Tabel 4.133. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 20
True Negative True Netral True Positif Class Precision
Pred. Negative 3 0 1 75.00%
Pred. Netral 185 196 185 34.63%
Pred. Positif 2 0 10 83.33%
Class Recall 1.58% 100.00% 5.10%
12. Nilai k 30
Untuk hasil analisis review pengguna DANA dengan nilai k 30 sebagai berikut:
Accuracy : 34.71%
Kappa : 0.016 Rendah (Poor)
Tabel 4.134. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 30
13. Nilai k 40
Untuk hasil analisis review pengguna DANA dengan nilai k 40 sebagai berikut:
Accuracy : 34.20%
Kappa : 0.008 Rendah (Poor)
Tabel 4.135. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 40
True Negative True Netral True Positif Class Precision
Pred. Negative 0 0 0 0.00%
Pred. Netral 190 196 193 33.85%
Pred. Positif 0 0 3 100.00%
Class Recall 0.00% 100.00% 1.53%
14. Nilai k 50
Untuk hasil analisis review pengguna DANA dengan nilai k 50 sebagai berikut:
Accuracy : 33.85%
Kappa : 0.003 Rendah (Poor)
Tabel 4.136. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 50
True Negative True Netral True Positif Class Precision
Pred.
0 0 0 0.00%
Negative
Pred. Netral 190 196 195 33.73%
Pred. Positif 0 0 1 100.00%
Class Recall 0.00% 100.00% 0.51%
15. Nilai k 60
Untuk hasil analisis review pengguna DANA dengan nilai k 60 sebagai berikut:
Accuracy : 33.68%
Kappa : 0.000 Rendah (Poor)
Tabel 4.137. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 60
16. Nilai k 70
Untuk hasil analisis review pengguna DANA dengan nilai k 70 sebagai berikut:
Accuracy : 33.85%
Kappa : 0.003 Rendah (Poor)
Tabel 4.138. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 70
True Negative True Netral True Positif Class Precision
Pred.
0 0 0 0.00%
Negative
Pred. Netral 190 196 195 33.73%
Pred. Positif 0 0 1 100.00%
Class Recall 0.00% 100.00% 0.51%
17. Nilai k 80
Untuk hasil analisis review pengguna DANA dengan nilai k 80 sebagai berikut:
Accuracy : 33.68%
Kappa : 0.000 Rendah (Poor)
Tabel 4.139. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 80
True Negative True Netral True Positif Class Precision
Pred. Negative 0 0 0 0.00%
Pred. Netral 190 196 196 33.68%
Pred. Positif 0 0 0 0.00%
Class Recall 0.00% 100.00% 0.00%
18. Nilai k 90
Untuk hasil analisis review pengguna DANA dengan nilai k 90 sebagai berikut:
Accuracy : 33.68%
Kappa : 0.000 Rendah (Poor)
Tabel 4.140. Hasil Review Pengguna DANA 3 Kelas dengan Nilai k 90
PENUTUP
5.1. Kesimpulan
diraih oleh aplikasi DANA, dan terakhir jika menggunkan 3 kelas akurasi
tertinggi diraih oleh OVO.
8. Nilai k terbaik dari kedua aplikasi e-wallet untuk mencari nilai akurasi terbaik
dan kappa yaitu menggunakan nilai k 1, sedangkan jika mencari nilai AUC
dengan 2 kelas, nilai k terbaik pada OVO yaitu 3 sedangkan pada dana yaitu
80.
5.2. Saran
1. Kerangka kerja yang diusulkan pada penelitian ini dapat digunakan untuk
melakukan penelitian-penelitian text mining dari berbagai kumpulan dokumen
teks berbahasa indonesia yang tidak terstruktur.
2. Penelitian selanjutnya perlu coba dikembangkan dengan menggunakan data
yang lebih banyak dan pariatif.
3. Disarankan untuk pihak yang berkaitan dengan E-Wallet OVO dan DANA
untuk dapat meningkatkan dan meyakinkan publik supaya opini negatif atau
rating 1 dan 2 yang masih ada di masyarakat bisa lebih berkurang.
4. Melakukan analisis review pada pengguna aplikasi e-wallet berdasarkan
jumlah like yang didapatkan.
Eransa, Doni. (2016, Desember, 12). Data Mining. Dipetik Mei 15, 2018, dari
https://student.uigm.ac.id/assets/file/Materi/Quiz2_BI.pdf.
100
101
Informasi & Komunikasi Terapan 2012 (Semantik 2012), ISBN 979-26-
0255-0
Http://www.gataframework.com/
Https://sitimasyithah.wordpress.com/2016/10/22/analisis-data-pemilu
Liaw, Yi-Ching, et el. (2010) " Fast exact k nearest neighbors search using
an orthogonal search tree" https://doi.org/10.1016/j.patcog.2010.01.003
Rokach, Lior dan Oded Maimon.2015. Data mining With Decision Trees
Theory
and Applications 2nd Edition. America : World Scientific
Publishing.
Salam, Abu, et al. "Analisis Sentimen Data Komentar Sosial Media Facebook
dengan K-Nearest Neighbor (Studi Kasus Pada Akun Jasa Ekspedisi
Barang J&T Ekspress Indonesia)" Prosiding SINTAK 2018, ISBN :
978-602-8557-20-7
Siregar, Riki Ruli A., et al. “Klasifikasi Sentiment Analysis Pada Komentar
Peserta Diklat Menggunakan Metode K-Nearest Neighbor.” Kilat, vol.
8, no. 1, 2019, pp. 81–92, doi:10.33322/kilat.v8i1.421.
Wahyudi, Tri., Richardus E.I & M. Fauzi. (2017). Pemanfaatan Status Kredit
Nasabah Untuk Mengevaluasi Pembiayaan Kpr Pada Bank Muamalat
Indonesia Menggunakan Data Mining. Seminar Nasional Sains dan
Teknologi 2017. e-ISSN : 2460 – 8416.