Ta1 Wawan Kurniawan

Anda mungkin juga menyukai

Anda di halaman 1dari 22

ANALISIS SENTIMEN TERHADAP OPINI

MASYARAKAT MENGENAI BUKALAPAK


MENGGUNAKAN METODE KNN

TUGAS AKHIR

Diajukan sebagai salah satu syarat


Untuk memperoleh Gelar Sarjana Teknik pada
Jurusan Teknik Informatika

Oleh:
WAWAN KURNIAWAN
11551100410

FAKULTAS SAINS DAN TEKNOLOGI


UNIVERSITAS UIN SULTAN SYARIF KASIM RIAU
PEKANBARU
DAFTAR ISI

DAFTAR ISI................................................................................................................................... 1

BAB 1 PENDAHULUAN .............................................................................................................. 4

1.1 Latar Belakang ............................................................................................................... 4

1.1.1 Definisi kasus ........................................................................................................... 4

1.1.2 Penelitian Terkait (Kasus sama metode beda) ..................................................... 5

1.1.3 Penelitian terkait (kasus beda metode sama) ....................................................... 8

1.2 Rumusan Masalah .......................................................................................................... 11

1.3 Batasan Masalah ............................................................................................................. 11

1.4 Tujuan............................................................................................................................. 11

1.5 Sistematika penulisan ..................................................................................................... 12

BAB 2 LANDASAN TEORI........................................................................................................ 13

2.1 E-Commerce................................................................................................................... 13

2.2 Analisis Sentiment.......................................................................................................... 14

2.3 Metode KNN .................................................................................................................. 14

2.4 Penelitian Terkait ........................................................................................................... 15

BAB 3 METODOLOGI PENELITIAN ....................................................................................... 18

3.1 Studi Pustaka .................................................................................................................. 18

3.2 Perumusan masalah ........................................................................................................ 18

3.3 Pengumpulan data .......................................................................................................... 18

3.4 Analisa dan perancangan ................................................................................................ 19

3.4.1 Perancangan ............................................................................................................ 19

3.5 Implementasi .................................................................................................................. 19

3.5.1 Pengujian................................................................................................................. 20
3.6 Kesimpulan dan saran .................................................................................................... 20
BAB 1
PENDAHULUAN
1.1 Latar Belakang
1.1.1 Definisi kasus
No Definisi Menurut/sumber
1 Marketplaces adalah sebuah tempat dari komunitas (Brunn, Jensen, &
bisnis interaktif secara elektronik yang menyediakan Skovgaard, 2002)
suatu wadah jual beli, dimana perusahaan dapat
ambil andil dalam B2B e-commerce atau kegiatan e-
business lain. Dalam tulisannya mereka membagi 2
kategori emarketplaces, yaitu :
1. E-marketplaces Horizontal, adalah kategori dari
sebuah pasar elektronik yang menyediakan
kebutuhan umum seperti : smartphone, pc(personal
computer), baju dan barang umum lainnya seperti
layaknya di pusat perbelanjaan, namun dengan biaya
transaksi yang lebih rendah.
2. E-marketplaces vertical, adalah kategori dari
sebuah pasar elektronik yang menyediakan
kebutuhan khusus yang biasanya menyediakan
kebutuhan suatu bahan industri seperti : baja, beton,
semen dan bahan yang lain dalam jumlah banyak.
2 E-marketplace adalah sebuah sistem informasi antar (Rahmadi, Prasetyo, &
organisasi dimana pembeli dan penjual di pasar Hasibuan, 2015)
mengkomunikasikan informasi tentang harga,
produk dan mampu menyelesaikan transaksi melalui
saluran komunikasi elektronik. Dengan melalui
internet para penjual dimudahkan dalam melakukan
promosi dan memasarkan produknya dalam
jangkauan yang lebih luas
3 Marketplace merupakan media online berbasis (Sofiana, 2017).
internet (web-based) tempat melakukan kegiatan
bisnis dan transaksi antara pembeli dan penjual.
Pembeli dapat mencari supplier sebanyak mungkin
dengan kriteria yang diinginkan, sehingga
memperoleh sesuai harga pasar.

Menurut Brunn, P., Jensen, M., & Skovgaard, J. (2002) Marketplaces adalah sebuah tempat
dari komunitas bisnis interaktif secara elektronik yang menyediakan suatu wadah jual beli,
dimana perusahaan dapat ambil andil dalam B2B e-commerce atau kegiatan e-business
lain.
Definisi lain dari marketplace yaitu sebuah sistem informasi antar organisasi dimana
pembeli dan penjual di pasar mengkomunikasikan informasi tentang harga, produk dan
mampu menyelesaikan transaksi melalui saluran komunikasi elektronik. Dengan melalui
internet para penjual dimudahkan dalam melakukan promosi dan memasarkan produknya
dalam jangkauan yang lebih luas (Y. Rahmadi, Y. A. P. dan M. A. H).
Marketplace merupakan media online berbasis internet (web-based) tempat melakukan
kegiatan bisnis dan transaksi antara pembeli dan penjual. Pembeli dapat mencari
supplier sebanyak mungkin dengan kriteria yang diinginkan, sehingga memperoleh
sesuai harga pasar (Silvia Sofian, 2017).

1.1.2 Penelitian Terkait (Kasus sama metode beda)


Penulis Judul Metode Variable hasil
(Haryani, Sentimen Analisis Lexicon -system sentimen analisis untuk
Tohari, & Kepuasan classificatio quality ketiga e-commerce ini
Nurrahman, Pelanggan E- n - termasuk kategori
2018) commerce information sentimen positif.
Menggunakan quality
Lexicon -service
Classification quality
dengan R -features
-usefullness
(Wilana, ANALISIS Naïve Bayes Total dari seluruh data
Hanasbey, SENTIMEN yang diinput adalah 510
Awinero, TERHADAP
Modouw, & OPINI data. Hasil dari
Sitokdana, 2018) MASYARAKAT pengolahan data
INDONESIA tersebut menghasilkan
MENGENAI nilai netral lebih tinggi
BUKALAPAK dari yang lainnya.
Dengan
presentase sebagai
berikut
Positif (Hijau) : 190/510
x100=37%
Netral (Hitam) :
257/510 x100=50%
Negatif (Biru) : 63/510
x100=13%
(Syah, ANALISIS maximum hasil akurasi yang
Adiwijaya, & SENTIMEN entropy dan didapat bahwasanya
Faraby, 2017) PADA DATA TF-IDF akurasi pada
ULASAN snowball stemmer dan
PRODUK TOKO lancaster stemmer
ONLINE memiliki nilai yang
DENGAN sama dan tinggi diantara
METODE kedua stemming lainnya
MAXIMUM dengan nilai sebesar
ENTROPY 78.833%. Sedangkan
pada bagian f1-score
nilai tertinggi terdapat
pada snowball stemmer
dengan nilai 88.145%.
(Wati, 2016) Penerapan Naive penelitian ini
Algoritma Genetika Bayes menghasilkan akurasi
Untuk Seleksi Fitur 60.00% dan AUC
Pada Analisis sebesar 0.512
Sentimen Review sedangkan akurasi
Jasa Maskapai setelah menggunakan
Penerbangan pemilihan fitur
Menggunakan Algoritma Genetika
Naive Bayes sebesar 89.50 dan AUC
sebesar 0.919 termasuk
kedalam excellent
classification terjadi
peningkatan akurasi
sebesar 29.5% dan AUC
sebesar 0.407.
(Chandani & Komparasi tiga Hasil dari komparasi
Wahono, 2015) Algoritma algoritma algoritma klasifikasi
Klasifikasi klasfiikasi antara Support Vector
Machine Learning (SMV, NB Machine (SVM), Naïve
Dan Feature dan ANN) Bayes (NB) dan
Selection pada dan Artificial Neural
Analisis Sentimen mengkompa Network (ANN)
Review Film rasi empat didapatkan SVM
algoritma dengan hasil terbaik
feature dengan nilai accuracy =
selection 81.10% dan nilai AUC =
(IG, Chi 0.904.
Square,
Forward
Selection
dan
Backward
Elimination
).

Beberapa penelitian yang telah dilakukan untuk analisis sentimen terhadap opini masyarakat
mengenai marketplace bukalapak (Wivadario WIlana, Sandy Hanshe Hanasbey, Meylan Ribka
Awinero, Jonathan Vorgorius Adeputra Modouw, Melkior N. N Sitokdana , 2018) mengggunakan
metode Naïve Bayes Adapun hasil yang di dapat dari penelitian ini sebagai berikut. Total dari
seluruh data yang diinput adalah 510 data. Hasil dari pengolahan data tersebut menghasilkan nilai
netral lebih tinggi dari yang lainnya. Dengan presentase sebagai berikut: Positif (Hijau) : 190/510
x100=37% , Netral (Hitam) : 257/510 x100=50% , Negatif (Biru) : 63/510x100=13%.
Selanjutnya, (Calandra Alencia Haryani, Hamim Tohari, Marhamah, Yoga Afif Nurrahman ,2018)
melakukan penelitian dengan menggunakan metode lexicon classification dan hasil Sentimen
analisis untuk kepuasan pelanggan terhadap Amazon, Ebay, dan Rakuten yang dihasilkan
penelitian ini adalah sentimen positif. Sentimen positif ini didapatkan dengan menggunakan
lexicon classification. Jumlah dari klasifikasi positif yang dihasilkan untuk Amazon adalah
sebanyak 530.382, Ebay sebanyak 49.247, dan Rakuten sebanyak 4.606. selanjutnya pada
penelitian (Wivadario WIlana, Sandy Hanshe Hanasbey, Meylan Ribka Awinero, Jonathan
Vorgorius Adeputra Modouw, Melkior N. N Sitokdana , 2018) menggunakan metode maximum
entropy dan TF-IDF dan hasil hasil akurasi yang didapat bahwasanya akurasi pada snowball
stemmer dan lancaster stemmer memiliki nilai sebesar 78.833%. Sedangkan pada bagian f1-score
nilai tertinggi terdapat pada snowball stemmer dengan nilai 88.145%.
Selanjutnya (Risa Wati, 2016) menggunakan metode naïve bayes menghasilkan hasil akurasi
60.00% dan AUC sebesar 0.512 sedangkan akurasi setelah menggunakan pemilihan fitur
Algoritma Genetika sebesar 89.50 dan AUC sebesar 0.919 termasuk kedalam excellent
classification terjadi peningkatan akurasi sebesar 29.5% dan AUC sebesar 0.407.
Selanjutnya pada penelitian (Vinita Chandani, 2015) menggunakan metode Support Vector
Machine (SVM), Naïve Bayes (NB) dan Artificial Neural Network (ANN) didapatkan SVM
dengan hasil terbaik dengan nilai accuracy = 81.10% dan nilai AUC = 0.904. Hasil dari komparasi
algoritma feature selection antara information gain, chi square, forward selection, backward
elimination didapatkan information gain pada parameter top k dengan nilai k = 200 sebagai hasil
terbaik, dengan nilai accuracy average adalah 84.57% dan nilai AUC = 0.899.

1.1.3 Penelitian terkait (kasus beda metode sama)


Penulis Judul Metode Variable hasil
(Kustiyahningsi SISTEM KNN (K- -nilai Dengan menggunakan
h & Syafa’ah, PENDUKUNG Nearest raport metode KNN dan
2015) KEPUTUSAN Neighbor), -hasil test SMART dapat
UNTUK SMART psikologi diperoleh hasil yang
MENENTUKAN (Simple -minat cukup
JURUSAN Multi siswa mendekati keakuratan
PADA SISWA SMA Attribute - dari data yang telah
MENGGUNAKAN Rating saran/anju ada sebesar 62,5 %,
METODE KNN DAN Technique) ran org tua dihitung dari total hasil
SMART jumlah jurusan dengan
menggunakan metode
KNN dan SMART
sebanyak 20 siswa
dibagi
dengan jumlah
banyaknya siswa
dalam 1 kelas tersebut
sebanyak 32 siswa.
(Rismawan, sistem pendukung KNN (K- -tinggi 1. Sistem ini dapat
Irawan, keputusan berbasis NEAREST badan dijadikan sebagai alat
Prabowo, & pocket pc sebagai NEIGHBOR -berat bantu untuk
Kusumadewi, penentu status gizi ) badan menentukan status gizi
2008) menggunakan metode -%lemak seseorang.
knn (k-nearest -sistolik 2. Metode K-NN dapat
neighbor) -detak digunakan untuk
jantung menentukan status gizi
-lengan seseorang
atas berdasarkan parameter
-lengan kondisi fisik dari
bawah orang tersebut.
-lingkar 3. Sistem yang
perut dibangun memiliki
-lingkar kinerja yang
panggul cukup baik yaitu
sebesar 85%.
(Ndaumanu & Analisis Prediksi K-Nearest -IPK Berdasarkan pengujian
Arief, 2014) Tingkat Pengunduran Neighbor -Pekerjaan hasil prediksi
Diri Mahasiswa ortu menggunakan
dengan Metode K- -jurusan algoritma k-nearest
Nearest Neighbor -semester neighbor secara
manual dan
menggunakan sistem
yang digunakan data
training adalah
mengunakan 90 data
mahasiswa yaitu 42
orang data teknik
informatika S1, 40
orang mahasiswa
sistem informasi S1
dan 8 orang
mahasiswa teknik
informatika D3.
Berdasarkan hasil uji
coba menggunakan
secara manual dan
menggunakan sistem
didapatkan kesamaan
hasil prediksi yaitu
79% dan melihat dari
presentasi mungkin
saja ini kurang akurat.
(Nurjanah, Analisis Sentimen K-Nearest Tingkat akurasi
Perdana, & Terhadap Tayangan Neighbor metode pada kasus
Fauzi, 2017) Televisi Berdasarkan tersebut melebihi 80%
Opini Masyarakat
pada Media Sosial
Twitter menggunakan
Metode K-Nearest
Neighbor dan
Pembobotan Jumlah
Retweet
Menurut penelitian yang menggunakan metode K-Nearest NeighBor (KNN) (Yeni
Kustiyahningsih, Nikmatus Syafa’ah) menunjukkan hasil penelitiannya mendekati keakuratan dari
data yang telah ada sebesar 62,5 %, dihitung dari total hasil jumlah jurusan dengan menggunakan
metode KNN dan SMART sebanyak 20 siswa dibagi dengan jumlah banyaknya siswa dalam 1
kelas tersebut sebanyak 32 siswa.
Selanjutnya pada penelitian (Tedy Rismawan, Ardhitya Wiedha Irawan , Wahyu Prabowo, Sri
Kusumadewi, 2008) dan hasilnya Metode K-NN dapat digunakan untuk menentukan status gizi
seseorang berdasarkan parameter kondisi fisik dari orang tersebut dan Sistem yang dibangun
memiliki kinerja yang cukup baik yaitu sebesar 85%.
Selanjutnya pada penelitian (Ricky Imanuel Ndaumanu, Kusrini, M. Rudyanto Arief, 2014) dan
Berdasarkan hasil uji coba menggunakan secara manual dan menggunakan sistem didapatkan
kesamaan hasil prediksi yaitu 79% dan melihat dari presentasi mungkin saja ini kurang akurat.
selanjutnya pada penelitian (Winda Estu Nurjanah, Rizal Setya Perdana, Mochammad Ali Fauzi,
2017) memiliki hasil Tingkat akurasi ketika menggunakan pembobotan tekstual mencapai 82,50%,
ketika menggunakan pembobotan non-tekstual mencapai 60%, sedangkan ketika menggunakan
penggabungan keduanya mencapai 83,33%.

1.2 Rumusan Masalah


Berdasarkan latar belakang diatas, maka dapat dirumuskan masalah dalam penelitian ini
yaitu bagaimana mengimplementasikan metode K-Nearest Neighbor (KNN) untuk Menganalisis
sentimen terhadap opini masyarakat indonesia mengenai bukalapak

1.3 Batasan Masalah


Dalam memudahkan penelitian ini, dibutuhkan adanya batasan masalah. Adapun beberapa
batasan masalah dalam penelitian ini adalah sebagai berikut:

1. Data yang dianalisis adalah data dari media social berbahasa Indonesia
2. Metode yang digunakan adalah K-Nearest Neighbor (KNN)
3. Kelas sentiment yang digunakan pada penelitian ini yaitu positifdan negatif

1.4 Tujuan
Berdasarkan rumusan masalah yang disebutkan diatas , maka tujuan dari penelitian ini
adalah sebagai berikut:

1. Membuktikan bahwa metode K-Nearest Neighbor (KNN) dapat digunakan untuk


pengklasifikasian analisi sentiment e-commerce bukalapak.
2. Mengukur efisiensi metode K-Nearest Neighbor (KNN)
1.5 Sistematika penulisan
Sistematika penulisan ini merupakan gambaran singkat yang berisi berbagai pokok
permasalahan yang dibahas pada masing-masing yang diuraikan menjadi beberapa bagian:

BAB I PENDAHULUAN

Pada bagian ini berisi tentang latar belakang, rumusan masalah, batasan masalah, tujuan
dan sistematika penulisan.

BAB II LANDASAN TEORI

Pada bagian ini berisi tentang landasan teori dan mendukung penelitian ini sebagai dasar
untuk pemecahan masalah.

BAB III METODOLOGI PENELITIAN

Pada bab ini berisi tentang langkah-langkah yang dilaksanakan dalam proses penelitian,
yaitu identifikasi masalah, studi pustaka, analisa dan perancangan, implementasi dan pengujian,
serta kesimpulan dan saran.

BAB IV ANALISIS DAN PERANCANGAN SISTEM

Pada bab ini berisi tentang analisa data, analisa proses menggunakan algoritma K-Nearest
Neighbor (KNN).

BAB V IMPLEMENTASI DAN PENGUJIAN

Pada bab ini menguraikan mengenai implmentasi K-Nearest Neighbor (KNN) untuk
analsisis sentiment terhadap bukalapak.

BAB VI PENUTUP

Pada bab ini berisi tentang kesimpulan hasil penelitian beserat saran saran yang berkaitan
dengan penelitian ini
BAB 2
LANDASAN TEORI
2.1 E-Commerce
suatu set dinamis teknologi, aplikasi dan proses bisnis yang (Baum, 2002)
menghubungkan perusahaan, konsumen, dan komunitas melalui transaksi
elektronik dan perdagangan barang, pelayanan dan informasi yang
dilakukan secara elektronik.
E-commerce adalah suatu jenis dari mekanisme bisnis secara elektronik (Karmawan, 2010)
yang memfokuskan diri pada transaksi bisnis berbasis individu dengan
menggunakan internet (teknologi berbasis jaringan digital) sebagai
medium pertukaran barang atau jasa baik antara dua buah institusi
(business to business) dan konsumen langsung (business to consumer),
melewati kendala ruang dan waktu yang selama ini merupakan hal-hal yang
dominan.
E-commerce adalah proses pembelian dan penjualan antara dua belah pihak (Indrajit, 2001)
di dalam suatu perusahaan dengan adanya pertukaran barang, jasa, atau
informasi melalui media internet.

(Baum, 2002) di dalam bukunya mengatakan e-commerce merupakan suatu set dinamis teknologi,
aplikasi dan proses bisnis yang menghubungkan perusahaan, konsumen, dan komunitas melalui
transaksi elektronik dan perdagangan barang, pelayanan dan informasi yang dilakukan secara
elektronik. Jadi menurut pengertian tersebut e-commerce merupakan sebuah sistem/aplikasi yang
dapat menghubungkan suatu perusahaan, produsen dan konsumen dalam melakukan transaksi jual
beli secara online.

Menurut pengertian dari buku (Karmawan, 2010) e-commerce adalah proses bisnis untuk dua
institusi maupun umum yang dilakukan secara elektronik dan online.
2.2 Analisis Sentiment
Analisis sentiment adalah kajian tentang cara untuk memecahkan masalah (Wati, 2016)
dari opini masyrakat, sikap, emosi suatu entitas, dimana entitas tersebut
dapt mewakili inividu
Analisis sentiment merupakan proses memahami, mengestrak dan (Rozi et al. 2012)
mengolah data tekstual secara otomatis untuk mendapatkan informasi
sentimen yang terkandung dalam kalimat opini. Analisi sentiment
dilakukan untuk melihat pendapat atau kecendrungan opini terhadap
sebuah masalah atau objek oleh seseorang, apakah cenderung beropini
negatif atau positif.
Analisis sentiment adalah bidang studi yang menganalisa pendapat, (Liu, 2012)
sentimen, evaluasi, penilaian, sikap, dan emosi seseorang terhadap suatu
produk, oganisasi, individu, masalah, peristiwa atau topik

Merujuk dari pendapat (Liu, 2012) analisis sentiment dilakukan untuk melihat pendapat terhadap
sebuah masalah, atau dapat juga digunakan untuk identifikasi kecendrungan hal yang sedang
menjadi topic pembicaraan . analisis sentiment dalam penelitian ini adalah proses pengelompokan
data yang bersumber dari Instagram, google playstore, dan Facebook.

2.3 Metode KNN


K-NN merupakan salah satu algoritma pembelajaran mesin sederhana. Hal ini hanya
didasarkan pada gagasan bahwa suatu objek yang 'dekat' satu sama lain juga akan memiliki
karakteristik yang mirip. Ini berarti jika kita mengetahui ciri-ciri dari salah satu objek, maka kita
juga dapat memprediksi objek lain berdasarkan tetangga terdekatnya. K-NN adalah improvisasi
lanjutan dari teknik klasifikasi Nearest Neighbor. Hal ini didasarkan pada gagasan bahwa setiap
contoh baru dapat diklasifikasikan oleh suara mayoritas dari k tetangga, di mana k adalah bilangan
bulat positif, dan biasanya dengan jumlah kecil (Khamis et al, 2014). Algoritma klasifikasi K-NN
memprediksi kategori tes sampel sesuai dengan sampel pelatihan k yang merupakan tetangga
terdekat dengan sampel uji, dan memasukkan ke dalam kategori yang memiliki kategori
probabilitas terbesar (Suguna dan Thanushkodi, 2010).
Dalam pengenalan pola, algoritma KNN adalah metode yang digunakan untuk mengklasifikasikan
objek berdasarkan contoh pelatihan terdekat di ruang fitur. KNN adalah jenis insctance-based
learning, atau lazy learning dimana fungsi ini hanya didekati secara lokal dan semua perhitungan
ditangguhkan sampai klasifikasi (Imandoust dan Bolandraftar, 2013).

Metode klasifikasi K-NN memiliki beberapa tahap, yang pertama nilai k yang merupakan jumlah
tetangga terdekat yang akan menentukan kueri baru masuk ke kelas mana ditentukan. Tahap kedua,
k tetangga terdekat dicari dengan cara menghitung jarak titik kueri dengan titik training. Tahap
ketiga, setelah mengetahui jarak masing-masing titik training dengan titik kueri, kemudian lihat
nilai yang paling kecil. Tahap keempat ambil k nilai terkecil selanjutnya lihat kelasnya. Kelas yang
paling banyak merupakan kelas dari kueri baru (Pramesti, 2013). Dekat atau jauhnya jarak titik
dengan tetangganya bisa dihitung dengan menggunakan Euclidean distance. Euclidean distance
direpresentasikan sebagai berikut (Pramesti, 2013):

𝑘𝑛

𝐽 (𝑎, 𝑏) = √∑(𝑎𝑘 − 𝑏𝑘 )2
𝑘=1

J(a,b) merupakan jarak antara titik a yang merupakan titik yang telah diketahui kelasnya dan b
berupa titik baru. Jarak antara titik baru dengan titik-titik training dihitung dan diambil k buah titik
terdekat. Titik baru diprediksi masuk ke kelas dengan klasifikasi terbanyak dari titik-titik tersebut
(Pramesti, 2013).

2.4 Penelitian Terkait


Berikut ini merupakan beberapa penelitian yang berkaitan dengan penelitian ini :

Penulis Judul Metode Variable hasil


(Haryani, Sentimen Analisis Lexicon -system sentimen analisis untuk
Tohari, & Kepuasan classificatio quality ketiga e-commerce ini
Nurrahman, Pelanggan E- n - termasuk kategori
2018) commerce information sentimen positif.
Menggunakan quality
Lexicon -service
Classification quality
dengan R -features
-usefullness
(Wilana, ANALISIS Naïve Bayes Total dari seluruh data
Hanasbey, SENTIMEN yang diinput adalah 510
Awinero, TERHADAP data. Hasil dari
Modouw, & OPINI pengolahan data
Sitokdana, 2018) MASYARAKAT tersebut menghasilkan
INDONESIA nilai netral lebih tinggi
MENGENAI dari yang lainnya.
BUKALAPAK Dengan
presentase sebagai
berikut
Positif (Hijau) : 190/510
x100=37%
Netral (Hitam) :
257/510 x100=50%
Negatif (Biru) : 63/510
x100=13%
(Syah, ANALISIS maximum hasil akurasi yang
Adiwijaya, & SENTIMEN entropy dan didapat bahwasanya
Faraby, 2017) PADA DATA TF-IDF akurasi pada
ULASAN snowball stemmer dan
PRODUK TOKO lancaster stemmer
ONLINE memiliki nilai yang
DENGAN sama dan tinggi diantara
METODE kedua stemming lainnya
MAXIMUM dengan nilai sebesar
ENTROPY 78.833%. Sedangkan
pada bagian f1-score
nilai tertinggi terdapat
pada snowball stemmer
dengan nilai 88.145%.
(Wati, 2016) Penerapan Naive penelitian ini
Algoritma Genetika Bayes menghasilkan akurasi
Untuk Seleksi Fitur 60.00% dan AUC
Pada Analisis sebesar 0.512
Sentimen Review sedangkan akurasi
Jasa Maskapai setelah menggunakan
Penerbangan pemilihan fitur
Menggunakan Algoritma Genetika
Naive Bayes sebesar 89.50 dan AUC
sebesar 0.919 termasuk
kedalam excellent
classification terjadi
peningkatan akurasi
sebesar 29.5% dan AUC
sebesar 0.407.
(Chandani & Komparasi tiga Hasil dari komparasi
Wahono, 2015) Algoritma algoritma algoritma klasifikasi
Klasifikasi klasfiikasi antara Support Vector
Machine Learning (SMV, NB Machine (SVM), Naïve
Dan Feature dan ANN) Bayes (NB) dan
Selection pada dan Artificial Neural
Analisis Sentimen mengkompa Network (ANN)
Review Film rasi empat didapatkan SVM
algoritma dengan hasil terbaik
feature dengan nilai accuracy =
selection 81.10% dan nilai AUC =
(IG, Chi 0.904.
Square,
Forward
Selection
dan
Backward
Elimination
).
BAB 3
METODOLOGI PENELITIAN

Dalam melakukan sebuah penelitian, diperlukannya sebuah tahapan-tahapan atau acuan


pelaksanaan penelitian yang dinamakan dengan metodologi penelitian. Metedologi penelitian ini
terdiri dari beberapa tahapan kerangka kerja penelitian yang tersusun secara sistematis agar
pelaksanaan penelitian mencapai tujuan yang diharapkan. Berikut adalah gambaran tahapan yang
akan dilakukan dalam penelitan ini yang dapat dilihat pada flowchart berikut.

mulai Perumusan Studi pustaka Pengumpulan


masalah data

Kesimpulan Implementasi perancangan Analisa


dan saran dan pengujian

selesai

3.1 Studi Pustaka


Pada tahapan studi pustaka dilakukan proses pencarian informasi terkait mengenai
penelitian yang akan dilaukan melalu jurnal dan buku terkait.

3.2 Perumusan masalah


Pada tahap ini yaitu bagaimana merancang dan membangun sebuah sistem untuk analisis
sentiment terhadap e-commerce BUKALAPAK

3.3 Pengumpulan data


Tahapan ini merupakan tahapan pengumpulan data yang diperlukan untuk menganalisa dan
memperoleh data-data serta informasi yang berhubungan dengan penelitian yang akan
dilakukan. Data yang diambil pada penelitian ini yaitu dari playstore, situs bukalapak, dan
social media bukalapak.
3.4 Analisa dan perancangan
Analisa adalah suatu kegiatan dalam mempelajari serta mengevaluasi suatu bentuk
permasalahan atau kasus yang terjadi. Perancangan adalah suatu kegiatan membuat desain
teknis berdasarkan evaluasi yang telah dilakukan pada kegiatan analisis. Pada tahapan
analisis terbgi menjadi beberapa proses:
1. Mengumpulkan data dokumen yang di dapat dari kumpulan komentar pada aplikasi
bukalapak di google playstore dan sosial media bukalapak.
2. Melakukan Case Folding: tahapan merubah semua huruf capital mejadi huruf kecil.
3. Menghapus karakter selain UTF-8, link URL dan dokumen yang berulang
4. Pemisahan rangkaian kata.
5. Melakukan linguistic preprocessing: stopword dan steaming
6. Normalisasi : tahapan identifikasi kata slang dan penulisan kata berlebihan kemudian
diganti dengan kata kamus KBBI
7. Indexing
8. Pemobotan kata
3.4.1 Perancangan
Dalam tahapan perancangan ini terdapat 3 tahapan, yaitu:

1. Perancangan menu yang akan digunakan pada sistem


2. Tahapan rancangan database
3. Tahapan rancangan interface atau tampilan pada sistem

3.5 Implementasi
Tahapan ini yaitu dimana sistem akan dijalankan dan pada tahapan ini membutuhkan
hardware dan softaware. Berikut software dan hardware yang akan digunakan:

1. Perangkat keras (hardware)

Processor : Intel(R) Celeron(R) CPU N3050 @1.60GHz 1.60 GHz

RAM : 4,00 GB

System Type :64-bit Operating System, x64-based processor

HDD : 500GB
2. Peragkat Lunak (software)
Sistem Operasi : Microsoft Windows 10
Bahasa Pemograman :PHP
Text Editor :Sublime text 3
Browser : Google Chrome

3.5.1 Pengujian
Pada tahap pengujian ini dilakukan menggunakan Confusion matrix dalam
mengkasifikasikan sentiment.

3.6 Kesimpulan dan saran


Tahapan ini berisi tentang kesimpulan yang dapat diambil dari penelitian ini, pada bagian
saran berisi saran-saran yang penulis berikan untuk mengembangkan sistem agar lebih baik
lagi kedepannya.
Daftar Pustaka
Brunn, P., Jensen, M., & Skovgaard, J. (2002). e-Marketplaces:: Crafting A Winning Strategy.
European Management Journal, 20(3), 286–298.

Chandani, V., & Wahono, R. S. (2015). Komparasi Algoritma Klasifikasi Machine Learning Dan
Feature Selection pada Analisis Sentimen Review Film. Journal of Intelligent Systems, 1(1),
56–60.

Haryani, C. A., Tohari, H., & Nurrahman, Y. A. (2018). Sentimen Analisis Kepuasan Pelanggan
E-commerce Menggunakan Lexicon Classification dengan R. Konferensi Nasional Sistem
Informasi (KNSI) 2018.

Kustiyahningsih, Y., & Syafa’ah, N. (2015). Sistem Pendukung Keputusan Untuk Menentukan
Jurusan Pada Siswa SMA Menggunakan Metode KNN dan SMART. Jurnal Sistem Informasi
Indonesia, 1(1).

Ndaumanu, R. I., & Arief, M. R. (2014). Analisis Prediksi Tingkat Pengunduran Diri Mahasiswa
dengan Metode K-Nearest Neighbor, 1(1).

Nurjanah, W. E., Perdana, R. S., & Fauzi, M. A. (2017). Analisis Sentimen Terhadap Tayangan
Televisi Berdasarkan Opini Masyarakat pada Media Sosial Twitter menggunakan Metode K-
Nearest Neighbor dan Pembobotan Jumlah Retweet. Jurnal Pengembangan Teknologi
Informasi Dan Ilmu Komputer E-ISSN, 2548, 964X.

Rahmadi, Y., Prasetyo, Y. A., & Hasibuan, M. A. (2015). Pengembangan Modul Freemium
Aplikasi Tel-us (telkom University Store) Menggunakan Metode Iterative Incremental Dan
Framework Laravel. EProceedings of Engineering, 2(2).

Rismawan, T., Irawan, A. W., Prabowo, W., & Kusumadewi, S. (2008). Sistem Pendukung
Keputusan Berbasis Pocket Pc Sebagai Penentu Status Gizi Menggunakan Metode Knn (K-
Nearest Neighbor). Jurnal Teknoin, 13(2).

Sofiana, S. (2017). Penerapan Sistem Informasi E-Commerce Berbasis Web (Studi Kasus Untuk
Vendor Pernikahan). JITEKH (Jurnal Ilmiah Teknologi Harapan), 6(2), 52–57.

Syah, A., Adiwijaya, A., & Faraby, S. (2017). Analisis Sentimen Pada Data Ulasan Produk Toko
Online Dengan Metode Maximum Entropy. EProceedings of Engineering, 4(3).
Wati, R. (2016). Penerapan Algoritma Genetika Untuk Seleksi Fitur Pada Analisis Sentimen
Review Jasa Maskapai Penerbangan Menggunakan Naive Bayes. EVOLUSI-Jurnal Sains
Dan Manajemen AMIK BSI Purwokerto, 4(1).

Wilana, W., Hanasbey, S. H., Awinero, M. R., Modouw, J. V. A., & Sitokdana, M. N. N. (2018).
ANALISIS SENTIMEN TERHADAP OPINI MASYARAKAT INDONESIA MENGENAI
BUKALAPAK. SEMNASTEKNOMEDIA ONLINE, 6(1), 1–3.

Anda mungkin juga menyukai