Anda di halaman 1dari 57

PROYEK MATAKULIAH

INTEGRASI DATA

UJIAN AKHIR SEMESTER (181)

OLEH :

KELOMPOK 2

1. Sebastianus Sembara 17410100054


2. Irvan Adfaridzi Dwi P 17410100073
3. Triska Wahyudiningkasih 17410100149

FAKULTAS TEKNOLOGI DAN INFORMATIKA

INSTITUT BISNIS DAN INFORMATIKA STIKOM SURABAYA

2018
DAFTAR PUSTAKA
DAFTAR GAMBAR .................................................................................................... v

DAFTAR TABEL ....................................................................................................... vii

BAB I ............................................................................................................................ 1

PENDAHULUAN ........................................................................................................ 1

1.1 Latar Belakang ............................................................................................... 1

1.2 Rumusan Masalah .......................................................................................... 4

1.3 Tujuan Penelitian ............................................................................................ 4

1.4 Batasan Masalah ............................................................................................. 4

1.5 Manfaat Penelitian .......................................................................................... 4

BAB II ........................................................................................................................... 5

TINJAUAN PUSTAKA ............................................................................................... 5

2.1 Penilitian yang Pernah Dilakukan .................................................................. 6

2.1.1 Judul Jurnal ............................................................................................. 6

2.1.2 Latar Belakang ........................................................................................ 6

2.1.3 Studi Kasus ............................................................................................. 6

2.1.4 Teori yang Digunakan ............................................................................. 7

2.1.5 Metode..................................................................................................... 7

2.1.6 Analisis Data ........................................................................................... 9

2.1.7 Data yang Diolah................................................................................... 11

2.1.8 Hasil Penelitian ..................................................................................... 12

2.2 Permasalahan / Topik yang dibahas ............................................................. 12

2.3 Social Web Yang Digunakan ....................................................................... 13

2.3.1 Twitter ................................................................................................... 13

ii
2.3.2 Play Store / Google Play ....................................................................... 17

2.4 Integerasi Data .............................................................................................. 18

2.5 Schema Heterogenity ................................................................................... 19

2.6 Mediated Schema ......................................................................................... 20

2.7 Similarity ...................................................................................................... 20

2.8 Edit Distance ................................................................................................ 20

2.9 Visualisasi Informasi .................................................................................... 24

2.9.1 Teknik Visualiasasi Informasi............................................................... 24

BAB III ....................................................................................................................... 26

ANALISIS DAN PERANCANGAN SISTEM .......................................................... 26

3.1 Tujuan dilakukan Integrasi Data .................................................................. 26

3.2 Kebutuhan Informasi oleh Pengguna ........................................................... 26

3.3 Profil Sumber data ........................................................................................ 27

3.3.1 Profil masing – masing sumber data ..................................................... 27

3.3.2 Skema Sumber Data .............................................................................. 28

3.4 Proses Integrasi Data .................................................................................... 29

3.4.1 Metode pembuatan Schema Mapping (GAV/LAV/GLAV) ................. 29

3.4.2 Crawling Data Sekunder ....................................................................... 30

3.4.3 Algoritma Pembobotan Similarity ........................................................ 37

3.4.4 Mediated Schema dan Pemetaan dengan Sumber Data ........................ 39

3.4.5 Desain I/O ............................................................................................. 39

3.4.5 Desain Uji Coba .................................................................................... 42

3.5 Pengembangan Aplikasi ............................................................................... 42

BAB IV ....................................................................................................................... 43

iii
HASIL DAN PEMBAHASAN ................................................................................... 43

4.1 Kebutuhan Perangkat Keras ......................................................................... 43

4.2 Kebutuhan Perangkat Lunak ........................................................................ 43

4.3 Implementasi Sistem .................................................................................... 44

4.4 Hasil Uji Coba Sistem .................................................................................. 46

BAB V......................................................................................................................... 47

PENUTUP ................................................................................................................... 47

5.1 Kesimpulan ................................................................................................... 47

5.2 Saran ............................................................................................................. 47

DAFTAR PUSTAKA ................................................................................................. 49

iv
DAFTAR GAMBAR
Gambar 1 Struktur Tinjauan Pustaka ........................................................................... 5
Gambar 2 Twitter ......................................................................................................... 6
Gambar 3 Hasil Filling ................................................................................................. 9
Gambar 4 Hasil Ekstraksi ............................................................................................ 9
Gambar 5 Contoh Tweet .............................................................................................. 9
Gambar 6 Contoh Tweet ............................................................................................ 10
Gambar 7 Anotasi Tweet Dalam Format XML ........................................................ 10
Gambar 8 Hasil Filling ............................................................................................... 11
Gambar 9 Logo Twitter .............................................................................................. 13
Gambar 10 Logo PLay Store...................................................................................... 17
Gambar 11 Tampilan Twitter ..................................................................................... 27
Gambar 12 Tampilan Play Store ................................................................................ 28
Gambar 13 Metode Mapping ..................................................................................... 30
Gambar 14 Key dan Tokens Twitter .......................................................................... 30
Gambar 15 Composer ................................................................................................ 31
Gambar 16 Library Abraham TwitterOAuth ............................................................. 31
Gambar 17 Tampilan di Localhost ............................................................................. 33
Gambar 18 Tampilan Import.Io ................................................................................. 33
Gambar 19 Tampilan Import ...................................................................................... 34
Gambar 20 Pemilihan data 1 ...................................................................................... 34
Gambar 21 Pemilihan data 2 ...................................................................................... 35
Gambar 22 Extract 1 .................................................................................................. 35
Gambar 23 Pemilihan Data 3 ..................................................................................... 35
Gambar 24 Extract 2 .................................................................................................. 36
Gambar 25 Tampilan data format yang diinginkan ................................................... 36
Gambar 26 Data Format Exel .................................................................................... 37
Gambar 27 Output Levenstein ................................................................................... 38
Gambar 28 Parameter ................................................................................................. 38
Gambar 29 Mediated Schema .................................................................................... 39

v
Gambar 30 Tampilan memasukkan kata kunci .......................................................... 39
Gambar 31 Data Matching ......................................................................................... 40
Gambar 32 Tampilan data Tweet ............................................................................... 40
Gambar 33 Informasi Sentimen Analisis ................................................................... 41
Gambar 34 Proses Mapping ....................................................................................... 41
Gambar 35 Tampilan awal Website ........................................................................... 44
Gambar 36 Hasil pencarian berdasarkan keyword..................................................... 44
Gambar 37 Pencarian ................................................................................................. 44
Gambar 38 Proses Mapping Menggunakan tampilan diagram .................................. 45
Gambar 39 Penentuan analisis ................................................................................... 45

vi
DAFTAR TABEL
Tabel 1Interpelasi ........................................................................................................ 23
Tabel 2 Inventarisasi ................................................................................................... 23
Tabel 3 Interupsi ......................................................................................................... 24
Tabel 4 Investasi ......................................................................................................... 24
Tabel 5 Hirarki Visualisasi ......................................................................................... 25
Tabel 6 Kebutuhan Informasi oleh Pengguna ............................................................. 26
Tabel 7 Sumber Data Twitter ...................................................................................... 28
Tabel 8 Sumber data Play Store .................................................................................. 29
Tabel 9 Code PHP ....................................................................................................... 32
Tabel 10 Algoritma dalam PHP .................................................................................. 37
Tabel 11 Desain Uji Coba .......................................................................................... 42
Tabel 12 Hasil Uji Coba Sistem .................................................................................. 46

vii
BAB I

PENDAHULUAN
1.1 Latar Belakang
Media sosial di Indonesia saat ini mulai berkembang pesat mengikuti
perkembangan para pengguna di Indonesia. Menurut Asosiasi penyelenggara
Jasa Internet Indonesia (APJII) pada tahun 2012, kurang lebih 63 juta
masyarakat Indonesia terhubung dengan internet dan sebanyak 95 persen
aktivitas yang dilakukan adalah membuka media sosial. Bahkan Indonesia
diprediksi akan menjadi negara dengan pengguna sosial media paling aktif dan
paling banyak. Salah satu alasan yang paling kuat mengapa hal tersebut bisa
terjadi karena perangkat-perangkat internet mobile semakin terjangkau
harganya bagi masyarakat sehingga memungkinkan penetrasi jaringan pada
user yang lebih luas. Perkembangan ini mendukung akses media sosial di
Indonesia. Telepon genggam pintar seperti Android, iOS, dan lain sebagainya,
beserta beragam model IoT seperti phablet, tablet, dan lain sebagainya turut
menyumbang pada semakin luasnya akses internet dan media sosial bagi
masyarakat di Indonesia.

Pada mulanya media sosial hanya digunakan untuk bersosialisasi satu sama lain
yang dilakukan secara online, untuk saling berinteraksi tanpa dibatasi ruang
dan waktu. Perkembangan media sosial yang semakin meningkat membuat
media sosial tidak hanya digunakan untuk media bertukar informasi namun
juga transaksi penjualan atau pembelian online.Namun, saat ini media sosial
tidak hanya digunakan sebagai platform komunikasi dan sosialisasi, tetapi juga
digunakan untuk kepentingan politik, pemerintahan, penjualan online dan lain
sebagainya. kegiatan sosial terhadap suatu informasi atau peristiwa tertentu
sangat mudah dilakukan dengan media sosial.

1
Dengan perkembangan media sosial yang semakin pesat menjadikan beberapa
pengguna memanfaatkan media sosial sebagai alat untuk transaksi jual beli
online, menurut (Noor, 2017) setiap hari ada 2,7 juta transaksi online yang
terjadi di media sosial. Banyaknya transaksi online diiringi munculnya E-
commerce baru untuk memenfaatkan kesempatan tersebut. Banyaknya E-
commerce baru membuat kita kebingungan dalam menentukan pilihan toko
online mana yang akan digunakan. Dari permasalahan yang ada kami
melakukan penelitian analisis untuk membantu pengguna dalam mengambil
keputusan sebelum membeli atau berjualan online suatu E-commerce dengan
melihat tingkat kepuasan pengguna toko online tersebut.

Sosial media yang digunakan dalam analisis ini yaitu Twitter dan Google Play
atau disebut juga Play Store. Twitter adalah layanan jejaring sosial atau
microblog yang memungkinkan pengguna mengirim dan membaca pesan
berbasis teks hingga 140 karakter, yang dikenal dengan sebutan kicauan
(tweet). Twitter didirikan pada bulan Maret 2006 oleh Jack Dorsey, dan situs
jejaring sosialnya diluncurkan pada bulan Juli. Sejak diluncurkan, Twitter telah
menjadi salah satu dari sepuluh situs yang paling sering dikunjungi di Internet,
dan dijuluki dengan "pesan singkat dari Internet.". Dalam manfaatnya twitter
dapat digunakan sebagai berjejaring karena Twitter adalah salah satu media
sosial yang berbasis microblog yang dapat menambah jaringan kita, yang
dimaksud dengan jaringan seperti kita mengenal suatu komunitas atau kita
mengenal beberapa orang dari pulau berbeda atau bahkan negara yang berbeda.
Twitter merukapan alat komunikasi gratis yang mudah dijangkau oleh semua
kalangan. Twitter juga dapat digunakan untuk membangun wawasan perubahan
yang pada kolom tweet yang jumlah maximal karakter tweet 140 menjadi 280
karakter yang membuat pengguna Twitter dapat lebih mengekpresikan dirinya
dengan menulis tweet tersebut. Begitu juga fitur trends didalam Twitter
menjadikan kita selalu mengetahui berita – berita yang sedang naik daun, tidak
hanya fitur trends kita juga dapat menambah wawasan dengan melihat home

2
timeline. Twitter juga dapat digunakan sebagai alat bantu pengambilan
keputusan seperti pada saat anda ingin membeli suatu barang pada toko online
tertentu, anda dapat melihat komentar bagus atau buruk dari orang orang yang
dapat anda lihat dari home timeline took online tersebut.

selain Twitter, sosial web lainnya yang digunakan adalah Google Play atau
sering disebut juga dengan Play Store. Play Store Play Store adalah layanan
yang disediakan oleh Google. Play Store diluncurkan pada 2008 sebagai cara
pengguna untuk mendownload aplikasi dan game pada sistem operasi Android
yang pada saat itu merupakan OS baru. Awalnya Play Store bernama Android
Market. Play Store menambahkan dukungan untuk aplikasi berbayar pada 2009
di AS dan Inggris, dan berkembang ke pasar Internasional di tahun 2010. Pada
peluncuran Google Play meliki 450.000 aplikasi dan game Android untuk
diunduh. Pada Mei 2014, toko melakukan beberapa perubahan pada setiap
deskripsi aplikasi, peringkat, dan ukuran file. Saat ini Google play store cukup
banyak dijadikan pemilik Android yang ingin sebagai perantara untuk
mengunduh aplikasi, membeli aplikasi, dan lain sebagainya. Berjejaring
merupakan salah satu manfaat yang kita dapatkan saat kita mengunduh suatu
aplikasi misalkan facebook kita dapat menggunakan aplikasi tersebut dengan
sangat mudah dimanapun dan kapanpun karena aplikasi tersebut diunduh ke
smartphone. Selain dalam berjejaring manfaat play store yang kedua adalah
untuk meningkatkan wawasan yang di dapatkan dari aplikasi yang kita unduh
kita dapat melihat dan membaca apa saja yang terjadi hari ini. Play Store juga
dapat digunakan untuk pengambilan keputusan, dengan cara melihat rate
aplikasi sebelum kita mengunduhnya, kita dapat melibat berapa pengguna yang
telah mengunduh aplikasi tersebut.

3
1.2 Rumusan Masalah
Berdasarkan latar belakang tersebut, maka pemesalahannya adalah bagaimana
cara mengintegrasikan data dari Twitter dan Play Store untuk merancang serta
membuat aplikasi analisis tingkat kepuasan konsumen.

1.3 Tujuan Penelitian


Tujuan penelitian yang ingin dicapai adalah merancang dan membangun
aplikasi “Analisis tingkat kepuasan komsumen terhadap toko online Shopee ”
dengan cara melakukan Integrasi data pada Twitter dan Play Store untuk
menganalisis tingkat kepuasan konsumen terhadap toko online Shopee.

1.4 Batasan Masalah


1. Data pengguna Shopee diperoleh dari tweet Twitter dan komentar pada
Play store.
2. Social website yang digunakan adalah Twitter dan Play Store
3. Dalam aplikasi menyampaikan :
 Total penguna
 Total pengguna yang puas
 Total pengguna tidak puas
 Kata kunci pengguna yang puas (sering digunakan).
 Kata kunci pengguna tidak puas (sering digunakan)
 Diagram perbandingan puas dan tidak puas.

1.5 Manfaat Penelitian


Manfaat yang ingin dicapai dalam penelitian ini adalah mengetahui tingkat
kepuasan pelanggan toko online Shopee, yang digunakan untuk memberikan
informasi apakah pengguna telah puas atau tidak dalam menggunakan aplikasi
Shopee, apabila pelanggan tidak puas Shopee Internasional Indonesia PT
diharapkan dapat meningkatkan pelayanan pada toko online Shopee.

4
BAB II

TINJAUAN PUSTAKA

2.1 Penelitian Sebelumnya

2.2 Permasalahan / Topik yang dibahas

2.3 Sosial Web Yang digunakan

2.4 Integrasi Data

2.5 Schema Heterogenity 2.6 Mediated Schema

2.7 Similarity

2.8 Edit Distance

2.9 Visualisasi Informasi

Gambar 1 Struktur Tinjauan Pustaka

5
2.1 Penilitian yang Pernah Dilakukan
2.1.1 Judul Jurnal
“Ekstraksi Infromasi Transaksi Online”

2.1.2 Latar Belakang


Pengumpulan informasi transaksi dari para online-shop tidak efektif karena
jumlah penjual yang sangat banyak dan transaksi pembelian merupakan hal
rahasia bagi para penjual. Jurnal ini berisi tentang eksplorasi analisis
konten tweet dari twitter untuk mengumpulkan secara otomatis transaksi
online. Hal ini dilakukan dengan cara melakukan klarifikasi tweet label
atau kategori suatu tweet, misalnya opini positif, negatif, atau netral. Maka
dari itu akan dibuat sebuah aplikasi yang bisa mengekstrasi informasi
transaksi dari para online-shop yang ada guna menjadi solusi dalam
pengambilan keputusan

2.1.3 Studi Kasus


Contoh tweet berbahasa Indonesia yang berisi aktifitas pengiriman buku
telah sampai ke ekstraksi informasi trasnsaksi online pembeli dari
penjual pasa twitter.

Gambar 2 Twitter

Dari tweet terebut, didapatkan bahwa produk yang dibeli adalah


#HOPE, sedangkan penjualnya adalah @bukabuku.

Bayangkan berapa banyak tweet hal nya dengan tweet diatas. Mungkin
puluhan, ratusan, bahkan mungkin ribuan. Karena menurut (Boorstin,
2012) transaksi online dilakukan pengguna twitter lebih banyak 24%
dibandingkan rata-rata pengguna internet lainnya. Oleh karena itu
menjadi suatu kemungkinan untuk membuat aplikasi pengambilan
keputusan bersumber dari twitter.

6
2.1.4 Teori yang Digunakan
2.1.4.1 Twitter
Twitter merupakan sebuah situs web yang dimiliki dan
dioperasikan oleh Twitter Inc., yang menawarkan
jejaring sosial berupa microblog sehingga
memungkinkan penggunanya untuk mengirim dan
membaca pesan yang disebut kicauan (tweet).

2.1.4.2 Ekstraksi Inforamsi


Ekstrasi informasi merupakan proses yang
mengumpulkan informasi target dari kumpulan teks
yang tidak terstruktur ke dalam bentuk yang lebih
terstruktur (Manning, 2012)

2.1.5 Metode
Metode yang digunakan pada jurnal ini adalah pencarian (Search) dengan
kata kunci tertentu, memfilter konten tweet yang relevan dengan kegiatan
transaksi online (Filter), mengekstraksi informasi transaksi online
(Ekstraksi), dan menyimpan hasil ekstraksi dalam bentuk yang lebih
terstruktur (Filling).

2.1.5.1 Search
Menentukan kata kunci pencarian. Kata kunci berupa nama akun
Twitter dari online-shop Indonesia yang popular yaitu
kutukutubuku, tokopedia, bukabuku, tokobagus, bukalapak, juale,
berniagaIndo, dmarketID, zaloraID, ngomik, and bhinnekacom.
Twitter API digunakan untuk tahapan pertama ini. Hasil pencarian
berbasis kata kunci tersebut masih menghasilkan konten yang
beragam. Terdapat tiga kategori tweet yang dihasilkan

7
 Kategori Relevan, Jika tweet tersebut berisi informasi aktifitas
pembelian, aktifitas pemesanan, dan aktifitas pengiriman
barang
 Kategori Iklan, jika tweet tersebut berisi iklan produk yang
dijual.
 Kategori tidak-relevan, jika tweet tersebut tidak mengandung
informasi rlevan ataupun iklan.

2.1.5.2 Filter
Melakukan analisis konten tweet untuk mengklasifikasikannya ke
dalam satu dari tiga kategori tweet pada tahap search. Dalam proses
ini akan dilakukan pembuangan kata yang tidak bermakna
(stopword), penggunaan kata kecl atau capital (case folding), dll.

2.1.5.3 Ekstraksi
mengekstraksi informasi transaksi online, untuk tahapan ekstraksi,
terdapat 10 jenis informasi yang akan diekstraksi dari tweet yaitu:
produk yang dibeli (PP: purchased product), produk yang diminati
(PI: product of interest), tempat belanja (SP: shopping place),
jumlah produk yang dibeli (NP:number of purchase), cara
pembayaran (PM: payment method), kepuasan pelanggan (CS:
customer satisfaction), ketidakpuasan pelanggan (CI: customer
inconvenience), haparan pelanggan (CE:customer expectation),
lokasi pengguna (UL: user location), dan harga produk (PR:
product price).

Token pertama setiap informasi mendapat awalan B (begin) seperti


kategori B-CS (begin-CS), B-PP (begin-PP), dan B-SP (begin-SP).
Jika informasi tersebut mengandung lebih dari satu token, kategori
yang digunakan diawali dengan I (in) seperti I-CC (in-CS).

8
2.1.5.4 Filling
Menyimpan hasil ekstraksi dalam bentuk yang lebih terstruktur,
Tahapan filling menggabungkan semua token dengan kategori B-
X dan I-X yang berurutan sampai mendapatkan token dengan
kategori berbeda.

Contoh :

Gambar 5 Contoh Tweet

Gambar 4 Hasil Ekstraksi

Gambar 3 Hasil Filling

2.1.6 Analisis Data


Data yang digunakan dalam penelitian ini adalah data dari jutaan tweet
pengguna aktif twitter. Berdasarkan penjelasan pada bagian metode,
terdapat dua korpus tweet yang dibutuhkan, yaitu korpus filter untuk
model klasifikasi pada tahapan filter, dan korpus ekstrasi untuk Contoh
data yang diambil dari sebuah tweet :

9
Gambar 6 Contoh Tweet

Gambar
disamping adalah
contoh hasil
anotasi tweet
dalam format
xml. Dari data
tersebut nanti
akan ditentukan
klasifikasi
menurut 10 jenis
informasi yang
telahdijelaskan
dalam bagian
metode : filter.

Gambar 7 Anotasi Tweet Dalam Format XML

10
2.1.7 Data yang Diolah
Dari data tweet yang diperoleh bisa dilihat bahwa data yang didapat
adalah data yang tidak terstuktur. Maka dari itu perlu untuk membuat
data menjadi terstuktur agar mudah dipahami dan mendapatkan suatu
informasi.

Gambar 8 Hasil Filling

Pada contoh hasil filling terlihat bahwa masih ada satu kejanggalan
yakni kata buku dan casual vacancy masih mendapat klasifikasi yang
berbeda begitu juga jaket dan varsity bigbang. Kedua token tersebut
seharusnya diklasifikasikan sebagai kategori I-PP, Sehingga hasil filling
seharusnya adalah buku casual vacancy dan jaket versity bigbang.
Untuk mendapatkan model klasifikasi yang terbaik untuk tahapan filter
dan tahapan ekstrasi dilakukan eksperimen menggunakan weka 3.7.9 (
Hall dkk, 2009 ). Algoritma pembelajaran yang digunakan telah
disediakan Weka yaitu Naïve Bayes (NB), instance-based learning
(IBk), dan C4.5. Model NB berupa model probabilitas setiap atribut
terhadap suatu kelas, dan klasifikasi suatu data dilakukan dengan
mencari kelas yang memiliki probabilitas maksimum berdasarkan
attribut dari data tersebut (Mitchel, 1997). Ibk tidak menghasilkan
model pembelajaran karena bersifat lazy learning, tetapi hanya
menyimpan semua data pembelajaran yang ada. Klasifikasi suatu data
pada Ibk dilakukan dengan mencari kelas mayoritas dari k-data tetangga
terdekat dengan data yang diklasifikasikan (Mitchell, 1997). Model
C4.5 berupa pohon keputusan, dan klasifikasi suatu data dilakukan
dengan menginferensi pohon sampai mencapai daun yang
merepresentasikan kategori yang dicari (Mitchell, 1997).

11
2.1.8 Hasil Penelitian
Mengekstrak informasi transaksi onlineshop di Indonesia dari konten
tweet. Terdapat empat tahapan yaitu: Search, Filter, Ekstraksi, dan
Filling. Karena sistem ini menggunakan pendekatan klasifikasi untuk
tahap filter dan ekstraksi, beberapa eksperimen dilakukan untuk
mendapatkan model klasifikasi terbaik. Untuk tahap filter, didapatkan
model terbaik dengan akurasi 85.09% dengan representasi fitur trigram,
pembobotan biner, dan algoritma C4.5. Untuk tahap ekstraksi,
didapatkan model terbaik dengan akurasi 81.49% dengan menggunakan
algoritma IBk dan set 7 fitur terbaik berdasarkan gain ratio yaitu
currentWord+ Bef1Class+Bef2Class+ IsLink+ isNumber+ isMention+
isPrice

2.2 Permasalahan / Topik yang dibahas


Media Sosial adalah sebuah media untuk bersosialisasi satu sama lain dan
dilakukan secara online yang memungkinkan manusia untuk saling berinteraksi
tanpa dibatasi ruang dan waktu. Perkembangan media social yang semakin
meningkat membuat media social tidak hanya digunakan untuk media bertukar
informasi namun juga transaksi penjualan atau pembelian online.

Transaksi belanja online tercatat meningkat. Menurut riset yang diprakarsai


oleh Asosiasi E-commerce Indonesia (idEA), Google Indonesia, dan TNS
(Taylor Nelson Sofres), nilai pasar E-commerce Indonesia mencapai Rp 94,5
triliun pada tahun 2013. Tahun 2016 nilainya diprediksi meningkat tiga kali
lipat mencapai Rp 295 triliun. Riset yang dilakukan pada Januari 2014
mendapatkan, produk yang paling penting dan banyak dibeli secara online
adalalah fashion. Pembeli produk fashion mencapai 78% konsumen online
disusul dponsel 46%, elektronik 43%, buku dan majalah 39% dan barang
kebutuhan rumah tangga 24%.

12
Transaksi online yang semakin meningkat membuka peluang bagi toko online
untuk melebarkan sayapnya di dunia teknologi, dengan cara memberikan
pelayanan atau feedback yang menarik bagi pengguna toko online tersebut.
Meningkatnya transaksi online tersebut juga mengakibatkan pengumpulan
informasi transaksi dari para penjual online tidak efektif karena jumlah penjual
yang banyak dan dan informasi tersebut merupakan data rahasia bagi para
penjual. Maka dari permasalahan tersebut penelitian ini dilakukan dengan
tujuan untuk memberikan informasi tingkat kepuasan pada pengguna pada toko
online Shopee.

2.3 Social Web Yang Digunakan


Sosial web yang digunakan untuk penelitian ini adalah Twitter dan Play Store
dimana kita akan menganalisis berdasarkan tweet dan review pengguna
Shopee.

2.3.1 Twitter

Gambar 9 Logo Twitter

Twitter adalah layanan jejaring sosial dan mikroblog daring yang


memungkinkan penggunanya untuk mengirim dan membaca pesan
berbasis teks hingga 140 karakter, yang dikenal dengan sebutan kicauan
(tweet).

Twitter didirikan pada bulan Maret 2006 oleh Jack Dorsey, dan situs
jejaring sosialnya diluncurkan pada bulan Juli. Sejak diluncurkan,

13
Twitter telah menjadi salah satu dari sepuluh situs yang paling sering
dikunjungi di Internet, dan dijuluki dengan "pesan singkat dari
Internet.":

fitur- fitur yang ada pada twitter :

1. Following
Following dalam Twitter merupakan orang yang kita ikuti (follow).
Dengan following tersebut kami akan mendapat updatean baru dari
orang tersebut.
2. Followers
Followers dalam Twitter merupakan orang yang mengikuti kita.
3. ReTweet
Retweet dalam bahasa Indonesia adalah mengulang tweet seseorang
maka ReTweet memiliki makna bahwa kita mengulang (meng-
copy) tweet seseorang untuk disampaikan kembali kepada para
Follower kita. ReTweet juga bisa kita sisipkan comment
sebelumnya, sehingga bisa juga digunakan sebagai alternatif dari
Reply
4. Comment / Reply
Comment atau reply adalah sebuah fitur dimana antar pengguna
dapat saling mengomentari sebuah tweet. Fitur ini dimaksudkan
supaya twitter lebih ramai ada sebuah interaksi antar pengguna.
5. Like
Dahulu fitur ini bernama “favorited” dengan icon bintang. Alasan
diganti dengan nama like adalah karena istilah like dan tombol love
itu sudah menjadi sebuah trend dan icon bagi pengguna sosial media
untuk menunjukkan ketertarikan akan sebuah topik. Kalau di
facebook fitur ini dinamakan “like”, kalau di instagram “fav”, kalau
di google plus adalah “plus 1”. Intinya sama, untuk menunjukkan
bahwa kita menyukai/tertarik sebuah postingan.

14
6. Share
Share merupakan salah satu fitur pada Twitter yang akan
membagikan twett melalui aplikasi yang ada pada perangkat anda.
7. Trends
Trends merupakan suatu topik yang sedang banyak dibicarakan
dalam twitter, semakin banyak pengguna twitter yang
membicarakan suatu topik maka semakin lama pula topik tersebut
berada di halaman utama twitter dan akan menjadi trending topik.
8. Mention
Fungsi dari mention adalah untuk memberi tahu pengguna akun
twitter lain dengan menuliskan username nya (@username)
sehingga pengguna akun tersebut dapat membaca tweet yang kita
tandai ke mereka. Pengguna akun tersebut akan mendapatkan
notifikasi di akun twitter.
9. Hastag (#)
Hastag merupakan kata kunci yan dapat dicari oleh pengguna
tweeter dengan mudah dan cepat. Kata kunci berhashtag tersebut
dapat menjadi trending di tweeter.
10. Direct Messages (DM)
Direct Messages (DM) adalah fitur yang digunakan untuk memberi
pesan pribadi ke pengguna Tweeter lain. Fitur ini hanya dapat
digunakan apabila kedua akun saling follow, dan DM ini hanya
memiliki batas 140 karakter.
11. Tweet
Tweet merupakan fitur untuk pengguna twitter agar dapat menulis
sesuatu yang nantinya akan di posting di home timeline twitter.
Dalam tweet ini memiliki batas 140 karakter.
12. Notifications
Notif adalah pemberitahuan pengguna jika ada aktivitas di twitter,
seperti: tweet baru, Retweet, like, comment, dll.

15
13. Night mode
Night mode adalah merubah tampilan twitter. Jika night mode
diaktifkan maka UI twitter akan berwarna gelap (biru navy)
sedangkan jika tidak aktif akan berwarna terang (putih).
14. Unfollow
Unfollow berfungsi untuk tidak mem-follow atau tidak mengikuti
suatu akun twitter tertentu yang sebelumnya kita follow. Ketika kita
sudah melakukan unfollow suatu akun, segala tweet akun tersebut
tidak akan muncul lagi di home timeline anda.
15. Search
Search merupakan sebuah fitur untuk mencari pengguna lain atau
hastag atau mencari sesuatu yang sedang dipikirkan oleh
penggunanya. Semua yang diketikkan akan munsul selama kata
kunci yang dimasukkan terdapat di Twitter.
16. Blocking, Muting
Fitur ini digunakan untuk memblokir sebuah akun pengguna jika
dirasa akun pengguna tersebut mengganggu atu mematikan segala
pemberitahuan tentang akun tersebut
17. Analitika
Analitika berfungsi untuk menampilkan informasi secara detail
segala aktifitas pengguna di twitter.
18. Iklan Twitter
Iklan Twitter digunakan bagi pengguna untuk melakukan promosi
sebuag produk baik berupa barang ataupun jasa. Iklan Twitter
berbasis objek dirancang untuk membantu pengguna mencapai hasil
yang mendorong tindakan dan memberikan nilai tambah pada
produk tersebut. Fitur ini disesuaikan berbagai tujuan bisnis, mulai
dari mendorong tingkat kunjungan situs web hingga meningkatkan
kesadaran merek

16
2.3.2 Play Store / Google Play

Gambar 10 Logo PLay Store

Google Play atau Play Store adalah layanan yang disediakan oleh
Google. Play Store diluncurkan pada 2008 sebagai cara pengguna untuk
mendownload aplikasi dan game pada sistem operasi Android yang
pada saat itu merupakan OS baru. Awalnya Play Store bernama Android
Market. Play Store menambahkan dukungan untuk aplikasi berbayar
pada 2009 di AS dan Inggris, dan berkembang ke pasar Internasional di
tahun 2010. Pada peluncuran Google Play meliki 450.000 aplikasi dan
game Android untuk diunduh. Pada Mei 2014, toko melakukan
beberapa perubahan pada setiap deskripsi aplikasi, peringkat, dan
ukuran file. Saat ini Google play store cukup banyak dijadikan toko
pusay agi pemilik Android yang ingin mengunduh aplikasi, membeli
aplikasi, dan lain sebagainya.

Fitur – fitur yang ada pada Play Store :

1. Search
Search digunakan untuk kita mencari aplikasi, game, flim atau buku
yang akan kita cari dalam aplikasi tersebut.
2. Home
Home adalah tampilan awal dari Play Store dengan menampilkan
beberapa iklan dan rekomendasi .
3. Rating dan Review

17
Rating dan riview merupakan fitur yang dapat kita lakukan apabla
kita telah menginstal suatu aplikasi pada Play Store yang digunakan
untuk memberikan penilaian pada aplikasi yang telah anda gunakan.
4. Daftar Aplikasi
Daftar aplikasi adalah daftar aplikasi yang telah kita unduh.
5. Update Otomatis
Update otomaatis adaah pengaturan yang ada di Play store untuk
mengupdate aplikasi yang ada versi baru dari aplikasi tersebut,
namun fungsi update otomatis dapat dimatikan jika tidak ingin
digunakan.

2.4 Integerasi Data


Integrasi data adalah kombinasi antara proses teknis dan bisnis yang digunakan
untuk menggabungkan data dari sumber yang berbeda menjadi informasi yang
berarti dan berharga. Solusi integrasi data yang lengkap memberikan data
tepercaya dari berbagai sumber.
Tujuan sistem integrasi data adalah menawarkan akses seragam ke satu
kumpulan sumber data yang otonom dan heterogen. Lingkup focus sistem
integrasi data adalah sebagai berikut:
 Query: Fokus sebagian besar sistem integrasi data adalah pada query
sumber data yang berbeda.
 Jumlah sumber: Integrasi data sudah menjadi tantangan bagi sejumlah kecil
sumber, namun tantangannya semakin meningkat ketika jumlah sumber
tumbuh. Yang paling ekstrem, jika ingin mendukung integrasi data skala-
Web.
 Heterogenitas: Skenario integrasi data yang khas melibatkan sumber data
yang ada dikembangkan secara mandiri satu sama lain. Sebagai
konsekuensinya, sumber data berjalan pada sistem yang berbeda: beberapa
di antaranya adalah database, namun ada juga sistem manajemen konten
atau file yang berada dalam direktori. Sumber akan memiliki skema dan

18
referensi yang berbeda untuk objek, bahkan ketika mereka memodelkan
domain yang sama. Beberapa sumber mungkin benar-benar terstruktur
(misalnya, database relasional), sementara yang lain mungkin tidak
terstruktur atau semi-terstruktur (misalnya, XML, teks).
 Otonomi: Sumber tidak harus termasuk dalam satu kesatuan administratif,
dan bahkan ketika mereka melakukannya, mereka mungkin dijalankan oleh
suborganisasi yang berbeda. Oleh karena itu, kita tidak dapat
mengasumsikan bahwa kita memiliki akses penuh terhadap data dalam
sumber atau bahwa kita dapat mengakses data kapan pun kita mau, dan
perhatian yang besar perlu diberikan untuk menghormati privasi data bila
sesuai. Selanjutnya, sumber dapat mengubah format data dan pola akses
mereka setiap saat, tanpa harus memberitahukan kepada masing-masing
entitas administratif pusat.

2.5 Schema Heterogenity


Heterogenitas adalah sebuah skenario integrasi data melibatkan sumber data
yang dikembangkan secara independen satu sama lain. Ketika sebuah database
didesain oleh banyak orang atau organisasi yang berbeda, jelas struktur
database yang dihasilkan akan berbeda. Meskipun memiliki domain database
yang sama. Akibatnya, sumber data berjalan pada sistem yang berbeda
beberapa di antaranya adalah basisdata, tetapi yang lain kemungkinan sistem
manajemen konten atau hanya file yang berada di direktori. Sumber-sumber
akan memiliki schema data yang berbeda dan referensi ke objek, bahkan ketika
mereka memodelkan domain yang sama. Beberapa sumber mungkin terstruktur
sepenuhnya (misalnya, basis data relasional), sementara yang lain mungkin
tidak terstruktur atau semi-terstruktur (misalnya, XML, teks).

19
2.6 Mediated Schema
Mediated schema adalah mesin pencari vertikan memodelkan sifat – sifat
penting dari objek yang sedang di pertimbangkan, beberapa atribur dalam
skema termediasi akan menjadi atribut dalam bentuk yang diakses pengguna.
Atribut lainnya akan menjadi atribut output dan hanya akan terlihat di halaman
hasil pencarian. Misalnya, skema yang dimediasi untuk pencarian pekerjaan
yang mengintegrasikan data dari dua sumber akan menyertakan atribut yang
ditampilkan dalam formulir, seperti kategori, kata kunciDeskripsi, kota, negara
bagian, dan atribut yang dibukaTanggal dan menggunakanAgency yang hanya
ditampilkan dengan hasil. Perhatikan bahwa dalam beberapa kasus, atribut yang
ditampilkan pada formulir dapat berupa nilai minimum dan maksimum untuk
atribut skema.

2.7 Similarity
Semakin berkembangnya teknologi informasi, sehingga membuat pembuatan
karya tulis semakin mudah dan cepat. Hal tersebut dikarenakan informasi kini
tersedia secara melimpah. Akan tetapi dikarenakan kemudahan dalam
memperoleh informasi tersebut, pada pembuatan karya tulis sering ditemukan
kesamaan dengan karya tulis orang lain sehingga kemudian menimbulkan isu
plagiarism.

Similarity merupakan cara yang digunakan untuk menanggulangi


permasalahan tersebut dengan menggunakan metode levenstein dan jaro
winkler.

2.8 Edit Distance


Algoritma Levenshtein ditemukan oleh ilmuan asal Rusia bernama Vladimir
Levenshtein pada tahun 1963, algoritma ini juga disebut dengan algoritma Edit
Distance. Perhitungan edit distance didapatkan dari matriks yang digunakan
untuk menghitung jumlah perbedaan string antara dua string, sebagai contoh
hasil penggunaan algoritma ini, string “komputer” dan “computer” memiliki

20
distance 1 karena hanya perlu dilakukan satu operasi saja untuk mengubah satu
string ke string yang lain. Dalam kasus dua string di atas, string “computer”
dapat menjadi “komputer” hanya dengan melakukan satu penukaran karakter
“c” menjadi “k” . Algoritma Levenshtein digunakan secara luas dalam berbagai
bidang, misalnya mesin pencari, pengecek ejaan (spell checking), pengenal
pembicaraan (speech recognition), pengucapan dialek, analisis DNA,
pendeteksi pemalsuan, dan lain-lain. Algoritma ini menghitung jumlah operasi
string paling sedikit yang diperlukan untuk mentransformasikan suatu string
menjadi string yang lain . Algoritma Levenshtein bekerja dengan menghitung
jumlah minimum pentranformasian suatu string menjadi string lain yang
meliputi penghapusan, penyisipan, dan penukaran. Selisih perbedaan antar
string dapat diperoleh dengan memeriksa apakah suatu string sumber sesuai
dengan string target. Nilai selisih perbedaan ini disebut juga edit distance atau
jarak Levenhstein. Jarak Levenshtein antar string “s” dan string “t” tersebut
adalah fungsi D yang memetakan (s,t) ke suatu bilangan real non negatif,
sebagai contoh diberikan dua buah string s = s(1)s,(2),s(3),...,s(m) dan t =
t(1),t(2),t(3),...,t(n) dengan | s | = m dan | t | = n sepanjang alfabet V berukuran
r sehingga “s” dan “t” anggota dari V*. s(j) adalah karakter pada posisi ke-j
pada string “s” dan t(i) adalah karakter pada posisi ke-i pada string “t”.
Sehingga jarak Levenshtein dapat didefinisikan sebagai (Harahap, 2013). D(s,t
) = d(s1,t1 ) + d(s2,t2) + … + d(s1,t1 ) D(s,t) adalah banyaknya operasi
minimum dari operasi penghapusan, penyisipan dan penukaran untuk
menyamakan string s dan t. Pada implementasi pencocokan antar string, ketiga
operasi tersebut dapat dilakukan sekaligus untuk menyamakan string sumber
dengan string target.

Tahapan :

Pada saat melakukan pencarian pada sistem menggunakan kata kunci yang
tidak sesuai yang disebabkan oleh kesalahaan pada pengejaan, maka sistem
akan memberikan saran kata kunci yang merupakan hasil dari perbaikan ejaan

21
kata kunci yang sebelumnya. Sistem memberikan saran kata kunci
inventorisasi“ yang merupakan perbaikan ejaan dari kata “inventrisasi”.
Adapun proses perbaikan ejaan dapat dijelaskan sebagai berikut :

1. Mengkonversi kata kunci “inventrisasi” ke dalam array.


2. Melakukan proses seleksi pada semua kata yang tersimpan pada tabel Kata
Kunci. Kata kunci yang digunakan perbandingan adalah kata kunci yang
memiliki panjang karakter (P) antara Pkata kunci -3 sampai Pkata kunci +
3. Sehingga kata kunci “inventrisasi” dengan panjang karakter 12, maka
katakata yang digunakan sebagai pembanding adalah kata yang memiliki
panjang karakter diantara 9 – 15.
3. Melakukan perhitungan jarak dengan menggunakan metode Levenshtein
terhadap kata kunci “inventrisasi” dengan setiap kata yang terpilih pada
tabel Kata Kunci. Sebagai contoh empat kata kunci yang dipilih sebagai
perbandingan dan akan dilakukan perhitungan jarak yaitu kata “interpelasi”
dengan panjang karakter = 11, kata “inventorisasi” dengan panjang karakter
= 13, kata “interupsi” dengan panjang karakter = 9 dan kata “investasi”
dengan panjang karakter = 9.

22
Tabel 1Interpelasi

Tabel 2 Inventarisasi

23
Tabel 3 Interupsi

Tabel 4 Investasi

2.9 Visualisasi Informasi


Visualisasi Informasi adalah rekayasa dalam pembuatan gambar, diagram atau
animasi untuk penampilan suatu sistem informasi. Visualisasi dalam bentuk
gambar baik yang bersifat abstrak maupun nyata telah dikenal sejak awal dari
peradaban manusia.

2.9.1 Teknik Visualiasasi Informasi


1. Pengumpulan Jumlah
Mengakumulasikan elemen individual kedalam sebuah unit yang
lebih besar untuk menghadirkannya seperti sesuatu yang utuh atau

24
lengkap. Teknik ini akan digunakan untuk mengakumulasikan
setiap tweet dan komentar Play Store yang dibuat oleh pengguna
Twitter dan Play Store yang dimana akan ditampung kedalam
database untuk menghadirkan informasi yang lebih lengkap dan
akurat.
2. Brushing
Memilih atau menunjuk/ menspesifikasikan nilai, kemudian melihat
item yang tepat ditempat lain pada tampilan. Teknik ini akan
digunakan untuk menspesifikasikan data data yang diperoleh dari
Twitter dan Play Store untuk dijadikan suatu informasi yang
berguna.
3. Hirarki yang menggambarkan visualisasi aplikasi ini adalah tree
(Pohon). Hal ini dikarenakan semua data yang beragam akan
divisualisasikan kedalam satu tampilan puncak yaitu informasi
mengenai kepuasan, ketidakpuasan, dan harapan pelanggan
terhadapa transaksi online Shoope.id

Tweet

Informasi Transaksi
Review Play Store
toko online.

Hastag

Tabel 5 Hirarki Visualisasi

25
BAB III

ANALISIS DAN PERANCANGAN SISTEM

3.1 Tujuan dilakukan Integrasi Data


1. Mendapatkan data dari dua macam sumber mengenai respon pelanggan
shopee Indonesia
2. Mengolah data tersebut berdasarkan respon positif, negatif, dan netral (
sentiment analysis ) untuk dijadikan sumber informasi pengambilan
keputusan pelanggan shopee dalam melalukan proses transaksi.
3.2 Kebutuhan Informasi oleh Pengguna
Penjelasan kebutuhan informasi untuk masing-masing pengguna yang
bersumber dari banyak sumber data, contoh :

NO PENGGUNA KEBUTUHAN INFORMASI

Admin Penjual Data Tweet Twitter dan Data Komentar di


1 Shoope Google Playstore yang telah
Barang diintegerasikan untuk melihat berbagai macam
respon dari pelanggan/ konsumen
Informasi Sentiment Analysis untuk
Pelanggan Shopee
memperkirakan keinginan pelanggan untuk
2 Indonesia
belanja di Shoope Indonesia

Tabel 6 Kebutuhan Informasi oleh Pengguna

26
3.3 Profil Sumber data
3.3.1 Profil masing – masing sumber data
3.3.1.1 Twitter
Twitter adalah layanan jejaring sosial dan mikroblog daring
yang memungkinkan penggunanya untuk mengirim dan
membaca pesan berbasis teks yang dikenal dengan sebutan
tweet (kicauan). Pada Twitter terdapat berbagai macam fitur,
yaitu: Profile, follower/ following, Tweet, Retweet, Comment,
Like, Trends, hastag, Mention, dll.

Gambar 11 Tampilan Twitter

3.3.1.2 Play Store


Google Playstore adalah layanan konten digital milik Google
yang melingkupi toko daring untuk produk-produk seperti
musik/lagu, buku, aplikasi, permainan, ataupun pemutar media
berbasis awan. Layanan ini dapat diakses baik melalui web,
aplikasi android (Play Store), dan Google TV. Shopee sebagai
salah satu e-commerce terbesar di Indonesia juga sudah tersedia
di Playstore untuk memperbesar cakupan konsumennya. Dalam
hal ini juga terdapat banyak sekali komentar mengenai kinerja
shopee dengan berbagai macam penilaian oleh konsumen.

27
Gambar 12 Tampilan Play Store

3.3.2 Skema Sumber Data


3.3.2.1 Twitter
Nama_User Nama user pengguna Twitter
Waktu_Posting Waktu dari sebuah tweet/posting dibuat
Lokasi Lokasi Pengguna Twitter
Tweet Postingan dalam Twitter
Hastag Gabungan kata tanpa spasi yang di awali
dengan tanda “#”
Mention Menyebut pengguna lain dalam postingan /
komentar kita yang diawali dengan “@”
Like Menyukai sebuah tweet

Tabel 7 Sumber Data Twitter

28
3.3.2.2 Play Store
Nama_User Nama user pengguna Playstore
Review Postingan Pengguna Playstore
Waktu_Posting Waktu dari sebuah review dibuat
Like Menyukai sebuah review
Rate Menilai sebuah aplikasi yang ada di
Playstore
Tabel 8 Sumber data Play Store

3.3.2.3 Skema Keberagaman Data


Dari kedua sumber yang digunakan yaitu Twitter dan Playstore
memiliki keberagaman yang sering ditemukan seperti :
1. Penulisan Tanggal Posting pada Twitter (25 Nov) sedangkan
Playstore (December 5, 2018)
3.4 Proses Integrasi Data
3.4.1 Metode pembuatan Schema Mapping (GAV/LAV/GLAV)
Dalam Hal ini pembuatan Schema Mapping menggunakan metode
local as view. Metode local as view dilakukan dengan cara membuat
tabel view diluar dari mediated schema. Data yang telah diambil dari
berbagai macam sumber akan diletakan pada suatu tabel view terlebih
dahulu sebelum diletakkan di sebuah mediated schema.

29
Gambar 13 Metode Mapping

3.4.2 Crawling Data Sekunder


3.4.2.1 Crawling Data twitt dari Twitter.
1. Mengambil kode API pada Twitter dengan meminta request
API pada Twitter

Gambar 14 Key dan Tokens Twitter

30
2. Menggunakan Library Abraham TwitterOAuth untuk
pengembangan dengan menggunakan PHP sebagai Bahasa
pemrograman. Untuk mempermudah penggunaan,
gunakanlah composer untuk melakukan installasi library.

Gambar 15 Composer

Memasukkan kode diatas pada terminal dengan directori yang


akan dituju. Setelah itu library akan otomatis terinstal pada
directori yang akan dituju.

Gambar 16 Library Abraham TwitterOAuth

31
3. Membuat file php baru dengan nama file twitter dalam satu
folder yang sama dengan Library Abraham TwitterOauth.
Memasukkan kode seperti dibawah ini.

<?php
// load library TwitterOAuth
require "vendor/autoload.php";
use Abraham\TwitterOAuth\TwitterOAuth;

// menentukan keyword yang akan di cari


$keyword = 'shoppe';

// ganti dengan API twitter anda


$key = 'Ian1y2YtFgN07KB6VZ7RiHJqu';
$secret_key =
'w13loCr1RckHkZvDXbAazxv5gEpbFZ8a6sDFrsBZo9ID5Des5l';
$token = '464384965-wrh2z3T9FNgP7TyFwzFi6lJP2eJwwJ51mjo5IP52';
$secret_token =
'ohHc8F561BkQlYk1i1X4JTbjr4Y0v4D74IdH7QigkI6aW';

// membuka koneksi
$conn = new TwitterOAuth($key, $secret_key, $token,
$secret_token);

// mengambil tweet berdasarkan keyword yang di tentukan


// anda bisa merubah jumlah tweet yang akan di tampilkan dengan
merubah angka pada count
$tweets = $conn->get('search/tweets', array('q'
=>$keyword,'count'=>10000, 'lang'=>'in'));

// menampilkan hasil keyword yang di tentukan


echo '<h4>Keyword @'.$keyword.'</h4><hr />';
foreach ($tweets->statuses as $tweet) {
$str_id = $tweet->id_str;
$user = $tweet->user->screen_name;
$text = $tweet->text;
$date = date('Y-m-d h:i:s', strtotime($tweet->createdat));

?>

Tabel 9 Code PHP

32
4. Jalankan server php di localhost menggunakan browser,
maka akan muncul seperti tampilan data twitt seperti
dibawah ini.

Gambar 17 Tampilan di Localhost

3.4.2.2 Crawling Data Komentar dari Google Playstore


1. Membuka alamat https://www.imports.io/ pada browser

Gambar 18 Tampilan Import.Io

33
2. Memasukkan url
https://play.google.com/store/apps/details?id=com.shopee.i
d&hl=in

Gambar 19 Tampilan Import

3. Memilih data yang ingin diambil

Gambar 20 Pemilihan data 1

34
Gambar 21 Pemilihan data 2

Gambar 23 Pemilihan Data 3

4. Mengextract data yang telah didapatkan

Gambar 22 Extract 1

35
Gambar 24 Extract 2

5. Mendowload data dengan format yang diinginkan

Gambar 25 Tampilan data format yang diinginkan

36
6. data dalam format exel

Gambar 26 Data Format Exel

3.4.3 Algoritma Pembobotan Similarity


Algoritma yang digunakan dalam penelitian ini adalah Algoritma Edit
Distance/ Leveinstein. Algoritma ini bekerja dengan cara
menggabungkan dua string. Dalam proses perbandingannya , string
kedua dimanipulasi sehingga pada akhirnya serupa dengan string
pertama.

1. Menggunakan Algoritma Leveinstein

Tabel 10 Algoritma dalam PHP

37
2. Memasukkan beberapa parameter yaitu ( string $str1, string $str2,
int $cost_ins, int $cost_rep, int $cost_del )

Gambar 28 Parameter

3. Output yang dikeluarkan yaitu berupa tipe data integer dengan nilai
kesamaan antara $target(nilai yang dicari) dengan $candidate(nilai
yang disamakan). Semakin kecil nilai yang dihasilkan function
levenshtein, maka semakin mirip kata yang ada di ta$rget dengan
$candidate.

Gambar 27 Output Levenstein

38
3.4.4 Mediated Schema dan Pemetaan dengan Sumber Data
Mediated Schema terdiri dari Id, username, Posting, dan Waktu
Posting. Data yang paling dibutuhkan adalah data twitt dari
twitter dan review dari google playstore.

Informasi:
Sentiment Analysis Konsumen Shopee Indonesaia

Mediated Schema:
( Id, Username, Posting, Waktu
Posting, )

Database Database
Twitter Google
Playstore

Gambar 29 Mediated Schema

3.4.5 Desain I/O


1. Pengambilan data
 Memasukkan kata kunci kedalam text box yang
tersedia.

Gambar 30 Tampilan memasukkan kata kunci

39
 Secara otomatis program akan mencari dan
menampilkan data twitt dan review dari Google
Playstore.

Gambar 32 Tampilan data Tweet

2. Matching Data

Gambar 31 Data Matching

40
3. Proses Mapping

Gambar 34 Proses Mapping

4. Informasi Sentimen analisis

Gambar 33 Informasi Sentimen Analisis

41
3.4.5 Desain Uji Coba
NO SKENARIO HASIL
Text Box Search kosong Muncul pesan alert!
( Masukkan Kata Kunci! )
1.

2. Hasil Pencarian Web Crawler Muncul Data dari Twitter


atau Playstore
3. Menentukan Treshold dan keyword Mengetahui tingkat
dalam penghitungan similarity similarity dari suatu kata
pada sebuah twit / review
playstore
4. Menyimpan data dari dua source Data tersimpan di satu
berbeda mediated schema
(database)
Tabel 11 Desain Uji Coba

3.5 Pengembangan Aplikasi


 Bahasa Pemrograman: PHP, HTML, CSS, JAVASCRIPT
 Database: PHPMYADMIN
 Text Editor : VS Code, Notepad ++
 Lain- Lain : MS. EXCEL, XAMPP, IMPORT.IO

42
BAB IV

HASIL DAN PEMBAHASAN


4.1 Kebutuhan Perangkat Keras
OS : Windows 7 32-bit

CPU : Intel Core i5-530 2.9 GHz or AMD Phenom II X4 925 2.8 GHz

RAM : 2 GB System Memory

GPU RAM : 1024MB Graphics Memory

GPU : Nvidia GeForce GTX 260 or AMD Radeon HD 4850

4.2 Kebutuhan Perangkat Lunak


Perangkat Lunak basis data yang digunakan adalah Microsoft Exel, semua daa
yag diambil dari Play Store akan ditampung di file berformat MS.Excel. Lalu
program akan mengambil semua data di file Excel untuk dilakukan proses
perhitungan mengukur tingkat similarity. Selain itu, untuk menjalankan
aplikasi atau sistem yang kami buat, kami menggunakan bantuan browser dan
text editor dikarenakan kami membuat sistem atau aplikasi web.

43
4.3 Implementasi Sistem
1. Tampilan awal

Gambar 35 Tampilan awal Website

2. Sistem pencarian data menurut kata kunci/ keyword

Gambar 37 Pencarian

3. Hasil Pencarian Berdasarkan Keyword

Gambar 36 Hasil pencarian berdasarkan keyword

44
4. Proses mapping data dengan menggunakan tampila diagram garis

Gambar 38 Proses Mapping Menggunakan tampilan diagram

5. Proses menentukan sentiment analisis

Gambar 39 Penentuan analisis

45
4.4 Hasil Uji Coba Sistem

KESIMPULA
NO SKENARIO HASIL N

Text Box Search kosong Muncul pesan alert!


( Masukkan Kata Kunci!

1. ) Valid

2. Hasil Pencarian Web Crawler Muncul Data dari Twitter


Valid
atau Playstore
3. Menentukan Treshold dan keyword Mengetahui tingkat
dalam penghitungan similarity similarity dari suatu kata
Valid
pada sebuah twit / review
playstore
4. Menyimpan data dari dua source Data tersimpan di satu
berbeda mediated schema Valid
(database)
Tabel 12 Hasil Uji Coba Sistem

46
BAB V

PENUTUP
5.1 Kesimpulan
Kesimpulan yang dapat diambil dari pembuatan aplikasi Analisis tingkat
kepuasan komsumen terhadap toko online Shopee dengan membandingkan 2
website yaitu Twitter dan Play Store berdasarkan komentarnya sebagai berikut
:

1. Aplikasi ini berisi tentang informasi terkait tingkat kepuasan konsumen


yang di ambil dari tweet pada twitter dan review pada Play Store yang
dikumpulkan menjadi satu supaya mengetahui tingkat kepuasan pelanggan
2. Aplikasi ini dapat menjadi tolak ukur konsumen yang akan melakukan
transaksi karena dapat melihat tigkat kepuasan terlebih dahulu, jika tingkat
kepuasan lebih tinggi maka pelanggan akan mempercayai bahwa shopee
memiliki pelayanan yang baik.
3. Aplikasi ini juga dapat menjadi pertimbangan untuk Shopee Internasional
Indonesia PT untuk meningkatkan pelayanan jika dalam aplikasi tersebut
tingkat kepuasan konsumen rendah.

5.2 Saran
Dalam pembuatan aplikasi Analisis tingkat kepuasan komsumen terhadap toko
online Shopee tentulah masih ada kekurangan dan perlunya perbaikan lebih
lanjut. Demi pengembangan dan kemajuan aplikasi yang lebih baik, maka hal-
hal yang perlu diperhatikan guna mengembangkan aplikasi ini adalah :

1. Aplikasi Analisis tingkat kepuasan komsumen terhadap toko online Shopee


membandingkan 2 website ( Twitter dan Play Store ) ini merupakan salah
satu pilihan alternative untuk membantu konsumen dalam mengambil
keputusan.

47
2. Dalam pengembangannya, aplikasi Analisis tingkat kepuasan komsumen
terhadap toko online Shopee dengan membandingkan 2 website ini perlu
didukung oleh perangkat yang memadai, baik perangkat lunak (Sofware),
perangkat keras (Hardware), maupun jaringan (Network).

48
DAFTAR PUSTAKA
Arnani, M. (2018, September 11). 16000 Laporan diterima cekrekenig.id 14000
penipuaan. Retrieved from Kompas.com:
https://nasional.kompas.com/read/2018/09/11/15014481/16000-laporan-
diterima-cekrekeningid-penipuan-online-capai-14000

Baskoro, A. (2018, September 12). Kasus Penipuan Toko Online, Bela Hasilkan
Ratusan Juta Hasil Penipuan Bermodus Jual Beli Online. Retrieved from
Wartakota.tribunnews.com:
http://wartakota.tribunnews.com/2018/09/12/kasus-penipuan-toko-online-
bela-hasilkan-ratusan-juta-hasil-penipuan-bermodus-jual-beli-online

Grafelly, D. (2015, September 13). Bagaimana perkembangan Twitter saat ini?


Retrieved from Techno.Id: https://www.techno.id/social/bagaimana-
perkembangan-twitter-saat-ini-1509122.html

Inilah Sejarah Berdirinya Twitter yang Fenomenal di Dunia. (2017, Agustus 26).
Retrieved from Netralnews.com:
http://www.netralnews.com/news/singkapsejarah/read/97615/inilah-sejarah-
berdirinya-twitter-yang-fenomenal-di-dunia

Manning. (2012). C. Information Extraction and Named Entity Recognition.


California: Stanford University.

Maulida, L. (2017, November 21). OKEZONE INNOVATION: Menguak Sejarah


Google Play Store yang Dulunya Bernama Android Market. Retrieved from
Okezonetechno:
https://techno.okezone.com/read/2017/11/21/56/1818092/okezone-innovation-
menguak-sejarah-google-play-store-yang-dulunya-bernama-android-market

49
Noor, A. R. (2017, April 27). Tiap hari ada 2,7 juta transaksi online lewat medsos.
Retrieved from https://inet.detik.com/business/d-3485125/tiap-hari-ada-27-
juta-transaksi-jual-beli-lewat-medsos

Setiawan, S. R. (2014, Oktober 13). Ketika Orang Indonesia Lebih Senang Belanja
Online. Retrieved from Kompas.com:
https://ekonomi.kompas.com/read/2014/10/13/084300126/Ketika.Orang.Indo
nesia.Lebih.Senang.Belanja.Online

vinashaw. (n.d.). Apa yang dimaksud dengan web crawler ? Retrieved from Dictio.id:
https://www.dictio.id/t/apa-yang-dimaksud-dengan-web-crawler/1511

50

Anda mungkin juga menyukai