Anda di halaman 1dari 6

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/366229568

ANALISIS DATASET GOOGLE PLAY STORE MENGGUNAKAN METODE


EXPLORATORY DATA ANALYSIS (EDA) Analysis of Google Play Store Datasets
Using the Exploratory Data Analysis (EDA) Method

Preprint · December 2022


DOI: 10.13140/RG.2.2.14192.12808

CITATIONS READS

0 290

5 authors, including:

Lintang Aura Syufee Dwi Ria Latifa


Universitas Jember Universitas Jember
1 PUBLICATION 0 CITATIONS 2 PUBLICATIONS 1 CITATION

SEE PROFILE SEE PROFILE

Stefany Kurniawan Selvi Aulia


Universitas Jember Universitas Jember
1 PUBLICATION 0 CITATIONS 6 PUBLICATIONS 105 CITATIONS

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

ANALISIS DATASET GOOGLE PLAY STORE MENGGUNAKAN METODE EXPLORATORY DATA ANALYSIS (EDA) View project

Biology Content View project

All content following this page was uploaded by Stefany Kurniawan on 13 December 2022.

The user has requested enhancement of the downloaded file.


ANALISIS DATASET GOOGLE PLAY STORE MENGGUNAKAN
METODE EXPLORATORY DATA ANALYSIS (EDA)

Analysis of Google Play Store Datasets Using the


Exploratory Data Analysis (EDA) Method

Lintang Aura Syufee , Dwi Ria Latifa ,


(a) (b)

Stefany Amanda Kurniawan , Selvi Aulia Nilasari


(c) (d)

Program Studi Sistem Informasi, Universitas Jember (abcd)

212410101002@mail.unej.ac.id , 212410101009@mail.unej.ac.id ,
(a) (b)

212410101004@mail.unej.ac.id , 212410101098@mail.unej.ac.id
(c) (d)

ABSTRAK: Bagi para pengguna android, salah satu tempat untuk mengunduh ratusan ribu
aplikasi Android adalah Google Play Store. Aplikasi-aplikasi Android dibagi menjadi
kategori-kategori yang unik. Kategori tersebut memiliki aplikasi dan didalamnya terdapat Rating
untuk masing-masing aplikasinya. Pada penelitian ini kami menggunakan metode Data Analysis
dan Exploratory Data Analysis (EDA). Data set Google Play Store diambil dari website resmi
Kaggle. Tujuan dari penelitian ini adalah untuk mengetahui aplikasi yang paling banyak diinstal,
aplikasi yang memiliki Rating tertinggi, juga aplikasi yang memiliki review paling banyak
berdasarkan kategori yang terdapat pada Google Play Store, untuk mengetahui korelasi antara
dara Rating dan Reviews terhadap instalasi aplikasi. Hasil dari penelitian ini adalah adanya data
mengenai banyaknya Rating, instalasi, dan review aplikasi berdasarkan kategori pada Google
Play Store.

Kata kunci: dataset, google play store, EDA

ABSTRACT: The Google Play Store allows Android users to download hundreds of thousands
of Android applications. Android apps are divided into unique categories. This category has
applications, and in it, there is a Rating for each application. We used the Data Analysis and
Exploratory Data Analysis (EDA) methods in this study. The Google Play Store data set is taken
from the official Kaggle website. The purpose of this research is to find out the most installed
applications, the applications with the highest ratings, and the applications with the most
reviews based on the categories found on the Google Play Store, to find out the correlation
between Ratings and Reviews on application installations. The results of this study are data
regarding the number of ratings, installations, and application reviews by category on the
Google Play Store.

Keywords: dataset, google play store, EDA

I. PENDAHULUAN mobile. Pada tahun 2011, total


Bagi para pengguna android, pengunduhan aplikasi android pada
salah satu tempat untuk mengunduh Google Play Store sudah mencapai 10
ratusan ribu aplikasi android adalah Miliar unduhan. Google Play Store
Google Play Store. Google Play Store memungkinkan pengguna untuk
adalah pasar platform android yang mengunduh dan menggunakan
penting untuk pendistribusian aplikasi
aplikasi-aplikasi pihak ketiga secara yang banyak, serta dapat diterima oleh
bebas. para penggunanya khususnya pada
Pada Google Play Store, Google Playstore
aplikasi-aplikasi android di bagi Pada penelitian ini,
menjadi kategori-kategori yang unik. aplikasi-aplikasi pada Google Play
Aplikasi android ini ada yang berbayar Store digunakan metode Data Analysis
dan gratis. Dengan adanya dan Exploratory Data Analysis (EDA)
kategori-kategori tersebut, pengguna untuk mengolah data. Data
bisa dengan mudah mencari aplikasi Visualization digunakan untuk
yang dibutuhkannya. Indikator lain menampilkan hasil pengolahan.
yang terdapat pada Google Play Store Kelebihan metode-metode tersebut
adalah Rating, Review, dan Installs. yaitu, dapat diimplementasikan dalam
Rating merupakan merupakan nilai mengolah data besar dan juga dapat
yang diberikan pengguna kepada menampilkannya dalam bentuk
aplikasi yang mereka gunakan, tinggi diagram agar lebih mudah dipahami.
rendahnya Rating dapat memberikan
gambaran terhadap aplikasi tersebut. II. METODE
Review berisikan pendapat pengguna Metode pengumpulan data yang
terhadap aplikasi dapat berbentuk kritik digunakan adalah menggunakan
maupun saran. Installs merupakan dataset yang ada pada open source
indikasi yang menunjukan keseluruhan kaggle dengan link:
dari total aplikasi telah diunduh oleh https://www.kaggle.com/lava18/google-
pengguna. play-store-apps. Setelah mendapatkan
Ratusan ribu developer dataset yang dibutuhkan, selanjutnya
mengunggah konten ke Google Play kami melakukan pemrosesan data.
Store dengan harapan aplikasi mereka Berikut adalah flowchart tahapan
mendapatkan Rating yang tinggi dan pengolahan data yang kami lakukan:
Installs yang banyak, karena dengan
begitu mereka mengetahui bahwa
aplikasi yang mereka kembangkan
disukai oleh banyak penggunanya.
Namun, masih banyak developer juga
yang belum mengetahui indikator apa
saja yang mempengaruhi Rating dan
Install pada aplikasi.
Salah satu kendala bagi
developer adalah ketidaktahuan
mereka akan indikator apa saja yang
dapat mempengaruhi tingginya Rating
dan banyaknya Installs. Developer
akan menjadi kesulitan untuk
menentukan target yang harus dicapai
ketika mengembangkan sebuah
aplikasi. Hal tersebut dapat dihindari
apabila developer mengetahui indikator Gambar 1. Proses pengolahan data
apa saja yang dapat mempengaruhi
Rating dan Installs, dengan begitu Langkah awal yang dilakukan
developer dapat mengetahui gambaran yaitu adalah mentransformasikan
tentang sebuah aplikasi yang dataset menjadi dataframe agar data
berkemungkinan besar dapat dapat dibaca Google Collab Notebook
memperoleh Rating tinggi dan Installs yang digunakan sebagai platform
penelitian. Kemudian dilakukan proses aplikasi yang paling banyak diunduh
Data Cleaning untuk mengidentifikasi oleh pengguna dari total 33 kategori
adanya missing value, juga aplikasi pada Google Play Store
mengidentifikasi dan menangani merupakan aplikasi dengan kategori
adanya outliers. Hasil dari proses Communication.
tersebut berupa data bersih yang
sesuai dengan kebutuhan penelitian ● Data grafik Rating yang diberikan
kami, yaitu data yang tidak memiliki pengguna kepada aplikasi
missing value dan memiliki tipe data
yang sama. Selanjutnya merupakan
proses visualisasi data, dimana dataset
yang sudah diproses akan
divisualisasikan dalam bentuk diagram
grafik. Data-data yang akan di
visualisasikan diantaranya yaitu data
Instalasi, data Rating, hubungan antara
data Rating dan Review, hubungan
antara data Instalasi dan Rating

III. HASIL DAN PEMBAHASAN


Hasil visualisasi yang kami
lakukan untuk mendapatkan informasi
yang diinginkan adalah sebagai berikut:
● Data grafik instalasi aplikasi yang
dilakukan oleh user berdasarkan
kategori aplikasi.

Gambar 3. Rating setiap kategori

Rating merupakan penilaian yang


diberikan oleh pengguna setelah
melakukan Instalasi pada aplikasi di
Google Play Store yang
merepresentasikan tingkat kepuasan
pengguna saat menggunakan aplikasi.
Pada gambar diatas, didapatkan
informasi bahwa dari total 33 kategori,
aplikasi yang mendapatkan Rating
tertinggi adalah aplikasi dengan
kategori Family, dan aplikasi yang
mendapatkan Rating paling rendah
adalah aplikasi dengan kategori Dating.
Gambar 2. Instalasi setiap kategori
● Data Reviews aplikasi yang
dilakukan oleh pengguna
Installs merupakan total jumlah dari
aplikasi yang diunduh oleh pengguna
Google Play Store. Pada gambar di
atas didapatkan informasi bahwa
Gambar 5. Hubungan Rating dan Reviews

Gambar 4. Data Reviews aplikasi Rating dapat menggambarkan


pendapat pengguna terhadap aplikasi
Reviews merupakan data komentar yang digunakan, sedangkan Review
yang berupa kritik atau saran oleh merupakan komentar pengguna baik
pengguna setelah penggunaan itu kritik atau saran setelah
aplikasi, data ini yang nantinya akan menggunakan suatu aplikasi. Gambar
membantu Developer dalam grafik diatas merupakan hasil dari
memaksimalkan pengembangan analisis statistik menggunakan Korelasi
aplikasinya. Pada grafik diatas, Pearson guna melihat hubungan linier
didapatkan informasi bahwa aplikasi antara variabel Reviews dan Rating.
pada Google Play Store yang memiliki Dapat diketahui bahwa koefisien
Review paling banyak ialah kategori korelasi melebihi 0, yakni 0,068141,
Social dan Communication dari yang berarti terdapat korelasi positif
keseluruhan 33 kategori. antara data Rating dan Review. Dapat
dilihat pula, apabila terdapat kenaikan
● Hubungan antara Rating dan pada data Review, maka akan terjadi
Review kenaikan pula pada data Rating. Akan
tetapi, apabila terjadi kenaikan pada
data Rating, belum tentu terjadi
kenaikan pada data Review.

● Data grafik hubungan antara Installs


dan Rating
View publication stats

aplikasi dengan kategori Event yang


memiliki review terbaik.
Pada data Rating dan Reviews,
setelah dilakukan pemrosesan dan
visualisasi data, didapat hasil bahwa
keduanya memiliki korelasi positif,
apabila Reviews dari pengguna aplikasi
meningkat, maka jumlah Rating pada
aplikasi juga akan meningkat, akan
tetapi apabila Rating meningkat, belum
tentu jumlah Review akan meningkat.
Sedangkan pada data Installs dan
Rating, keduanya memiliki korelasi
positif dan berhubungan, namun tidak
terdapat korelasi sebab-akibat yang
kuat dari keduanya. Sehingga dapat
disimpulkan bahwa nilai Rating dan
Review saling berkaitan, begitu pula
dengan nilai Instalasi dan Rating.
Dari penelitian ini, diharap untuk
pihak pengembang aplikasi
mempertimbangkan data Rating,
Review, dan Instalasi pada kategori
Gambar 6. Hubungan Rating dan Installs aplikasi untuk melihat trend aplikasi
yang disukai oleh pengguna, guna
Data grafik diatas merupakan hasil memaksimalkan dan meningkatkan
visualisasi dari data Rating dan Install peluang pasar aplikasi.
aplikasi pada Google Play Store.
Didapatkan data bahwa nilai korelasi V. PUSTAKA ACUAN
antara kedua data tersebut diatas 0,
yakni 0,051355. Dapat diartikan bahwa Jurnal
kedua data tersebut memiliki korelasi Effendi Jannes, dkk. Analisis Cluster
positif dan berhubungan. Namun, Aplikasi pada Google Play Store
karena persebaran titik pada grafik Menggunakan Metode K-Mean.
tidak banyak yang searah dengan garis ISBN: 978-979-587-813-1 Vol.4
linear, maka tidak ada korelasi No.1.
sebab-akibat yang kuat dari kedua data Hadi Sofian, dkk. ANALISA CLUSTER
tersebut. APLIKASI PADA APP STORE
DENGAN MENGGUNAKAN
IV. SIMPULAN DAN SARAN METODE K-MEANS. Bianglala
Berdasarkan hasil penelitian yang Informatika Vol. 8 No. 2 - Tahun
sudah dilakukan, didapatkan hasil 2020.
berupa data instalasi aplikasi, Rating Bozanta, A., & Co, M. (2018). K-Means
aplikasi, hubungan antara Rating dan vs . Fuzzy C-Means : A
Instalasi, hubungan antara Rating dan Comparative Analysis of Two
Review pada aplikasi di Google Play Popular Clustering Techniques on
Store. Dimana dari keseluruhan the Featured Mobile Applications
kategori aplikasi yaitu 33 kategori, Benchmark.
didapatkan kategori Communication
dengan jumlah instalasi tertinggi, dan

Anda mungkin juga menyukai