Deskripsi Dataset
Dataset ini berisi data hasil survei terhadap lebih dari 100 responden untuk perilaku pembelian mereka di Starbucks. Pendapatan
ditampilkan dalam Ringgit Malaysia (RM).
Konteks
Data ini dapat digunakan untuk memperoleh informasi yang dapat digunakan oleh pemangku kepentingan guna menganalisis dan
mengetahui perilaku data pelanggan, mempertahankan pelanggan yang ada serta mengembangkan program marketing untuk
menarik pelanggan tepat sasaran
Isi
Info demografis tentang pelanggan – jenis kelamin, rentang usia, status pekerjaan, rentang pendapatan
Perilaku mereka saat ini dalam membeli Starbucks
Fasilitas dan fitur Starbucks yang berkontribusi pada perilaku
Panduan Praktikum
Bacalah instruksi praktikum dengan seksama.
Lakukan instruksi pengerjaan ada pada setiap checkpoint (tips : cari tanda <> atau '...' dan isilah dengan perintah yang tepat)
notes : kode program akan memberikan informasi error jika Anda belum mengisi tanda <> atau '..' dengan perintah yang tepat
# import libraries
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from pandas.plotting import autocorrelation_plot
from scipy import stats
plt.style.use("ggplot")
import warnings
warnings.filterwarnings("ignore")
from scipy import stats
Instuksi 1
Masukkan (bacalah) file dataset .csv yang tersedia pada link https://raw.githubusercontent.com/supasonicx/ATA-praktikum-
01/main/Starbucks%20satisfactory%20survey%20encode%20cleaned.csv dengan perintah pandas read.
Instruksi 2
Tampilkan 5 baris awal dari dataset
0 1 1 1 0 0 3 0 1 0
1 2 1 1 0 0 3 2 0 1
2 3 0 1 2 0 2 0 1 2
3 4 1 1 0 0 3 2 0 2
4 5 0 1 0 0 2 2 1 1
1/6
Instruksi 2
Tampilkan dimensi dari dataset yang digunakan dengan perintah shape()
data['visitNo'].hist(figsize=(10,10))
plt.show()
Instruksi 3
Tampilkan kolom apa saja yang dimiliki oleh dataset yang digunakan dengan perintah columns()
data[data["visitNo"]>50].shape
(0, 33)
Instruksi 4
Tampilkan histogram dari kolom income. Berikan kesimpulan Anda dari informasi yang diberikan! (Catatan : Data nilai income
merupakan data kategori yang bersifat interval, yang di representasikan dengan nilai 0-5)
ax = sns.countplot(x="income", data=data)
for p in ax.patches:
height = p.get_height()
ax.text(p.get_x()+p.get_width()/2.,
height + 3,
'{:1.2f}'.format((height/total)*100),
2/6
ha="center")
plt.show()
Kesimpulannya adalah berdasarkan histogram diatas data set tidak seimbang, pada kolom 0 terdapat 57.72%, sementara kolom 1
terdapat 20.35%, kolom 2 terdapat 15.04%, kolom 3 terdapat 2.65%, dan kolom 4 terdapat 4.42%.
Instruksi 5
Tampilkan histogram dari kolom umur. Kategori umur mana yang paling sering mengunjungi starbucks?
ax = sns.countplot(x="age", data=data)
for p in ax.patches:
height = p.get_height()
ax.text(p.get_x()+p.get_width()/2.,
height + 3,
'{:1.2f}'.format((height/total)*100),
ha="center")
plt.show()
Kategori umur yang sering mengunjungi Starbucks adalah yang pertama dengan sebanyak 69.91%.
Instruksi 6
Tampilkan boxplot dari kolom income dan age. Tuliskan kesimpulan yang Anda dapatkan
3/6
fig = plt.figure(figsize=(10,10))
sns.boxplot(x="income", y="age", data=data)
plt.show()
Kesimpulannya adalah berdasarkan boxplot dari kolom age dan income dapat terlihat mean dari setiap nilai.
Instruksi 7
Buatlah kesimpulan data produk pastry berdasarkan kolom gender dibawah ini.
Kesimpulannya adalah gender Male lebih banyak membeli produk pastri daripada gender Female.
Instruksi 8
Tampilkan jumlah data gender yang bernilai 0. Buatlah kesimpulan dari hasil tersebut.
data[data['gender']<=0]
4/6
Id gender age status income visitNo method timeSpend location membershipCard itemPurchaseCoffee itempu
2 3 0 1 2 0 2 0 1 2 0 1
4 5 0 1 0 0 2 2 1 1 1 1
7 8 0 1 2 2 3 0 1 2 0 1
9 10 0 1 2 0 2 2 0 2 1 1
16 17 0 2 2 2 2 1 0 0 0 1
17 18 0 1 2 0 3 0 0 0 0 1
18 19 0 1 2 1 1 2 0 1 0 1
20 21 0 2 2 3 3 2 0 0 0 1
22 23 0 1 2 1 3 0 4 0 1 1
24 25 0 3 1 3 3 0 2 2 1 1
25 26 0 2 2 4 2 0 1 1 0 1
26 27 0 2 2 4 3 1 0 1 1 1
27 28 0 1 1 0 2 2 0 2 1 1
28 29 0 3 1 4 1 1 0 1 0 1
37 38 0 0 0 0 3 0 2 2 1 1
38 39 0 1 2 0 3 2 0 2 0 1
39 40 0 2 2 2 3 2 0 0 0 1
40 42 0 1 2 0 2 0 1 0 0 1
46 50 0 0 0 0 3 1 0 0 0 1
47 51 0 3 2 3 3 0 0 2 0 1
54 58 0 0 0 0 2 0 1 2 0 1
55 59 0 0 0 0 2 0 0 1 1 1
57 61 0 1 0 0 3 0 2 1 0 1
59 63 0 2 0 0 3 0 1 2 1 1
60 64 0 1 2 0 3 2 1 0 0 1
67 72 0 1 2 1 1 2 2 0 0 1
69 74 0 2 2 0 3 2 0 1 0 1
71 76 0 1 2 1 3 2 0 2 0 1
72 77 0 1 2 0 3 2 0 1 1 1
73 78 0 1 2 2 2 0 1 2 0 1
77 83 0 1 1 2 3 0 2 2 0 1
78 84 0 2 1 2 1 2 1 1 0 1
79 85 0 1 2 1 3 0 2 2 1 1
80 86 0 2 1 4 2 0 3 2 0 1
81 87 0 1 1 4 3 1 1 2 0 1
84 90 0 1 1 1 3 0 0 1 0 1
88 95 0 1 2 2 2 2 0 2 0 1
93 100 0 2 2 0 3 1 1 2 0 1
94 101 0 1 0 0 3 1 1 2 1 1
95 102 0 1 0 0 3 0 1 2 1 1
96 103 0 1 1 2 0 1 0 2 0 1
97 104 0 2 2 1 1 0 2 2 1 1
98 105 0 0 0 0 3 1 1 2 1 1
99 106 0 3 2 2 2 1 1 2 1 1
100 107 0 1 0 0 3 2 0 2 1 1
101 110 0 1 0 0 3 0 0 2 1 1
102 111 0 1 0 0 3 2 0 2 1 1
105 115 0 3 1 1 3 0 1 2 1 1
106 116 0 0 0 0 0 2 0 2 1 1
5/6
107 117 0 2 0 0 2 0 2 2 1 1
108 118 0 3 1 1 2 0 2 1 0 1
109 119 0 1 2 0 2 0 2 1 0 1
110 120 0 1 0 0 3 0 1 1 1 1
112 122 0 1 2 2 3 0 1 1 1 1
Kesimpulannya adalah terdapat banyak sekali gender yang bernilai 0, berdasarkan tabel terhitung kurang lebih 50 orang.
6/6