Anda di halaman 1dari 6

Pertemuan III

Deskripsi Dataset
Dataset ini berisi data hasil survei terhadap lebih dari 100 responden untuk perilaku pembelian mereka di Starbucks. Pendapatan
ditampilkan dalam Ringgit Malaysia (RM).

Konteks
Data ini dapat digunakan untuk memperoleh informasi yang dapat digunakan oleh pemangku kepentingan guna menganalisis dan
mengetahui perilaku data pelanggan, mempertahankan pelanggan yang ada serta mengembangkan program marketing untuk
menarik pelanggan tepat sasaran

Isi
Info demografis tentang pelanggan – jenis kelamin, rentang usia, status pekerjaan, rentang pendapatan
Perilaku mereka saat ini dalam membeli Starbucks
Fasilitas dan fitur Starbucks yang berkontribusi pada perilaku

Apa yang bisa kita temukan ?


Apa karakteristik pelanggan yang akan terus membeli Starbucks?

Panduan Praktikum
Bacalah instruksi praktikum dengan seksama.
Lakukan instruksi pengerjaan ada pada setiap checkpoint (tips : cari tanda <> atau '...' dan isilah dengan perintah yang tepat)
notes : kode program akan memberikan informasi error jika Anda belum mengisi tanda <> atau '..' dengan perintah yang tepat

# import libraries
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from pandas.plotting import autocorrelation_plot
from scipy import stats
plt.style.use("ggplot")
import warnings
warnings.filterwarnings("ignore")
from scipy import stats

Instuksi 1
Masukkan (bacalah) file dataset .csv yang tersedia pada link https://raw.githubusercontent.com/supasonicx/ATA-praktikum-
01/main/Starbucks%20satisfactory%20survey%20encode%20cleaned.csv dengan perintah pandas read.

# read data as pandas data frame


url_data = "https://raw.githubusercontent.com/supasonicx/ATA-praktikum-01/main/Starbucks%20satisfactory%20survey%20encode%20
data = pd.read_csv("https://raw.githubusercontent.com/supasonicx/ATA-praktikum-01/main/Starbucks%20satisfactory%20survey%20e

Instruksi 2
Tampilkan 5 baris awal dari dataset

## Melihat 5 baris awal dari dataset yang digunakan


data.head(5)

Id gender age status income visitNo method timeSpend location membersh

0 1 1 1 0 0 3 0 1 0

1 2 1 1 0 0 3 2 0 1

2 3 0 1 2 0 2 0 1 2

3 4 1 1 0 0 3 2 0 2

4 5 0 1 0 0 2 2 1 1

1/6
Instruksi 2
Tampilkan dimensi dari dataset yang digunakan dengan perintah shape()

data['visitNo'].hist(figsize=(10,10))
plt.show()

Instruksi 3
Tampilkan kolom apa saja yang dimiliki oleh dataset yang digunakan dengan perintah columns()

data[data["visitNo"]>50].shape

(0, 33)

Mengetahui Informasi Demografi Responden Melalui Histogram


Menampilkan Berapa kali (frekuensi) setiap nilai muncul dalam kumpulan data.
Jenis deskripsi ini disebut distribusi variabel
Cara paling umum untuk merepresentasikan distribusi variabel adalah histogram yaitu grafik yang menunjukkan frekuensi dari
setiap nilai.
Frequency = berapa kali setiap nilai muncul
Contoh: [1,1,1,1,2,2,2]. Frequency dari 1 adalah empat dan frequency dari 2 adalah tiga.

Instruksi 4
Tampilkan histogram dari kolom income. Berikan kesimpulan Anda dari informasi yang diberikan! (Catatan : Data nilai income
merupakan data kategori yang bersifat interval, yang di representasikan dengan nilai 0-5)

## Buatlah diagram histogram dari kolom income


plt.figure(figsize=(7,7))
total = float(len(data) )

ax = sns.countplot(x="income", data=data)
for p in ax.patches:
height = p.get_height()
ax.text(p.get_x()+p.get_width()/2.,
height + 3,
'{:1.2f}'.format((height/total)*100),

2/6
ha="center")
plt.show()

Kesimpulannya adalah berdasarkan histogram diatas data set tidak seimbang, pada kolom 0 terdapat 57.72%, sementara kolom 1
terdapat 20.35%, kolom 2 terdapat 15.04%, kolom 3 terdapat 2.65%, dan kolom 4 terdapat 4.42%.

Instruksi 5
Tampilkan histogram dari kolom umur. Kategori umur mana yang paling sering mengunjungi starbucks?

## Buatlah diagram histogram dari kolom income


plt.figure(figsize=(7,7))
total = float(len(data) )

ax = sns.countplot(x="age", data=data)
for p in ax.patches:
height = p.get_height()
ax.text(p.get_x()+p.get_width()/2.,
height + 3,
'{:1.2f}'.format((height/total)*100),
ha="center")
plt.show()

Kategori umur yang sering mengunjungi Starbucks adalah yang pertama dengan sebanyak 69.91%.

Instruksi 6
Tampilkan boxplot dari kolom income dan age. Tuliskan kesimpulan yang Anda dapatkan

3/6
fig = plt.figure(figsize=(10,10))
sns.boxplot(x="income", y="age", data=data)
plt.show()

Kesimpulannya adalah berdasarkan boxplot dari kolom age dan income dapat terlihat mean dari setiap nilai.

Instruksi 7
Buatlah kesimpulan data produk pastry berdasarkan kolom gender dibawah ini.

## ploting untuk data produk pastry berdasarkan kolom gender


m = plt.hist(data[data["gender"] == 1].itemPurchasePastries,label = "Male")
## ploting untuk data produk pastry berdasarkan kolom gender
f = plt.hist(data[data["gender"] == 0].itemPurchasePastries,label = "Female")
plt.legend()
plt.xlabel("Nilai timeSpend")
plt.ylabel("Frequency")
plt.title("Histogram waktu yang dihabiskan di toko bedasarkan demografi gender")
plt.show()

Kesimpulannya adalah gender Male lebih banyak membeli produk pastri daripada gender Female.

Instruksi 8
Tampilkan jumlah data gender yang bernilai 0. Buatlah kesimpulan dari hasil tersebut.

data[data['gender']<=0]

4/6
Id gender age status income visitNo method timeSpend location membershipCard itemPurchaseCoffee itempu

2 3 0 1 2 0 2 0 1 2 0 1

4 5 0 1 0 0 2 2 1 1 1 1

7 8 0 1 2 2 3 0 1 2 0 1

9 10 0 1 2 0 2 2 0 2 1 1

16 17 0 2 2 2 2 1 0 0 0 1

17 18 0 1 2 0 3 0 0 0 0 1

18 19 0 1 2 1 1 2 0 1 0 1

20 21 0 2 2 3 3 2 0 0 0 1

22 23 0 1 2 1 3 0 4 0 1 1

24 25 0 3 1 3 3 0 2 2 1 1

25 26 0 2 2 4 2 0 1 1 0 1

26 27 0 2 2 4 3 1 0 1 1 1

27 28 0 1 1 0 2 2 0 2 1 1

28 29 0 3 1 4 1 1 0 1 0 1

37 38 0 0 0 0 3 0 2 2 1 1

38 39 0 1 2 0 3 2 0 2 0 1

39 40 0 2 2 2 3 2 0 0 0 1

40 42 0 1 2 0 2 0 1 0 0 1

46 50 0 0 0 0 3 1 0 0 0 1

47 51 0 3 2 3 3 0 0 2 0 1

54 58 0 0 0 0 2 0 1 2 0 1

55 59 0 0 0 0 2 0 0 1 1 1

57 61 0 1 0 0 3 0 2 1 0 1

59 63 0 2 0 0 3 0 1 2 1 1

60 64 0 1 2 0 3 2 1 0 0 1

67 72 0 1 2 1 1 2 2 0 0 1

69 74 0 2 2 0 3 2 0 1 0 1

71 76 0 1 2 1 3 2 0 2 0 1

72 77 0 1 2 0 3 2 0 1 1 1

73 78 0 1 2 2 2 0 1 2 0 1

77 83 0 1 1 2 3 0 2 2 0 1

78 84 0 2 1 2 1 2 1 1 0 1

79 85 0 1 2 1 3 0 2 2 1 1

80 86 0 2 1 4 2 0 3 2 0 1

81 87 0 1 1 4 3 1 1 2 0 1

84 90 0 1 1 1 3 0 0 1 0 1

88 95 0 1 2 2 2 2 0 2 0 1

93 100 0 2 2 0 3 1 1 2 0 1

94 101 0 1 0 0 3 1 1 2 1 1

95 102 0 1 0 0 3 0 1 2 1 1

96 103 0 1 1 2 0 1 0 2 0 1

97 104 0 2 2 1 1 0 2 2 1 1

98 105 0 0 0 0 3 1 1 2 1 1

99 106 0 3 2 2 2 1 1 2 1 1

100 107 0 1 0 0 3 2 0 2 1 1

101 110 0 1 0 0 3 0 0 2 1 1

102 111 0 1 0 0 3 2 0 2 1 1

105 115 0 3 1 1 3 0 1 2 1 1

106 116 0 0 0 0 0 2 0 2 1 1
5/6
107 117 0 2 0 0 2 0 2 2 1 1

108 118 0 3 1 1 2 0 2 1 0 1

109 119 0 1 2 0 2 0 2 1 0 1

110 120 0 1 0 0 3 0 1 1 1 1

112 122 0 1 2 2 3 0 1 1 1 1

Kesimpulannya adalah terdapat banyak sekali gender yang bernilai 0, berdasarkan tabel terhitung kurang lebih 50 orang.

6/6

Anda mungkin juga menyukai