Anda di halaman 1dari 16

Laporan Tugas Kelompok Komputasi

“Tugas DATA ANALYSIS”

Kelompok 10
Nama Anggota Kelompok:
1. Astrid Maharani (16722484)
2. Joshua Jovano (16722496)
3. Muhammad Zaki (16722508)
4. Teungku Muhammad Ja’far Ali Syam (16722520)

Fakultas Teknologi Industri


Institut Teknologi Bandung
2022
1
Daftar Isi
Cover……………………………………………………………………… 1
Daftar Isi………………………………………………………………….. 2
BAB I Pendahuluan
A. Latar Belakang…………………………………………………….. 3

BAB II Laporan Inti


A. Deskripsi data……………………………………………………….. 4
B. Karakteristik Data…………………………………………………… 4
C. Statistik Data..……………………………………………………….. 4
D. Visualisasi Data……………………………………………………... 6
E. Korelasi……………………………………………………………… 10
Pembagian Tugas dalam Kelompok……………………………………… 16
Referensi……………………………………………………………………. 16

2
BAB I
Pendahuluan

A. Latar Belakang
Masyarakat Rusia dikenal gemar mengonsumsi minuman alkohol. Kebiasaan
ini telah dilakukan sejak negara Rusia belum terbentuk. Bagi masyarakat Rusia,
minum alkohol merupakan kesenangan dan gaya hidup yang sulit untuk
ditinggalkan.
Beberapa pendapat lainnya mengungkapkan bahwa dalam tubuh atau gen
orang Rusia menyerap asetaldehida atau senyawa organik yang menyebabkan
mabuk dengan lambat.
Orang Rusia tidak mengonsumsi vodka, melainkan wine dan mead, minuman
fermentasi dari anggur dan madu. Namun, seiring berkembangnya zaman, pada
abad ke-16 barulah masyarakat Rusia beralih minum vodka dan minuman lainnya.

3
BAB II
LAPORAN INTI

A)Deskripsi Data
Data yang digunakan ialah data yang berisi tentang konsumsi alcohol di Rusia yang terdiri
dari nilai konsumsi anggur, bir, vodka, brendi dan sampanye. Data ini memberikan perkiraan
dari tahun 1998 hingga tahun 2016. Format data yang digunakan berupa Comma-separated
values (CSV).
Data yang digunakan diambil dari website Kaggle[1]. Data kemudian di-load ke IDE untuk
dilakukan analisis data adalah Jupyter Notebook yang menggunakan bahasa Pyhton. Ukuran
data sebesar 68,8 KB.
Data ini terdiri dari 7 kolom dan 1615 baris. Data ini berisi year, region, wine, vodka,
champagne dan brandy. Year dan region merupakan data kategorikal-nominal sedangkan
wine, beer, vodka, champagne, dan brandy merupakan data kuantitatif-kontinu.

B)Karakteristik Data
Data yang digunakan oleh penulis terduru dari atribut-atribut sebagai berikut: Year, Region,
Wine, Beer, Vodka, Champagne, dan Brandy.
Berikut penjelasan lebih rinci mengenai atribut-atribut yang dimiliki oleh data set.
1)Year berisi keterangan tahun, dimulai dari tahun 1998 sampai tahun 2016
2)Region berisi nama subjek federal Rusia. Bisa berupa oblast, republic, krai okrug otonom,
kota federal dan satu oblast otonom.
3)Wine berisi data penjualan wine dalam liter per tahun per kapita.
4)Beer berisi data penjualan bir dalam liter per tahun per kapita.
5)Vodka berisi data penjualan vodka dalam liter per tahun per kapita.
6)Champagne berisi data penjualan sampanye dalam liter per tahun per kapita.
7)Brandy berisi data penjualan brendi dalam liter per tahun per kapita.

C)Statistik Data

Sampel data yang kami gunakan adalah sampel dari 10 data menurut penjualan wine
tertinggi, sampel dari 10 data berdasarkan penjualan beer terendah, sampel dari 10 data
berdasarkan vodka tertinggi pada tahun 2015, sampel dari 10 data berdasarkan penjualan
champagne tertinggi di Kota Moscow, dan sampel dari 10 data berdasarkan penjualan brady
terendah pada tahun 2012.
Statistik yang ingin diambil dari data ini adalah statistik deskriptif yang berupa rata-rata ,
standar deviasi, persentil (10% dan 90%), serta distribusi frekuensi nilai pada data. Untuk
mencari statistik deskriptif dari sebuah Data Frame, penulis menggunakan fungsi dari pandas
yaitu Dataframe.describe(). Fungsi Dataframe. describe() menerima beberapa parameter,
salah satunya adalah percentiles. Dengan parameter percentiles, kita dapat mendapatkan
informasi mengenai persentil yang ingin kita dapatkan yaitu 10% dan 90%. Penulisannya
dalam code dapat dilihat pada gambar dibawah ini.

4
Output dari kode diatas dapat dilihat pada gambar dibawah ini.

Informasi yang kita dapatkan dari output diatas adalah penjualan terbanyak pada tahun 1999
ialah beer. Kami juga ingin mengetahui distribusi frekuensi pada atribut tahun. Untuk melihat
distribusi frekuensi, penulis menuliskan kode seperti gambar dibawah ini.

Output dari kode diatas dapat kita lihat pada gambar dibawah ini.

5
Informasi yang kita dapatkan dari output diatas adalah bahwa setiap tahun memiliki frekuensi
yang sama banyak, yakni 85.

D)Visualisasi Data
Selain dengan menggunakan statistic, digunakan juga visualisasi untuk mendapatkan
pengetahuan lebih dalam. Dalam visualisasi data, penulis akan membagi jenis visualisasi ke
dalam 3 jenis: perbandingan penjualan tiap daerah, perbandingan penjualan tiap tahun, dan
korelasi dan scatter antara masing-masing minuman. Visualisasi data bisa dibagi menjadi 5
bagian penting
D.1) Perbandingan penjualan wine terhadap:
a) Daerah di Russia
b) Tahun mulai dari 1997-2015
D.2) Perbandingan penjualan beer terhadap:
a) Daerah di Russia
b) Tahun mulai dari 1997-2015
D.3) Perbandingan penjualan vodka terhadap:
a) Daerah di Russia
b) Tahun mulai dari 1997-2015
D.4) Perbandingan penjualan champagne terhadap:
a) Daerah di Russia
b) Tahun mulai dari 1997-2015
D.5) Perbandingan penjualan brandy terhadap:
a) Daerah di Russia
b) Tahun mulai dari 1997-2015
D.6) Koefisien korelasi antara 1 minuman dengan yang lain

D.1.
a)Visualisasi data pertama yang digunakan adalah peninjauan perbandingan penjualan rata
rata wine di tiap daerah dan tiap tahunnya.
Perbandingan penjualan wine di tiap daerah dapat ditampilkan dengan menggunakan fungsi
df.groupby. Penulisannya dapat dilihat sebagai berikut

Jika kita menginput code tersebut, kita akan mendapatkan data yang berupa ‘bar graph’ dari
tiap penjualan wine di berbagai daerah di rusia dengan nama daerah di sumbu X dan jumlah
penjualan di sumbu y.

6
b)Selanjutnya, penjualan wine juga dapat dianalisis tiap tahunnya. Fungsi yang kami gunakan
dapat dilihat sebagai berikut:

Jika kita menginput code tersebut, kita akan mendapatkan data yang berupa ‘bar graph’ dari
tiap penjualan wine setiap tahunnya dengan nomor tahun di sumbu x dan jumlah penjualan di
sumbu y.

D.2
a)Selain wine, kami juga melakukan analisis terhadap minuman beer di Rusia. Perbandingan
penjualan beer di tiap daerah dapat ditampilkan dengan menggunakan fungsi df.groupby.
Penulisannya dapat dilihat sebagai berikut.

Jika kita menginput code tersebut, kita akan mendapatkan data berupa ‘bar graph’ dari
penjualan wine di setiap daerah di Russia dengan nama daerah di sumbu x dan jumlah
penjualan di sumbu y.

7
b)Analisis lebih lanjut yang kami lakukan terhadap minuman wine adalah analisis jumlah
penjualan setiap tahunnya. Fungsi dapat dilihat sebagai berikut:

Jika kita menginput code tersebut, kita akan mendapatkan data yang berupa ‘bar graph’ dari
penjualan beer setiap tahunnya dengan nomor tahun di sumbu x dan jumlah penjualan di
sumbu y. Berikut adalah output dari hasil grafik.

D.3
a)Minuman ketiga yang kami analisis adalah minuman Vodka. Kami menganalisis penjualan
minuman ini terhadap daerah daerah di Rusia dan juga penjualan setiap tahunnya.
Perbandingan penjualan vodka di tiap daerah dapat ditampilkan dengan menggunakan fungsi
df.groupby. Penulisannya dapat dilihat sebagai berikut.

Jika kita menginput code tersebut, kita akan mendapatkan data berupa ‘bar graph’ dari
penjualan wine di setiap daerah di Rusia dengan nama daerah di sumbu x dan jumlah
penjualan di sumbu y.

8
b) Analisis lebih lanjut yang kami lakukan terhadap minuman vodka adalah analisis jumlah
penjualan setiap tahunnya. Fungsinya dapat dilihat sebagai berikut:

Jika kita menginput code tersebut, kita akan mendapatkan data yang berupa ‘bar graph’ dari
penjualan vodka setiap tahunnya dengan nomor tahun di sumbu x dan jumlah penjualan di
sumbu y. Berikut adalah output dari hasil grafik.

D.4
a)Minuman ke-empat yang kami analisis adalah minuman brandy. Kami menganalisis
penjualan minuman ini terhadap daerah daerah di Rusia dan juga penjualan setiap tahunnya.
Perbandingan penjualan brandy di tiap daerah dapat ditampilkan dengan menggunakan fungsi
df.groupby. Penulisannya dapat dilihat sebagai berikut.

Jika kita menginput code tersebut, kita akan mendapatkan data berupa ‘bar graph’ dari
penjualan brandy di setiap daerah di Rusia dengan nama daerah di sumbu x dan jumlah
penjualan di sumbu y.

9
b)Analisis lebih lanjut yang kami lakukan terhadap minuman brandy adalah analisis jumlah
penjualan setiap tahunnya. Fungsinya dapat dilihat sebagai berikut:

Jika kita menginput code tersebut, kita akan mendapatkan data yang berupa ‘bar graph’ dari
penjualan brandy setiap tahunnya dengan nomor tahun di sumbu x dan jumlah penjualan di
sumbu y. Berikut adalah output dari hasil grafik.

E) Korelasi
Pada bagian korelasi, kami ingin mencari seberapa kuat hubungan antar variabel dengan
variabbel lainnya. Kami menemukan koefisien korelasi antara 1 minuman dengan minuman
lainnya. Kami menemukan korelasi antara
a)minuman wine dengan beer
b)minuman wine dengan vodka

10
c)minuman wine dengan champagne
d)minuman wine dengan brandy
e)minuman vodka dengan champagne
f)minuman vodka dengan brandy
g)minuman champagne dengan brandy

A)Minuman wine dengan beer dapat ditunjukkan dengan menginput fungsi sebagai berikut:

Didapatkan bahwa koefisien korelasi antara wine dan beer adalah 0,4884049
Lalu, grafik scatter antara wine dan beer dapat ditunjukkan dengan fungsi:

Output dari fungsi tersebut membentuk scatter plot dimana sumbu x merepresentasikan
variabel wine dan sumbu y merepresentasikan variabel beer.

B)Minuman wine dengan vodka dapat ditunjukkan dengan menginput fungsi sebagai berikut:

Didapatkan bahwa koefisien korelasi antara wine dan vodka adalah 0,427762874
Lalu, grafik scatter antara wine dan vodka dapat ditunjukkan dengan fungsi:

Output dari fungsi tersebut membentuk scatter plot dimana sumbu x merepresentasikan
variabel wine dan sumbu y merepresentasikan variabel vodka.

11
C)Minuman wine dengan champagne dapat ditunjukkan dengan menginput fungsi sebagai
berikut:

Didapatkan bahwa koefisien korelasi antara wine dan champagne adalah 0,4685704
Lalu, grafik scatter antara wine dan champagne dapat ditunjukkan dengan fungsi:

Output dari fungsi tersebut membentuk scatter plot dimana sumbu x merepresentasikan
variabel wine dan sumbu y merepresentasikan variabel champagne.

.
D) Minuman wine dengan champagne dapat ditunjukkan dengan menginput fungsi sebagai
berikut:

12
Didapatkan bahwa koefisien korelasi antara wine dan brandy adalah 0,55337
Lalu, grafik scatter antara wine dan brandy dapat ditunjukkan dengan fungsi:

Output dari fungsi tersebut membentuk scatter plot dimana sumbu x merepresentasikan
variabel wine dan sumbu y merepresentasikan variabel champagne.

E)Minuman vodka dengan champagne dapat ditunjukkan dengan menginput fungsi sebagai
berikut:

Didapatkan bahwa koefisien korelasi antara wine dan brandy adalah 0,2690989
Lalu, grafik scatter antara vodka dan champagne dapat ditunjukkan dengan fungsi:

Output dari fungsi tersebut membentuk scatter plot dimana sumbu x merepresentasikan
variabel vodka dan sumbu y merepresentasikan variabel champagne.

13
F)Minuman vodka dengan brandy dapat ditunjukkan dengan menginput fungsi sebagai
berikut:

Didapatkan bahwa koefisien korelasi antara wine dan brandy adalah 0,21184482
Lalu, grafik scatter antara vodka dan champagne dapat ditunjukkan dengan fungsi:

Output dari fungsi tersebut membentuk scatter plot dimana sumbu x merepresentasikan
variabel vodka dan sumbu y merepresentasikan variabel brandy.

G)Minuman champagne dengan brandy dapat ditunjukkan dengan menginput fungsi sebagai
berikut:
14
Didapatkan bahwa koefisien korelasi antara wine dan brandy adalah 0,77737167
Lalu, grafik scatter antara champagne dan brandy dapat ditunjukkan dengan fungsi:

Output dari fungsi tersebut membentuk scatter plot dimana sumbu x merepresentasikan
variabel champagne dan sumbu y merepresentasikan variabel brandy.

Pembagian tugas dalam kelompok


1. Astrid Maharani 🡪 Membuat Powerpoint
2. Joshua Jovano 🡪 Membuat Laporan dan Powerpoint

15
3. Muhammad Zaki 🡪 Mengolah data
4. Teungku Muhammad Ja’far Ali Syam 🡪 Membuat Laporan

Referensi
1) Data konsumsi alkohol di Rusia diambil dari :
https://www.kaggle.com/datasets/dwdkills/alcohol-consumption-in-russia

16

Anda mungkin juga menyukai