Anda di halaman 1dari 9

UJIAN AKHIR SEMESTER

STATISTIKA

DISUSUN OLEH :

KELOMPOK 6

1. RAHMITA DWI KURNIA (G1A020034)


2. KHALID ALRIJALI (G1A020046)
3. GILANG RAHMAT F (G1A020074)

DOSEN PENGAMPU :

RUVITA FAURINA, S.T., M.Eng.

PROGRAM STUDI INFORMATIKA

FAKULTAS TEKNIK

UNIVERSITAS BENGKULU

2021
VISUALISASI DATASET

A. Inisialisasi Dataset Menggnakan Mount Data Drive

B. Import Method yang akan Digunakan

Penjelasan :
Pada langkah kedua yaitu kita harus mengimport method dan library dari berbagai
package seperti, pandas, matplotlib, numpy, dan seaborn. Karena package tersebut dapat
membantu membuat visualisasi data menggunakan frame yang sudah ada. Setelah
berhasil mengimport method, maka kita akan mendefinisikan file Game.csv ke dalam
variabel yang bernama df, dimana df adalah variabel dari pandas. Pada tahap ini juga kita
akan membaca dataset dari file Game.csv dengan menggunakan syntax df =
pd.read_csv(lokasi dataset).

C. Visualisasi Dataset Game.csv


1. Line Plot

1
Penjelasan :

Kita juga dapat melihat perubahan jumlah Pokemon per tipe untuk tiap generasi. Kita
dapat membuat pivot table seperti dengan kode di bawah ini sebelum digambarkan dengan
diagram garis (line plot). Diagram di atas menunjukkan bahwa tipe 1 terbanyak untuk Pokemon
dari tiga generasi pertama adalah water.

2. Bar Chart

Penjelasan :

Sekarang, kita ingin menganalisis lebih jauh tentang berbagai atribut yang lain.
Pertama, kita akan mencari tahu berapa jumlah Pokemon berdasarkan masing-masing tipe
pertamanya. Kita dapat memvisualisasikan ini dengan menggunakan diagram batang (bar
plot).

2
Penjelasan :

Dapat dilihat bahwa tipe 2 didominasi oleh Flying yang bahkan tidak termasuk dalam
tipe 1. Jadi, dapat kita ambil kesimpulan sementara bahwa mempunyai Pokemon
tipe ice, electric, atau rock (yang efektif untuk menghadapi Pokemon tipe flying) dalam tim
merupakan solusi yang cukup efektif karena peluang untuk menemukan Pokemon dengan
tipe flying cukup besar.

Meski demikian, sebetulnya tipe Pokemon yang menjadi pilihan awal (starter Pokemon)
hampir selalu terdiri dari tiga pilihan tipe 1: fire, water, dan grass. Untuk itu, kita akan mencoba
mengeksplorasi perbandingan masing-masing atribut untuk ketiga tipe ini. Dengan mengetahui
bahwa Pokemon dengan tipe 1 water paling banyak, permainannya bisa jadi tidak seimbang
jika Pokemon dengan tipe ini juga jadi yang terkuat.

3. Histogram

3
Penjelasan :
Dari histogram tersebut, dapat terlihat bahwa ada perbedaan yang cukup jelas antara
Pokemon biasa dengan legendaris. Perbedaan tersebut mulai terlihat batasnya di sekitar nilai
total 550. Sebagai perbandingan, di bawah ini digambarkan histogram nilai total atribut untuk
seluruh Pokemon yang ada. Distribusi dengan dua puncak seperti ini biasa disebut juga dengan
distribusi bimodal (= dua modus). Kurva tegas yang ada pada grafik merupakan nilai
probability density dari metode Kernel Density Estimation.
4. Box Chart

Penjelasan :

Titik-titik pada box plot merupakan kemungkinan nilai-nilai pencilan, sementara garis
di tengah-tengah kotak merupakan nilai median.
4
5. Scatter Plot

Penjelasan :
Dari scatter plot tersebut, dapat dilihat bahwa secara umum kekuatan ketiga jenis
Pokemon dari atribut Sp. Atk dan Sp. Def tersebar merata. Hanya ada dua Pokemon yang
terlihat sebagai pencilannya dengan Sp. Atk dan Sp. Def yang tinggi.

Penjelasan :
Sekarang, mari kita mengeksplorasi Pokemon dengan tipe 1 terbanyak kedua: normal.
Karena Pokemon jenis ini lemah terhadap serangan fisik dari Pokemon bertipe fighting, maka
kita akan menginvestigasi distribusi nilai Attack dari Pokemon fighting jika dibandingkan
dengan nilai Defense dari Pokemon normal.

Kali ini, alih-alih menggunakan Kernel Density Estimation, kita menggunakan


distribusi normal/Gaussian untuk mencocokkan distribusi dari atributnya. Dalam grafik di atas

5
dapat dilihat bahwa nilai rata-rata Attack dari Pokemon fighting lebih tinggi dibandingkan nilai
rata-rata Defense dari Pokemon normal. Jadi, memilih Pokemon normal dalam tim mungkin
bukan keputusan yang bijak.

COVARIANCE AND CORELATION

1. Covariance
Kovariansi adalah ukuran variabilitas gabungan dari dua variabel acak. Jika nilai yang
lebih besar dari satu variabel terutama sesuai dengan nilai yang lebih besar dari variabel
lainnya, dan hal yang sama berlaku untuk nilai yang lebih kecil, kovariannya positif.

Covariance (atau kovarians) digunakan untuk mengukur besarnya hubungan antara dua
variabel. Jenis hubungan yang dapat terjadi atara dua buah variabel berdasarkan nilai
covariance-nya adalah:

Positif : bila nilai covariance-nya positif atau > 0

Negatif : nilai covariance-nya negatif atau < o

Zero : bila nilai covariance-nya nol atau = 0

2. Correlation
Correlation adalah (dalam neurologic) kumpulan impulsimpuls aferen di pusat saraf
guna menghasilkan respons yang sesuai; (dalam statistik) derajat asosiasi berbagai
fenomena variabel.

6
Dalam statistik, korelasi atau ketergantungan adalah setiap hubungan statistik, apakah
kausal atau tidak, antara dua variabel acak atau data bivariat. Dalam arti luas korelasi
adalah setiap asosiasi statistik, meskipun sebenarnya mengacu pada sejauh mana sepasang
variabel terkait secara linier.

Pada gambar di bawah terlihat bahwa nilai korelasi berdasarkan dataset yang
digunakan adalah [[1070.74853567 460.88730914][ 460.88730914
774.44855444]].

7
8

Anda mungkin juga menyukai