DISUSUN OLEH :
DITA AULIA BUDIARTHA (C1A021082)
RICHWAN GUNAWAN (C1A021080)
FERI SETIAWAN (C1A021056)
Asisten Dosen :
Ikhsan Adi Nugroho
Dosen Pengampu :
Indra Agustina S.T.M Eng
b0 : atau constant, adalah nilai awal “x” pada suatu kejadianMatplotlib adalah library Python
yang fokus pada visualisasi data seperti membuat plot grafik. Matplotlib pertama kali
diciptakan oleh John D. Hunter dan sekarang telah dikelola oleh tim developer yang besar.
Awalnya matplotlib dirancang untuk menghasilkan plot grafik yang sesuai pada publikasi
jurnal atau artikel ilmiah. Matplotlib dapat digunakan dalam skrip Python, Python dan
IPython shell, server aplikasi web, dan beberapa toolkit graphical user interface (GUI)
lainnya.
Visualisasi dari matplotlib adalah sebuah gambar grafik yang terdapat satu sumbu
atau lebih. Setiap sumbu memiliki sumbu horizontal (x) dan sumbu vertikal (y), dan data
yang direpresentasikan menjadi warna dan glyphs seperti marker (contohnya bentuk
lingkaran) atau lines (garis) atau poligon.
Hal yang penting dalam visualisasi data adalah penentuan warna, tekstur, dan style
yang menarik untuk dilihat dan representatif terhadap data. Seorang Cartographer yaitu
Jacques Bertin mengembangkan rekomendasi berikut untuk pemilihan informasi visual
yang cocok, dan kita dapat menerapkannya menggunakan matplotlib.
PEMBAHASAN
Gambar 1.1
Source Code :
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import LinearRegression
penjualan = np.array([8,8,8,7,7,6,5,5,5,4,3,2,1])
harga = np.array([10000, 15000, 20000, 17000, 25000, 32000, 50000, 65000, 62000, 80000
, 83000, 90000, 95000,])
%matplotlib inline
plt.scatter (penjualan, harga)
Penjelasan :
Pada gambar 1.1 terdapat source code untuk import library numpy dan library matplotlib
dan dari sklearn linier untuk mengimport linier regression. Berikutnya memasukan nilai
untuk penjualan dan harga dengan library numpy, selanjutnya memasukkan plt.scatter
untuk mengeluarkan grafik.
Output :
Gambar 1.2
Penjelasan :
Gambar 1.2 merupakan output dari source code yang telah dijalankan yaitu berupa grafik
dari penjualan dan harga.
Gambar 2.1
Source Code :
penjualan = penjualan.reshape (-1,1)
linreg = LinearRegression()
linreg.fit(penjualan, harga)
Penjelasan :
Gambar 2.1 merupakan source code untuk membuat permodelan regresi, di tukar baris dan
kolom variable ini agar bisa dikalikan dalam operasi matriks.
Output :
Gambar 2.2
Penjelasan :
Gambar 2.2 merupakan hasil output yang berarti berhasil untuk di buat menjadi model
regresi
Gambar
2.3
Source Code :
plt.scatter(penjualan, harga, color='green')
plt.plot(penjualan, linreg.predict(penjualan))
Penjelasan :
Gambar 2.3 merupakan source code untuk menghasilkan plot hasil regresi. Dengan
menggunakan fungsi plt.scatter dan plt.plot dengan menggunakan linreg.predict
Output :
Gambar 2.4
Penjelasan :
Gambar 2.4 merupakan hasil dari data penjualan dan harga yang sudah di regresi, dengan
demikian muncl garis miring pada kurva.
Gambar 3.1
Source Code :
import pandas as pd
import pylab as pl
%matplotlib inline
from google.colab import files
uploaded = files.upload()
for fn in uploaded.keys():
print('user uploaded file "{name}" with length {length} bytes'.format(name=fn,
length=len(uploaded[fn])))
Penjelasan :
Pada gambar 3.1 melihatkan source code untuk menghasilkan dataset yang telah disediakan
terlebih dahulu. Untuk meng-upload data yang telah disediakan di perangkat
computer/excel perlu menggunakan fungsi from google.colab import files uploaded =
files.upload().
Output :
Gambar 3.2
Penjelasan :
Gambar 3.2 merupakan output apabila berhasil memasukkan file dari perangkat.
Gambar 4.1
Source Code :
df = pd.read_csv("ucl_stats.csv")
df.head()
Penjelasan :
Pada gambar 4.1 melihatkan source code untuk membaca data yang telah dimasukkan serta
untuk melihat 5 garis pertama pada data tersebut.
Output :
Gambar 4.2
Penjelasan :
Gambar 4.2 merupakan hasil dari source code yang telah dijalankan yaitu menghasilkan 5
baris pertama pada data tersebut.
Gambar 4.3
Source Code :
cdf = df[['team','wins','goals_scored','champions']]
cdf.head(11)
Penjelasan :
Gambar 4.4 merupakan source code untuk mengambil kolom mana saja yang akan kita
analisis dan membuang sisanya, dengan menggunakan fungsi cdf = df[[]] dan
menggunakan fungsi cdf.head untuk menghasilkan jumlah baris yang kita inginkan
Output :
Gambar 4.4
Penjelasan :
Gambar 4.4 merupakan hasil output dari source code di atas untuk menghasilkan data yang
ingin di analisis.
Gambar 5.1
Source Code :
plt.scatter(cdf.wins, cdf.goals_scored, color='blue')
plt.xlabel("wins")
plt.ylabel("goals_scored")
plt.show()
Penjelasan :
Pada gambar 5.1 menunjukkan source code untuk menghasilkan plot hubungan antara satu
kolom dengan kolom lain nya, kami mengambil contoh menghubungkan kolom wins dan
kolom goals_scored.
Output :
Gambar 5.2
Penjelasan :
Gambar 5.2 merupakan hasil output yang berupa grafik dari hubungan antara kolom wins
dan kolom goals_scored.
Gambar 5.3
Source Code :
msk = np.random.rand(len(df)) < 0.8
train = cdf[msk]
test = cdf[~msk]
plt.scatter(train.ENGINESIZE, train.CO2EMISSIONS, color='blue')
plt.xlabel("Engine size")
plt.ylabel("Emission")
plt.show()
Penjelasan :
Gambar 5.3 merupakan source code untuk membagi data ke dalam data latih (train) dan
data uji (test), Kita gunakan data latih untuk melatih model, dan data uji untuk menilai
performa dari permodelan yang kita buat.
Gambar 5.4
Penjelasan :
Gambar 5.4 merupakan hasil output data yang telah di bagi menjadi data latih dan data uji.
Gambar 6.1
Source Code :
regr = LinearRegression()
train_x = np.asanyarray(train[['wins']])
train_y = np.asanyarray(train[['goals_scored']])
regr.fit (train_x, train_y)
print ('Coefficients: ', regr.coef_)
print ('Intercept: ',regr.intercept_)
Penjelasan :
Gambar 6.1 merupakan source code untuk membuat model regresi dan keofisien model.
Dalam membuat model regresi, sebenarnya kita mencari nilai-nilai Coefficient
(gradien/kemiringan) dan Intercept yang kita sebut parameter model.
Output :
Gambar 6.2
Penjelasan :
Gambar 6.2 meruapakan hasil output yang berupa coefficients dan intercept pada data
tersebut.
Gambar 6.3
Source Code :
plt.scatter(train.wins, train.goals_scored, color='blue')
plt.plot(train_x, regr.coef_[0][0]*train_x + regr.intercept_[0], '-r')
plt.xlabel("wins")
plt.ylabel("goals_scored")
Penjelasan :
Gambar 6.3 merupakan source code untuk menghasilkan regresi pada kurva sebelumnya.
Output :
Gambar
6.4
Penjelasan :
Gambar 6.4 merupakan hasil output dari source code yang telah dijalankan yang
menghasilkan regresi pada kurva.
Gambar 6.5
Source Code :
from sklearn.metrics import r2_score
test_x = np.asanyarray(test[['wins']])
test_y = np.asanyarray(test[['goals_scored']])
test_y_ = regr.predict(test_x)
Penjelasan :
Gambar 6.5 merupakan source code untuk mencari error yang dihasilkan model regresi di
atas.
Output :
Gambar 6.6
Penjelasan :
Dapat kita lihat pada gambar 6.6 bahwa error yang dihasilkan model regresi yang kita buat
termasuk cukup kecil dengan mean absolute error 2.38, MSE 10.80 dan R2-score 0.74.
DAFTAR PUSTAKA