Laporan KB DL

Adi Pratama Kurniawan 311810001
Albert Meidison Wijaya 311810002

Laporan KB Deep Learning ANN
Dataset yang digunakan pada KB ini adalah dataset zoo yang diambil dari
https://archive.ics.uci.edu/ml/datasets/zoo untuk menentukan kelas tipe hewan. Dataset ini
berisi 18 atribut dengan 16 input dan 1 output (type). Data input terdiri dari 15 data boolean
(hair, feathers, eggs, milk, airborne, aquatic, predator, toothed, backbone, breathes, venomous,
fins) dan 1 data numerik (legs).
Arsitektur yang digunakan pada KB ini menggunakan aktivasi default milik library
SKLearn yaitu relu. Dan hidden layer yang digunakan sejumlah 6 node (Gambar 1.). Pada
arsitektur lainnya juga menggunakan aktivasi default milik library SKLearn yaitu relu. Dan
hidden layer yang digunakan sejumlah 10 node (Gambar 2.). Jumlah epoch yang dilakukan
pada kedua arsitektur yaitu sejumlah 5000, 8000, dan 10000.
Dengan menentukan input, hidden layer, dan output. Maka terbentuklah algoritma
ANN (Artificial Neural Network) yang disusun menggunakan MLPClassifier, Algoritma akan
dibagi dalam 2 kasus, kasus pertama adalah 100% data train dan 100% data test dan kasus
kedua adalah 80% data train dan 20% data test. Oleh karena itu, dilakukan coding untuk
menentukan tingkat akurasi test dengan algoritma ANN. Serta pengaruh perubahan hidden
layer pada akurasi test.
Setelah hasil akurasi dan rata rata didapatkan, hasil tersebut akan diuji dengan Wilcoxon
Signed Rank Test yaitu uji nonparametris untuk mengukur signifikansi perbedaan antara 2
kelompok data berpasangan berskala ordinal atau interval tetapi berdistribusi tidak normal.
Pada kasus 1 (100% data train dan 100% data test) dilakukan perulangan sebanyak 10
kali dengan epoch 5000, 8000, dan 10000 dan dengan hidden layer 6 node dan 10 node hingga
mendapatkan hasil sebagai berikut.
Epoch 5000
Akurasi Test Hidden Layer 6 Akurasi Test Hidden Layer 10
Iterasi 1 97% 100%
Iterasi 2 99% 99%
Iterasi 3 94% 100%
Iterasi 4 97% 100%
Iterasi 5 99% 100%
Iterasi 6 99% 100%
Iterasi 7 100% 100%
Iterasi 8 90% 100%
Iterasi 9 94% 100%
Iterasi 10 100% 100%
Mean 97% 100%
Epoch 8000
Iterasi 1 99% 100%
Iterasi 2 92% 100%
Iterasi 3 94% 100%
Iterasi 4 100% 100%
Iterasi 5 98% 100%
Iterasi 6 99% 97%
Iterasi 7 100% 100%
Iterasi 8 100% 100%
Iterasi 9 98% 100%
Iterasi 10 99% 100%
Mean 98% 100%
Epoch 10000
Iterasi 1 99% 100%
Iterasi 2 98% 100%
Iterasi 3 92% 99%
Iterasi 4 98% 100%
Iterasi 5 98% 100%
Iterasi 6 99% 100%
Iterasi 7 73% 100%
Iterasi 8 98% 100%
Iterasi 9 96% 100%
Iterasi 10 99% 100%
Mean 95% 100%
Tabel 1. Tabel hasil akurasi tes dari kasus 1
Analisa hasil akurasi test kasus 1 dilakukan dengan Wilcoxon test dan dengan hasil
sebagai berikut.
H0: Tidak ada perubahan signifikan

H1: Terdapat perubahan signifikan
Test statistik antara Case 1 Hidden Layer 6 node dan 10 node
Statistics=0.000, p=0.109
Tidak ada perubahan signifikan (menerima H0)
Sehingga pada kasus 1 menunjukkan bahwa tidak adanya pengaruh yang signifikan
antara jumlah node hidden layer dengan akurasi test.
Pada kasus 2 (80% data train dan 20% data test) dilakukan tanpa perulangan dengan
epoch 5000, 8000, dan 10000 serta hidden layer 6 node dan 10 node sehingga mendapatkan
hasil sebagai berikut.
Epoch 5000 100% 95%
Epoch 8000 95% 95%
Epoch 10000 86% 95%
Tabel 2. Tabel hasil akurasi tes dari kasus 2
Analisa hasil akurasi test kasus 2 dilakukan dengan Wilcoxon test dan dengan hasil
sebagai berikut.
H0: Tidak ada perubahan signifikan

H1: Terdapat perubahan signifikan
Test statistik train test split antara Case 2 Hidden Layer 6 node dan
Hidden Layer 10 node
Sehingga pada kasus 2 menunjukkan bahwa tidak adanya pengaruh yang signifikan
antara jumlah node hidden layer dengan akurasi test.
Lampiran
Gambar 1. Arsitektur ANN dengan hidden layer 6 node
Gambar 2. Arsitektur ANN dengan hidden layer 10 node
Code:
- Menghubungkan colab dengan drive

from google.colab import drive
drive.mount('/content/drive',force_remount=True)
ANN case 1 (100% Data Latih, 100% Data Uji)

- Input dan Normalisasi
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_cs
v)
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import label_binarize
dataset = pd.read_csv('/content/drive/My Drive/ML/animals2.csv')

dataset.head()
dataset.drop('animal_name',axis = 1, inplace=True)
y = dataset['type']
X = dataset.drop('type', axis=1)
scaler = MinMaxScaler()
# mengubah data numerik menjadi boolean menggunakan label_binarize
X = pd.DataFrame(scaler.fit_transform(X), columns=X.columns)
print(X)
y = label_binarize(y, classes=[1,2,3,4,5,6,7])
- Array untuk menyimpan akurasi

ar5t=[]
ar8t=[]
ar10t=[]
from sklearn.neural_network import MLPClassifier

from sklearn.model_selection import train_test_split
Epoch 5000
for i in range (10):
model = MLPClassifier(hidden_layer_sizes=(6),max_iter=5000)
model.fit(X,y)
ar5t.append(model.score(X,y))
print("5000 Epoch completed successfully. Loading next run...")
Epoch 8000
model.fit(X,y)
Epoch 10000
model.fit(X,y)
print("10000 Epoch completed successfully. Loading output...")
print()
print()
- Perhitungan rata rata akurasi

mean1=0
mean2=0
mean3=0
print("Accuracy Results 5000 Epoch\n" + "*"*30)
for i in range (len(ar5t)):
mean1=mean1+ar5t[i]
print("Neural Network Model " , i , " : ", ar5t[i], "\t", round(ar
5t[i]*100), "%")
print("Mean : ", mean1/10, "\t", round((mean1/10)*100), "%")
mean2=mean2+ar8t[i]
8t[i]*100), "%")
mean3=mean3+ar10t[i]
print("Neural Network Model " , i , " : ", ar10t[i], "\t", round(a
r10t[i]*100), "%")
- Hidden Layer diubah menjadi 10
- Array penyimpanan akurasi

ar5t=[]
ar8t=[]
ar10t=[]

Epoch 5000
model.fit(X,y)
Epoch 8000
model.fit(X,y)
Epoch 10000
model.fit(X,y)
print()
print()
- Rata rata Akurasi

mean1=0
mean2=0
mean3=0
mean1=mean1+ar5t[i]
5t[i]*100), "%")

mean2=mean2+ar8t[i]
8t[i]*100), "%")

r10t[i]*100), "%")
Hasil :
[Hidden layer 1]
5000 Epoch completed successfully. Loading next run...
10000 Epoch completed successfully. Loading output...
Accuracy Results 5000 Epoch

******************************
Neural Network Model 0 : 0.9702970297029703 97 %
Mean : 0.9693069306930692 97 %
******************************
Mean : 0.9792079207920791 98 %
******************************
Mean : 0.9504950495049507 95 %
[Hidden layer 2]

******************************
Mean : 0.9990099009900991 100 %
******************************
Mean : 0.9970297029702969 100 %
******************************
Mean : 0.9990099009900991 100 %
Analisa Wilcoxon:
from scipy.stats import wilcoxon
testC1 =pd.read_csv('/content/drive/My Drive/ML/WTC1all.csv')

dfC1= testC1[['HL1','HL2']].dropna()
print("Test statistik train test split antara Case 1 Hidden Layer 6

node dan Hidden Layer 10 node")
stat,p=wilcoxon(dfC1['HL1'],dfC1['HL2'])
print('Statistics=%.3f, p=%.3f' % (stat, p))
alpha = 0.05
if p > alpha:
print('Tidak ada perubahan signifikan (menerima H0)')
else:
print('Terdapat perubahan signifikan (menolak H0)')
Hasil analisa:
ANN case 2 (80% Data Latih, 20% Data Uji)
- Input dan Normalisasi

dataset = pd.read_csv('/content/drive/My Drive/ML/animals2.csv')
dataset.head()
- Pemisahan output dan input

dataset.drop('animal_name',axis = 1, inplace=True)
y = dataset['type']
X = dataset.drop('type', axis=1)
scaler = MinMaxScaler()
X = pd.DataFrame(scaler.fit_transform(X), columns=X.columns)
- Pengambilan data berdasarkan baris dan kolom

y_1 = dataset.iloc[:41,16]
y_2 = dataset.iloc[41:61,16]
y_7 = dataset.iloc[91:,16]
X_1 = dataset.iloc[:41,:15]
X_2 = dataset.iloc[41:61,:15]
X_7 = dataset.iloc[91:,:15]
- Membagi data menjadi data train 80%, data test 20%

X_train1, X_test1, y_train1, y_test1 = train_test_split(X_1, y_1, te
st_size=0.2)
st_size=0.2)
st_size=0.2)
st_size=0.2)
st_size=0.2)
st_size=0.2)
st_size=0.2)
- Mengabungkan beberapa data frame

X_train = pd.concat([X_train1, X_train2, X_train3, X_train4, X_train
5, X_train6, X_train7])
X_test = pd.concat([X_test1, X_test2, X_test3, X_test4, X_test5, X_t
est6, X_test7])
y_train = pd.concat([y_train1, y_train2, y_train3, y_train4, y_train
5, y_train6, y_train7])
y_test = pd.concat([y_test1, y_test2, y_test3, y_test4, y_test5, y_t
est6, y_test7])
# mengubah data numerik menjadi boolean menggunakan label_binarize

y_train = label_binarize(y_train, classes=[1,2,3,4,5,6,7])
y_test = label_binarize(y_test, classes=[1,2,3,4,5,6,7])
- Menyiapkan array penampung akurasi

ar5t=[]
ar8t=[]
ar10t=[]

Epoch 5000
model.fit(X_train,y_train)
ar5t.append(model.score(X_test,y_test))
Epoch 8000
Epoch 10000
print()
print()
- Menghitung rata rata akurasi

mean1=0
mean2=0
mean3=0
mean1=mean1+ar5t[i]
5t[i]*100), "%")
print("Mean : ", mean1/10, "\t", round((mean1)*100), "%")
mean2=mean2+ar8t[i]
8t[i]*100), "%")
r10t[i]*100), "%")
- Hidden layer diubah menjadi 10
- Menyiapkan array penampung akurasi

ar5t=[]
ar8t=[]
ar10t=[]

Epoch 5000
Epoch 8000
Epoch 10000
print()
print()
- Menghitung rata rata akurasi

mean1=0
mean2=0
mean3=0
mean1=mean1+ar5t[i]
5t[i]*100), "%")
mean2=mean2+ar8t[i]
8t[i]*100), "%")
r10t[i]*100), "%")
Hasil :
[Hidden layer 1]

******************************
Mean : 0.1 100 %
******************************
Mean : 0.09545454545454546 95 %
******************************
Mean : 0.08636363636363636 86 %
[Hidden layer 2]

******************************
Mean : 0.09545454545454546 95 %
******************************
Mean : 0.09545454545454546 95 %
******************************
Mean : 0.09545454545454546 95 %
Analisa Wilcoxon:
from scipy.stats import wilcoxon
testC2 =pd.read_csv('/content/drive/My Drive/ML/WTC2all.csv')
dfC2= testC2[['HL1','HL2']].dropna()
print("Test statistik train test split antara Case 2 Hidden Layer 6

node dan Hidden Layer 10 node")
stat,p=wilcoxon(dfC2['HL1'],dfC2['HL2'])
print('Statistics=%.3f, p=%.3f' % (stat, p))
alpha = 0.05
if p > alpha:
print('Tidak ada perubahan signifikan (menerima H0)')
else:
print('Terdapat perubahan signifikan (menolak H0)')
Hasil analisa:

Laporan KB DL

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Laporan KB DL

Diunggah oleh

Hak Cipta:

Format Tersedia

Adi Pratama Kurniawan 311810001

Albert Meidison Wijaya 311810002

H0: Tidak ada perubahan signifikan

H0: Tidak ada perubahan signifikan

Gambar 1. Arsitektur ANN dengan hidden layer 6 node

Gambar 2. Arsitektur ANN dengan hidden layer 10 node

- Menghubungkan colab dengan drive

ANN case 1 (100% Data Latih, 100% Data Uji)

dataset = pd.read_csv('/content/drive/My Drive/ML/animals2.csv')

- Array untuk menyimpan akurasi

from sklearn.neural_network import MLPClassifier

- Perhitungan rata rata akurasi

- Hidden Layer diubah menjadi 10

- Array penyimpanan akurasi

from sklearn.neural_network import MLPClassifier

- Rata rata Akurasi

print("Accuracy Results 8000 Epoch\n" + "*"*30)

print("Accuracy Results 10000 Epoch\n" + "*"*30)

Accuracy Results 5000 Epoch

Accuracy Results 5000 Epoch

testC1 =pd.read_csv('/content/drive/My Drive/ML/WTC1all.csv')

print("Test statistik train test split antara Case 1 Hidden Layer 6

- Input dan Normalisasi

- Pemisahan output dan input

- Pengambilan data berdasarkan baris dan kolom

- Membagi data menjadi data train 80%, data test 20%

- Mengabungkan beberapa data frame

# mengubah data numerik menjadi boolean menggunakan label_binarize

- Menyiapkan array penampung akurasi

from sklearn.neural_network import MLPClassifier

- Menghitung rata rata akurasi

- Hidden layer diubah menjadi 10

- Menyiapkan array penampung akurasi

from sklearn.neural_network import MLPClassifier

- Menghitung rata rata akurasi

Accuracy Results 5000 Epoch

Accuracy Results 5000 Epoch

print("Test statistik train test split antara Case 2 Hidden Layer 6

Anda mungkin juga menyukai

print("Accuracy Results 8000 Epoch\n" + ""30)

print("Accuracy Results 10000 Epoch\n" + ""30)