Erik Fadliansyah C Modul I

LAPORAN PRAKTIKUM
KECERDASAN BUATAN
MODUL I
Disusun oleh:
ERIK FADLIANSYAH
3411181151
C
PROGRAM STUDI TEKNIK INFORMATIKA

FAKULTAS SAINS DAN INFORMATIKA
UNIVERSITAS JENDERAL ACHMAD YANI
CIMAHI
2020
1. Pembahasan Praktikum
Decision tree atau pohon keputusan adalah alat pendukung keputusan yang
menggunakan model keputusan yang berbentuk seperti pohon. Decision tree
memetakan berbagai alternatif yang mungkin untuk mengatasi suatu masalah, dan
terdapat juga faktor-faktor kemungkinan yang dapat mempengaruhi alternatif
tersebut beserta estimasi akhirnya jika memilih alternatif yang ada. Decision tree
merupakan salah satu metode yang bisa digunaan untuk menampilkan algoritma
dimana hanya berisi pernyataan kontrol bersyarat.
Decision tree merupakan struktur seperti bagan alur dimana setiap simpul
internal mewakili kemungkinan yang ada pada atribut, setiap cabang mewakili
hasil dari kemungkinan tersebut, dan setiap simpul daun mewakili label kelas
(keputusan diambil setelah menghitung semua atribut). Jalur dari root ke daun
mewakili aturan klasifikasi.
formula entropi
Dimana:
S adalah himpunan (dataset) kasus
k adalah banyaknya partisi S
pj adalah probabilitas yang di dapat dari Sum(Ya) dibagi Total Kasus.
information gain
Dimana:
S = ruang (data) sample yang digunakan untuk training.
A = atribut.
|Si| = jumlah sample untuk nilai V.
|S| = jumlah seluruh sample data.
Entropi(Si) = entropy untuk sample-sample yang memiliki nilai i
1
Algoritma ID3
1. Buat simpul root.
2. ika semua sampel adalah kelas i. maka return pohon satu simpul Root
dengan label =i
3. Jika kumpulan atribut kosong maka return pohon satu simpul Root dengan
label nilai atribut target yang paling umum (yang paling sering muncul).
Jika kumpulan atribut ada nilainya maka,
 A diisi oleh atribut yang memiliki information gain terbesar
 A menjadi atribut keputusan untuk Root
4. Jika selesai, maka return Root
2. Analisis & Hasil

Tree.py
import re
import math
from collections import deque
class Node(object):
def __init__(self):
self.value = None
self.next = None
self.childs = None
class DecisionTree(object):
def __init__(self, sample, attributes, labels):
self.sample = sample
self.attributes = attributes
self.labels = labels
self.labelCodes = None
self.labelCodesCount = None
self.initLabelCodes()
# print(self, labelCodes)
self.root = None
self.entropy = self.getEntropy([x for x in
range(len(self.labels))])
def initLabelCodes(self):
self.labelCodes = []
self.labelCodesCount = []
for l in self.labels:
if l not in self.labelCodes:
self.labelCodes.append(l)
self.labelCodesCount.append(0)
self.labelCodesCount[self.labelCodes.index(l)] += 1
def getLabelCodeId(self, sampleId):

return self.labelCodes.index(self.labels[sampleId])
def getAttributeValues(self, sampleIds, attributeId):
2
vals = []
for sid in sampleIds:
val = self.sample[sid][attributeId]
if val not in vals:
vals.append(val)
# print(vals)
return vals
def getEntropy(self, sampleIds):

entropy = 0
labelCount = [0] * len(self.labelCodes)
labelCount[self.getLabelCodeId(sid)] += 1
# print("-ge", labelCount)
for lv in labelCount:
# print(lv)
if lv != 0:
entropy += -lv/len(sampleIds) *
math.log(lv/len(sampleIds), 2)
else:
entropy += 0
return entropy
def getDominantLabel(self, sampleIds):

labelCodesCount = [0] * len(self.labelCodes)
labelCodesCount[self.labelCodes.index(self.labels[sid])] +=
1
return
self.labelCodes[labelCodesCount.index(max(labelCodesCount))]
def getInformationGain(self, sampleIds, attributeId):

gain = self.getEntropy(sampleIds)
attributeVals = []
attributeValsCount = []
attributeValsIds = []
val = self.sample[sid][attributeId]
if val not in attributeVals:
attributeVals.append(val)
attributeValsCount.append(0)
attributeValsIds.append([])
vid = attributeVals.index(val)
attributeValsCount[vid] += 1
attributeValsIds[vid].append(sid)
# print("-gig", vids)
for vc, vids in zip(attributeValsCount, attributeValsIds):
# print("-gig", vids)
gain -= vc/len(sampleIds) * self.getEntropy(vids)
return gain
def getAttributeMaxInformationGain(self, sampleIds, attributeIds):

attributesEntropy = [0] * len(attributeIds)
for i, attId in zip(range(len(attributeIds)), attributeIds):
attributesEntropy[i] = self.getInformationGain(sampleIds,
attId)
maxId =
attributeIds[attributesEntropy.index(max(attributesEntropy))]
return self.attributes[maxId], maxId
def isSingleLabeled(self, sampleIds):

label = self.labels[sampleIds[0]]
if self.labels[sid] != label:
3
return False
return True
def getLabel(self, sampleIds):

return self.labels[sampleId]
def id3(self):
sampleIds = [x for x in range(len(self.sample))]
attributeIds = [x for x in range(len(self.attributes))]
self.root = self.id3Recv(sampleIds, attributeIds, self.root)
def id3Recv(self, sampleIds, attributeIds, root):

root = Node() # Initialize current root
if self.isSingleLabeled(sampleIds):
root.value = self.labels[sampleIds[0]]
return root
# print(attributeIds)
if len(attributeIds) == 0:
root.value = self.getDominantLabel(sampleIds)
return root
bestAttrName, bestAttrId = self.getAttributeMaxInformationGain(
sampleIds, attributeIds)
# print(bestAttrName)
root.value = bestAttrName
root.childs = [] # Create list of children
for value in self.getAttributeValues(sampleIds, bestAttrId):
# print(value)
child = Node()
child.value = value
root.childs.append(child) # Append new child node to
current
# root
childSampleIds = []
if self.sample[sid][bestAttrId] == value:
childSampleIds.append(sid)
if len(childSampleIds) == 0:
child.next = self.getDominantlabel(sampleIds)
else:
# print(bestAttrName, bestAttrId)
# print(attributeIds)
if len(attributeIds) > 0 and bestAttrId in
attributeIds:
toRemove = attributeIds.index(bestAttrId)
attributeIds.pop(toRemove)
child.next = self.id3Recv(
childSampleIds, attributeIds, child.next)
return root
def printTree(self):
if self.root:
roots = deque()
roots.append(self.root)
while len(roots) > 0:
root = roots.popleft()
print(root.value)
if root.childs:
for child in root.childs:
print('({})'.format(child.value))
roots.append(child.next)
elif root.next:
print(root.next)
def test():
f = open('playtennis.csv')
4
attributes = f.readline().split(',')
attributes = attributes[1:len(attributes)-1]
print(attributes)
sample = f.readlines()
f.close()
for i in range(len(sample)):
sample[i] = re.sub('\d+,', '', sample[i])
sample[i] = sample[i].strip().split(',')
labels = []
for s in sample:
labels.append(s.pop())
# print(sample)
# print(label)
decisionTree = DecisionTree(sample, attributes, labels)
print("System entropy {}".format(decisionTree.entropy))
decisionTree.id3()
decisionTree.printTree()
if __name__ == '__main__':
test()
Playtennis.csv
5
Buat file exel bernama Playtennis lalu simpan dengan format csv. Setelah
itu buka file tersebut menggunakan Notepad dan ubah setiap tanda ( ; ) menjadi
(,). Setelah itu compile program Tree.py
Untuk setiap variabel yang muncul dengan tanpa tanda kurung maka dia akan
menjadi Root untuk variabel bertanda kurung yang di bawahnya.
6
Dimulai dari Outlook atau (Pandangan Langit) sebagai Root utama,
kemudian Sunny (Cerah), Overcast (Mendung), dan Rain (Hujan). Bila Langit
Mendung maka akan bermain tenis, namun apabila Langit cerah di cek terlebih
dahulu apabila Kelembabannya Tinggi maka tidak bermain tenis, apabila normal
maka bermain tenis. Lalu apabila langit hujan dan ber-angin maka di cek apakah
anginnya kuat atau tidak, bila anginnya lemah maka bermain tenis, bila anginnya
kuat maka tidak bermain tenis.
3. Tugas Praktikum
Buat dataset baru yang menunjukan hasil dari Wawancara. Lalu gunakan
Tree.py untuk menghitung Information Gainnya.
7
Setelah di Compile
8
Dari hasil dataset tersebut dihasilkan bahwa wawancara yang baik maka
akan diterima, namun bila buruk di lihat kondisi psikologinya, apakah sedang atau
rendah, apabila rendah maka tidak diterima, namun bila sedang dipertimbangkan
kembali dengan melihat nilai IPK. Bila nilainya bagus atau cukup maka diterima,
namun bila nilainya kurang maka tidak diterima.

Erik Fadliansyah C Modul I

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Erik Fadliansyah C Modul I

Diunggah oleh

Hak Cipta:

Format Tersedia

LAPORAN PRAKTIKUM

PROGRAM STUDI TEKNIK INFORMATIKA

2. Analisis & Hasil

def getLabelCodeId(self, sampleId):

def getAttributeValues(self, sampleIds, attributeId):

def getEntropy(self, sampleIds):

def getDominantLabel(self, sampleIds):

def getInformationGain(self, sampleIds, attributeId):

def getAttributeMaxInformationGain(self, sampleIds, attributeIds):

def isSingleLabeled(self, sampleIds):

def getLabel(self, sampleIds):

def id3Recv(self, sampleIds, attributeIds, root):

Anda mungkin juga menyukai