(5)
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
dimana :
(6)
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
A : atribut
V : suatu nilai yang mungkin untuk atribut A Untuk data yang lengkap seharusnya
terdapat 3 x 3 x 2 = 18 kombinasi sampel data,
Values (A) : himpunan yang mungkin untuk
atribut A tetapi dalam tabel diatas hanya terdapat 11
sampel data artinya masih ada 7 sampel data
|Sv| : jumlah sampel untuk nilai v lain yang belum diketahui. Contoh : [ nilai
SPMB ‘Tinggi’, nilai UAN ‘Kurang’ dan
|S| : jumlah seluruh sampel data
Psikotest ‘Buruk’ ]. Kita tidak bisa menentukan
Entropy(Sv): entropy untuk sampel-sampel peserta SPMB tersebut diterima atau tidak.
yang memilki nilai v
(7)
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
Entropy (Ssedang ) = (-3/4) log2 (3/4) - (1/4) log2 SBaik = [ 6+, 0- ] , | SBaik | = 6
(1/4) = 0,8113
SBuruk = [ 2+, 3- ] , | SBuruk | = 5
Entropy (SRendah) = (-2/3) log2 (2/3) - (1/3) log2
(1/3) = 0,9183 Entropy (SBaik) = (-6/6) log2 (6/6) – (0/6) log2
(0/0)
• Information Gain (S, Nil.SPMB)
= 0 ( kebergaman data
=Entropy(S)– minimum )
(8)
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
Entropy (SBuruk) = (-2/5) log2 (2/5) – (3/5) log2 Memanggil fungsi ID3 dengan kumpulan
(3/5) sampel berupa sampel baik [6+, 0-] atribut
target = ‘Diterima’ dan kumpulan atribut (nilai
= 0,97094 SPMB, UAN). Semua sampel baik termasuk
dalam kelas “ya” maka fungsi ini akan berhenti
IG ( S, Psikotest ) = 0,8454 – 0 – (5/11) 0,97094 dan mengembalikan satu simpul tunggal Root
dengan label ‘ya’ .
= 0,8454 – 0,44134
Rekursi level 0 , Itersi ke 2
= 0,40406
Pada proses rekursi level 0 , iterasi ke 1,
Dari perhitugan diatas didapat nilai Information sudah dilakukan pengecekan untuk atribut
Gain dari ketiga atribut ( Nil.SPMB, UAN, dan ‘Psikotest’ dengan nilai ‘baik’. Untuk nilai
Psikotest ) ‘buruk’, terdapat 5 sampel, berarti Sampelburuk
tidak kosong. Sehingga, perlu memanggil
IG ( S, Nil.SPMB) = 0,0049 fungsi ID3 dengan kumpulan sampel berupa
Sampelburuk = [ 2+, 3- ], AtributTarget
IG ( S, UAN) = 0,26682 =’Diterima’, dan KumpulanAtribut = { nil.SPMB,
UAN }.
IG ( S, Psikotest) = 0,40406
Rekursi level 1 iterasi ke 2
Dari ketiga nilai Information Gain diatas Gain (
S, Psikotest ) adalah yang terbesar sehingga Memanggil fungsi ID3 dengan kumpulan
atribut Psikotest merupakan the best classifier sampel berupa Sampelburuk = [2+, 3-],
dan harus diletakkan sebagai root. AtributTarget = ‘Diterima’, dan
KumpulanAtribut = { nil.SPMB, Psikotest }.
Rekursi Level 0 iterasi ke-1
Pada tahap ini dilakukan perhitungan
Memanggil fungsi ID3 dengan kumpulan information gain untuk atribut nil.SPMB dan
sampel berupa semua sampel data = [ 8+ , 3- UAN . tetapi kumpulan sampel yang
]; diperhitungkan adalah Sampelburuk dengan 5
sampel data, yaitu [ 2+ , 3- ]. Dengan kata lain
Atribut target = ‘Diterima’ dan kumpulan atribut
[nil.SPMB, UAN, Psikotest] S = Sampelburuk.
Hitung entropy dan Information Gain untuk Value (nil.SPMB) = Tinggi, Sedang, rendah
menentukan the best classifier dan
S = Sampelburuk = [2+, 3- ] , | S | = 5
meletakkannya sebagai root.
STinggi = [1+, 1-] , | STinggi | = 2
Dari penjelasan sebelumnya didapat
nilai Information Gain (S, Psikotest ) sebagai
SSedang = [1+, 1-] , | SSedang | = 2
the best classifier karena IG nya terbesar.
Setelah mendapat the best classifier langkah SRendah = [0+, 1-] , | SRendah | = 1
selanjutnya adalah setiap nilai pada atribut
Psikotest akan di cek apakah perlu dibuat Hitung nilai entropy untuk S, STinggi , SSedang ,
subtree di level berikutnya atau tidak.. atribut SRendah dan Information Gain untuk nil.SPMB
Psikotest, ada 2 sampel ( baik dan buruk ). adalah :
Untuk nilai ‘Baik’ terdapat 6 sampel, berarti
sampel baik tidak kosong. Sehingga perlu Entropy (S) = - ( 2/5) log2 (2/5) – (3/5)
memanggil fungsi ID3 dengan kumpulan log2 (3/5
sampel berupa sampel baik = [6+, 0-] , atribut
= 0,9710
target =’Diterima’ dan kumpulan atribut ={
nil.SPMB, Psikotest } Entropy (STinggi) = - (1/2) log2 (1/2) – (1/2) log2
(1/2)
Rekursi level 1 iterasi ke 1
(9)
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
( 10 )
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
= { }. Karena semua sample pada SampleTinggi Memanggil fungsi ID3 dengan kumpulan
termasuk dalam kelas ‘ya’ , maka fungsi ini Sample berupa SampleKurang = [ 0+, 1- ],
akan berhenti dan mengembalikan satu simpul AtributTarget = ‘Diterima’, dan kumpulan
tunggal Root dengan label ‘ya’. Atribut = {}. Karena semua sample pada
SampleKurang termasuk dalam kelas ‘Tidak’,
Selanjutnya, proses akan kembali ke rekursi maka fungsi ini akan berhenti dan
level 2 iterasi ke-2. mengembalikan satu simpul tunggal root
dengan label ‘Tidak’
Rekursi level 2 iterasi ke-2
Rekursi level 1 iterasi ke-3
Pengecekan atribut nilai SPMB untuk nilai
‘Tinggi’ sudah dilakukan pada rekursi level 2 Pengecekan atribut UAN untuk nilai ‘Bagus’
iterasi ke-1. Selanjutnya, pengecekan dan ‘Cukup’ yaitu pada rekursi level 1 iterasi
dilakukan pada atribut nilai SPMB untuk nilai ke-2. Selanjutnya pengecekan dilakukan pada
‘Sedang’ . ternyata terdapat 1 sampel pada atribut UAN untuk nilai ‘Kurang’ . ternyata
kumpulan sampel dimana psikotest bernilai terdapat 2 sample pada Kumpulan Sample
‘Buruk’ dan UAN bernilai ‘Cukup’ . karena dimana Psikotest bernilai ‘Buruk’ dan UAN
SampleSedang tidak kosong maka perlu bernilai ‘Rendah’. Karena sample rendah tidak
memanggil fungsi ID3 dengan kosong sehingga perlu memanggil fungsi ID3
KumpulanSampel berupa SampleSedang = [ 1+, dengan kumpulan sample berupa SampleRendah
0- ], AtributTarget = ‘Diterima’, dan = [ 0+, 2- ], atribut target = ‘Diterima’, dan
KumpulanAtribut = {}. kumpulan atribut = { IPK }
Rekursi level 3 iterasi ke-2 Selanjutnya proses akan kembali ke rekursi
( 11 )
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
Baik Buruk
POHON KEPUTUSAN
Baik
Baik Buruk
Psikotest
Bagus Cukup
Tidak
Baik
Ya
( 12 )
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
Baik Buruk
Baik Buruk
Ya UAN
Ya UAN
Bagus Cukup
Bagus Cukup
Tidak Nil.SPMB
Tidak Nil.SPMB
Tinggi
Tinggi Sedang
Psikotest
Rekursi level 3 iterasi ke-2
Psikotest
Baik Buruk
Tidak Nil.SPMB
Tinggi
Ya Tinggi Sedang
Ya Ya
( 13 )
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
Baik Buruk
Baik Buruk
Ya UAN
Ya UAN
Tidak Nil.SPMB
Tidak Nil.SPMB
Ya Ya Tidak
Ya Ya
Baik Buruk
Baik Buruk
Ya UAN
Ya UAN
( 14 )
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)
JURNAL PENDIDIKAN TEKNOLOGI INFORMASI DAN KOMUNIKASI (PTIK) ISSN 1979-9462
Pohon keputusan akhir yang dihasilkan oleh fungsi tergantung pada pihak universitas berdasarkan
ID3. pertimbangan beberapa kriteria yang
ditetapkan.
Dengan demikian 7 sampel yang
belum diketahui adalah sebagai berikut : Reference
( 15 )
Indonesian Community on Information and Vol. 2 no. 2 / Desember 2009
Communication Technology (IC2T)