PERINGKAS
OTOMATIS TEKS
BERBAHASA
INDONESIA
MENGGUNAKAN
METODE TF-IDF
DAN FUZZY C
MEANS
Hello!
I am Neng Mira
I am here forRahayu
my final project presentation
You can find me at:
mira.effendy
mira.effendy@gmail.com
1.
pendahuluan
read
The more things you know
The more that you learn
The more places youll go
The more you
-Dr. Seuss
Latar belakang
Perkembangan teknologi
Artikel bersifat real time dan up to date
Banyak artikel tidak menyediakan
ringkasan
Waktu luang yang terbatas
Latar belakang
(cont..)
Ringo apps
Rumusan masalah
ANALISIS metode
TF-IDF dan FUZZY C
MEANS untuk
aplikasi peringkas
teks otomatis??
Batasan masalah
Menggunakan artikel, dokumen tunggal
Stemming menggunakan algoritma nazief
dan andriani
Kamus kata dasar sebanyak 28.526
Stopwords berjumlah 758 kata
tujuan penelitian
ANALISIS metode
TF-IDF dan FUZZY C
MEANS untuk
aplikasi peringkas
teks otomatis
Metodologi penelitian
Studi literatur
kuisioner
Metodologi
pengembangan
perangkat lunak
Requirement
Definition
System
and
Software
Design
Implementation
and unit testing
Integration and
system design
Operation and
maintenance
Bab 2
Landasan Teori
Tahapan
Pengertian
Rasio
Kompresi
Pendekatan
Artikel
Pra proses
Case
Folding
Remove
stopwords
Pemecahan
Kalimat
tokenizing
stemming
Identifikasi
topik
Interpretasi
generate
Tf-idf
TF : frekuensi kemunculan term pada
dokumen
DF : banyaknya dokumen dimana suatu term
(t) muncul.
IDF : jumlah dokumen yang mengandung
sebuah term yang dicari dari kumpulan
dokumen yang ada
Teori fuzzy
Fuzzy set dinyatakan dalam fungsi
keanggotaan.
Fungsi keanggotaan bernilai 0.0 1.0
K means clustering
Tujuan : mempartisi data yang ada ke dalam
bentuk satu cluster atau lebih
Algoritma:
a. Tentukan jumlah cluster
b. Menentukan nilai centroid
c. Menghitung jarak antar data dgn cluster
d. Pengelompokan data
e. Kembali ke tahap (b) sampai anggota
cluster tidak berubah
Fuzzy C MEans
tahap FCM:
Tahap
a. Memasukan data dokumen hasil tf-idf dan
menentukan parameter
b. Membangkitkan bilangan acak ik sbg
derajat keanggotaan masing-masing cluster
c. Menghitung nilai kedekatan tiap term
d. Menghitung fungsi objektif
Fuzzy c means
(cont)
Memperbaharui
e.
derajat keanggotaan
f. Mengecek kondisi berhenti
1) Jika |Pt-Pt-1| < e atau t >maxIter , maka
berhenti
2) Jika tidak, kembali kelangkah c untuk
melakukan perulangan sampai memenuhi
kondisi f1
Bab 3
ANALISA DAN
PERANCANGAN
SISTEM
PERANCANGAN DATA
DAFTAR STOPWORD
Nama Field
Tipe Data
Panjang
Kunci
Keterangan
id_stopword
int
11
PK
autoincrement
kata_stopword
text
Not null
DAFTAR STEMMING
Nama Field
Tipe Data
Panjang
Kunci
Keterangan
id_rootword
int
11
PK
autoincrement
kata_rootword
text
Not null
Tipe_katadasar
text
Not null
PERANCANGAN ARSITEKTUR
MENU
PERANCANGAN ANTARMUKA
BAB 4
IMPLEMENTASI DAN
PENGUJIAN SISTEM
SCREENSHOOT APLIKASI
Works; 84%
Topi
k
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
KS
40%
8
5
6
8
5
6
8
5
6
8
5
6
8
5
6
KR
4,5,7,9,10,13,16,18
3,6,11,13,15
1,2,3,4,6,15,19
1,4,6,8,12,15,18,20
2,4,6,8,13
1,3,4,7,11,15,19
1,4, 6,10,12,13,15,19
4,6,10,11,13
1,2,3,6,10,15,18
1,9,13,15,16,17,18,20
3,6,10,11,12
3,4,5,6,7,15,17
4,9,10,13,15,16,17,19
3,4,6,12,13,15
1,3,4,8,15,19
KR
8
5
7
8
5
7
8
5
7
8
5
7
8
6
6
KRS
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
KR
S
5
3
5
3
2
6
4
2
3
6
3
4
7
5
5
sum
average
Akurasi
62.50
60.00
71.43
37.50
40.00
85.71
50.00
40.00
42.86
75.00
60.00
57.14
87.50
83.33
83.33
936.31
62.42
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
KS
40%
8
5
6
8
5
6
8
5
6
8
5
6
8
5
6
KR
recall
(KRS/KR)
krs
8
5
7
8
5
7
8
5
7
8
5
7
8
6
6
precision
(KRS / KS)
f
measure
5
3
5
3
2
6
4
2
3
6
3
4
7
5
5
0.63
0.60
0.71
0.38
0.40
0.86
0.50
0.40
0.43
0.75
0.60
0.57
0.88
0.83
0.83
0.63
0.60
0.83
0.38
0.40
1.00
0.50
0.40
0.50
0.75
0.60
0.67
0.88
1.00
0.83
0.63
0.60
0.77
0.38
0.40
0.92
0.50
0.40
0.46
0.75
0.60
0.62
0.88
0.91
0.83
sum
average
9.36
0.62
9.96
0.66
9.64
0.64
Bab 5
KESIMPULAN DAN
SARAN
KESIMPULAN
Aplikasi peringkas otomatis teks berbahasa
Indonesia dapat dibangun dengan
menggunakan metode tf-idf dan fuzzy c
means
Hasil :
80%
60%
40%
20%
0%
recall
precision
f-measure
saran
Kembangkan interface agar lebih menarik
ditambahkan parameter lain, seperti bobot
kalimat utama atau kalimat akhir.
Terima
kasih