Anda di halaman 1dari 38

APLIKASI

PERINGKAS
OTOMATIS TEKS
BERBAHASA
INDONESIA
MENGGUNAKAN
METODE TF-IDF
DAN FUZZY C
MEANS

Dzat yang paling


mulia, terimakasih
sudah begitu baik

Hello!
I am Neng Mira
I am here forRahayu
my final project presentation
You can find me at:
mira.effendy
mira.effendy@gmail.com

1.
pendahuluan

read
The more things you know
The more that you learn
The more places youll go
The more you

-Dr. Seuss

Latar belakang
Perkembangan teknologi
Artikel bersifat real time dan up to date
Banyak artikel tidak menyediakan
ringkasan
Waktu luang yang terbatas

Latar belakang

(cont..)

TF-IDF lebih baik dari frase penunjuk


(sitawati,2005)
Pratama menyarankan clustering
menggunakan perkembangan dari KMeans
Belum ada penelitian mengenai
Peringkasan menggunakan Fuzzy C
Means
Belum ada aplikasi peringkas
otomatis berbasis Android

Ringo apps

Aplikasi Peringkas Otomatis Teks


Berbahasa Indonesia menggunakan
Metode TF-IDF dan Fuzzy C Means

Rumusan masalah
ANALISIS metode
TF-IDF dan FUZZY C
MEANS untuk
aplikasi peringkas
teks otomatis??

Batasan masalah
Menggunakan artikel, dokumen tunggal
Stemming menggunakan algoritma nazief
dan andriani
Kamus kata dasar sebanyak 28.526
Stopwords berjumlah 758 kata

tujuan penelitian
ANALISIS metode
TF-IDF dan FUZZY C
MEANS untuk
aplikasi peringkas
teks otomatis

Metodologi penelitian

Studi literatur

kuisioner

Metodologi
pengembangan
perangkat lunak
Requirement
Definition
System
and
Software
Design
Implementation
and unit testing

Integration and
system design

Operation and
maintenance

Diagram waterfall model Ian Sommerville, 2007

Bab 2
Landasan Teori

2.1 peringkas teks otomatis


Tujuan

Tahapan

Pengertian

Rasio
Kompresi

Pendekatan

Artikel

Pra proses

Case
Folding

Remove
stopwords

Pemecahan
Kalimat

tokenizing

stemming

Proses peringkasan teks

Identifikasi
topik

Interpretasi

generate

Tf-idf
TF : frekuensi kemunculan term pada
dokumen
DF : banyaknya dokumen dimana suatu term
(t) muncul.
IDF : jumlah dokumen yang mengandung
sebuah term yang dicari dari kumpulan
dokumen yang ada

Teori fuzzy
Fuzzy set dinyatakan dalam fungsi
keanggotaan.
Fungsi keanggotaan bernilai 0.0 1.0

K means clustering
Tujuan : mempartisi data yang ada ke dalam
bentuk satu cluster atau lebih
Algoritma:
a. Tentukan jumlah cluster
b. Menentukan nilai centroid
c. Menghitung jarak antar data dgn cluster
d. Pengelompokan data
e. Kembali ke tahap (b) sampai anggota
cluster tidak berubah

Fuzzy C MEans
tahap FCM:
Tahap
a. Memasukan data dokumen hasil tf-idf dan
menentukan parameter
b. Membangkitkan bilangan acak ik sbg
derajat keanggotaan masing-masing cluster
c. Menghitung nilai kedekatan tiap term
d. Menghitung fungsi objektif

Fuzzy c means

(cont)

Memperbaharui
e.

derajat keanggotaan
f. Mengecek kondisi berhenti
1) Jika |Pt-Pt-1| < e atau t >maxIter , maka
berhenti
2) Jika tidak, kembali kelangkah c untuk
melakukan perulangan sampai memenuhi
kondisi f1

Pengujian black box

Metode ini fokus pada keperluan penelusuran


kesalahan fungsional dari software

Bab 3
ANALISA DAN
PERANCANGAN
SISTEM

ANALISIS ARSITEKTUR SISTEM

USE CASE DIAGRAM

PERANCANGAN DATA

DAFTAR STOPWORD
Nama Field

Tipe Data

Panjang

Kunci

Keterangan

id_stopword

int

11

PK

autoincrement

kata_stopword

text

Not null

DAFTAR STEMMING
Nama Field

Tipe Data

Panjang

Kunci

Keterangan

id_rootword

int

11

PK

autoincrement

kata_rootword

text

Not null

Tipe_katadasar

text

Not null

PERANCANGAN ARSITEKTUR
MENU

PERANCANGAN ANTARMUKA

BAB 4
IMPLEMENTASI DAN
PENGUJIAN SISTEM

SCREENSHOOT APLIKASI

Pengujian Aplikasi Ringo


Force Closed; 16%

Works; 84%

Dari 25 pengujian aplikasi didapat 21


berhasil.
Dan dengan durasi analisis rata-rata selama

Pengujian oleh pakar


No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Topi
k
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3

KS
40%
8
5
6
8
5
6
8
5
6
8
5
6
8
5
6

KR
4,5,7,9,10,13,16,18
3,6,11,13,15
1,2,3,4,6,15,19
1,4,6,8,12,15,18,20
2,4,6,8,13
1,3,4,7,11,15,19
1,4, 6,10,12,13,15,19
4,6,10,11,13
1,2,3,6,10,15,18
1,9,13,15,16,17,18,20
3,6,10,11,12
3,4,5,6,7,15,17
4,9,10,13,15,16,17,19
3,4,6,12,13,15
1,3,4,8,15,19

KR
8
5
7
8
5
7
8
5
7
8
5
7
8
6
6

KRS
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19
4,9,13,15,16,17,18,19
3,4,6,12,15
1,3,4,7,15,19

KR
S
5
3
5
3
2
6
4
2
3
6
3
4
7
5
5
sum
average

Akurasi
62.50
60.00
71.43
37.50
40.00
85.71
50.00
40.00
42.86
75.00
60.00
57.14
87.50
83.33
83.33
936.31
62.42

No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

KS
40%
8
5
6
8
5
6
8
5
6
8
5
6
8
5
6

KR

recall
(KRS/KR)

krs
8
5
7
8
5
7
8
5
7
8
5
7
8
6
6

precision
(KRS / KS)

f
measure

5
3
5
3
2
6
4
2
3
6
3
4
7
5
5

0.63
0.60
0.71
0.38
0.40
0.86
0.50
0.40
0.43
0.75
0.60
0.57
0.88
0.83
0.83

0.63
0.60
0.83
0.38
0.40
1.00
0.50
0.40
0.50
0.75
0.60
0.67
0.88
1.00
0.83

0.63
0.60
0.77
0.38
0.40
0.92
0.50
0.40
0.46
0.75
0.60
0.62
0.88
0.91
0.83

sum
average

9.36
0.62

9.96
0.66

9.64
0.64

Bab 5
KESIMPULAN DAN
SARAN

KESIMPULAN
Aplikasi peringkas otomatis teks berbahasa
Indonesia dapat dibangun dengan
menggunakan metode tf-idf dan fuzzy c
means
Hasil :
80%
60%
40%
20%
0%

recall
precision
f-measure

saran
Kembangkan interface agar lebih menarik
ditambahkan parameter lain, seperti bobot
kalimat utama atau kalimat akhir.

Terima
kasih

SlidesCarnival icons are editable shapes.


This means that you can:

Resize them without losing quality.

Change fill color and opacity.


Isnt that nice? :)

Anda mungkin juga menyukai