Anda di halaman 1dari 5

Algoritma Porter Stemmer Stemming adalah proses menghapus variasi kata untuk

mendapatkan kata dasar yang mengacu pada morfologi kata. Stemming khusus bahasa
Inggris ditemukan oleh Martin Porter pada tahun 1980.
Algoritma Porter stemmer adalah proses penghilangan akhiran morphological dan
inflexional yang umumnya terdapat dalam bahasa Ingris (Porter, 1980). Algoritma ini
mencari kata dasar dari suatu kata yang berimbuhan dengan membuang imbuhanimbuhan
(akhiran) pada kata-kata bahasa Inggris karena bahasa Inggris tidak mengenal awalan.
Kondisi stem (akar kata) pada algoritma Porterstemmer:
1. Ukuran (measure), dinotasikan dengan m, dari sebuah stem berdasarkan pada urutan
vokal-konsonan.
m = 0, contoh : TR, EE, TREE, Y, BY
m = 1, contoh : TROUBLE, OATS, TREES, IVY
m = 2, contoh : TROUBLES, PRIVATE, OATEN
2.
3.
4.
5.

*<X>berarti stem berakhir dengan huruf X


*v*berarti stem mengandung sebuah vokal
*d berarti stem diakhiri dengan konsonan double
*o berarti stem diakhiri dengan konsonan vokal konsonan secara berurutan
dimana konsonan akhir bukan w, x, atau y.
Pada sebagian kondisi mungkin juga terdapat ekspresi dengan, and, or and not,

seperti:
1. (m>1 and (*S or *T)) Pada bagian m>1 dengan berakhir di s atau t.
2. (*d and not (*L or *S or *Z)) stem diakhiri dengan konsonan double,
tidak akhiran L atau S atau Z
Aturan-aturan
dalam
proses
stemming
pada
Porterstemmer(http://tartarus.org/martin/PorterStemmer/def.txt):

algoritma

1. Langkah 1
Langkah 1a: remove plural suffixation, yaitu mengganti atau
menghapus akhiran kata berbentuk jamak hingga mendapatkan
stem.
Tabel 2.1 Aturan Stemming Step
1a(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
NULL
NULL

Suffix
SSES
IES

Replacement
SS
I

NULL
NULL

SS
S

SS
NULL

Examples
Caresses caress
Ponies poni
Ties ti
Caress caress
Cats cat

Langkah 1b: remove verbal inflection. Jika kata mengandung


huruf vokalkonsonan berurutan, maka akhiran -eed berubah
-ee. Pada akhiran -ed dan ing, kata tidak akan mengalami
perubahan jika kata tersebut hanya memiliki satu huruf vokal,
dan jika lebih dari satu huruf vokal, akhiran -ed dan -ing akan
dihapus.
Tabel 2.2 Aturan Stemming Step

1b(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>0)

Suffix
EED

Replacement
EE

(*v*)

ED

NULL

(*v*)

ING

NULL

Examples
feed feed
agreed agree
plastered plaster
bled bled
motoring motor
singing sing

Continued for -ed and -ing rules, merupakan tahap selanjutnya


pada akhiran ed dan -ing. Kata yang diakhiri oleh double
konsonan (tidak berakhir oleh huruf l, s, z) maka kata tersebut
akan diganti dengan satu huruf konsonan saja. Suatu kata akan
ditambahkan e, jika kata diakhiri oleh huruf konsonanvokalkonsonan secara berurutan (konsonan akhir bukan w ,x, y)
dan hanya memiliki satu urutan vokal-konsonan didalamnya.
Tabel 2.3 Continued for ed and ing
rules(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
NULL
NULL
NULL
(*d* and not (*L
or *S or *Z))

(m=1 and *o)

Suffix
AT
BL
IZ
NULL

NULL

Replacement
ATE
BLE
IZE
Single letter

Examples
conflate(ed) conflate
trouble(ed) trouble
size(ed) size
hopp(ing) hop
tann(ed) tan
fall(ing) fall
hiss(ing) hiss
fizz(ed) fizz
fail(ing) fail
fil(ing) file

Langkah 1c: -y dan -i, jika dalam sebuah kata terdapat huruf
vokal, maka akhiran y diganti dengan -i.
Tabel 2.4 Aturan Stemming Step

1c(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(*v*)

Suffix
Y

Replacement
I

Examples
happy happi
sky sky

2. Langkah 2: peel one suffix off for multiple suffixes yaitu sebuah kata
memiliki sebuah huruf vokal-konsonan secara berurutan.
Tabel 2.5 Aturan Stemming
Step 2 (http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>0)
(m>0)

Suffix
ATIONAL
TIONAL

Replacement
ATE
TION

(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)

ENCI
ANCI
IZER
ABLI
ALLI
ENTLI
ELI
OUSLI
IXATION

ENCE
ANCE
IZE
ABLE
AL
ENT
E
OUS
IZE

(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)

ATION
ATOR
ALISM
IVENESS
FULNESS
OUSNESS
ALITI
IVITI
BILITI

ATE
ATE
AL
IVE
FUL
OUS
AL
IVE
BLE

Examples
relational relate
conditional condition
rational rational
valenci valence
hesitanci hesitance
digitizer digitize
conformabli conformable
radicalli radical
differentli different
vileli vile
analogousli analogous
vietnamization
vietnamize
predication predicate
operator operate
feudalism feudal
decisiveness decisive
hopefulness hopeful
callousness callous
formaliti formal
sensitiviti sensitive
sensibiliti sensible

3. Langkah 3:kata yang memiliki akhiran -icate, -icitii atau -ical akan
diubah menjadi -ic, kata berakhiran-ative, -ful, -ness akan dihapus, dan
kata berakhiran alize akan menjadi -al. Dimana, kata tersebut harus
memiliki sebuah vokalkonsonan secara berurutan.

Tabel 2.6 Aturan Stemming


Step 3(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)

Suffix
ICATE
ATIVE
ALIZE
ICITI
ICAL
FULL
ABLI

Replacement
IC
NULL
AL
IC
IC
NULL
NESS

Examples
triplicate triplic
formative form
formalize formal
electriciti electric
electrical electric
hopeful hope
goodness good

4. Langkah 4: delete last suffix. Sebuah akhiran akan dihapus jika kata
tersebut memiliki dua huruf vokal-konsonan secara berurutan.
Tabel 2.7 Aturan Stemming
Step 4 (http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1 and (*S or
*T))
(m>1)
(m>1)

Suffix
AL
ANCE
ENCE
ER
IC
ABLE
IBLE
ANT
EMENT
MENT
ENT
ION

Replacement
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL

Examples
revival reviv
allowance allow
inference infer
airliner airlin
gyroscopic gyroscop
adjustable adjust
defensible defens
irritant irrit
replacement replac
adjustment adjust
dependent depend
adoption adopt

ISM
OU

NULL
NULL

communism commun
homologous homolog

Tabel 2.7 Aturan Stemming


Step 4 (lanjutan) (http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)

Suffix
ATE
ITI
OUS
IVE
IZE

Replacement
NULL
NULL
NULL
NULL
NULL

Examples
activate active
angulariti angular
homologous homolog
effective effect
bowdlerize bowdler

5. Langkah 5 :
Langkah 5a: remove e. Akhiran eakan dihapus jika kata
tersebut memiliki dua vokal-konsonan berurutan (konsonan
akhir tidak w, x, y) dan tidak diakhiri konsonan-vokalkonsonan secara berurutan.

Tabel 2.8 Aturan Stemming


Step 5a (http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>1)

Suffix
E

(m=1 and not *o)

Replacement
NULL

Examples
probate probat
rate rate
E
NULL
cease ceas
Langkah 5b: reduction. Akhiran akan diganti menjadi satu
huruf konsonan jika, kata memiliki sebuah vokal-konsonan
berurutan dan tidak berakhir dengan double konsonan.

Tabel 2.9 Stemming


Step 5b (http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>1 and *d an
*L)

Suffix
NULL

Replacement
Single Letter

Examples
controll control
roll roll

Anda mungkin juga menyukai