mendapatkan kata dasar yang mengacu pada morfologi kata. Stemming khusus bahasa
Inggris ditemukan oleh Martin Porter pada tahun 1980.
Algoritma Porter stemmer adalah proses penghilangan akhiran morphological dan
inflexional yang umumnya terdapat dalam bahasa Ingris (Porter, 1980). Algoritma ini
mencari kata dasar dari suatu kata yang berimbuhan dengan membuang imbuhanimbuhan
(akhiran) pada kata-kata bahasa Inggris karena bahasa Inggris tidak mengenal awalan.
Kondisi stem (akar kata) pada algoritma Porterstemmer:
1. Ukuran (measure), dinotasikan dengan m, dari sebuah stem berdasarkan pada urutan
vokal-konsonan.
m = 0, contoh : TR, EE, TREE, Y, BY
m = 1, contoh : TROUBLE, OATS, TREES, IVY
m = 2, contoh : TROUBLES, PRIVATE, OATEN
2.
3.
4.
5.
seperti:
1. (m>1 and (*S or *T)) Pada bagian m>1 dengan berakhir di s atau t.
2. (*d and not (*L or *S or *Z)) stem diakhiri dengan konsonan double,
tidak akhiran L atau S atau Z
Aturan-aturan
dalam
proses
stemming
pada
Porterstemmer(http://tartarus.org/martin/PorterStemmer/def.txt):
algoritma
1. Langkah 1
Langkah 1a: remove plural suffixation, yaitu mengganti atau
menghapus akhiran kata berbentuk jamak hingga mendapatkan
stem.
Tabel 2.1 Aturan Stemming Step
1a(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
NULL
NULL
Suffix
SSES
IES
Replacement
SS
I
NULL
NULL
SS
S
SS
NULL
Examples
Caresses caress
Ponies poni
Ties ti
Caress caress
Cats cat
1b(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>0)
Suffix
EED
Replacement
EE
(*v*)
ED
NULL
(*v*)
ING
NULL
Examples
feed feed
agreed agree
plastered plaster
bled bled
motoring motor
singing sing
Suffix
AT
BL
IZ
NULL
NULL
Replacement
ATE
BLE
IZE
Single letter
Examples
conflate(ed) conflate
trouble(ed) trouble
size(ed) size
hopp(ing) hop
tann(ed) tan
fall(ing) fall
hiss(ing) hiss
fizz(ed) fizz
fail(ing) fail
fil(ing) file
Langkah 1c: -y dan -i, jika dalam sebuah kata terdapat huruf
vokal, maka akhiran y diganti dengan -i.
Tabel 2.4 Aturan Stemming Step
1c(http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(*v*)
Suffix
Y
Replacement
I
Examples
happy happi
sky sky
2. Langkah 2: peel one suffix off for multiple suffixes yaitu sebuah kata
memiliki sebuah huruf vokal-konsonan secara berurutan.
Tabel 2.5 Aturan Stemming
Step 2 (http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>0)
(m>0)
Suffix
ATIONAL
TIONAL
Replacement
ATE
TION
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
ENCI
ANCI
IZER
ABLI
ALLI
ENTLI
ELI
OUSLI
IXATION
ENCE
ANCE
IZE
ABLE
AL
ENT
E
OUS
IZE
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
(m>0)
ATION
ATOR
ALISM
IVENESS
FULNESS
OUSNESS
ALITI
IVITI
BILITI
ATE
ATE
AL
IVE
FUL
OUS
AL
IVE
BLE
Examples
relational relate
conditional condition
rational rational
valenci valence
hesitanci hesitance
digitizer digitize
conformabli conformable
radicalli radical
differentli different
vileli vile
analogousli analogous
vietnamization
vietnamize
predication predicate
operator operate
feudalism feudal
decisiveness decisive
hopefulness hopeful
callousness callous
formaliti formal
sensitiviti sensitive
sensibiliti sensible
3. Langkah 3:kata yang memiliki akhiran -icate, -icitii atau -ical akan
diubah menjadi -ic, kata berakhiran-ative, -ful, -ness akan dihapus, dan
kata berakhiran alize akan menjadi -al. Dimana, kata tersebut harus
memiliki sebuah vokalkonsonan secara berurutan.
Suffix
ICATE
ATIVE
ALIZE
ICITI
ICAL
FULL
ABLI
Replacement
IC
NULL
AL
IC
IC
NULL
NESS
Examples
triplicate triplic
formative form
formalize formal
electriciti electric
electrical electric
hopeful hope
goodness good
4. Langkah 4: delete last suffix. Sebuah akhiran akan dihapus jika kata
tersebut memiliki dua huruf vokal-konsonan secara berurutan.
Tabel 2.7 Aturan Stemming
Step 4 (http://tartarus.org/martin/PorterStemmer/def.txt)
Conditions
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1)
(m>1 and (*S or
*T))
(m>1)
(m>1)
Suffix
AL
ANCE
ENCE
ER
IC
ABLE
IBLE
ANT
EMENT
MENT
ENT
ION
Replacement
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
NULL
Examples
revival reviv
allowance allow
inference infer
airliner airlin
gyroscopic gyroscop
adjustable adjust
defensible defens
irritant irrit
replacement replac
adjustment adjust
dependent depend
adoption adopt
ISM
OU
NULL
NULL
communism commun
homologous homolog
Suffix
ATE
ITI
OUS
IVE
IZE
Replacement
NULL
NULL
NULL
NULL
NULL
Examples
activate active
angulariti angular
homologous homolog
effective effect
bowdlerize bowdler
5. Langkah 5 :
Langkah 5a: remove e. Akhiran eakan dihapus jika kata
tersebut memiliki dua vokal-konsonan berurutan (konsonan
akhir tidak w, x, y) dan tidak diakhiri konsonan-vokalkonsonan secara berurutan.
Suffix
E
Replacement
NULL
Examples
probate probat
rate rate
E
NULL
cease ceas
Langkah 5b: reduction. Akhiran akan diganti menjadi satu
huruf konsonan jika, kata memiliki sebuah vokal-konsonan
berurutan dan tidak berakhir dengan double konsonan.
Suffix
NULL
Replacement
Single Letter
Examples
controll control
roll roll