Prosiding Uns 2013 PDF

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2
ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA KELAS

LISTENING
Novatiara Fury Pritasari 1), Hanna Arini Parhusip 2), Bambang Susanto 3)
1)
Mahasiswa Program Studi Matematika FSM UKSW
2), 3)
Dosen Program Studi Matematika FSM UKSW
Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana
Jl. Diponegoro 52-60 Salatiga 50711
1)
novatiarafury@gmail.com, 2)hannaariniparhusip@yahoo.co.id, 3)bsusanto5@gmail.com
Abstract
Data pengukuran berulang (repeated measures) memiliki struktur data longitudinal. Dalam
makalah ini, data longitudinal yang dianalisa adalah data hasil penyebaran kuesioner
mahasiswa FBS UKSW pada 2 kelas Listening FBS UKSW yang berbeda selama 3 kali
pertemuan (3 minggu). Adapun tujuan dari makalah ini adalah untuk mengetahui apakah ada
perbedaan yang signifikan antara respon mahasiswa kelas Listening terhadap pertanyaan yang
diteliti pada setiap kelas menggunakan one-wayrepeated measures dan dua kelas yang bebeda
menggunakan two-way repeated measures. Analisis data menggunakan program SPSS 16.0
sebagai alat bantu. Berdasarkan pengujian one-way repeated measures, pada Kelas A ada
perbedaan yang signifikan yaitu ada perbedaan respon minggu kedua dengan minggu ketiga.
Sedangkan respon mahasiswa pada Kelas B tidak berbeda secara signifikan. Pada pengujian
two-way repeated measuresada perbedaan respon Kelas A dan Kelas B, tetapi tidak ada
perbedaan respon mahasiswa dari minggu pertama sampai minggu ketiga. Untuk interaksi
Kelas dan Rata-rata respon mahasiswa menunjukkan bahwa respon mahasiswa tergantung pada
dua kelas yang berbeda.
Kata Kunci:One-way repeated measures, two-way repeated measures
PENDAHULUAN
Pritasari dkk (2013) telah membahas perbedaan respon mahasiswa kelas Listening antar dua
minggu yang berbeda dalam tiga minggu yang bertujuan untuk mengetahui perbedaan respon
mahasiswa menggunakan paired comparisons. Pada pengujian tersebut disimpulkan bahwa pada
kelas A minggu ke-1 dengan minggu ke-3 tidak ada perbedaan respon mahasiswa. Tetapi pada
minggu ke-1 dengan minggu ke-2 dan minggu ke-2 dengan minggu ke-3 ada perbedaan respon.
Sedangkan pada kelas B tidak ada perbedaan respon mahasiswa pada minggu ke-2 dengan minggu
ke-3, tetapi pada minggu ke-1 dengan minggu ke-2 dan minggu ke-1 dengan minggu ke-3 ada
perbedaan respon. Hal ini juga diperkuat dengan hasil analisa penghitungan daerah konfidensi
95%.
Dalam makalah ini ANOVA digunakan untuk menganalisis data yang sama.ANOVA adalah
suatu metode untuk menguji hipotesis kesamaan rata-rata dari tiga atau lebih populasi. Analisis
terhadap data pengukuran berulang tersebut dilakukan untuk menyelidiki apakah ada perbedaan
yang signifikan antara respon mahasiswa kelas Listening pada setiap kelas dan dua kelas yang
berbedamenggunakan one-wayrepeated measures dan two-way repeated measures. Program SPSS
16.0 digunakan sebagai alat bantu untuk melakukan analisis data.
Makalah Pendamping: Matematika 3 233

Volume 2 Prosiding SNMPM Universitas Sebelas Maret 2013
METODE PENELITIAN
Jenis Penelitian
Penelitian ini menggunakan pendekatan kuantitatif.
Waktu dan Tempat Penelitian
Penyebaran kuesioner dilakukan pada kelas Listening Fakultas Bahasa dan Sastra (FBS)
UKSW selama tiga kali pertemuan pada setiap hari Senin tanggal 11, 18, dan 25 Februari 2013
untuk kelas A. Sedangkan untuk kelas B setiap hari Kamis tanggal 14, 21, dan 28 Februari 2013.
Target atau Subjek Penelitian
Subjek dari penelitian ini adalah mahasiswa baru kelas Listening FBS UKSW pada dua
kelas yang berbeda.
Data dan Teknik Pengumpulan Data
 Data yang digunakan adalah data sekunder dari penelitian Rahandika(2013). Data tersebut
diperoleh melalui penyebaran kuesioner yang berisi 13 pertanyaan yang sama di setiap minggu
untuk 29 mahasiswa pada 2 kelas Listening FBS-UKSW selama tiga kali pertemuan. Isi
kuesioner mengenai persepsi mahasiswa tentang variasi latihan pada kelas Listening. Jenis data
adalah data skala 1-5 (skala likert) sebagai skala untuk menyatakan berturut-turut sangat tidak
setuju hingga sangat setuju.
Teknik Analisis Data
ANOVA adalah suatu modelyangcukup komprehensif untukmendeteksi perbedaan
kelompok pada variabel terikat tunggal. Teknik yang lebih umum biasa dikenal sebagai multivariat
analisis varians (MANOVA). MANOVA dapat dianggap sebagai ANOVA untuk situasi dimana
ada beberapa variabel terikat. Pada Tabel 1 dijelaskan perbedaan dari ANOVA dan MANOVA.
Informasi lebih lengkap dapat dilihat di Field(2009) dan Stevens (2009).
Tabel 1. Perbedaan ANOVA dan MANOVA
ANOVA MANOVA
Hanya satu variabel terikat Beberapa variabel terikat
Menguji perbedaan mean pada Menguji perbedaan vektor mean
variabel terikat untuk beberapa beberapa variabel terikat
variabel bebas
Sedangkan perbedaan one-way repeated measures dan two-way repeated measures hanya
pada variabel bebas. One-way repeated measures menggunakan satu variabel bebas dan two-way
repeated measures menggunakan dua variabel bebas.
a. Repeated Measures (Pengukuran Berulang) ANOVA
Repeated measures adalah pengukuran berulang terhadap sekumpulan obyek atau partisipan
yang sama. Pada prinsipnya Repeated Measures ANOVA sama dengan paired t-test untuk
membandingkan rata-rata dua sampel yang saling berhubungan. Perbedaannya dengan ANOVA
234 Makalah Pendamping: Matematika 3

adalah sampel uji ini adalah sampel pengukuran berulang, sementara ANOVA mensyaratkan
sampel bebas.
One-way repeated measures ANOVA biasanya digunakan untuk membandingkan nilai
disain sebelum dan sesudah partisipan yang sama pada satu grup. Sedangkan two-way repeated
measures ANOVA membandingkan pada dua grup. (Web 4)
Dalam disain general linear model repeated measures, level dari within subject factor
mewakili beberapa pengamatan dari skala waktu ke waktu dalam kondisi yang berbeda. Ada 3 jenis
tes yang dilakukan jika within subject factormemiliki lebih dari dua level, yaitustandar univariat uji
F, uji univariat alternatif, dantes multivariat. Tiga jenistes ini mengevaluasi hipotesis yang sama,
rata-rata populasisama untuk semua level pada faktor (Web 1).
 Standarunivariatuji F ANOVAtidak dianjurkanketikawithin subject factormemiliki lebih
daridua levelkarenapadaasumsitersebut, asumsi Sphericity umumnyadilanggardanuji F
ANOVAmenghasilkan p-value yangakuratsejauhasumsiini dilanggar.
 Tes univariat alternatif memperhitungkan pelanggaran asumsi Sphericity. Tes ini menggunakan
penghitungan statistik F yang sama dengan standar univariat tes. Namun p-value berpotensi
berbeda. Dalam menentukan p-value, sebuah epsilon statistikdihitung berdasarkan data sampel
untuk mengetahui derajat yang melanggar asumsi Sphericity. Pembilang dan penyebut derajat
kebebasan uji standar dikalikan dengan epsilon untuk mendapatkan serangkaian derajat
kebebasanyang sudah dikoreksi untuk membuat nilai F yang baru dan menentukan p-value.
 Uji multivariat tidak memerlukan asumsi Sphericity. Perbedaan nilai
dihitung dengan membandingkan nilai-nilai dari berbagai levelwithin subject factor.Misalnya
untuk within subject factor dengan tiga level, nilai perbedaan mungkin
dihitung antara level pertama dengan kedua dan antara level kedua dengan ketiga. Uji
multivariat kemudian akan mengevaluasi apakah rata-rata populasi untuk nilai perbedaan kedua
pasangan secara simultan sama dengan nol. Tes ini tidak hanyamengevaluasi rata-rata terkait
dengan dua pasangan nilai perbedaan, tetapi juga mengevaluasi apakah rata-rata dari nilai
selisih antara level pertama dan ketiga faktor tersebut sama dengan nol sebagaikombinasi linier
dari nilai perbedaan.
Menurut Carey (1998), semua perhitungan statistik multivariat didasarkan pada akar-akar
karakteristik dari matriks A yang dibentuk dari
𝐴 = 𝐻𝐸 −1 (1)
dengan H : matriks varians-kovarians perlakuan pada MANOVA
E : matriks varians-kovarians error pada MANOVA.
Dalam uji multivariat sendiri ada beberapa uji yang digunakan, yaitu:
 Wilks’ Lamda

Statistik uji digunakan jika asumsi homogenitas dipenuhi. Nilai Wilks’ Lamda berkisar
antara 0-1. Statistik uji ini yang sering dipakai (Web 2). Statistik uji Wilks’ Lamda dirumuskan
sebagai:
𝐸 𝑠 1
𝛬= 𝐻+𝐸
= 𝑖=1 1+𝜆 (2)
𝑖
dengan 𝛬 : Wilks’ Lamda; 𝐸 : determinan dari matriks E;𝑠 : banyaknya akar-akar karakteristikdari
matriks A;𝜆𝑖 : akar-akar karakteristik ke-i matriks A.
Statistik Wilks’ Lamda di atas dapat ditransformasikan menjadi suatu statistik yang
berdistribusi F. Khususnya
Kasus 1: 𝑝 = 1, 𝑔 ≥ 2
1−𝛬 𝑛−𝑔
𝛬 𝑔−1
~ 𝐹𝑔−1,𝑛−𝑔 . (3)
Kasus 2: 𝑝 ≥ 1, 𝑔 = 2
1−𝛬 𝑛−𝑝−1
𝛬 𝑝−1
~ 𝐹𝑝,𝑛−𝑝−1 (4)
dengan 𝑝 : banyaknya variabel; 𝑔 : banyaknya grup; 𝑛 : banyaknya partisipan.

Informasi lebih lanjut dapat dilihat pada Patel dkk (2013).
 Pillai’s Trace
Statistik uji ini paling cocok digunakan jika asumsi homogenitas tidak dipenuhi (Web 2).
Statistik uji Pillai’s Trace 𝑉 dirumuskan sebagai:
−1 𝑠 𝜆𝑖
𝑉 = 𝑡𝑟𝑎𝑐𝑒 𝐻 𝐻 + 𝐸 = 𝑖=1 1+𝜆 . (5)
𝑖
Beberapa ahli statistik menganggapnya paling kuat dari 4 statistik yang lain.
Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑉 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari tabel nilai
kritis statistik tersebut (Giri, 2004).
 Hotelling’s Trace
Statistik uji ini jarang digunakan oleh para ahli (Web 2). Berikut rumus dari Hotelling’s
Trace:
𝑠
𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 𝑡𝑟𝑎𝑐𝑒 𝐻𝐸 −1 = 𝑖=1 𝜆𝑖 . (6)
Statistik Hotelling’s Trace di atas dapat ditransformasikan menjadi suatu statistik yang
berdistribusi F (Web 3). Khususnya
𝑣1 𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔
𝑣2
× 𝑛 𝑚𝑖𝑛 𝑝,𝑞 1
~𝐹𝑣1 ,𝑣2 , (7)
dimana 𝑣1 = 𝑝𝑞1 dan 𝑣2 = 𝑛 − 𝑝 − 1 𝑚𝑖𝑛 𝑝, 𝑞1 , dengan p : akar-akar karakteristik dari matriks

A; n : banyaknya partisipan.
Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 ≥ 𝐶, dengan nilai 𝐶 diperoleh dari
tabel nilai kritis statistik tersebut (Giri, 2004).
 Roy’s Largest Root

Roy’s Largest Root digunakan jika asumsi dipenuhi dan berkorelasi dengan kuat. Tetapi uji
ini harus hati-hati dalam penggunaanya (Web 2).
𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 𝑚𝑎𝑥 𝜆𝑖 . (8)
Adapun aturan pengujiannya adalah tolak 𝐻0 ketika 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 ≥ 𝐶, dengan nilai 𝐶
diperoleh dari tabel nilai kritis statistik tersebut (Giri, 2004).
Keempat tes multivariat tersebut menggunakan uji statistik sebagai berikut:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan)
𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (setidaknya ada perbedaan antar dua perlakuan).
Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05 dan 𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 .
b. Sphericity
Pada dasarnya, asumsi Sphericitymengacu padakesamaanvariansdariperbedaan diantaralevel
pada faktorrepeated measures.Dengan kata lain, kitamenghitungperbedaanantara setiap
pasanganlevelfaktorrepeated measuresdankemudian
menghitungvariansdarinilaiperbedaan.Sphericitymensyaratkan bahwavariansuntuk
setiapnilaiperbedaansama. Kita mengasumsikanbahwa hubunganantara tiap
pasangkelompokadalahsama. Untuk menguji asumsi Sphericity dapat menggunakan tes Mauchly,
uji Greenhouse Geisser dan tes Huynh Feldt.
Hipotesis untuk Sphericity:
𝐻0 : 𝜎𝑦21 −𝑦2 = 𝜎𝑦21 −𝑦3 = 𝜎𝑦22 −𝑦3 (tidak ada perbedaan yang signifikan diantara varians perbedaan)
𝐻𝑎 : 𝜎𝑦21 −𝑦2 ≠ 𝜎𝑦21 −𝑦3 ≠ 𝜎𝑦22 −𝑦3 (ada perbedaan yang signifikan diantara varians perbedaan)
dengan 𝑦1 − 𝑦2 : perbedaan level 1 dengan level 2 pada faktorrepeated measure
𝑦1 − 𝑦3 : perbedaan level 1 dengan level 3 pada faktorrepeated measure
𝑦2 − 𝑦3 : perbedaan level 2 dengan level 3 pada faktorrepeated measure.
Kriteria pengujiannya tolak 𝐻0 jika hasil p-value dari Mauchly Tests< 0.05, yang artinya
bahwa ada perbedaan yang signifikan diantara varians perbedaan, dengan kata lain bahwa kondisi
Sphericity tidak ditemui (Field, 2012). Jika tes Mauchly dari Sphericity tidak signifikan, maka tes
within-subjects effects dapat dilakukan. Sedangkan jika tes Mauchly dari Sphericity signifikan, tes
multivariat yang digunakan (Ho, 2006).
Jika data melanggar asumsi Sphericity, ada beberapa pembenaran yang dapat diterapkan
untuk menghasilkan rasio Fyang valid. SPSS membuat tiga pembenaran berdasarkan perkiraan
Sphericity yang dianjurkan oleh Greenhouse Geisser dan Huynh Feldt. Kedua perkiraan ini
menimbulkan faktor koreksi yang diterapkan pada derajat kebebasan yang digunakan untuk menilai
rasio Fyang telah diteliti.
1
Koreksi Greenhouse Geisser biasanya dilambangkan dengan 𝜀 bervariasi antara dan 1,
𝑘−1
dimana k adalah jumlah kondisi repeated measures. Semakin 𝜀 dekat ke 1, varians dari perbedaan
semakin homogen.

Ketika estimasi Greenhouse Geisser lebih besardari 0,75 maka hipotesis nol ditolak. Ketika
perkiraan Sphericity lebihbesar dari 0.75 maka koreksi Huynh Feldtharus digunakan, tetapi ketika
perkiraan Sphericity kurang dari 0,75 atau Sphericity sama sekali tidak diketahui maka koreksi
Greenhouse Geisser harus digunakansebagai gantinya(Field, 2009).
c. Pengukuran Pengaruh atau Dampak

Ukuran pengaruh keseluruhan untuk pendekatan univariat adalah parsial eta kuadrat 𝜂 2
dan dapat dihitung menggunakan persamaan berikut:
2 𝑆𝑆 𝑓𝑎𝑐𝑡𝑜𝑟
Parsial𝜂𝑓𝑎𝑐𝑡𝑜𝑟 = 𝑆𝑆 +𝑆𝑆𝑒𝑟𝑟𝑜𝑟
. (9)
𝑓𝑎𝑐𝑡𝑜𝑟
Ukuran pengaruh keseluruhan untuk uji multivariat terkait dengan Wilks’ Lamda 𝛬 adalah
multivariat eta kuadrat dan dapat dihitung menggunakan persamaan berikut:
Multivariat𝜂 2 = 1 − 𝛬. (10)
Nilai parsial eta kuadrat dan multivariat eta kuadrat berkisar antara 0 sampai 1. Nilai 0
menunjukkan tidak ada hubungan antara faktor repeated measures dan variabel terikat, sedangkan
nilai 1 menunjukkan adanya hubungan yang kuat. (Web 1)
d. Pairwise Comparisons
Desain within-subjects direkomendasikan menggunakan pendekatan Bonferroni.
Pendekatan ini harus digunakan terlepas dari apakah peneliti merencanakan untuk menguji semua
perbandingan berpasangan atau hanya membuat keputusan untuk memeriksa data (Maxwell dkk,
2004)
Uji statistik disusun sebagai berikut:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘 (tidak ada perbedaan antar perlakuan)
𝐻𝑎 : 𝜇1 ≠ 𝜇2 ≠ ⋯ ≠ 𝜇𝑘 (ada perbedaan antar perlakuan).
Kriteria pengujiannya tolak 𝐻0 jika p-value < 0.05.
Prosedur
a. Variabel Penelitian
1. Variabel terikat (level) : banyaknya perlakuan, yaitu minggu pertama, minggu kedua dan
minggu ketiga.
2. Variabel bebas (faktor repeated measures) :
One-way repeated measures: rata-rata respon mahasiswa.
Two-way repeated measures : kelas dan rata-rata respon mahasiswa.
b. Langkah-langkah dalam Analisis Data
1. Menghitung rata-rata respon tiap mahasiswa pada tiap minggu.
2. Menganalisa hasil Sphericity. Jika signifikan (p-value< 0.05) dilanjutkan tes multivariat,
sebaliknya jika tidak signifikan dilanjutkan tes within-subject effects.

3. Jika dilanjutkan tes multivariat, setelah itu menganalisa keempat uji pada tes multivariat.
Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk memperkuat hasil tersebut,kemudian
menghitung nilai-nilai dari keempat uji menggunakan persamaan (1), (2) , (5), (6) dan (8).
Statistik uji yang dianalisis adalah Wilks’ Lamda sehingga untuk menghitung penolakan Ho
digunakan persamaan (3) dan (4). Tolak Ho saat 𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 dan sebaliknya.
4. Jika dilanjutkan tes within-subject effects, setelah itu menganalisa p-value dari Greenhouse
Geisser dan Huynh-Feldt. Tolak Ho saat p-value < 0.05 dan sebaliknya. Untuk
memperkuat hasil tersebut, kemudian membuat perubahan derajat kebebasan untuk
pembilang dan penyebut yang baru.
5. Menghitung pengaruh faktor dari repeated measures menggunakan persamaan (9) atau
(10).
6. Menganalisa hasil p-value dari Pairwise Comparisons. Tolak 𝐻0 jika p-value < 0.05.
HASIL PENELITIAN DAN PEMBAHASAN

One-Way Repeated Measures
Kasus 1
Akan diuji apakah ada perbedaan yang signifikan pada Kelas A minggu pertama, minggu
kedua dan minggu ketiga. Hasil dari analisis mengindikasikan bahwa tes Mauchlydari Sphericity
signifikan (p-value = 0 < 0.05). Artinya bahwa ada perbedaan yang signifikan diantara varians
perbedaan, dengan kata lain bahwa kondisi Sphericity tidak ditemui. Oleh karena itu, teswithin-
subject effects tidak dapat digunakan, tetapi yang dapat digunakan adalah tes multivariat.
Dari Tabel 2a dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata minggu
ketiga semakin meningkat, tetapi perbedaannya tidak terlalu jauh. Sedangkan standart deviasi dari
minggu pertama sampai minggu ketiga semakin menurun.
Tabel 2a. Rata-rata dan standar deviasi Tabel 2b. Hasil dari tes multivariat untuk
Kelas A Kelas A minggu pertama, kedua dan ketiga
Mean Standart Deviasi Nama Uji p-value
Minggu pertama 4.019 0.396 Pillai’s Trace 0.008
Minggu kedua 4.098 0.296 Wilks’ Lamda 0.008
Minggu ketiga 4.223 0.232 Hotelling’s Trace 0.008
Roy’s Largest Root 0.008
Untuk mengetahui apakah rata-rata dari minggu pertama sampai minggu ketiga berbeda
secara signifikan, dapat dilakukan tes multivariat dengan melihat Tabel 2b. Dari semua uji
diperoleh kesimpulan bahwa semua menolak Ho karena semua uji menghasilkan p-value yang

sama yaitu 0.008 < 0.05. Maka ada perbedaan yang signifikan antara rata-rata respon
mahasiswa pada minggu pertama sampai minggu ketiga.
Pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’ Lamda, Hotelling’s Trace
dan Roy’s Largest Root, nilai-nilai dari keempat uji tersebut juga digunakan untuk memperkuat
hasil hipotesis. Setiap uji dapat dihitung nilainya dengan menghitung akar-akar karakteristik
terlebih dahulu. Dengan menggunakan persamaan (1) dapat diperoleh:
0.605 0.077 3.262 −1.876 0.5763 0.4691
𝐻= ,𝐸= dan 𝐸 −1 = .
0.077 0.010 −1.876 2.305 0.4691 0.8156
0.3848 0.3466 0.4290
Sehungga matriks 𝐴 = dan didapatkan akar-akar karakteristik .
0.0491 0.0443 0.0001
Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat dihitung
menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh:
1 1 0.4290 0.0001
𝛬 = 1+0.4290 . 1+0.0001 = 0.6997; 𝑉 = 1+0.4290 + 1+0.0001 = 0.3003
𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 0.4290 + 0.0001 = 0.4291; 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.4290.

Dalam kasus ini yang dianalisis adalah 1 variabel dan 3 grup. Dari persamaan (3) diperoleh
statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui)
1−0.6997 29−3
𝐹𝑕𝑖𝑡𝑢𝑛𝑔 = 0.6997 3−1
= 5.5794.
Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹3−1,29−3 = 𝐹2,26 = 3.37. Jadi 𝐻0 ditolak
karena𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Artinya bahwa ada perbedaan yang signifikan antara rata-rata respon
mahasiswa pada minggu pertama sampai minggu ketiga.
Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan
multivariat eta kuadrat sehingga diperoleh
Multivariat𝜂 2 = 1 − 0.6997 = 0.3003.
Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa
dan perlakuan yang diberikan setiap minggunya.
Tabel 2d menunjukkan semua perbandingan berpasangan (dengan interval konfidensi
Bonferroni) diantara 3 level. Dengan membandingkan respon setiap minggunya, kita dapat
memasang-masangkan data rata-rata respon antar minggu pertama sampai minggu ketiga.
Tabel 2d. Hasil analisa perbandingan berpasangan Kelas A
Respon mahasiswa p-value Analisa
Minggu ke-1 dan ke-2 1 𝐻0 diterima
Minggu ke-1 dan ke-3 0.092 𝐻0 diterima
Minggu ke-2 dan ke-3 0.042 𝐻0 ditolak

Dapat dilihat dari Tabel 2d, dengan = 5% maka rata-rata respon mahasiswa minggu
kedua dan minggu ketiga berbeda secara signifikan (p-value< 0.05). Rata-rata respon
mahasiswa minggu pertama dengan minggu kedua dan rata-rata respon minggu pertama dengan
minggu ketiga tidak berbeda secara signifikan (p-value> 0.05).
Kasus 2
Akan diuji apakah ada perbedaan yang signifikan pada Kelas B minggu pertama,
minggu kedua dan minggu ketiga. Dari hasil analisis mengindikasikan bahwa tes Mauchlydari
Sphericity tidak signifikan (p-value= 0.299 > 0.05). Hasiltes within-subject
effectsmengindikasikan bahwa within-subjects variabel rata-rata respon mahasiswa tidak
signifikan karena p-value = 0.736 >0.05. Artinya, tidak ada perbedaan yang signifikan diantara
varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga.
Setelah hasil tes Mauchlydari Sphericity sudah diperoleh, kemudian dari tes within-
subject effects dibuat sebuah perubahan derajat kebebasan untuk pembilang dan penyebut. Hal
ini dapat diperoleh dengan mengalikan kedua nilai ini menggunakan Huynh-Feldt karena
perkiraan Sphericity lebih dari 0.75. Perubahan derajat kebebasan pembilangnya adalah
2 × 0.921 = 1.966. Rasio F = 0.308 harus dievaluasi dengan derajat kebebasan yang baru ini.
Setelah dihitung dengan derajat kebebasan yang baru diperoleh F yang sama yaitu 0.308 dan p-
value = 0.733 > 0.05. Ternyata setelah dievaluasi dengan derajat kebebasan yang baru tetap
memperoleh kesimpulan yang sama dengan sebelumnya, yaitu tidak ada perbedaan yang
signifikan diantara varians perbedaan dari minggu pertama, minggu kedua dan minggu ketiga.
Dari Tabel 3a dapat disimpulkan bahwa rata-rata minggu pertama sampai rata-rata
minggu ketiga perbedaannya tidak terlalu jauh.
Tabel 3a. Rata-rata dan standar deviasi Tabel 3b. Hasil analisa perbandingan
Kelas B berpasangan Kelas B
Mean Standar deviasi Respon mahasiswa p-value Analisa
Minggu pertama 3.939 0.300 Minggu ke-1 dan ke-2 1 𝐻0 diterima
Minggu kedua 3.989 0.184 Minggu ke-1 dan ke-3 1 𝐻0 diterima
Minggu ketiga 3.955 0.219 Minggu ke-2 dan ke-3 1 𝐻0 diterima
Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan

parsial eta kuadrat sehingga diperoleh
2 0.038
Partial𝜂𝑓𝑎𝑐𝑡𝑜𝑟 = = 0.011.
0.038+3.500
Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara rata-rata respon mahasiswa
dan perlakuan yang diberikan setiap minggunya.

Tabel 3b menunjukkan semua pairwise comparisons (dengan interval konfidensi

Bonferroni) diantara 3 level. Dengan membandingkan setiap minggunya, kita dapat memasang-
masangkan data rata-rata antar minggu pertama sampai minggu ketiga.
Dapat dilihat dari Tabel 3b dengan = 5% maka rata-rata respon mahasiswa minggu
pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05).
Two-Way Repeated Measures
Akan diuji apakah ada perbedaan yang signifikan interaksi respon dari mahasiswa pada
Kelas A dan Kelas B pada minggu pertama, minggu kedua dan minggu ketiga.Dari Tabel 4a,
variabel Kelas menghasilkan hasil yang sangat signifikan untuk semua tes multivariat dengan p-
value = 0 < 0.05. Artinya ada perbedaan respon Kelas A dan Kelas B.Dari Tabel 4b dapat
dilihat bahwa pada respon Kelas A lebih besar daripada rata-rata respon Kelas B.
Tabel 4a. Hasil tes multivariat Kelas A dan
B untuk variabel Kelas Tabel 4b. Perbedaan rata-rata respon Kelas
Nama Uji p-value A dan B untuk variabel Kelas
Pillai’s Trace 0 Kelas Mean
Wilks’ Lamda 0 A 4.113
Hotelling’s Trace 0 B 3.961
Roy’s Largest Root 0
Selanjutnya diuji variabel Rata-rata respon mahasiswa.Padates MauchlydariSphericity

menghasilkan nilai 0.731, dan signifikan karena p-value = 0.015 < 0.05. Asumsi Sphericity
dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4c
menunjukkan bahwa variabel Rata-rata respon mahasiswa tidak signifikan. Hal ini dapat dilihat
dari p-value = 0.170 > 0.05 yang artinya tidak ada perbedaan rata-rata respon mahasiswa dari
minggu pertama sampai minggu ketiga. Tetapi dari Tabel 4ddapat dilihat bahwa rata-rata respon
mahasiswa minggu pertama, minggu kedua dan minggu ketiga semakin meningkat.
Tabel 4c. Hasil tes multivariat rata-rata Respon mahasiswa Mean
respon mahasiswa Minggu ke-1 3.979
Nama Uji p-value Minggu ke-2 4.044
Pillai’s Trace 0.170 Minggu ke-3 4.089
Wilks’ Lamda 0.170
Hotelling’s Trace 0.170
Tabel 4d. Rata-rata respon mahasiswa

Untuk interaksi Kelas dengan Rata-rata respon mahasiswa, tes Mauchlydari Sphericity
menghasilkan nilai 0.454 dan signifikan karena p-value = 0.042 < 0.05. Asumsi Sphericity juga
dilanggar, maka harus menginterpretasi tes multivariat. Keempat tes multivariat pada Tabel 4e
menunjukkan bahwa efek interaksi signifikan karena p-value = 0.023 < 0.05. Hal ini
menunjukkan bahwa respon mahasiswa tergantung pada dua kelas yang berbeda.
Tabel 4e. Hasil tes multivariat dari interaksi Kelas dengan Rata-rata respon mahasiswa
Nama Uji p-value
Pillai’s Trace 0.023
Wilks’ Lamda 0.023
Hotelling’s Trace 0.023
Nilai-nilai dari keempat uji pada tes multivariat yang meliputi uji Pillai’s Trace, Wilks’
Lamda, Hotelling’s Trace dan Roy’s Largest Root untuk interaksi Kelas dengan Rata-rata
respon mahasiswa juga digunakan untuk memperkuat hasil hipotesis. Setiap uji dapat dihitung
nilainya dengan menghitung akar-akar karakteristik terlebih dahulu. Menggunakan persamaan
(1) dapat diperoleh:
0.094 −0.293 2.898 −1.695 0.5433 0.3389
𝐻= ,𝐸= dan 𝐸 −1 = .
−0.293 0.907 −1.695 2.717 0.3389 0.5795
−0.0482 −0.1379
Sehingga matriks 𝐴 = dan didapatkan akar-akar karakteristik
0.1482 0.4263
−0.0003
. Setelah akar-akar karakteristik diperoleh maka uji-uji dalam tes multivariat dapat
0.3784
dihitung menggunakan persamaan (2), (5), (6) dan (8) sehingga diperoleh:
1 1 −0.0003 0.3784
𝛬 = 1−0.0003 . 1+0.3784 = 0.7257; 𝑉 = 1−0.0003 + 1+0.3784 = 0.2742
𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = −0.0003 + 0.3784 = 0.3781; 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.3784.

Dalam kasus ini yang dianalisis adalah 3 variabel dan 2 grup. Dari persamaan (4) diperoleh
statistik F (hanya untuk Wilks Lamda karena uji yang lain tabel nilai kritis tidak diketahui)
1−0.7253 29−3−1
𝐹𝑕𝑖𝑡𝑢𝑛𝑔 = 0.7253 3−1
= 4.7342.
Dengan𝛼 = 0.05 diperoleh nilai dari 𝐹𝑡𝑎𝑏𝑒𝑙 yaitu 𝐹𝑝,𝑛−𝑝−1 = 𝐹3,25 = 2.99. Jadi 𝐻0
ditolak karena𝐹𝑕𝑖𝑡𝑢𝑛𝑔 > 𝐹𝑡𝑎𝑏𝑒𝑙 . Hal ini menunjukkan bahwa respon mahasiswa tergantung pada
dua kelas yang berbeda.
Kemudian mengukur pengaruh interaksi Kelas dengan Rata-rata respon mahasiswa
tersebut menggunakan multivariat eta kuadrat sehingga diperoleh
Multivariat𝜂 2 = 1 − 0.7257 = 0.2743.
Dari hasil tersebut menunjukkan bahwa tidak ada hubungan antara Kelas dengan Rata-rata
respon mahasiswa terhadap perlakuan yang diberikan setiap minggunya.

Gambar 1. Grafik rata-rata respon mahasiswa pada Kelas A dan Kelas B
Gambar 1 menunjukkan bahwa rata-rata respon mahasiswa yang diberikan pada 3

minggu tergantung pada perbedaan kelas. Pada kelas A, rata-rata respon mahasiswa semakin
meningkat tetapi pada kelas B rata-rata respon mahasiswa meningkat dan mengalami penurunan
lagi pada minggu ketiga.
Tabel 4f. Hasil analisa perbandingan berpasangan minggu pertama sampai minggu ketiga
Respon mahasiswa p-value Analisa
Minggu ke-1 dan ke-2 1 𝐻0 diterima
Tabel 4f menunjukkan semua perbandingan berpasangan antara dua kelas dan rata-rata
respon mahasiswa tiga minggu dengan menggunakan interval konfidensi Bonferroni 95%.
Dapat dilihat dari Tabel 4f dengan = 5%, rata-rata respon mahasiswa di Kelas A dan Kelas B
pada minggu pertama, kedua dan ketiga tidak berbeda secara signifikan (p-value> 0.05). Artinya
tidak ada perbedaan rata-rata respon mahasiswa di minggu pertama sampai ketiga.
SIMPULAN
Pada makalah ini telah dibahas studi tentang respon mahasiswa dengan metode one-way
dan two-wayrepeated measures untuk dua kelas Listening FBS-UKSW. Berdasarkan hasil yang
diperoleh dapat disimpulkan bahwa:
One-wayRepeated Measures
 Pada kelas A
Berdasarkan tes multivariat, ada perbedaan yang signifikan antara rata-rata respon
mahasiswa pada minggu pertama sampai minggu ketiga. Tetapi varians dari minggu
pertama, minggu kedua dan minggu ketiga tidak berbeda secara signifikan. Dari hasil
parsial eta kuadrat menunjukkan bahwa tidak ada hubungan antara rata-rata respon
mahasiswa dan perlakuan setiap minggunya. Dalam pengujian pairwise comparisons,

respon minggu kedua dengan respon minggu ketiga berbeda secara signifikan sedangkan
respon minggu pertama dengan minggu kedua dan respon minggu pertama dengan
minggu ketiga tidak berbeda secara signifikan.
 Pada kelas B
Berdasarkan tes within-subject effects, varians dari minggu pertama, minggu kedua dan
minggu ketiga tidak berbeda secara signifikan. Dari hasil parsial eta kuadrat menunjukkan
bahwa tidak ada hubungan antara rata-rata respon mahasiswa dan perlakuan setiap
minggunya. Dalam pengujian pairwise comparisons, rata-rata respon mahasiswa minggu
pertama, kedua dan ketiga juga tidak berbeda secara signifikan.
Two-way Repeated Measures
Berdasarkan uji yang dilakukan, dapat disimpulkan bahwa terdapat perbedaan respon
Kelas A dengan Kelas Btetapi tidak ada perbedaan respon mahasiswa dari minggu pertama
sampai minggu ketiga. Untuk interaksi Kelas dengan Rata-rata respon mahasiswa menunjukkan
bahwa respon mahasiswa tergantung pada dua kelas yang berbeda. Pengujian Pairwise
Comparisonsyang dilakukan untuk dua kelas yang berbeda mengindikasikan tidak ada
perbedaan antara respon mahasiswa di minggu pertama sampai ketiga.
DAFTAR PUSTAKA
Carey, G. (1998). Multivariate Analysis of Variance (MANOVA): I. Theory. Diakses tanggal 1
November 2013 pukul 12.40 WIB dari
http://ibgwww.colorado.edu/~carey/p7291dir/handouts/manova1.pdf.
Field, A. (2009). Discovering Statistics Using SPSS. (3thed.). India : Sage.
Field, A. (2012). Discovering Statistics Repeated Measures ANOVA. Diakses tanggal 29
Oktober 2013 dari http://www.discoveringstatistics.com.
Giri, N.C. (2004). Multivariate Statistical Analysis. (2nded). New York : Marcel Dekker.
Ho, R. (2006). Handbook of Univariate and Multivariate Data Analysis and Interpretation with
SPSS. New York : Chapman & Hall/CRC Taylor & Francis Group.
Maxwell, S.E. & Delaney, H.D. (2004). Designing Experiments And Analyzing Data A Model
Comparison Perspective. (2nded.). London: Lawrence Erlbaum Associates.
Patel, S. & Bhavsar, C.D. (2013). Analysis of Pharmocokinetic Data by Wilk‟s Lamda (An
Important Tool of Manova). International Journal of Pharmaceutical Science Invention,
Vol. 2, 36-44.
Pritasari, N.F., Parhusip, H.A. & Susanto, B. (2013). Analisis Respon Mahasiswa Kelas
Listening Menggunakan Metode Paired Comparisons. Prosiding, Seminar Nasional
Matematika VII yang diselenggarakan oleh Jurusan Matematika FMIPA dan Prodi
Pendidikan Matematika Program Pascasarjana UNNES tanggal 26 Oktober 2013.
Semarang: Universitas Negeri Semarang.

Rahandika, A. (2013). The Students Perceptions toward Different Task Types in Public
Listening Class. Skripsi. Program Studi Pendidikan Bahasa Inggris, Fakultas Bahasa dan
Sastra, Universitas Kristen Satya Wacana. Salatiga.
Stevens, J.P. (2009). Applied Multivariate Statistics For The Social Sciences. (5thed.). New
York : Routledge Taylor & Francis Group.
Web 1: http://oak.ucc.nau.edu/rh232/courses/EPS625/Handouts/RM-
ANOVA/Understanding%20Repeated-Measures%20ANOVA.pdf. Diakses tanggal 30
Oktober 2013 pukul 09.53 WIB.
Web 2:
https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=6&cad=rja&ved
=0CFQQFjAF&url=http%3A%2F%2Fwww.chsbs.cmich.edu%2Fk_han%2Fpsy613%2F
manova1.doc&ei=4tZ5UvzpOqzwiQfH-
oCwAw&usg=AFQjCNFOCcK9hRRVQczMgt0tSqX6Al8z5Q&sig2=w5KyDbLxz-Ma-
MqVVyntzA&bvm=bv.55980276,d.aGc. Diakses tanggal 6 November 2013 pukul
12.45 WIB.
Web 3: http://www.stat.ncsu.edu/people/bloomfield/courses/st784/twa-08-3.pdf. Diakses
tanggal 7 November 2013 pukul 08.27 WIB.
Web 4: http://www.zu.ac.ae/main/files/contents/research/training/one-
wayrepeatedmeasureanova.pdf. Diakses tanggal 7 November 2013 pukul 09.12 WIB.

ANALISIS BIPLOT PADA PEMETAAN KARAKTERISTIK KEMISKINAN

DI PROVINSI NUSA TENGGARA BARAT
Desy Komalasari 1), Mustika Hadijati 2), Marwan 3)

1) Program Studi Matematika FMIPA UNRAM, email: Desi_its@yahoo.com
2) Program Studi Matematika FMIPA UNRAM, email: Ika_wikan@yahoo.co.id
3) Program Studi Matematika FMIPA UNRAM, email: marwanmath@yahoo.co.id
1), 2), 3). Jln. Majapahit No.62 Mataram- NTB.
Abstrak
Penelitian ini bertujuan memberikan inovasi baru mengenai pemetaan
karakteristik kemiskinan pada kabupaten/kota di provinsi Nusa Tenggara Barat,
menggunakan metode analisis Biplot. Analisis Biplot didasarkan pada singular value
decomposition, matriks orthonormal, dan faktorisasi dari matriks data. Penelitian ini
menghasilkan Square Root Biplot (SQRT) atau Biplot Simetri, yaitu grafik Biplot yang
memetakan secara bersamaan kabupaten/kota dengan karakteristik kemiskinan di
provinsi NTB. Analisis Biplot dalam penelitian ini memberikan penyajian yang cukup
baik mengenai informasi data yang sebenarnya berdasarkan nilai 𝑝2 sebesar 84,59%.
Grafik Biplot menampilkan wilayah yang memiliki kesamaan karakteristik kemiskinan
ada pada kabupaten Bima dan kabupaten Sumbawa, dengan jarak Euclid terdekat
sebesar 0.266. Sedangkan jarak terjauh ada pada kabupaten Lombok Tengah dan kota
Mataram, sebesar 9.779. Keragaman karakteristik kemiskinan ditunjukkan dengan
panjang vektor, vektor terpanjang pada penduduk miskin yang bekerja di sektor
pertanian (𝑋7 ) dan vektor terpendek pada angka partisipasi sekolah penduduk miskin
(𝑋3 ).
Kata kunci: Analisis Biplot, Singular Value Decomposition, Karakteristik Kemiskinan.
PENDAHULUAN
Kemiskinan merupakan masalah yang sering dihadapi di setiap daerah di Indonesia
seperti halnya provinsi Nusa Tenggara Barat. Jumlah penduduk miskin di provinsi Nusa
Tenggara Barat (NTB) pada Maret 2011 sebesar 19,73%, dan menurun pada Maret 2012
sebesar 18,63% (Berita Resmi Statistik, 2012). Angka penurunan sebsar 1,10% dipengaruhi
oleh beberapa faktor karakteristik kemiskinan di antaranya faktor sosial ekonomi dan faktor
pendidikan. Penurunan yang kurang signifikan menyebabkan perlunya pemetaan karakteristik
kemiskinan, sehingga upaya pengentasan kemiskinan tepat sasaran. Karakteristik kemiskinan
yang digunakan merupakan data kemiskinan makro. Data kemiskinan makro menunjukkan
jumlah dan persentase penduduk miskin di setiap daerah berdasarkan estimasi. Data ini
digunakan untuk perencanaan dan evaluasi program kemisikinan dengan target geografis. Oleh
karena itu, perlunya dilakukan pemetaan karakteristik kemiskinan pada kabupaten/kota di
Provinsi NTB menggunakan analisis Biplot. Analisis Biplot merupakan teknik statistik
deskriptif dimensi ganda dengan menyajikannya secara visual dan simultan sejumlah objek
pengamatan dan variabel dalam suatu grafik. Oleh karena itu, tujuan penelitian ini yaitu untuk
mengetahui gambaran pemetaan karakteristik kemiskinan di Provinsi NTB menggunakan
analisis Biplot. Sehingga manfaat dari pemetaan ini dapat digunakan sebagai bahan acuan
Pemerintah Daerah Provinsi NTB untuk melakukan upaya pengentasan kemiskinan yang tepat
sasaran pada karakteristik kemiskinan di wilayah tersebut.

METODE PENELITIAN
Jenis Penelitian
Penelitian ini menggunakan pendekatan kuantitatif dan aplikatif, yaitu mengaplikasikan
data – data numerik ke dalam analisis Biplot. Analisis Biplot adalah salah satu upaya
menggambarkan data - data yang ada pada tabel ringkasan kedalam grafik berdimensi dua.
Grafik yang dihasilkan dari Biplot ini merupakan grafik yang berbentuk bidang datar. Dengan
penyajian seperti ini, ciri-ciri variabel dan objek pengamatan serta posisi relatif antara objek
pengamatan dengan variabel dapat dianalisis (Kohler dan Luniak, 2005).
Waktu dan Tempat Penelitian

Penelitian dilaksanakan mulai bulan Juni 2013 sampai dengan bulan Oktober 2013.
Tempat penelitian di Universitas Mataram dan Badan Pusat Statistik Provinsi NTB.
Data Penelitian
Penelitian ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik
(BPS) Provinsi Nusa Tenggara barat. Data yang digunakan yaitu data karakteristik kemiskinan
tahun 2011, terdiri dari 10 kabupaten/kota yang merupakan Objek penelitian dan 10
karakteristik kemiskinan yang merupakan variabel penelitian. Objek penelitian meliputi Kab.
Lombok Barat, Kab. Lombok Tengah, Kab. Lombok Timur, Kab. Sumbawa, Kab. Dompu, Kab.
Bima, Kab. Sumbawa Barat, Kab. Lombok Utara, Kota Mataram, Kota Bima. Variabel
penelitian merupakan karakteristik kemiskinan meliputi Jumlah Penduduk Miskin (𝑋1 ), Angka
Melek Huruf Penduduk Miskin (𝑋2 ), Angka Partisipasi Sekolah Penduduk Miskin (𝑋3 ),
Penduduk miskin yang tidak bekerja (𝑋4 ), Penduduk miskin yang bekerja di sektor Informal
(𝑋5 ), Penduduk miskin yang bekerja di sektor formal (𝑋6 ), Penduduk miskin yang bekerja di
sektor pertanian (𝑋7 ), Penduduk bekerja di bukan sektor pertanian (𝑋8 ), Pengeluaran perkapita
untuk makanan (𝑋9 ), Luas lantai perkapita rumah tangga miskin (𝑋10 ).
Prosedur Penelitian
Prosedur penelitian ini meliputi observasi pendahuluan, perancangan penelitian,
pengumpulan data, analisis data, interpretasi hasil, dan kesimpulan. Observasi pendahuluan
dilakukan dengan survey data-data yang relevan, dengan tujuan untuk memberikan gambaran
dan informasi mengenai karakteristik kemiskinan di setiap kabupaten/kota di provinsi NTB.
Perancangan penelitian meliputi penetapan rumusan masalah, tujuan penelitian, penentuan alat
dan bahan, pengumpulan data, serta penentuan teknik analisis data. Langkah selanjutnya yaitu
pengumpulan data, data yang dikumpulkan disini adalah data sekunder yang berhubungan
dengan karakteristik kemiskinan. Selanjutnya analisis data menggunakan Biplot, kemudian

interpretasi hasil Biplot yaitu memberikan gambaran atau penjelasan secara deskriptif mengenai
kedekatan antar objek yang diamati, keragaman variabel, hubungan atau korelasi antar variabel,
dan nilai variabel pada suatu objek. Berdasarkan hasil interpretasi akan ditarik kesimpulan
mengenai analisis Biplot terhadap posisi kabupaten/kota terhadap karakteristik yang dimilikinya
serta karakteristik kemiskinan mana saja yang paling dominan di suatu kabupaten/kota di
provinsi NTB.

Analisis data menggunakan teknik analisis Biplot. Prosedur analisis biplot meliputi
menentukan matriks data yang dikoreksi terhadap rata-rata (𝒀), menentukan matriks 𝒀𝑻 𝒀,
menentukan nilai eigen dan vektor eigen, mencari Singular Value Decomposition (SVD) yaitu
mendapatkan matriks U, L dan A, menentukan matriks koordinat dengan 𝛼yang digunakan
berkisar pada 0 ≤ 𝛼 ≤ 1. Namun nilai 𝛼yang lazim digunakan dalah 𝛼 = 1; 𝛼0.5; dan
𝛼0 (Nugroho, 2008). Menentukan matriks G(objek) dan H(variabel) terpilih berdasarkan
𝒀 ≅ 𝑮𝑯𝑻 , menggambar grafik menggunakan program, interpretasi hasil dan kesimpulan.
Analisis Biplot bertujuan menggambarkan suatu matriks dengan menumpang tindihkan
vektor-vektor baris dengan vektor-vektor kolom matriks. Analisis Biplot didasarkan pada
penguraian nilai-nilai singular (Singular Value Decomposition) dari suatu matriks data yang
telah dikoreksi oleh rataanya. Biplot dibentuk dari suatu matriks data, dimana setiap kolom
mewakili variabel-variabel penelitian, dan setiap baris mewakili objek penelitian.
Misalkan matriks Xadalah matriks yang terdiri dari variabel-variabel sebanyak p dan
objek penelitian sebanyak n. Misalkan matriks Y merupakan hasil dari matriks X yang dikoreksi
terhadap rataannya, maka akan diuraikan menjadi perkalian tiga buah matriks berikut:
𝒀(𝒏×𝒑) = 𝑼(𝒏×𝒓) 𝑳𝒓×𝒓 𝑨𝑻𝒓×𝒑 (1)
Matriks 𝑳 merupakan nilai singular 𝒀 dengan unsur-unsur diagonalnya akar kuadrat
dari nilai eigen𝒀𝑻 𝒀, sedangkan matriks 𝑼diperoleh dari 𝑼 = 𝒀𝑨𝑳−𝟏 . Sehingga 𝑼𝑻 𝑼 = 𝑨𝑻 𝑨 =
𝑰, I adalah matriks identitas dan L adalah matriks diagonal berukuran (rxr) dengan unsur-unsur
diagonalnya adalah akar dari nilai eigen–nilai eigen tak nol 𝒀𝑻 𝒀 yaitu 𝜆𝟏 ≥ 𝜆𝟐 … ≥
𝜆𝒓 (Menurut Matjik dan Sumertajaya, 2011)).
Menurut Joellife (1986) dalam Matjik dan Sumertajaya, 2011, dari matriks Y akan
dibentuk matriks G dan H, dimana 𝑮 = 𝑼𝑳𝜶 dan𝑯𝑻 = 𝑳𝟏−𝜶 𝑨𝑻 dengan 𝛼 besarnya 0 ≤ 𝛼 ≤
1, yang masing-masing berukuran 𝑛 × 𝑟 dan 𝑟 × 𝑝maka persamaan (1) menjadi:
𝒀 = 𝑼𝑳𝜶 𝑳𝟏−𝜶 𝑨𝑻 = 𝑮𝑯𝑻 (2)
Masing-masing merupakan matriks G baris ke-i , dimana𝑖 = 1,2, … , 𝑛serta matriks H kolom ke-
j dimana 𝑗 = 1,2, … , 𝑝, dan r adalah rank matriks data Y. Jika matriks Ymempunyai rank dua,

maka vektor baris 𝒈𝒊 dan vektor 𝒉𝒋 akan digambarkan dalam dimensi dua. Namun, jika Y
mempunyai rank lebih dari dua maka persamaan di atas menjadi :
𝟏
𝒓 𝟐 𝑻
𝒚𝒊𝒋 = 𝒌=𝟏 𝒖𝒊𝒌 𝝀𝒌 𝜶𝒌𝒋 (3)
dengan 𝒖𝒊𝒌 merupakan elemen ke-(i,k) pada matriks U, 𝜶𝒌𝒋 𝑻 merupakan elemen ke-(k,j) pada
𝟏
T 𝟐
matriks A serta 𝝀𝒌 adalah elemen diagonal ke-k matriks Lyang merupakan akar kuadrat nilai
eigen𝒀𝑻 𝒀 .
Menurut Gabriel (1971) dalam Matjik dan Sumertajaya, 2011, data pengamatan awal
matriks X yang terdiri dari n objek dan p variabel tereduksi menjadi beberapa himpunan data
yang terdiri dari n baris dengan m kolom.
Jika ada sebanyak m kolom yang ditentukan, maka persamaan (2) menjadi;
𝟏
𝒎 𝟐 𝑻
𝒎𝒚𝒊𝒋 = 𝒌=𝟏 𝒖𝒊𝒌 𝝀𝒌 𝜶𝒌𝒋 , 𝒎 <𝑟 (4)
Persamaan di atas dapat dibentuk sebagai berikut :

𝒎 𝟏 𝟏
𝒎𝒚𝒊𝒋 = 𝒖𝒊𝒌 𝝀𝜶𝒌 𝟐 𝝀𝟏−𝜶

𝒌
𝟐
𝜶𝒌𝒋 𝑻
𝒌=𝟏
𝒎
= 𝒈𝒊𝒌 𝒉𝑻𝒌𝒋
𝒌=𝟏
𝑻
= 𝒈∗𝒊 𝒉∗𝒋 (5)
𝑻
dengan 𝒈∗𝒊 dan𝒉∗𝒋 masing-masing merupakan elemen vektor 𝒈𝒊 dan 𝒉𝒋 . Jika 𝑚 = 2 pada
persamaan (5) maka dikatakan sebagai Biplot, sehingga dapat dibentuk menjadi :
𝑻
𝟐𝒚𝒊𝒋 = 𝒈∗𝒊 𝒉∗𝒋 (6)
Dengan 𝟐𝒚𝒊𝒋 merupakan elemen matriks Yberdimensi dua, sedangkan 𝒈∗𝒊 mengandung elemen
dua kolom pertama vektor 𝒈𝒊 , dan 𝒉∗𝒊 mengandung dua kolom pertama vektor 𝒉𝒋 .
Sehingga dari matriks Y pada dimensi dua diperoleh matriks dengan ukuran tereduksi
yaitu matriks Gdan H sebagai berikut (Johnson danWichern, 2002) :
𝑔11 𝑔12 𝑕11 𝑕12
⋮ ⋮ ⋮ ⋮
𝑮 = 𝑔𝑖1 𝑔𝑖2 dan 𝑯 = 𝑕𝑖1 𝑕𝑖2
⋮ ⋮ ⋮ ⋮
𝑔𝑛1 𝑔𝑛2 𝑕𝑝1 𝑕𝑝2
Masing-masing pada matriks G dan H merupakan titik-titik koordinat dari n objek dan titik-
titik koordinat dari p variabel.
Rencer (2002), mengemukakan ukuran Biplot dengan pendekatan matriks Y berdimensi
dua dalam bentuk :
(𝜆 1 + 𝜆 2 )
𝑝2 = 𝑟 (7)
𝑘=1 𝜆 𝑘

Dengan 𝜆1 adalah nilai eigen terbesar pertama, 𝜆2 adalah nilai eigen terbesar kedua dan
𝜆𝑘 , 𝑘 = 1,2, … , 𝑟 adalah nilai eigen ke-k. Apabila nilai 𝑝2 mendekati satu, maka Biplot
memberikan penyajian yang semakin baik mengenai informasi data yang sebenarnya.
Biplot mempunyai beberapa tipe. Perbedaan tipe ini berdasarkan pada nilai 𝛼yang
digunakan. Nilai 𝛼yang digunakan dalam Biplot adalah 0 ≤ 𝛼 ≤ 1. Namun nilai 𝛼yang lazim
digunakan dalah 𝛼 = 1; 𝛼0.5; dan 𝛼0 (Nugroho, 2008).
1) Biplot dengan 𝛼1 disebut juga dengan Biplot komponen utama. Jika 𝛼 yang
digunakan adalah 𝛼 = 1 maka Biplot yang dibentuk disebut Biplot RMP (Row Metric
Preserving). Biplot RMP ini digunakan untuk menduga jarak Euclid secara optimal.
Sehingga Biplot untuk 𝛼 = 1 diperoleh:
𝑮 = 𝑼𝑳𝟏 = 𝑼𝑳dan 𝑯 = 𝑨𝑳𝟏−𝟏 = 𝑨 (8)
Pada kondisi ini jarak Euclid antara 𝑔𝑖 dan 𝑔𝑗 sama dengan jarak antara 𝑦𝑖 dan 𝑦𝑗 pada
pengamatan sesungguhnya. Selain itu koordinat 𝑕𝑗𝑇 merupakan koefisien variabel ke-j
dalam dua komponen utama pertama.
2) Nilai 𝛼lain yang digunakan dalam pembuatan Biplot yaitu 𝛼 = 0.5. Untuk nilai 𝛼ini,
Biplot yang dibentuk disebut Biplot Simetri atau Biplot SQRT (Square Root Biplot)..
Biplot untuk 𝛼 = 0.5 diperoleh:
𝑮 = 𝑼𝑳𝟎,𝟓 dan 𝑯 = 𝑨𝑳𝟏−𝟎,𝟓 = 𝑨𝑳𝟎,𝟓 (9)
3) Jika 𝛼yang digunakan adalah 𝛼0, maka akan terbentuk tipe Biplot yang disebut
Biplot CMP (Column Metric Preserving).
Saat 𝛼 = 0 diperoleh matriks G dan H sebagai berikut
diperoleh𝑮 = 𝑼𝑳𝟎 = 𝑼 dan 𝑯 = 𝑨𝑳𝟏−𝟎 = 𝑨𝑳 (10)
𝑻
sehingga terbentuk 𝒀𝑻 𝒀 = 𝑮𝑯𝑻 (𝑮𝑯𝑻 )
= 𝑯𝑮𝑻 (𝑮𝑯)𝑻
= 𝑯𝑮𝑻 𝑮𝑯𝑻
= 𝑯𝑼𝑻 𝑼𝑯𝑻
= 𝑯𝑯𝑻 (11)
Matriks U merupakan matriks orthonormal dan 𝒀𝑻 𝒀 = 𝑛 − 1 𝑺dengan n merupakan
banyaknya objek serta Smerupakan matriks varian kovarian dari matriks Y, sehingga 𝑯𝑻 =
𝑛 − 1 𝑺 .Hasil kali elemen 𝑕𝑗 𝑕𝑘𝑇 akan sama dengan (𝑛 − 1) kali kovarian 𝑠𝑗𝑘 variabel ke-j dan
2
variabel ke-k. Elemen diagonal utama matriks 𝑯𝑯𝑻 , 𝑕11 2
+ 𝑕21 , … , 𝑕𝑗21 + 𝑕𝑗22 , … , 𝑕𝑝1
2 2
+ 𝑕𝑝2
merupakan variansi dari variabel. Sedangkan 𝑕𝑗21 + 𝑕𝑗22 , 𝑗 = 1,2, . . , 𝑝 merupakan panjang vektor
variabel (dengan pusat jarak Euclid di titik O(0,0)). Sehingga dapat dikatakan bahwa panjang
vektor variabel sebanding dengan variansi variabel (Matjik dan Sumertajaya, 2011).

HASIL DAN PEMBAHASAN

Deskripsi data penelitian
Gambaran data penelitian di tampilkan pada tabel Deskriptif Statistik berikut.
Tabel 1. Deskriptif Statistik
N Minimum Maximum Mean Std. Deviation Variance
Penduduk Miskin (X1) 10 11.69 39.27 19.9220 7.46983 55.798
AMH (X2) 10 72.57 91.63 84.3240 6.12581 37.526
APS (X3) 10 92.58 100.00 96.3380 2.54088 6.456
Tidak Bekerja (X4) 10 31.22 47.67 37.2530 5.46294 29.844
Bekerja Informal (X5) 10 36.38 68.34 54.7690 9.49724 90.197
Bekerja Formal (X6) 10 .45 15.95 7.9810 4.85856 23.606
Bekerja Sektor Pertanian (X7) 10 1.78 55.85 39.6360 16.41475 269.444
Bekerja Bukan Pertanian (X8) 10 12.40 50.54 23.1140 11.71297 137.194
Pengeluaran Makanan (X9) 10 59.69 73.21 67.2390 4.13745 17.118
Luas Lantai (X10) 10 41.12 79.19 59.3520 12.71368 161.638
Valid N (listwise) 10
Pada tabel 1 terlihat Gambaran karakteristik kemiskinan di provinsi NTB, rata-rata

penduduk miskin di 10 kabupaten tersebut sebesar 19.92%, dengan rata-rata angka melek huruf
84.32%, rata-rata angka partisipasi sekolah yang tinggi oleh penduduk miskin sebesar 96.33%
yang berarti semangat penduduk miskin untuk bersekolah sangat tinggi. Persentase penduduk
miskin yang tidak bekerja 37.25%, rata-rata penduduk miskin yang bekerja di sektor informal
54.77%, sedangkan yang bekerja di sektor formal masih sangat kecil yaitu 7.98%. Penduduk
miskin yang bekerja di sektor pertanian 39.64% lebih tinggi daripada penduduk miskin yang
bekerja di bukan sektor pertanian sebesar 23.11%. Rata-rata pengeluaran perkapita untuk
makanan rumah tangga miskin sebesar 67.24%. Pengeluaran perkapita adalah rata-rata
pengeluaran makanan rumah tangga dibagi dengan jumlah anggota rumah tangga yang
bersangkutan. Rata-rata luas lantai rumah tangga miskin di provinsi NTB sebesar 59.35%,
dengan luas lantai setiap rumah tangga lebih kecil dari 8m2 ≤ 8𝑚2 .
Hasil Analisis Biplot

Berdasarkan prosedur analisis Biplot diperoleh hasil berupa grafik Biplot seperti pada
Gambar 1.

a. Hasil grafik Biplot untuk 𝛼 = 0.5 ditunjukkan pada gambar di bawah ini:
Gambar 1. Pemetaan Biplot data karakteristik kemiskinan di provinsi NTB
Pada penelitian ini dihasilkan grafik biplot dengan 𝛼 = 0.5. Alasan terpilihnya biplot
dengan 𝛼 = 0.5 yaitu karena hasil kali matriks koordinat Objek (G) dan matriks koordinat
variabel (H) sama dengan elemen-elemen pada matriks data awal 𝒀 ≅ 𝑮𝑯𝑻.Sehingga biplot
dalam penelitian ini merupakan Square Root Biplot (SQRT) atau Biplot Simetri. Biplot Simetri
merupakan tipe Biplot yang membuat kesamaan penskalaan atau pembobotan pada baris dan
kolom secara bersamaan, sehingga digunakan untuk menggambarkan gabungan vektor objek
yaitu kabupaten/kota serta variabel yang merupakan karakteristik kemiskinan secara bersamaan
dalam satu plot (grafik).
b. Interpretasi Informasi Biplot

Biplot adalah upaya membuat gambar di ruang berdimensi banyak menjadi gambar di
ruang dimensi dua. Informasi data yang disajikan dalam Biplot ditentukan berdasarkan nilai
𝑝2 ,semakin mendekati nilai satu berarti Biplot yang diperoleh dari matriks pendekatan
berdimensi dua akan memberikan penyajian data yang semakin baik mengenai informasi-
informasi yang terkandung pada data yang sebenarnya. Penyajian informasi ini bergantung pada
nilai eigen(𝜆). Pada penelitian ini diperoleh nilai 𝜆1 sebesar 5231.74, dan 𝜆2 sebesar 1078.05,

sehingga diperoleh nilai 𝑝2 sebesar 84.59%. Nilai 𝑝2 mendekati satu, maka Biplot dalam
penelitian ini memberikan penyajian yang cukup baik mengenai informasi dari data yang
sebenarnya.
c. Kedekatan Antar Objek (Kabupaten/kota)

Informasi ini dijadikan panduan untuk mengetahui kabupaten/kota yang memiliki
kemiripan karakteristik kemiskinan dengan kabupaten/kota lainnya. Kabupaten/kota yang
berada pada kuadran yang sama dapat dikatakan memiki kesamaan karakteristik kemiskinan
yang cukup dekat, jika dibandingkan dengan kabupaten/kota yang berada pada kuadran yang
berbeda. Pada gambar 1. terlihat kabupaten/kota yang berada pada kuadran yang sama yaitu
kuadran keempat, diantaranya Kota Bima dan Kota Mataram. Dapat dikatakan bahwa kedua
kota tersebut memiliki kesamaan karakteristik kemiskinan. Selain itu juga dapat ditentukan
melalui jarak Euclidean, dari plot yang dihasilkan dapat ditentukan jarak Kota Bima dan Kota
Mataram sebesar 4.037, yang berarti kota kabupaten tersebut memiliki kemiripan karakteristik
kemiskinan. Interpretasi yang sama juga berlaku untuk kabupaten/kota lainnya.
d. Interpretasi Nilai Variabel Pada Suatu Objek

Informasi ini digunakan untuk menentukan karakteristik kemiskinan di setiap wilayah
(kabupaten/kota). Suatu wilayah yang terletak searah dengan vektor karakteristik kemiskinan
menunjukkan tingginya nilai karakteristik kemiskinan untuk wilayah tersebut. Atau dapat
interpretasikan bahwa karakteristik kemiskinan untuk wilayah tersebut mempunyai nilai di atas
rata-rata seluruh kabupaten/kota. Sebaliknya, jika suatu wilayah terletak berlawanan arah
dengan vektor karakteristik kemiskinan maka nilai karakteristik kemiskinannya rendah atau di
bawah nilai rata-rata seluruh kabupaten/kota. Sedangkan jika wilayah yang hampir berada di
tengah-tengah berarti wilayah tersebut memiliki nilai karakteristik kemiskinan yang dekat
dengan rata-rata.
Pada gambar 1, terlihat bahwa Kabupaten Lombok Barat searah dengan arah vektor
variabel (𝑋10 ). Sesuai dengan data asli, dimana luas lantai perkapita rumah tangga miskin (𝑋10 )
di Kabupaten Lombok Barat sebesar 79.19% di atas rata-rata keseluruhan yakni 59.35%.
Contoh lainnya pada Kabupaten Lombok Utara yang searah dengan vektor 𝑋1 , hal ini
menyatakan jumlah penduduk miskin di kabupaten tersebut sebesar 39.27% berada di atas rata-
rata yakni sebesar 19.92%. Contoh lainnya pada Kabupaten Lombok Tengah yang searah
dengan vektor 𝑋5 , hal ini menandakan bahwa penduduk miskin yang bekerja di sektor informal
pada kabupaten Lombok Tengah sebesar 68.34% berada di atas rata-rata keseluruhan yaitu
54.77%. Sedangkan variabel 𝑋6 berlawanan arah dengan kabupaten Lombok Tengah yang
berarti penduduk miskin yang bekerja di sektor formal pada kabupaten tersebut sebesar 0.45%
berada di bawah rata-rata seluruh kabupaten sebesar 7.98%. Interpretasi yang sama pada kota

Mataram yang searah dengan vektor variabel 𝑋8 dan berlawan arah dengan vektor variabel 𝑋7 .
Hal ini menandakan penduduk miskin yang bekerja di bukan sektor pertanian (𝑋8 ) sebesar
50.54% berada di atas rata-rata yakni 23.11%. Sedangkan penduduk miskin yang bekerja di
sektor pertanian (𝑋7 ) sebesar 1.78% berada di bawah rata-rata yakni 39.64%. Interpretasi yang
sama juga berlaku untuk kabupaten/kota dan karakteristik kemiskinan lainnya.
e. Keragaman Variabel (Karakteristik Kemiskinan)

Informasi ini digunakan untuk melihat keragaman karakteristik kemiskinan setiap
kabupaten/kota. Dengan informasi ini, bisa diperkirakan pada karakteristik kemiskinan yang
mana strategi harus ditingkatkan dalam rangka menurunkan angka kemiskinan, dan juga
sebaliknya. Dalam Biplot nantinya komponen-komponen dengan keragaman yang kecil
digambarkan sebagai vektor yang pendek sedangkan komponen-komponen dengan keragaman
yang besar digambarkan sebagai vektor yang panjang.
Pada gambar 1 terlihat bahwa vektor terpanjang pada variabel 𝑋7 yaitu penduduk
miskin yang bekerja di sektor pertanian, dengan nilai keragaman sebesar 34.162. Sesuai data
aslinya penduduk miskin yang bekerja disektor pertanian (𝑋7 ) untuk kota Mataram sebesar
1.78%, paling kecil di antara 9 kabupaten/kota lainnya. Sedangkan kabupaten Bima menempati
urutan ke sepuluh, dengan jumlah penduduk miskin yang bekerja disektor pertanian paling besar
yaitu 55.85%. Vektor terpendek ada pada variabel 𝑋3 (angka partisipasi sekolah penduduk
miskin), yang berarti keragaman data pada variabel 𝑋3 sebesar 0.232. Ini berarti angka
partisipasi sekolah penduduk miskin sangat tinggi. Kota Bima menempati urutan pertama,
dengan angka partisipasi sekolah penduduk miskin mencapai 100%, sedangkan yang terendah
pada kota Mataram sebesar 92.58%. Hal ini menandakan program pemertintah provinsi NTB
untuk meningkatkan angka partisispasi sekolah penduduk miskin sudah berhasil, terlihat dari
nilai rata-rata angka partisipasi sekolah di 10 kabupaten/kota mencapai 96.34% (Data Tabel 1).
Interpretasi yang sama juga berlaku untuk panjang vektor variabel lainnya. Secara berturut-turut
panjang vektor variabel yang menunjukkan keragaman data karakteristik kemiskinan meliputi
variabel 𝑋7 (penduduk miskin yang bekerja disektor pertanian) sebesar 34.162, 𝑋10 (Luas lantai
perkapita rumah tangga miskin) sebesar 30.230, 𝑋8 (Penduduk miskin bekerja di bukan sektor
pertanian) sebesar 17.389, 𝑋5 (Penduduk miskin yang bekerja di sektor informal) sebesar 9.307,
𝑋1 (Penduduk Miskin) sebesar 4.020, 𝑋4 (Penduduk miskin yang tidak bekerja) sebesar 3.146,
𝑋2 (angka melek huruf penduduk miskin) sebesar 3.140, 𝑋9 (Pengeluaran perkapita untuk
makanan) sebesar 1.878, 𝑋6 (Penduduk miskin yang bekerja di sektor formal) sebesar 1.661,
dan 𝑋3 (angka partisipasi sekolah penduduk miskin) sebesar 0.232.
f. Korelasi Antar Variabel (Karakteristik Kemiskinan)

Korelasi atau hubungan saling mempengaruhi antar karakteristik kemiskinan dapat

diinterpretasikan dari penyajian grafik Biplot. Pada grafik Biplot, karakteristik kemiskinan
digambarkan sebagai garis berarah. Dua karakteristik yang memiliki korelasi positif akan
digambarkan sebagai dua garis dengan arah yang sama sehingga membentuk sudut sempit atau
sudut lancip. Sedangkan jika dua buah karakteristik digambarkan sebagai dua garis yang
berlawanan maka dikatakan memiliki korelasi negatif, sehingga membentuk sudut lebar atau
tumpul. Namun jika dua buah karakteristik digambarkan dalam bentuk garis dengan sudut siku-
siku maka dikatakan karakteristik kemiskinan tersebut tidak saling berkorelasi atau
berhubungan.
Sudut yang dibentuk antara dua karakteristik kemiskinan merupakan nilai cosinus. Semakin
kecil nilai cosinus yang dibuat antara dua karakteristik kemiskinan maka semakin tinggi
korelasinya. Sehingga diperoleh hasil bahwa jumlah penduduk miskin (𝑋1 ) dan pengeluaran
perkapita untuk makanan penduduk miskin (𝑋9 )saling mempengaruhi dan berkorelasi positif.
Hal tersebut ditentukan dari sudut yang terbentuk sebesar 18.03° . Semakin banyak jumlah
penduduk miskin dalam satu keluarga, maka semakin banyak pengeluaran perkapita untuk
makanan yang harus dikeluarkan. Contoh lainya yaitu pada karakteristik penduduk miskin yang
bekerja di sektor informal (𝑋5 ) berkorelasi negative dengan penduduk miskin yang bekerja di
sektor formal (𝑋6 ), dengan sudut yang terbentuk sebesar 173.84. Semakin banyak jumlah
penduduk miskin yang bekerja di sektor informal maka semakin sedikit penduduk miskin yang
bekerja di sektor formal. Interpretasi yang sama juga berlaku untuk karakteristik kemiskinan
lainnya.
SIMPULAN DAN SARAN

Simpulan
Berdasarkan analisis hasil dan pembahasan, maka dapat disimpulkan hal-hal berikut:
Analisis Biplot dalam penelitian ini memberikan penyajian yang cukup baik mengenai
informasi dari data yang sebenarnya berdasarkan nilai 𝑝2 sebesar 84,59%. Biplot yang terbentuk
dalam pada penelitian ini merupakan Square Root Biplot (SQRT) atau Biplot Simetri. Wilayah
yang memiliki kesamaan karakteristik kemiskinan ada pada kabupaten Bima dan kabupaten
Sumbawa, dengan jarak Euclid terdekat sebesar 0.266. Sedangkan jarak terjauh ada pada
kabupaten Lombok Tengah dan kota Mataram, sebesar 9.779. Keragaman karakteristik
kemiskinan ditunjukkan dengan panjang vektor, dengan vektor terpanjang pada penduduk
miskin yang bekerja di sektor pertanian (𝑋7 ) dan vektor terpendek pada angka partisipasi
sekolah penduduk miskin (𝑋3 ).
Saran.
Selain menggunakan analisis Biplot, pemetaan karakteristik kemiskinan juga dapat
dilakukan menggunakan Multidimensional Scalling atau dengan kombinasi Biplot

menggunakan analisis faktor dan Cluster. Serta saran bagi pemerintah provinsi NTB dari hasil
pemetaan ini diharapkan program-program pemerintah dalam mengentaskan kemiskinan lebih
tepat sasaran, karena dari plot terlihat beberapa daerah yang memiliki karaktersitik kemiskinan
yang sama. Sehingga nantinya diperoleh distribusi kesejahteraan yang merata di setiap
kabupaten/kota.
DAFTAR PUSTAKA
Berita Resmi Statistik, 2012. BPS Provinsi NTB. BRS No. 44/07/52/TH.VI , 2 Juli 2012
Johnson, R.A. dan D.W. Wichern, 2002, Applied Multivariate Statistical Analysis, Fifth Edition.
Prentice Hall Inc, New Jersey.
Kohler, U. dan Luniak, M. (2005). Data inspection using Biplots. The Stata Journal Vol 5,
Number 2, pp. 208–223.
Matjik, A.A., dan Sumertajaya, (2011) I. M., Sidik Peubah Ganda dengan Menggunakan
SAS. IPB Press. Dermaga. Bogor.
Nugroho, S., 2008. Statistika Multivariat Terapan. UNIB Press. Bengkulu
Rencer, A. C., 2002. Methods of Multivariate Analysis. Brigham Young University.

PROBABILITAS WAKTU DELAY MODEL EPIDEMI ROUTING
Dyah Wardiyani1, Respatiwulan, Sutanto

Jurusan Matematika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Sebelas Maret Surakarta
1) dyahwardiyani@gmail.com
Abstrak
Model epidemi routing menjelaskan pengiriman paket data pada jaringan
mobile melalui analogi pada model epidemi penyebaran penyakit. Analogi didasarkan
pada kemiripan proses dan variabel. Pengiriman paket data dapat dilihat berdasarkan
banyaknya node yang menerima paket data. Perubahan banyaknyanode yang
menerima paket data terhadap waktu dapat dinyatakan dengan persamaan diferensial.
Waktu delay merupakan waktu yang dibutuhkan untuk mengirim paket dari satu node
ke node yang lain. Setiap pengiriman paket data memiliki waktu delay yang berbeda,
sehingga waktu delay dapat dipandang sebagai variabel random yang memiliki fungsi
distribusi probabilitas.
Tujuan penelitian ini adalah mengonstruksi model epidemi routing dan
menentukan probabilitas waktu delay. Selanjutnya, model epidemi routing dan
probabilitas waktu delay diterapkan pada kasus pengiriman informasi pada area
militer dan disimulasikan dengan mengambil laju pengiriman paket, 𝛽yang berbeda.
Hasil simulasi menunjukkan semakin besar 𝛽maka semakin cepat waktu yang
diperlukan agar semua node menerima paket data dan probabilitas kumulatif waktu
delay menuju 1.
Kata kunci: delay, epidemi routing, mobile, node, dan probabilitas.
1. Pendahuluan
Model epidemi merupakan model matematika yang dapat menggambarkan pola
penyebaran penyakit. Banyak ilmuwan yang meneliti dan memodelkan pola penyebaran
penyakit, diantaranya Mc.Kendrick dan Kermack [5]. Pada tahun 1927 Mc.Kendrick dan
Kermack berhasil memodelkan pola penyebaran penyakit dalam bentuk deterministik yang
sesuai dengan kasus epidemi sebenarnya. Kesesuaian model epidemi dengan kasus epidemi
sebenarnya, mengakibatkan banyak dilakukan pengembangan model epidemi. Menurut Isham
[4], pengembangan model epidemi dapat dilakukan dengan menambah variabel atau menambah
perlakuan. Pengembangan model epidemi juga dapat dilakukan dengan melakukan analogi
antara proses penyebaran penyakit dengan proses lain yang memiliki kemiripan proses. Salah
satu proses yang mirip dengan penyebaran penyakit adalah proses pengiriman paket data pada
routing (Zhang [10]).
Routing merupakan proses pemilihan jalur pengiriman paket data pada suatu jaringan
mobile (Andrew [1]). Jaringan mobile dibentuk oleh beberapa node yang dapat berpindah
tempat atau bersifat mobile. Menurut Liu [7] dan Zhang [10], pengiriman paket data pada
routing dapat dinyatakan dengan algoritma store- carry-forward. Maksud dari algoritma store-
carry-forward adalah node menerimapaket data, membawa paket data dan mengirimkannya ke
node lain yang belummemiliki paket data sampai semua node memiliki paket data. Menurut

Small [8]dan Sun[9], algoritma store-carry-forward mirip dengan proses penyebaran

penyakitpada model susceptible infected (SI ). Pada model SI, individu menularkanpenyakit ke
individu lain yang belum terinfeksi. Karena kemiripan proses penyebaranpenyakit dan
pengiriman paket data pada routing, maka dapat dilakukananalogi.
Model analogi penyebaran penyakit dan pengiriman paket data pada routing disebut
dengan model epidemi routing (Zhang [10]). Model epidemi routing menggambarkan pola
pengiriman paket data pada routing berdasarkan banyaknyanode yang menerima paket data tiap
waktu. Menurut Zhang [10], padamodel epidemi routing diharapkan mampu mencapai
minimum waktu penundaanpengiriman paket data (waktu delay). Waktu delay merupakan
selang waktudari pertama kali paket data diterima oleh sebuah node sampai dikirimkan ke
nodeyang lain. Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang
berbeda, sehingga waktu delay tidak dapat diprediksi dengan pasti. Olehkarena itu waktu delay
dapat dipandang sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam
fungsi distribusi kumulatif waktu delay.Sehingga pada penelitian ini akan dikonstruksi ulang
model epidemi routing danprobabilitas waktu delay.
2. Model Epidemi Routing

Model epidemi routing merupakan model yang dapat menggambarkan pola pengiriman
paket data pada jaringan mobile berdasarkan banyaknya node yang menerima paket data.
Menurut Zhang [10], model epidemi routing dapat mudah dikonstruksi dengan menganalogikan
pengiriman paket data dan penyebaran penyakit, berdasarkan proses dan variabel yang
berpengaruh. Menurut Small [8] dan Sun [9], model epidemi yang sesuai dengan proses
pengiriman paket data pada routing adalah model susceptible infected (SI).
Pada model SI, populasi individu dibagi ke dalam dua kelompok, yaitu kelompok
individu rentan (𝑆) dan kelompok individu terinfeksi penyakit (𝐼). Individu 𝑆 dapat terinfeksi
penyakit dengan laju penularan sebesar b, sehingga banyaknya individu 𝑆 akan berkurang
sebesar 𝑏𝑆𝐼 ke individu 𝐼. Individu rentan yang terus berkurang mengakibatkan semua individu
akan terinfeksi penyakit.
Karena pengiriman paket data pada routing dapat dianalogikan dengan model SI,
asumsi pada model epidemi routing mengacu pada model SI. Berikut adalah asumsi-asumsi
konstruksi model epidemi routing.
1. Pengiriman paket data terjadi pada suatu jaringan mobile dengan banyaknya node
konstan.
2. Node dalam jaringan mobile tersebut dibagi ke dalam kelompok node tanpa paket dan
node yang memiliki paket.
3. Setiap node memiliki peluang yang sama untuk mendapat paket data.
4. Hanya satu paket data yang dikirimkan

Pada model epidemi routing, node-node dibagi dalam kelompok node tanpa paket data
(𝑆) dan kelompok node yang memiliki paket data (𝐼). Node 𝑆dapat terkirimi paket data dengan
laju pengiriman paket data sebesar 𝛽, sehingga node 𝑆akan berkurang ke node 𝐼sebesar 𝛽𝑆𝐼.
Karena setiap node memiliki kemungkinan yang sama untuk menerimat paket data, banyaknya
node kelompok 𝑆berpindah ke kelompok 𝐼sebesar 𝛽𝑆𝐼. Sehingga proses pengiriman dan
penerimaan paket data antar node disajikan dalam Gambar 1.
Gambar 1. Proses pengiriman dan penerimaan paket data antar node
Banyaknya node pada kelompok 𝑆dan 𝐼pada waktu 𝑡, masing-masing dinyatakan

sebagai 𝑆(𝑡) dan 𝐼(𝑡). Jika banyaknya node dalam jaringan mobile dinyatakan dengan 𝑁maka
𝑆(𝑡) = 𝑁 − 𝐼(𝑡). Dengan demikian perubahan banyaknya node yang menerima paket data
terhadap waktu dapat dinyatakan sebagai
𝑑𝐼(𝑡)
= 𝛽𝐼 𝑡 𝑁 − 𝐼 𝑡 , (2.1)
𝑑𝑡
dengan laju pengiriman paket data 𝛽 > 0.
Model epidemi routing menggambarkan pola pengiriman paket data berdasarkan
banyaknya node yang menerima paket data. Persamaan (2.1) menyatakan perubahan banyaknya
node yang menerima paket data terhadap waktu. Sehingga persamaan (2.1) perlu diselesaikan
untuk mendapatkan banyaknya node yang menerima paket data tiap waktu.
Persamaan (2.1) harus dibentuk ke dalam persamaan diferensial dengan variabel
terpisah (Campbell [2]), yaitu
𝑑𝐼(𝑡)
𝐼 𝑡
= 𝛽 𝑁𝑑𝑡 (2.2)
𝐼 𝑡 1−
𝑁
Jika diasumsikan 𝐼(0) = 1 yang berarti mula-mula terdapat sebuah node yang memiliki paket
data, maka banyaknya node yang menerima paket data dapat dinyatakan sebagai
𝑁
𝐼 𝑡 = , (2.3)
1 + 𝑁 − 1 𝑒 −𝛽𝑁𝑡
Jika nilai 𝛽semakin besar maka nilai 𝑒 −𝛽𝑁𝑡 semakin mendekati 0. Hal ini
mengakibatkan banyaknya node yang menerima paket data mendekati 𝑁. Sedangkan jika
𝛽bernilai 0 maka 𝑒 −𝛽𝑁𝑡 bernilai 1, berakibat hanya terdapat sebuah node yang menerima paket
data yaitu node awal. Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka banyaknya
node yang menerima paket data semakin cepat mendekati N.
3. Probabilitas Waktu Delay

Ketika terjadi pengiriman paket data pada jaringan mobile dimungkinkan terdapat waktu
penundaan pengiriman paket data atau waktu delay (Groenevelt [3]). Menurut Zhang [10] dan
Zhou [11], waktu delay merupakan selang waktu dari pertama kali paket data diterima oleh
sebuah node sampai dikirimkan ke node yang lain, 𝑡 < 𝑇𝑑 < 𝑡 + 𝛥𝑡dengan 𝛥𝑡 kecil.
Pengiriman paket yang satu dengan yang lain memiliki waktu delay yang berbeda, sehingga
waktu delay tidak dapat diprediksi secara pasti. Oleh karena itu, waktu delay dapat dipandang
sebagai variabel random. Ketidakpastian waktu delay dapat dinyatakan dalam fungsi distribusi
kumulatif waktu delay. Menurut Zhang [10], fungsi distribusi kumulatif dari 𝑇𝑑 , 𝑃𝑁 (𝑡) =
𝑃𝑟(𝑇𝑑 < 𝑡).
Fungsi distribusi kumulatif 𝑇𝑑 sulit diperoleh secara langsung. Menurut Small [8] dan
Lin [6] perubahan fungsi distribusi kumulatif 𝑇𝑑 untuk 𝛥𝑡kecil dapat dinyatakan dengan
𝑑𝑃𝑁 𝑡 𝑃𝑁 𝑡 + ∆𝑡 − 𝑃𝑁 𝑡
= lim
𝑑𝑡 ∆𝑡→0 ∆𝑡
𝑃 𝑇𝑑 > 𝑡 + ∆𝑡 − 𝑃 𝑇𝑑 > 𝑡
= lim − . 3.1
∆𝑡→0 ∆𝑡
Pada persamaan (3.1),

𝑃 𝑇𝑑 > 𝑡 + ∆𝑡 = 𝑃(𝑡𝑖𝑑𝑎𝑘 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 [𝑡, 𝑡 + ∆𝑡]|𝑇𝑑 > 𝑡)𝑃(𝑇𝑑 > 𝑡)
= (1 − 𝑃 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 𝑡, 𝑡 + ∆𝑡 𝑇𝑑 > 𝑡 )𝑃 𝑇𝑑 > 𝑡 . (3.2)
Probabilitas waktu delay pada 𝑡, 𝑡 + ∆𝑡 ditentukan berdasarkan durasi delay dan rata-rata
banyaknya node yang menerima paket data. Karena waktu delay terdapat pada 𝑡, 𝑡 + ∆𝑡 maka
durasi delay sebesar ∆𝑡, sedangkan rata-rata banyaknya node yang menerima paket data sebesar
𝛽𝐼(𝑡). Probabilitas waktu delay pada 𝑡, 𝑡 + ∆𝑡 dinyatakan sebagai
𝑃 𝑎𝑑𝑎 𝑤𝑎𝑘𝑡𝑢 𝑑𝑒𝑙𝑎𝑦 𝑝𝑎𝑑𝑎 𝑡, 𝑡 + ∆𝑡 𝑇𝑑 > 𝑡 = ∆𝑡𝛽𝐼 𝑡 . (3.3)
Persamaan (3.3) disubtitusikan ke persamaan (3.2), sehingga didapatkan
𝑃𝑟 𝑇𝑑 > 𝑡 + ∆𝑡 = 1 − ∆𝑡𝛽𝐼 𝑡 𝑃 𝑇𝑑 > 𝑡 . (3.4)
Selanjutnya, persamaan (3.4) disubstitusikan ke persamaan (3.1), diperoleh
𝑑𝑃𝑁 𝑡 [𝑃 𝑇𝑑 > 𝑡 1 − ∆𝑡𝛽𝐼 𝑡 − 𝑃 𝑇𝑑 > 𝑡
= lim −
𝑑𝑡 ∆𝑡→0 ∆𝑡
= 𝛽𝐼 𝑡 𝑃 𝑇𝑑 > 𝑡 .
Karena 𝑃 𝑇𝑑 > 𝑡 = 1 − 𝑃(𝑇𝑑 < 𝑡), maka
𝑑𝑃𝑁 𝑡
= 𝛽𝐼 𝑡 1 − 𝑃𝑁 𝑡 . (3.5)
𝑑𝑡
Persamaan (3.5) diselesaikan untuk mendapatkan persamaan yang menyatakan
probabilitas waktu delay. Persamaan (3.5) harus dibentuk ke dalam persamaan diferensial
dengan variabel terpisah (Campbell [2]). Jika diasumsikan 𝑃(0) = 0, maka penyelesaian
persamaan (3.5) yaitu

𝑁
𝑃𝑁 𝑡 = 1 − , (3.6)
𝑒𝛽𝑁𝑡 + (𝑁 − 1)
Jika nilai 𝛽semakin besar maka nilai 𝑒 𝛽𝑁𝑡 juga semakin besar tergantung pada 𝑁. Hal
ini mengakibatkan probabilitas kumulatif waktu delay semakin mendekati 1. Sedangkan jika
𝛽bernilai 0 maka 𝑒 𝛽𝑁𝑡 bernilai 1, berakibat probabilitas kumulatif waktu delay bernilai 0.
Sehingga dapat disimpulkan bahwa semakin besar 𝛽maka probabilitas kumulatif waktu delay
semakin cepat mendekati 1.
4. Penerapan Kasus
Pada bagian ini diberikan kasus pengiriman paket data jaringan mobile di area militer.
Pada area militer tertentu terdapat 100 node mobile yang dapat mengirimkan paket data dengan
laju 0.222 jam/node (Groenevelt [3]). Semua node dalam jaringan mobile tersebut diharapkan
dapat menerima paket data dengan terdapat sebuah sumber atau node awal yang memiliki paket
data. Banyaknya node pada waktu t pada jaringan mobile di area militer tersebut dapat
dinyatakan dengan
100
𝐼 𝑡 = . (4.1)
1 + 99𝑒 −22.2𝑡
Pada model epidemi routing juga diharapkan mampu mencapai minimum waktu
penundaan pengiriman paket data (delay).Pengiriman paket yang satu dengan yang lain
memiliki waktu delay yang berbeda, sehingga waktu delay tidak dapat diprediksi dengan pasti.
Oleh karena itu waktu delay dapat dipandang sebagai variabel random. Ketidakpastian waktu
delay dapat dinyatakan dalam fungsi distribusi kumulatif waktu delay. Fungsi distribusi
kumulatif waktu delay pada jaringan mobile dalam area militer tersebut adalah
100
𝑃𝑁 𝑡 = 1 − . (4.2)
𝑒 22.2𝑡 + 99
Persamaan (4.1) dan persamaan (4.2) yang menyatakan banyaknya node yang menerima paket
data dan probabilitas kumulatif waktu delay dapat dilihat pada Gambar 2.
Gambar 2 (𝑎) menunjukan bahwa pada waktu 0.87 jam semua node dalam jaringan
mobile telah menerima paket data. Gambar 2 (𝑏) menunjukan bahwa probabilitas kumulatif
waktu delay kurang dari 0,87 jam dalam jaringan mobile menuju 1. Hal ini menunjukan
probabilitas waktu delay mendekati 0 atau dapat dikatakan sudah tidak terjadi waktu delay.
Sehingga semua node dalam jaringan mobile pada area militer tersebut menerima paket dan
probabilitas delay mencapai minimum setelah 0,87 jam. Banyaknya node yang menerima paket
data dan probabilitas waktu delay pengiriman paket data dalam area militer tersebut hanya
dipengaruhi oleh laju pengiriman paket data.

Gambar 2. (a) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay
Pengaruh laju pengiriman paket data 𝛽terhadap pola pengiriman paket data dan
probabilitas waktu delay dalam jaringan mobile dapat diperjelas dengan simulasi. Simulasi pola
pengiriman paket data dan probabilitas waktu delay untuk 𝛽 = 0.15, 𝛽 = 0.222, 档𝑎𝑛 𝛽 = 0.9
dapat dilihat pada Gambar 3.
Gambar 3. (𝑎) Banyaknya node yang menerima paket data dan (b) probabilitas waktu delay
dengan 𝛽 = 0.15, 𝛽 = 0.222, 𝑑𝑎𝑛 𝛽 = 0.9
Gambar 3 (𝑎) menunjukan bahwa untuk 𝛽 = 0.15 semua node dalam jaringan mobile
dapat menerima paket data dalam waktu 1.28 jam, untuk 𝛽 = 0.222 memerlukan waktu 0.87
jam, dan 𝛽 = 0.9 memerlukan waktu 0.22 jam. Sedangkan dari Gambar 3 (𝑏) terlihat bahwa
untuk 𝛽 = 0.15 probabilitas waktu delay menuju 1 setelah 1.28 jam, untuk 𝛽 = 0.222 setelah
0.87 jam, dan 𝛽 = 0.9 setelah 0.22 jam. Sehingga dapat disimpulkan bahwa semakin besar laju
pengiriman paket data (𝛽)maka semakin cepat waktu yang diperlukan agar semua node
menerima paket data dan probabilitas waktu delay cepat menuju 1. Hasil simulasi ini
memperjelas pengaruh laju pengiriman paket data (𝛽)terhadap banyaknya node yang menerima
paket data dan probabilitas waktu delay yang telah dijelaskan sebelumnya.

5. Kesimpulan
Model epidemi routing pada jaringan mobile dinyatakan sebagai
𝑁
𝐼 𝑡 = ,
1 + 𝑁 − 1 𝑒 −𝛽𝑁𝑡
dengan syarat terdapat satu node awal yang memiliki paket data, sedangkan probabilitas
kumulatifwaktu delay pada model epidemi routing yaitu
𝑁
𝑃𝑁 𝑡 = 1 − ,
𝑒𝛽𝑁𝑡 + (𝑁 − 1)
dengan probabilitas waktu delay mula-mula 0, laju pengiriman paket data 𝛽 > 0 dan banyaknya
node dalam jaringan N. Simulasi menunjukan semakin besar laju pengiriman paket data
(𝛽) maka semakin cepat waktu yang diperlukan agar semua node menerima paket data dan
probabilitas waktu delay juga semakin cepat menuju 1.
DAFTAR PUSTAKA
[1] Andrew S.T., Computer Networks, Pearson Education, Inc., Amsterdam, 2003.
[2] Campbell,L. Stephen, An Introduction to Differential Equations and Their Application,
second ed., Wadswordh, Inc, California, USA, 1990.
[3] Groenevelt, R., P. Nain, and G. Koole, The Message Delay in Mobile Ad Hoc Network,
Perform (2005), no. 62, 210-228.
[4] Isham, V., Stochastic Models for Epidemics, Research Report 263, Department of
Statistical Science, University College London, 2004.
[5] Kermack,W.O. and A. G. McKendrick, A Contribution to The Mathematical Theory
ofEpidemics, Proceedings of the Royal Society of London Series A 115(1927), 700-721.
[6] Lin, Y., B. Li, B. Liang, Stochastic Analysis of Network Coding in Epidemic Routing, ACN
MobiOpp (2007).
[7] Liu, J., X. Jiang, H. Nishiyama, and N. Kato, General Model for Store-Carry-
ForwardRouting Schemes with Multicast in Delay Tolerant Networks, IEEE (2011), 494-
500.
[8] Small, T., and Z.J. Haas, The Shared Wireless Infostation Model-A New Ad Hoc
NetworkingParadigm, MobiHoc, Maryland, USA (2003), 233-244.
[9] Sun,L., Epidemic Content Distribution in Mobile Networks, Master of science thesis, KTH
Royal Institute of Technology, Stockholm, Swedia, Februari 2013.
[10] Zhang, E., G. Neglia, J. Kurose, and D. Towsley, Performance Modeling of
EpidemicRouting, Tech. Report 44, UMass Computer Science, 2005.
[11] Zhou, S., L. Ying, S. Tirthapura, Delay, Cost and Infrastructure Tradeoff of Epidemic
Routingin Mobile Sensor Networks, Proceedings of 11 the 6th International Wireless
Communications and Mobile Computing Conference.

PIECEWISE POLYNOMIAL SMOOTH SUPPORT VECTOR MACHINE

UNTUK KLASIFIKASI DESA TERTINGGAL
DI PROVINSI KALIMANTAN TIMUR
Ita Wulandari1), Santi Wulan Purnami2), Santi Puteri Rahayu3)

1,2,3) Program Magister Jurusan Statistika FMIPA ITS
Kampus ITS Keputih, Sukolilo, Surabaya 60111, Jawa Timur,
ukhti.evita@gmail.com, santipurnami@yahoo.com, sprahayu@gmail.com
Abstrak
Support Vector Machine (SVM) adalah metode yang sangat popular untuk klasifikasi
data biner pada data mining. SVM dapat diaplikasikan secara luas seperti pengenalan
pola, analisis regresi, dan estimasi probabilitas. SVM memanfaatkan optimasi dengan
quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data
dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti
mengembangkan suatu teknik dengan mengubah formulasi SVM menggunakan
smoothing technique yang disebut Smooth-SVM (SSVM). Teknik ini mampu
mengkonversi quadratic programming pada SVM menjadi linear programming.
Penelitian selanjutnya berkembang dengan memodifikasi smooth function pada SSVM
kedalam bentuk polynomial smooth function seperti: quadratic polynomial function,
fourth polynomial function, piecewise polynomial function dan spline function.
Dibandingkan dengan ketiga polynomial smooth function lainnya, piecewise polynomial
function mempunyai performansi yang lebih baik. Piecewise polynomial function jika
diterapkan pada model SSVM, maka akan diperoleh model Piecewise Polynomial
Smooth Support Vector Machine (PPSSVM). Penelitian ini menggunakan dua model
yaitu Smooth-SVM (SSVM) dan PPSSVM yang ditemukan oleh Wu dan Wang.
Penelitian ini akan mengkaji performansi piecewise polynomial function dan
konvergensi kedua model secara teoritis serta mencoba menerapkan model terbaik
untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur menggunakan data
PODES (Potensi Desa) 2011.
Keywords: desa tertinggal, klasifikasi, piecewise polynomialsmooth functionSVM,

Smooth SVM.
PENDAHULUAN
SVM adalah suatu teknologi pembelajaran statistik yang dapat menghasilkan
performansi generalisasi terbaik. SVM diperkenalkan untuk pertama kalinya oleh Vapnik pada
tahun 1995 dan sangat berhasil melakukan prediksi, baik dalam kasus klasifikasi maupun
regresi. Metode ini berusaha untuk menemukan fungsi pemisah optimal yang bisa memisahkan
dua set data dari dua kelas atau disebut juga hyperplane terbaik diantara fungsi yang tidak
terbatas (Gunn, 1998).
Lee dan Mangasarian, (2001) menyatakan bahwa SVM memanfaatkan optimasi
dengan quadratic programming yang apabila digunakan untuk data berdimensi tinggi dan data
dengan jumlah besar menjadi kurang efisien. Oleh karena itu para peneliti mengembangkan
smoothing technique untuk mengubah optimasi yang terbatas menjadi optimasi yang tanpa
batas menggunakan formulasi dari SVM standar. Teknik tersebut adalah Smooth-SVM (SSVM)
yang mampu mengkonversi quadratic programming pada SVM menjadi linear programming
dengan menggunakan algoritma Newton-Armijo.

Para peneliti kemudian mengembangkan smooth function ke dalam bentuk fungsi

polynomial. Yuan dan Huang, (2005) menemukan quadratic polynomial function dan fourth
polynomial function. Luo dkk, (2006) menemukan piecewise polynomial function. Yuan dkk,
(2007) menemukan spline function. Purnami dkk, (2009a, 2009b) membandingkan keempat
fungsi yang ditemukan oleh peneliti-peneliti tersebut pada permasalahan diagnosis kanker
payudara. Hasil yang diperoleh adalah piecewise polynomial function mempunyai performansi
terbaik.
Penelitian selanjutnya dilakukan oleh Wu dan Wang (2013) yang menemukan
piecewise polynomial function yang berbeda rumus fungsinya dengan yang ditemukan Luo, dkk
(2006). Penelitian tersebut memberikan kesimpulan bahwa piecewise polynomial function
memiliki efisiensi, ketepatan serta akurasi yang terbaik.
Pada penelitian ini akan membandingkan model PPSSVM yang ditemukan Wu dan
Wang dengan model SSVM. Kedua model akan dilihat performansi smooth function dan
konvergensi kedua model secara teoritis untuk mendapatkan model terbaik. Model terbaik
selanjutnya diterapkan untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur
menggunakan data PODES Tahun 2011.
METODE PENELITIAN
Data dan Prosedur Penelitian
Data yang digunakan dalam penelitian ini adalah data sekunder. Variabel respon
berasal dari Kemendagri pada profil desa dan kelurahan 2011: data dasar tipologi klasifikasi,
kategori desa kelurahan (2012). Variabel prediktor berasal dari BPS yaitu data PODES Provinsi
Kalimantan Timur Tahun 2011 yang terdiri dari 16 variabel. Penelitian dilakukan terhadap 1465
desa. Untuk melakukan analisis data dalam penelitian ini digunakan program aplikasi
MATLAB. Langkah-langkah analisis data penelitian ini antara lain sebagai berikut:
1. Melakukan analisis secara teoritis performansi smooth function dan konvergensi kedua
modeluntuk mendapatkan model terbaik. Langkah-langkah untuk menyelesaikan tahap ini
adalah sebagai berikut:
a. Performansi smooth function: membandingkan selisih antara smooth function dengan
plus function.
b. Konvergensi kedua model: dengan membuktikan bahwa problem optimasi model
SSVM dan PPSSVM dapat mendekati problem optimasi model awal ketika k
mendekati tak hingga.
2. Model terbaik kemudian digunakan untuk klasifikasi desa tertinggal di Provinsi
Kalimantan Timur menggunakan data PODES 2011. Langkah-langkahnya adalah sebagai
berikut:

a. Menggunakan fungsi kernel Gaussian dalam implementasi pembentukan model

terbaik.
b. Membagi data training dan testing menggunakan 10-fold cross validation.
c. Mencari kombinasi log 2  dan log 2 v terbaik sebagai parameter model terbaik dengan
memilih akurasi yang paling tinggi.

d. Membangun model terbaik dengan algorithma Newton-Armijo.
e. Evaluasi performansi klasifikasi dilihat dari akurasinya.
1. Support Vector Machine (SVM)

Support Vector Machine (SVM)pertama kali diusulkan oleh Vapnik untuk klasifikasi
dua kategori atau binomial. Pada bentuk yang paling sederhana, SVM memisahkan titik-titik dari
kelas yang berbeda, misalkan kelas {+1} dan {-1} dengan hyperplane tunggal pada ruang
berdimensi banyak yang pada akhirnya partisi-partisi tersebut diselesaikan secara nonlinier.
Hyperplane yang optimum diperoleh melalui program nonlinier, tepatnya quadratic
programming (Bertsimas dan Shioda, 2007).
Diberikan permasalahan klasifikasi dari sebanyak n objek dalam ruang dimensi Rp
sehingga susunan data berupa matrik A berukuran n x p dan keanggotaan tiap titik yaitu yi
terhadap kelas {+1} atau {-1} didefinisikan pada diagonal matriks D berukuran n xn. Untuk
permasalahan klasifikasi program dari algorithma SVM standar adalah sebagai berikut ( SVM ||.||2
2
):
min ve ' y  12 || w ||22 (1)
( w , , y )R p1n
dengan kendala D(Aw  e )  y  e
y 0
dimana:
v : Parameter yang ditentukan sebagai pengontrol (trade off)
y : Vektor variabel slack berukuran n x 1 yang mengukur kesalahan klasifikasi dan bernilai
nonnegatif.
e : Vektor kolom berukuran n dan bernilai 1.
w : Vektor normal berukuran p x1 .
 : Nilai bias yang menentukan lokasi relatifhyperplane terhadap kelas asli.
Hyperplane margin yang mungkin dibentuk dalam memisahkan objek-objek dalam
masalah klasifikasi dua kelas secara linier adalah sebagai berikut:
x ' w    0, (2)

Sehingga kedua bidang memisahkan dua kelas dengan soft margin yang ditentukan oleh
variabel slack nonnegatif, adalah sebagai berikut:
x ' w    y i  1 untuk x '  Ai dan Dii  1
(3)
x ' w    y i  1 untuk x '  Ai dan Dii  1
Dimana vektor x adalah bagian dari matriks A berukuran p x 1. Dimana i= 1,2,…,n.
Persamaan di atas merupakan subject to bagi fungsi SVM yang dapat ditulis dalam satu
persamaan matriks sebagai berikut:
D(Aw  e )  y  e dan y  0 (4)
Penyelesaian persamaan (1) akan mudah diselesaikan dengan meminimumkan fungsi
Lagrange terhadap w,  , y serta meminimumkan terhadap Lagrange multiplier α dan β .
1
L ( w ,  , y , α, β)  || w ||22 ve ' y  α '(D( Aw  e )  e   )  β ' y (5)
2
Nonlinier SVM dengan bidang pemisah yang nonlinier diperoleh dengan
mentransformasi formulasi SVM standar sebagai berikut:
w  A ' Du (6)
Sangat sulit untuk mengetahui fungsi transformasi yang tepat, untuk itu pada SVM
digunakan „kernel trik’. Teknik ini dapat tercapai tanpa perlu mengetahui pemetaan
nonliniernya. Pemetaan tersebut dilakukan melalui sebuah fungsi kernel, yaitu (Hsu dkk, 2008):
a. Kernel Linier
K  xi , x   xTi x (7)
b. Polynomial Kernel
K  xi , x     xTi x  r  ,   0
d
(8)
c. Fungsi Kernel Gaussian
K  xi , x   exp   | xi  x |2  ,   0 (9)
d. Eksponensial Kernel
K  xi , x   tanh   xTi x  r  (10)
Fungsi kernel yang umum digunakan adalah kernel Gaussian. Dengan  , r dan d merupakan
parameter kernel dan i,j=1,2,…,n.
Dengan menggantikan A’A dengan kernel nonlinier K(A,A’) menghasilkan nonlinear
generalized SVM adalah sebagai berikut:
1
minp1n ve ' y  u ' D ' K ( A, A ')Du (11)
( w , , y )R 2
dengan kendala D( K (AA ')Du  e )  y  e
y0
2. Smooth Support Vector Machine (SSVM)
Sejak pertama kali muncul, metode SVM telah banyak dikembangkan dan
dimodifikasi demi meningkatkan performansi dan efisiensinya. Tahun 2001 Lee dan
Mangasarian merekomendasikan formulasi baru dari SVM dengan kernel dan nonlinier untuk
analisis klasifikasi menggunakan smoothing technique sehingga dinamakan smooth support
vector machine (SSVM).
Pendekatan smoothing Lee dan Mangasarian. (2001) menjadikan variabel slack y
v
menjadi 2-norm yang diboboti . Dengan demikian problem optimasi pada SSVM adalah:
2
min y ' y   w ' w   2 

v 1
(12)
w , , y 2 2
dengan kendala D(Aw  e )  y  e
y  0,
di mana untuk memperoleh solusi problem (12), kendala-kendalanya dapat ditulis sebagai
berikut:
y  (e  D(Aw  e )) (13)
Subtitusi persamaan (13) terhadap persamaan (12) menghasilkan fungsi objektif tanpa kendala
sebagai berikut
v 1
min || (e  D( Aw  e )) ||22  (w ' w   2 ) (14)
w , 2 2
Dimana ()  menggantikan komponen-komponen bernilai negatif dengan nilai nol. Fungsi
objektif dalam persamaan (14) tidak memiliki turunan kedua, smoothing technique yang
diusulkan Lee dan Mangasarian (2001) dilakukan dengan menggantikan fungsi plus dengan p(x,
 ) yaitu integral dari fungsi sigmoidneural network (1  exp( x))1 atau dapat dituliskan
sebagai berikut
1
p( x,  )  x  log(1    x ),   0 (15)

di mana  adalah smoothing parameter. Menggantikan    dengan p(x,  ), maka diperoleh
model SSVM sebagai berikut

v 1
min  (w,  )  minn1 || p(e  D( Aw  e ),  ||22  (w ' w   2 ) (16)
( w , )Rn1 ( w ,b )R 2 2
Sedangkan problem optimasi untuk SSVM non linier diperoleh sebagai berikut:
v 1
minn1  (w,  ) : minn1 || p(e  D( K ( A, A ')Du  e ),  ) ||22  (u ' u   2 ) (17)
( u , )R ( u , )R 2 2

Program optimasi linier maupun non linier dapat diselesaikan dengan algoritma Newton-
Armijo.
Langkah-langkah algoritma Newton-Armijo dimulai dengan inisiasi (w 0 ,  0 )  R n1 ,
kemudian mengulangginya sampai gradient dari fungsi objektif (16) atau (17) sama dengan nol
atau  (wi ,  i )  0 . Selainnya, menghitung (wi 1 ,  i 1 ) sebagai berikut :
n 1
Newton Direction: menentukan direction d  R
i
1) dengan menyelesaikan n +1
persamaan linier dengan n +1 variabel sebagai berikut:
2 (wi ,  i )d i   (wi ,  i )' (18)
2) Armijo Stepsize: memilih stepsize i  R sedemikian hingga:
w i 1
,  i 1    wi ,  i   i d i
(19)
 1 1 
dimana i  maksimumkan 1, , ,... sehingga:
 2 4 
  wi ,  i     w ,     d      w ,   d
i i
i
i
i 
i i i
(20)
 1
dengan    0, 
 2
 
Saat  w ,   0 , iterasi pada algoritma Newton-Armijo berhenti, dan
i i
diperoleh nilai w dan  yang konvergen. Dengan demikian fungsi pemisah yang diperoleh
untuk kasus klasifikasi linier adalah :
f ( x)  sign(x ' w   ), (21)
Sedangkan fungsi pemisah untuk kasus klasifikasi nonlinier adalah sebagai berikut:
f ( x)  sign(x ' w   )  sign(u ' D ' K (A, A ')   ), (22)
Seperti yang dijelaskan sebelumnya, Lee dan Mangasarian (2001) menemukan SSVM
dengan menggantikan fungsi plus dengan p(x,  ) yaitu integral dari fungsi sigmoid neural
network (1  exp( x))1 atau seperti pada persamaan (15), di mana  adalah smooth function.
Beberapa peneliti kemudian memodifikasi smooth function ke dalam bentuk polynomial smooth
function, yaitu quadratic polynomial function, fourth polynomial functionl, spline polynomial
function, dan piecewise polynomial function. Fungsi piecewise polynomial salah satunya
diusulkan oleh Wu dan Wang adalah sebagai berikut (2013):

 1
0, x ,
3k

3 2 
3
1  1
 2 k  x  3k  ,   x  0,
   3k (23)
f ( x, k )   3
 3 2 1  1
 x  k   x  ,0  x  ,
2  3k  3k

 1
 x, x ,
3k
3. Seleksi Parameter dan Evaluasi Ketepatan Klasifikasi

Seleksi parameter yang digunakan dalam penelitian ini menggunakan uniform design
(UD) dalam dua tahap. Pada dasarnya tahap pertama digunakan untuk mencobakan kombinasi-
kombinasi parameter v dan  . Huang dkk, (2007) menggunakan nilai parameter logaritma
berbasis 2 atau logaritma biner. Perlu diperhatikan bahwa nilai log 2 v dan log 2  digunakan
paling banyak satu kali dalam metode UD tersarang dan tidak ada titik yang ditempatkan di
sudut.
Metode UD pada penelitian ini menggunakan 10-fold cross validation dalam
pembagian data training-testing. Metode ini melakukan pengulangan sebanyak 10kali untuk
membagi sebuah himpunan contoh (sampel) secara acak menjadi 10-subset yang saling bebas.
Setiap ulangan disisakan satu subset untuk testing dan sisanya digunakan untuk training. Hasil
dari percobaan dan pembuktian teoritis, menunjukkan bahwa 10-fold cross validation adalah
pilihan terbaik untuk mendapatkan hasil validasi yang akurat (Kohavi, 1995).
Ukuran ketepatan klasifikasi dapat dilihat dari akurasi klasifikasi. Akurasi
menunjukkan performansi teknik klasifikasi secara keseluruhan, semakin tinggi akurasi
klasifikasi berarti semakin baik performansi teknik klasifikasi.
Tabel.1 Confusion Matrix Untuk Hasil Klasifikasi Biner

Kelas prediksi
Kelas sebenarnya
Positif Negatif
Positif tp fn
Negatif fp tn
Keterangan :
tp : true positive (sebenarnya positif dan diklasifikasikan positif)
tn : true negative (sebenarnya negatif dan diklasifikasikan negatif)
fp : false positive (sebenarnya negatif tetapi diklasifikasikan positif)
fn : false negative (sebenarnya positif tetapi diklasifikasikan negatif)

tp  tn
Akurasi klasifikasi (%) = (24)
tp  fp  tn  fn
Penelitian ini diawali dengan analisis secara teoritis yang terdiri dari dua tahap. Tahap
pertama menganalisis performasi smooth function dari kedua model dilanjutkan dengan
menganalisis konvergensi dari kedua model. Tahap berikutnya adalah menerapkan model
terbaik untuk klasifikasi desa tertinggal di Provinsi Kalimantan Timur dengan data PODES
2011.
Performansi smooth function

Lemma 1:
1
p( x,  )  x  log(1    x ),   0 , dan x adalah plus function. Untuk x  R dan x   ,

maka akan diperoleh hasil sebagai berikut:
(i) p( x, k )  x ;
(ii) for p  0,| x | p, p( x,  )  x  (log 2 /  )  (2  /  )log 2.

2 2
Pembuktian
1 1
(i) Untuk 0  x   , p( x,  )  ( x )  x  log(1    x )  x  log 2
 
Untuk    x  0 maka didapatkan: p( x,  )  ( x )  p( x,  )  p(0,  )
1
 log 2

1
Oleh karena itu p( x,  )  ( x )  log 2 atau p( x,  )  x

1 2x
(ii) Untuk 0  x   , maka p( x,  )2  ( x )2  x  log 2 (1    x )  log(1    x )
 2

 log 2  2 
2
   log 2
   
Untuk    x  0 , maka p( x,  )2 adalah fungsi monoton naik, sehingga didapatkan:
2
 log 2 
p( x,  )  ( x )  p( x,  )  p(0,  )  
2 2 2 2

  
 log 2  2 
2
Oleh karena itu p( x,  ) 2  ( x ) 2     log 2

   
Theorema 1. Piecewise function yang didefinisikan pada (23) mempunyai sifat:

(i) f ( x, k )  C1 (), f ( x, k )  C 2 (), x ;

(ii) Untuk semua x  R, f ( x, k )  x ;
(iii) Untuk semua x  R, then f ( x, k )2  x2  1

216k 2
Pembuktian.
(i) f(x,k) memenuhi persamaan pada titik x   31k , x  0,
1 1 1
𝑓 −3k , k = 0, lim− 𝑓 𝑥, 𝑘 = lim+ 𝑓 𝑥, 𝑘 , 𝑓 3𝑘
, 𝑘 = 3𝑘
𝑥→0 𝑥→0
1 1
𝑓′ −3k , 𝑘 = 0, lim 𝑓′ 𝑥, 𝑘 = lim+ 𝑓′ 𝑥, 𝑘 , 𝑓′ −3𝑘 , 𝑘 = 1
𝑥→0− 𝑥→0
1 1
𝑓′′ −3k , 𝑘 = 0, lim− 𝑓′′ 𝑥, 𝑘 = lim+ 𝑓′′ 𝑥, 𝑘 , 𝑓′′ −3𝑘 , 𝑘 = 0
𝑥→0 𝑥→0
Jika x   31k , x  0, disubtitusikan ke dalam persamaan f(x,k), maka hasil pada (i) akan
diperoleh dengan mudah.

(ii) f ( x, k )  x ;
1 3 1
Jika   x  0 , gunakan persamaan Q( x)  f ( x, k )  ( x)  k 2 ( x  k )3  x
3k 2 3
9 2 1
Sehingga Q' ( x)  k ( x  )2
2 3k
 Q' ( 31k )  0
1 1
Dan Q" ( x)  9k 2 ( x  )  9k 2 ( x  )  0 . Ini mengindikasikan bahwa Q( x)
3k 3k
monoton turun pada  31k , 0 
1 3 1
Jika 0  x  , gunakan persamaan Q( x)  f ( x, k )  ( x)   x  k 2 (  x)3  x
3k 2 3k
9 1
Sehingga Q ' ( x)  1  k 2 (  x) 2
2 3k
 Q' ( 31k )  0
1 1
Dan Q" ( x)  9k 2 (  x)  9k 2 (  x)  0 . Ini mengindikasikan bahwa Q( x)
3k 3k
monoton turun pada 0, 31k  . Sehingga Q( x)  Q  31k   f ( x, k )  ( x)
1 1
(iii) Jika x atau x  , maka nilai dari f(x,k) dan x+ adalah sama, sehingga
3k 3k
f ( x, k )2  x2  0 Pertidaksamaan pada (iii) terpenuhi.

Jika  31k  x  0 , maka ketika x  0 , maka f ( x, k )2  x2  f ( x, k )2 . Sebab f ( x, k )
adalah fungsi positif, kontinu dan fungsi monoton naik untuk  31k  x  0
1 1
sehingga akan didapatkan f ( x, k ) 2  f (0, k )2  2

324k 216k 2
2
1  3 2 1  
3
untuk 0  x  , misalkan s ( x )  f ( x , k ) 2
 x
2
  x  k   x    x
2
3k  2  3k  
6 3
9  1   1 
 k 4  x    3k 2 x  x  
4  3k   3k 
Untuk mendapatkan hasil, maka a ditransformasi menjadi a=kx , a  0, 1 

   3
Setelah mensubsitusi a=kx ke dalam persamaan di atas maka,
3  3  1 
6
 1 
3
s ( x)  2   a     a  a   
k  4  3   3  
 1
Untuk a  0,  , titik maksimum pada s(a) adalah a= 0.0605 dan

3 
1
s(a)  f ( x, k )2  x2  0.0046  . Sehingga diperoleh hasil
216k 2
1
f ( x, k ) 2  x2 
216k 2
Berdasarkan hasil pada Lemma 1 dan Theorema 1, maka diperolah perbandingan performansi
dari smooth function adalah sebagai berikut:
Theorema 2 (Lee dan Mangasarian, 2001). Jika   1k , dan k>0. Maka hasil dari performansi
smooth function adalah:
(i) Jika smooth function yang didefiniskan pada (15), maka berdasarkan pada Lemma 1
diperoleh:
2
 
2
 log 2  1 1
log 2  log 2  2log 2 2  0.69267 2
2
p( x, k ) 2  x2     (25)
 k  k k k
(ii) Jika smooth function yang didefiniskan pada (23), berdasarkan pada Theorem 1 maka,
1 1
f ( x, k )2  x2  2
 0.0046 2 (26)
216k k
Theorem 2 menunjukkan bahwa piecewise function f(x,k) mempunyai performasi terbaik
untuk plus function x+. Ketika k mempunyai nilai yang pasti, maka akan sangat mudah
mendapatkan perbedaan dari smooth function di atas.
Konvergensi SSVM dan PPSSVM

Pembuktian untuk konvergensi dari model SSVM dan PPSSVM akan diperoleh ketika
k mendekati tak hingga. Hal tersebut diperoleh ketika problem optimasi mendekati model awal
(15).
Theorema 3 (Lee dan Mangasarian, 2001). Jika A  Rmxn ,   R mx1 , definisi dari fungsi riil
f ( x) : Rn  R dan g ( x, k ) : Rn  N  R adalah sebagai berikut:
1 1
 Ax   
2
f ( x)  
2
x 2
2 2 2
1 1
g  x, k   f  Ax   , k  2  x
2 2
2
2 2
Untuk model SSVM dengan α > 0, maka:
(i) f ( x) dan g ( x, k ) adalah fungsi kecebungan yang kuat.
(ii) x* adalah solusi unik untuk min xRn f  x  dan xk* juga merupakan solusi uniq dari
min xRn g  x, k 
(iii) Untuk  0 , diperoleh pertidaksamaan :
m   log 2  log 2  Dimana   max Ax*  b

 
2
* 2
x x
*
     2y  (27)
k 
2      1i  m i
(iv) x* dan xk* memenuhi lim xk*  x* (28)

k 
Untuk model PPSSVM, maka :

(i) f ( x) dan g ( x, k ) adalah fungsi kecebungan yang kuat.
(ii) x* adalah solusi unik untuk min xRn f  x  dan xk* juga merupakan solusi uniq dari
min xRn g  x, k 
(iii) Untuk k  1 x* dan xk* keduanya memenuhi xk*  x*

2

m
(29)
216k 2
(iv) x* dan xk* memenuhi lim xk*  x* (30)

k 
Pembuktian Model SSVM dan PPSSVM

Pada point (i) dan (ii) baik model SSVM dan PPSSVM mempunyai pembuktian yang sama,
yaitu:
2
(i) f ( x) dan g ( x, k ) adalah fungsi kecembungan yang kuat karena . 2 adalah fungsi
kecembungan yang kuat. Jika Lv ( f ( x)) adalah level set dari f ( x) dan Lv ( g ( x, k )) adalah
level set dari g ( x, k ) , maka berdasarkan pada hasil (ii) Theorem 1 diperoleh:

Lv (( f ( x, k )  Lv ( f ( x))  x | x
2
2
 2v 
Oleh karena itu, Lv ( g ( x, k )) dan Lv ( f ( x)) adalah strict convex set. Dikarenakan hal
tersebut, keduanya merupakan solusi yang unik untuk min xRn f  x  dan min xRn g  x, k 
(ii) Jika x* adalah problem optimasi untuk min xRn f  x  dan xk* adalah problem optimasi
untuk min xRn g  x, k  , disebabkan oleh problem optimasi dan sifat kecembungan dari
f ( x) dan g ( x, k ) , maka pertidaksamaan yang diperoleh adalah:
f  xk*   f  x*   f  x*  xk*  x*  
1 * 2
xk  x* 
1
xk*  x*
2
2 2
2 2
f  x* , k   f  xk* , k   f  xk* , k  x*  xk*  

1 * *2 1 *
xk  x 
2
xk  x*
2 2
2 2
Untuk pembuktian point (iii) dan (iv) adalah sebagai berikut:

Model SSVM
(iii) p( x,  )  0 , maka:
 
xk*  x*  g  x* ,   f  x*   f  xk* ,   f ( xk* ) 
2
 g ( x* ,  )  f ( x* )
1 2 1 2
 p( Ax*  b),   ( Ax*  b)
2 2 2 2
m   log 2  2y 
2
* 2
Sehingga diperoleh x  x *
    log 2 
2      
k 2

(iv) Ketika k mendekati tak hingga , maka:
m   log 2  
2
* 2 2y
lim x  x *
 lim     log 2   0 Sehingga lim xk*  x*
k  2  
   
k
k  2 k 

Model PPSSVM
(v) Jika kedua persamaan diatas dijumlahkan dengan catatan f ( x, k )  x maka akan
diperoleh:
xk*  x*  f  xk*   f  x*   f  x* , k   f  xk* , k 

2
  
 g  x , k   f  x*   f  xk* , k   f  xk*   f  x* , k   f  x* 
*
f  Ax*   , k   Ax  
1 2 1 2
  *
2 2 2  2
2 m
Berdasarkan pada hasil (iii) pada Theorema 3 xk*  x*  , maka diperoleh
2 216k 2
kesimpulan bahwa persamaan (29) adalah benar.

(vi) Ketika k mendekati tak hingga pada (29), maka diperoleh

2 m
lim xk*  x*  lim 2
 0 Sehingga lim xk*  x*
k  2 k  216k k 
Hasil dari (iv) pada Theorema 3 menjelaskan bahwa problem optimasi model PPSSVM
mendekati model SVM standar ketika k mendekati positif tak hingga.
Hasil analisis teoritis menunjukkan bahwa model PPSSVM lebih baik dibandingkan
dengan model SSVM. Untuk menunjukan secara jelas perbedaan performansi smooth function
dengan plus function, maka kita gunakan k=10 untuk semua fungsi tersebut dan hasilnya dapat
dilihat pada gambar 1.
Gambar 1. Perbandingan performansi smooth function (k-=10)
Terlihat pada Gambar 1 bahwa piecewise polynomial function mempunyai performansi yang
terbaik untuk plus function. Hal tersebut ditunjukkan pada kurva piecewise polynomial function
yang lebih mendekati pada kurva plus function.
Aplikasi Model Terbaik

PPSSVM yang ditemukan Wu dan Wang adalah model terbaik hasil analisis secara
teoritis. Model ini kemudian digunakan untuk klasifikasi desa tertinggal di Provinsi Kalimantan
Timur. Variabel prediktor yang digunakan dalam penelitian ini sebanyak 16 variabel dengan
unit analisis adalah 1465 desa. Hasil Output MATLAB untuk model SSVM dan PPSSVM
diperoleh:
Tabel 2. Hasil Output model SSVM dan PPSSVM
Keterangan Nilai SSVM Nilai PPSSVM
Terr 0.11655 0.106826
Verr 0.118089 0.116041
Best C 1.778279 23.71374
Best Gamma 8.42E-06 5.255e-06
Elapse 9.001258 5137.425

Point < 21 x 2 double> < 21 x 2 double>

Ratio 1 1
Sumber : Hasil Output MATLAB
Ketepatan klasifikasi untuk desa tertinggal di Provinsi Kalimantan Timur dapat dilihat
dari tingkat akurasinya. Berdasarkan Tabel 2, maka diperoleh akurasi model PPSSVM:
Akurasi untuk data training : 99.89%
Akurasi untuk data testing : 99.88%
Jika dibandingkan dengan model SSVM maka model PPSSVM mempunyai tingkat akurasi
yang lebih baik, walaupun dapat dikatakan relatif tidak jauh berbeda untuk klasifikasi desa
tertinggal di Provinsi Kalimantan Timur menggunakan data PODES 2011.
SIMPULAN DAN SARAN

Analisis secara teoritis menunjukkan bahwa performansi dan konvergensi piecewise
polynomialfunction penemuan Wu lebih baik dibandingkan dengan smooth function dan model
terbaik yang didapatkan adalah model PPSSVM. Penerapan model terbaik PPSSVM pada
klasifikasi desa tertinggal di Provinsi Kalimantan Timur mendapatkan akurasi yang relative
lebih tinggi dibandingkan dengan model SSVM. Penelitian ini menggunakan algorithma
Newton Armijo dalam menentukan parameter dan model terbaik, sedangkan pembagian data
testing dan training menggunakan 10 fold – cross validation.
Peneliti menyarankan untuk menggunakan polynomial smoothing function yang lebih
baik pada penelitian berikutnya. Selain itu dapat pula dicoba beberapa k fold – cross validation
pada kasus yang sama ataupun berbeda.
DAFTAR PUSTAKA
Andari, S. (2013), Smooth Support Vector Machine dan Multivariate Adaptive Regression
Splines Untuk Mendiagnosis Kanker Payudara. Tesis ITS.
Anguita, D., Ghelardoni, L., and Ghio, A., (2012). The „K‟ in K-fold Cross Validation. ESANN
2012 proceedings, European Symposium on Artificial Neural Network, Computational
Intelligence and Machine Learning. Bruges (Belgium).
Badan Pusat Statistik, (2005), Identifikasi dan Penentuan Desa Tertinggal 2002. BPS, Jakarta.
Bertsimas, D. and Shioda, R. (2007), Clasification and regression via integer optimazion,
Journal of Operation Research, Vol 55, No.2, hal 252-271.
Breiman, L., Friedman, J., Olshen, R. and Stone, C. (1984). Classification and Regression
Trees, Wadsworth International Group.
Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri, (2012), Profil Desa dan
Kelurahan 2011: Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan Menurut
Provinsi, Dirjen PMD Kemendagri, Jakarta.

Fang, K.T., Winker, P., Lin, D.K.J., and Zhang, Y. (2000), Uniform Design: Theory and
Application, American Statistical Association and American Society for Quality, Vol. 42,
No 3, hal 237 – 248.
Gajdos, C., tarter, P.I., Bleiweiss, I.J., Herman, G., de Csepel, J., Estabrook, A., and Rademaker,
A.W. (2002), Mammography appearance of nonpalpable breast cancer reflects pathologi
characteristics, Annals of Surgery, Vol 235, No. 2, hal 246 – 251.S
Gunn, S. (1998), Support Vector Machines for Clasification and Regression, Technical Report,
ISIS.
Huang, C.M., Lee, Y.J., Lin D.K.J., and Huang, S.Y. (2007), Model selection for support vector
machine via uniform design, Computational Statistics and Data Analysis, Vol. 52. hal. 335-
346.
Hsu, C.W., Chang, C. C., and Lin, C. J. (2008). A practical guide to Support Vector
Classification, Taipe: Information Engineering National Taiwan University.
Kohavi, R. (1995), A Study of Cross-Validation and Bootstrap for Accuracy Estimation and
Model Selection, Appears in the International Joint Coference on Artificial Intelligence
(IJCAI), 1995.
Luo, L., Lin, C., Peng, H. and Zhou, Q. (2006), A Study on Piecewise Polynomial Smooth
Approximation to the Plus Function,In proceedings of the ICARCV.
Lee, Y.J., and Mangasarian, O.L. (2001), A Smooth Support Vector Machine, Jurnal of
Computational Optimization and applications 20:5-22.
Mangasarian, O.L., and Musicant, D.R. (1999), Succesive overrelaxation for support vector
machines, IEEE Transactions on Neural Network, 10, hal. 1032 – 1037.
Metz, C.E. (2006), Receiver Operating Characteristic Analysis: A Tool for the Quantative
Evolution of Observer Performance and Imaging Systems, Journal of Amerian College of
Radiology, Vol.3, hal. 413 – 422.
Purnami, S.W., and Embong, A. (2008b), Smooth Support Vector Machine for breast cancer
classification, The 4th IMT-GT 2008 Conference of Mathematics, Statistics and Its
Application (ICMSA 2008), Banda Aceh, Indonesia.
Purnami, S.W., Embong, A., Zain, J.M., and Rahayu, S.P. (2009), A Comparison of Smoothing
Function In Smooth Support Vector Machine, will be presented in International
Conference on Software Engineering & Computer Systems.
Purnami, S.W., Embong, A., and Zain, J.M. (2009), Application of data mining technique using
best polynomial smoot support vector machine in breast cancer diagnosis, International
Conference in Robotic, Vision, Signal Symposisum and Power Application (Rovsip 2009)
Langkawi Kedah, Malaysia.
Vapnik, V. (1995), The Nature of Statistical Learning Theory, Springer-Verlag, New York

Wu, Q., andWenqing, W. (2013), Piecewise-Smooth Support Vector Machine for Clasification,
Hindawi Publishing Corporation Matematical Problems in Engineerin, Volume 2013,
Article ID 135149.
Yuan, Y., and Huang, T. (2005), A Polynomial Smooth Support Vector Machine for
Classification, Springer-Verlag, Berlin Heidelberg, LNAI 3584: 157-164.
Yuan, Y., Yan J., and Xu, C. (2005), Polynomial Smooth Support Vector Machine (PSSVM),
Chinese Journal of Computers, 28: 9-17.
Yuan, Y., Fan, W., and Pu, D. (2007), Spline Function Smooth Support Vector Machine For
Clasification, Journal of Industrial and Management Optimization 3(3): 529 – 542.

ANALISIS KETEPATAN KLASIFIKASI STATUS KETERTINGGALAN DESA

DENGAN PENDEKATAN REDUCE SUPPORT VECTOR MACHINE (RSVM) DI
PROVINSI JAWA TIMUR
Herlina Prasetyowati Sambodo1), Santi Wulan Purnami2), Santi Puteri Rahayu3)

1, 2, 3 Program Pascasarjana Jurusan Statistik Fakultas MIPA ITS
Jl. Keputih Sukolilo Surabaya, 60111
e-mail: shadewha1@yahoo.com, santipurnami@yahoo.com, sprahayu@gmail.com
Abstract
Kemiskinan merupakan salah satu masalah serius yang dihadapi oleh bangsa ini.
Pelaksanaan program pengentasan kemiskinan secara langsung diimplementasikan dengan
perumusan beberapa program yang ditujukan untuk membantu kantong-kantong (wilayah)
kemiskinan dengan sasaran wilayah merujuk kepada identifikasi desa tertinggal. Oleh
karena itu identifikasi mengenai status ketertinggalan desa yang tepat sangat diperlukan
terlebih jika itu berhubungan dengan masalah yang cukup krusial seperti perencanaan
program pembangunan dan bantuan dana untuk pembangunan. Beberapa penelitian telah
banyak dilakukan untuk melakukan klasifikasi terhadap status ketertinggalan desa. RSVM
adalah metode klasifikasi untuk data yang berukuran besar dengan beberapa keunggulan
seperti waktu pemrosesan yang lebih pendek dan penggunaan memori yang lebih kecil.
Metode tersebut menggunakan fungsi kernel dan teknik K-fold Cross Validation (KCV)
dalam seleksi model dan estimasi error. Penelitian ini akan mengkaji dan membandingkan
penggunaan lebih dari satu fungsi kernel dan mengatur jumlah subset dalam teknik KCV
sehingga mendapatkan estimasi yang tepat dalam pembentukan model terbaik pada
klasifikasi status ketertinggalan desa di Provinsi Jawa Timur.
Keywords: Desa Tertinggal, Klasifikasi, Fungsi Kernel, KCV, RSVM.
PENDAHULUAN
Kemiskinan merupakan salah satu masalah yang dihadapi oleh bangsa ini. Pemerintah
telah berupaya keras untuk terus menekan angka kemiskinan, dengan terus memperbaiki
perencanaan pembangunan dengan tujuan untuk meningkatkan kesejahteraan masyarakat.
Upaya tersebut dapat dilihat melalui lebih dari 50 program penanggulangan kemiskinan yang
terdapat di 21 kementrian dan lembaga negara (Menko Kesra, 2009).
Pelaksanaan program pengentasan kemiskinan secara langsung pada awalnya
diimplementasikan oleh dengan perumusan beberapa program yang ditujukan untuk membantu
kantong-kantong (wilayah) kemiskinan dengan sasaran penduduk miskin. Sasaran wilayah
merujuk kepada identifikasi wilayah-wilayah (desa/kecamatan) miskin/tertinggal. Sejak tahun
2009, pemerintah melalui Tim Koordinasi Penanggulangan Kemiskinan (TKPK) yang
selanjutnya menjadi Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), akan
meningkatkan cakupan serta keterlibatan masyarakat melalui harmonisasi dan sinkronisasi
program penanggulangan kemiskinan agar lebih efektif dan terukur tingkat keberhasilannya
(Menko Kesra, 2009).
Harmonisasi dan sinkronisasi program penanggulangan kemiskinan diimplementasikan
melalui pengelompokan tiga klaster program, yaitu Program Bantuan dan Perlindungan Sosial,
Program Pemberdayaan Masyarakat (PNPM) Mandiri, serta Program Pemberdayaan Usaha

Mikro dan Kecil dengan Kredit Usaha Rakyat (KUR) sebagai salah satu instrumennya (TNP2K,
2012).
PNPM Mandiri merupakan payung dan kerangka kebijakan bagi program-program
penanggulangan kemiskinan berbasis pemberdayaan masyarakat yang merupakan instrumen
untuk mengkoordinasikan seluruh program kemiskinan berbasis pemberdayaan masyarakat pada
semua kementerian dan lembaga (Menko Kesra, 2009). Salah satu ciri program PNPM Mandiri
adalah memberikan Bantuan Langsung Masyarakat (BLM) untuk kegiatan yang dilaksanakan
secara swakelola oleh masyarakat.
Ruang lingkup kegiatan PNPM Mandiri terbuka bagi semua kegiatan penanggulangan
kemiskinan yang diusulkan dan disepakati masyarakat yang diantaranya meliputi penyediaan
prasarana/sarana lingkungan dan infrastruktur pemukiman, sosial dan ekonomi melalui kegiatan
padat karya (TNP2K, 2012). Desa sasaran program dan kegiatan telah ditetapkan oleh
pemerintah melalui Keputusan Menteri Negara Pembangunan Daerah Tertinggal.
Sehubungan dengan penentuan desa sasaran tersebut, Badan Pusat Statistik (BPS)
sebagai penyedia data resmi statistik pemerintahan di Indonesia, memberikan data dasar
sekaligus melakukan identifikasi dan pengelompokan desa tertinggal sebagai pendekatan untuk
mengidentifikasi daerah kantong-kantong kemiskinan.
Penetapan kriteria ketertinggalan selanjutnya dilakukan dengan menggunakan enam
kriteria dasar sesuai kepmen PDT nomor 1 Tahun 2005, yaitu perekonomian masyarakat,
sumber daya manusia, sarana dan prasarana (infrastruktur), kemampuan keuangan lokal (celah
fiskal), aksesbilitas, dan karakteristik daerah (Edy, 2009).
Provinsi Jawa Timur sebagai provinsi dengan jumlah penduduk terbesar kedua di
Indonesia memiliki jumlah desa terbanyak sebesar 8.502 desa. Banyaknya desa tersebut
menyebabkan penentuan status ketertinggalan desa menjadi sangat penting, khususnya apabila
berkaitan dengan perencanaan anggaran dan pengambilan kebijakan.
Provinsi Jawa Timur memiliki jumlah penduduk miskin nomor dua terbesar di
Indonesia pada tahun 2011 yaitu sebesar 5,2 juta jiwa yang sebagian besar terdapat di pedesaan.
3,49 juta jiwa penduduk miskin di Provinsi Jawa Timur berada di pedesaan yang merupakan
jumlah penduduk miskin terbesar di wilayah pedesaan di Indonesia (18,45 persen). Hal tersebut
menunjukkan bahwa kantong kemiskinan di provinsi tersebut terdapat di wilayah sehingga
klasifikasi status ketertinggalan desa yang tepat sangat diperlukan di sini.
Beberapa penelitian yang telah dilakukan mengenai identifikasi desa tertinggal
menggunakan metode seleksi variabel yang diduga menjadi faktor penentu status ketertinggalan
desa. Salah satu metode yang digunakan antara lain Dewi Wahyuningsih (2009) yang
menganalisis karakteristik desa tertinggal dengan Structural Equation Modelling (SEM),
sedangkan Syarif (2008), melakukan pemodelan desa tertinggal di Jawa Barat Tahun 2005
dengan Pendekatan MARS. Penelitian lain mengenai ketertinggalan daerah adalah Evaluasi

Ketertinggalan Daerah Dengan Analisis Diskriminan (Djuraidah, 2009) dan Penggunaan

Geographically Weighted Regression-Kriging untuk Klasifikasi Desa Tertinggal (Dimulyo, S.,
2009).
Terdapat beberapa metode klasifikasi lain yang dapat digunakan untuk menentukan
status ketertinggalan desa adalah diantaranya adalah Support Vector Machine (SVM). SVM
merupakan metode machine learning yang banyak digunakan untuk klasifikasi karena tingkat
akurasi klasifikasi maupun prediksi yang tinggi serta proses komputasi yang relatif singkat.
SVM pertama kali diperkenalkan oleh Vapnik pada tahun 1992 sebagai rangkaian harmonis
konsep-konsep unggulan dalam bidang statistical learning theory. SVM berusaha menemukan
hyperplane terbaik pada input space. Prinsip dasar SVM adalah linier classifier dan selanjutnya
dikembangkan agar dapat bekerja pada problem non linier dengan memasukkan konsep kernel
trick pada ruang kerja berdimensi tinggi (Vapnik and Cortez, 1995). Kelebihan SVM
diantaranya mempunyai error generalisasi yang lebih kecil, dapat digunakan pada data sampel
yang terbatas, memiliki landasan teori yang dapat dianalisa dengan jelas, dan dapat
diimplementasikan dengan mudah (Anto, dkk., 2003).
SVM sulit dipakai dalam problem berskala besar dalam hal ini dimaksudkan dengan
jumlah sampel yang diolah. Dalam kasus ini disarankan digunakan Reduced SVM (RSVM).
RSVM merupakan model yang dengan kernel matriks yang telah disederhanakan yang
diturunkan dari General Support Machine (GSVM) dan Smooth Support Vector Machine
(SSVM) (Lee and Mangasarian, 2001). RSVM disarankan digunakan untuk klasifikasi sampel
dalam jumlah besar yaitu untuk mengatasi kesulitan komputasi sekaligus mengurangi
kompleksitas model (Lee and Huang, 2005). Hal ini sesuai dengan kondisi Provinsi Jawa Timur
yang mempunyai jumlah desa yang cukup besar (8.502 desa), sehingga proses klasifikasi yang
tepat dengan efisiensi waktu pemrosesan dan tingkat kompleksitas model yang rendah sangat
diperlukan.
RSVM menggunakan fungsi kernel yang menunjukkan mapping dari input space
menjadi feature space berdimensi tinggi. Terdapat beberapa fungsi kernel dasar yang sering
digunakan seperti fungsi kernel linier, polynomial, gaussian, dan eksponensial (Hsu, Chang, and
Lin, 2005). Penelitian ini menggunakan beberapa fungsi kernel untuk mendapatkan fungsi
kernel yang menghasilkan tingkat akurasi terbaik dengan metode seleksi parameter Uniform
Design (UD).
K-fold Cross Validation (KCV) merupakan salah satu pendekatan yang sering dipakai
para peneliti dalam seleksi parameter dan estimasi error pada metode klasifikasi (Anguita,
Gelardoni, Ghio, Oneto, and Ridella, 2012). Nilai K dalam KCV yang sering digunakan dalam
metode SVM adalah 5 dan 10. Penelitian sebelumnya menunjukkan bahwa 10-fold CV
merupakan yang paling akurat untuk digunakan dalam SVM (Kohavi, 1995), namun ternyata
nilai k sebesar 3 dan 4 juga memberikan tingkat akurasi yang tinggi (Anguita, et al, 2012). Oleh

karena itu penelitian ini akan menggunakan teknik KCV dengan beberapa nilai k untuk
mendapatkan model berdasarkan KCV yang mempunyai tingkat akurasi tertinggi.
Berdasarkan paparan di atas, permasalahan yang akan diselesaikan melalui penelitian
ini adalah bagaimana ketepatan metode klasifikasi RSVM menggunakan beberapa fungsi kernel
berdasarkan KCV dengan nilai K yang memiliki tingkat akurasi tertinggi
Berdasarkan permasalahan yang telah dirumuskan sebelumnya, tujuan yang ingin
dicapai melalui penelitian ini adalah membandingkan tingkat ketepatan klasifikasi untuk status
ketertinggalan desa di Provinsi Jawa Timur melalui pendekatan RSVM dengan beberapa fungsi
kernel berdasarkan KCV yang memiliki tingkat akurasi tertinggi.
Manfaat yang ingin diperoleh dari hasil penelitian ini adalah memperoleh klasifikasi
yang tepat mengenai status ketertinggalan desa di Provinsi Jawa Timur untuk membantu
perencanaan dan pengambilan keputusan agar lebih efektif dan tepat sasaran dengan
menggunakan machine learning. Selain itu penelitian ini juga diharapkan dapat menambah
wawasan keilmuan dalam menerapkan RSVM dengan menggunakan fungsi kernel dan teknik
KCV sebagai salah satu alternatif metode untuk klasifikasi sampel dalam ukuran besar
khususnya untuk status ketertinggalan desa.
METODE PENELITIAN
Jenis, Waktu dan Tempat Penelitian
Penelitian ini menggunakan pendekatan kuantitatif dengan metode machine learning yaitu
menggunakan Reduce Support Vector Machine (RSVM).
Target/Subjek Penelitian
Penelitian dilakukan terhadap populasi desa di Provinsi Jawa Timur. Sebanyak 8.502
desa di Provinsi Jawa Timur akan diteliti dan dikaji mengenai status ketertinggalan yang
dimiliki.
Data
Data yang digunakan dalam penelitian ini adalah data sekunder yaitu data Potensi Desa
(PODES) dan data Klasifikasi desa/kelurahan tahun 2011. Data merupakan data Populasi yang
dikumpulkan melalui sensus. Data PODES dikumpulkan oleh Badan Pusat Statistik (BPS) yang
pendataannya dilaksanakan pada tahun 2011, sedangkan data klasifikasi desa/kelurahan
merupakan data yang dikeluarkan oleh Dirjen Pemberdayaan Masyarakat Desa (PMD)
Kementrian Dalam Negeri (Kemendagri).
Variabel Penelitian
Variabel yang akan digunakan dalam penelitian ini dipilih berdasarkan referensi dari
penelitian sebelumnya yaitu pada publikasi BPS mengenai identifikasi dan Penentuan Desa
tertinggal 2002, indikator desa tertinggal menurut Kementrian Pembangunan Daerah Tertinggal

(PDT) Tahun 2007 dan Profil Desa dan Kelurahan (2012) menurut Kementrian Dalam Negeri
c.q. Dirjen PMD.
Profil desa dan kelurahan memuat tipologi dan klasifikasi desa dan kelurahan yang
merupakan karakteristik desa dan kelurahan berdasarkan potensi sumber daya alam dan
interaksi dengan kegiatan sosial ekonomi masyarakat (pola nafkah). Tipologi desa dan
kelurahan mempertemukan konsep sumber daya alam, konsep pemberdayaan masyarakat, dan
pola nafkah, dan aspek kewilayahan. Proksi terhadap profil desa dan kelurahan disusun
berdasarkan data Potensi Desa dari Badan Pusat Statistik (BPS) antaralain PODES Tahun
2011.Penelitian dilakukan pada seluruh desa/kelurahan yang ada di Provinsi Jawa Timur yaitu
sebanyak 8.502 desa/kelurahan.
Variabel respon (Y) merupakan variabel yang berisi kelas yang terdiri atas dua kategori
yaitu {+1} untuk desa/kelurahan tertinggal dan {-1} untuk desa/kelurahan tidak tertinggal.
Pengukuran variabel respon didapat Profil Desa dan Kelurahan yang dikeluarkan dari Dirjen
PMD, sedangkan variabel prediktor didapatkan dari hasil pendataan PODES Provinsi Jawa
Timur Tahun 2011 yaitu sebanyak 17 variabel.
Smooth Support Vector Machine (SSVM)
SSVM adalah pengembangan baru dari SVM dengan fungsi kernel dan non linier untuk
analisis klasifikasi menggunakan metode smoothing. SVM pertama kali diperkenalkan oleh
Boser, Guyon dan Vapnik pada tahun 1992 sebagai rangkaian harmonis konsep-konsep
unggulan dalam statistical learning theory. Prinsip dasar SVM adalah linier classifier dan
selanjutnya dikembangkan agar dapat bekerja pada problem non linier dengan memasukkan
konsep kernel trick pada ruang kerja berdimensi tinggi (Vapnik, 1995).
SSVM seperti halnya SVM digunakan untuk klasifikasi dua kategori atau binomial untuk
memisahkan titik-titik yang berasal dari dua kelas yang berbeda misalnya kelas {+1} dan {-1},
dengan hyperplane tunggal pada ruang berdimensi banyak yang membentuk partisi yang
kemudian diselesaikan secara non linier (Vapnik and Cortez, 1995). Margin adalah jarak antara
hyperplane dengan pola terdekat masing-masing class. Pola yang paling dengan ini disebut
support vector.
Program algoritma dari SVM linier standar adalah
1
minve ' y  w ' w
( w ,b , y )R p1n
2
dengan kendala D(Aw  e )  y  e (1)
y0
v : merupakan parameter dalam SVM yang bernilai positif
y : adalah vektor variabel slack berukuran n x 1 yang mengukur kesalahan
klasifikasi dan bernilai nonnegative
e : adalah vektor kolom berukuran n dan bernilai satu
w : adalah vektor normal berukuran p x 1

 : nilai bias yang menentukan lokasi relatif hyperplane
Pemisah kedua kelas yang berbeda tersebut adalah permukaan linier yang berada tepat
di tengah-tengah bidang pemisah yaitu
x'w   (2)
Terdapat dua bidang pemisah yang paralel dengan bidang pemisah di atas yang merupakan
batas kedua kelas yaitu
x ' w    1
(3)
x ' w    1
dengan jarak tertentu yang disebut margin. Margin terbesar dapat ditemukan dengan
1
memaksimalkan nilai jarak antara hyperplane dan titik terdekatnya yaitu . x
w
merupakan vektor yang menyusun ruang riil berdimensi R dan  menentukan lokasi
p
relatif terhadap kelas asli. Pada persamaan tersebut y diminimasi dengan bobot v.
Sehingga bidang yang memisahkan kedua kelas dengan soft margin adalah
x ' w    y i  1, untuk x '  Ai dan Dii  1
x ' w    y i  1, untuk x '  Ai dan Dii  1
(4)
dengan kendala D( Aw  e )  y  e
y0
v
Dalam pendekatan smoothing, y diminimasi dengan bobot , sehingga problem dari
2
SVM yang dimodifikasi menjadi SSVM adalah
v 1
minn1m y'y  (w'w   2 )
( u , , y )R 2 2
dengan kendala D(Aw  e )  y  e (5)
y0
dimana untuk memperoleh solusi dari problem tersebut variabel slack dapat ditulis menjadi
y  (e  D(Aw  e )) (6)
Substitusi y dilakukan sehingga didapatkan problem optimasi SSVM tanpa kendala

dapat ditulis menjadi
v 1
(e - D(Aw - e )) 2  (w'w   2 )
2
min (7)
( w, )Rn1 2 2

dengan fungsi plus didefinisikan sebagai ( x )i  maks{0,x i } untuk i =1,2,...,p . Problem

di atas adalah problem cembung tanpa kendala yang mempunyai solusi unik tapi tidak
mempunyai turunan kedua sehingga memerlukan metode Newton. Problem tersebut di
smoothing dan metode Newton diterapkan, yang kemudian akan menghasilkan problem
nonlinier yang akan dijelaskan kemudian.
Untuk selanjutnya digunakan General Support Vector Machine (GSVM) untuk
membangkitkan bidang pemisah nonlinier dengan menggunakan kernel arbitrary lengkap.
Beberapa jenis fungsi kernel dasar yang biasa dipakai dalam SVM adalah (Gunn, 1998
dan Hsu et al., 2005) sebagai berikut :
1. Linear, dengan fungsi kernel K ( Ai , Aj )  AiT Aj
2. Polynomial, dengan fungsi K ( Ai , Aj )  (  AiT Aj  r )d dimana   0

2
3. Gaussian atau RBF, dengan fungsi K ( Ai , Aj )  exp( Ai  Aj )
2
dimana   0
4. Sigmoid ,dengan fungsi K ( Ai , Aj )  tanh(  AiT Aj  r )
dimana   0
GSVM memecahkan problem matematis untuk kernel umum K ( A, A ') sehingga
min ve'y  f (u)

( w, )R n1
dengan kendala D( K ( A, A')Du - e ) 2  y  e

2
(8)
y0
f (u) adalah fungsi cembung pada R m yang meminimasi parameter u dan v merupakan
bilangan positif yang memboboti error klasifikasi e'y dibandingkan minimasi dari u . Program
solusi untuk u dan  menghasilkan bidang pemisah nonlinier yaitu
K (x', A')Du   (9)
Formulasi linier SSVM didapatkan bila K (A, A ')  AA ' , w = A'Du dan
1
f (u)  u'DAA'Du . Sehingga digunakan tujuan klasifikasi yang berbeda yang meminimasi
2
parameter u dan  dalam persamaan nonlinier
v 1
min2 m1 y'y + (u'u   2 )
( u , , y )R 2 2
dengan kendala D( K ( A, A')Du - e )  y  e (10)
y0
yang dapat ditulis menjadi

y  (e - D( K (A, A')Du - e ) (11)
Sehingga didapatkan SSVM dengan problem optimasi tanpa kendala sebagai berikut :
v 2 1
minm1 (e - D( K ( A, A')Du - e ))   (u'u   2 ) (12)
( u , )R 2 2 2
yang merupakan fungsi objektif mempunyai solusi unik tetapi tidak mempunyai turunan kedua,
dan tidak smooth, oleh karena itu disarankan untuk menerapkan metode Newton dengan teknik
smoothing dan menggantikan x atau fungsi plus dengan p( x,  ) yaitu integral dari fungsi
1
sigmoid neural network sehingga dapat dituliskan menjadi
1    x
1
p( x,  )  x  log(1    x ),   0 (13)

Fungsi p di atas (dengan  sebagai parameter penghalus) digunakan untuk menggantikan fungsi
plus sehingga didapatkan model SSVM yaitu
v 1
p(e - D(Aw - e ),  ) 2  (w'w   2 )
2
minp1 (14)
( w, )R 2 2
Persamaan di atas yang telah dimodifikasi dengan penambahan parameter penghalus
dan dapat diperoleh turunan keduanya sehingga penyelesaian problem tersebut dapat dilakukan
dengan menerapkan algoritma konvergen kuadrat Newton dengan tahapan Armijo atau disebut
Algoritma Newton Armijo yang membuat algoritma tersebut konvergen secara global.
Reduce Support Vector Machine (RSVM)
SVM dengan kernel linier dan non linier menjadi algoritma yang cukup terkenal untuk
klasifikasi. Melalui kernel mapping, bermacam model SVM berhasil dengan efektif dan fleksibel
untuk model non linier. Namun terdapat beberapa keterbatasan yang dimiliki SVM di antaranya
masalah banyaknya waktu dan penyimpanan yang diperlukan untuk memecahkan masalah
pemrograman khususnya untuk data dengan ukuran besar. Kesulitan yang dihadapi dalam
penggunaan kernel non linier pada data berukuran besar secara garis besar ada dua. Pertama
adalah kesulitan komputasi dalam memecahkan problem optimasi tanpa kendala yang besar
yang melibatkan fungsi kernel yang membutuhkan memori sangat besar bahkan sebelum
dimulainya proses pencarian solusi. Kedua adalah kesulitan dalam penggunaan formula untuk
bidang pemisah pada x yang merupakan titik baru yang tidak terlihat. Hal tersebut berarti data
yang berukuran besar memerlukan memori besar dan waktu penghitungan yang lama. Untuk
menangani kesulitan komputasi tersebut, sebagai alternatif, disarankan metode Reduced Support
Vector Machine (RSVM) yang disarankan oleh Lee dan Mangasarian ( 2001).
RSVM diturunkan dari Generalized Support Vector Machine (GSVM) dan Smooth
Support Vector Machine (SSVM) (Lee and Huang, 2005; Purnami, Zain, Heriawan, 2012).

RSVMberangkat dari ide menggunakan bagian kecil (m) dari total dataset (m) yang dipilih
secara random atau acak ( m selalu lebih kecil dibandingkan m ) yang disebut A . Untuk
selanjutnya digunakan A ' untuk menggantikan A ' pada kedua probel optimasi tanpa kendala
untuk mengatasi masalah ukuran matriks dan waktu pemrosesan.
Formulasi RSVM
Dengan menggunakan formulasi untuk data di mana A  R

mxn
dengan kernel square
K ( A, A ')  R mxm dan memodifikasi formulasi berikut untuk data reduced A  Rmxn yang
korespondensi dengan matriks diagonal ( D) dan matriks kernel K ( A, A ')  R

mxn
akan
didapatkan algoritma RSVM yang dipecahkan dengan smoothing. Program kuadratik RSVM
didapatkan dengan mengganti A ' dengan A ' sehingga menjadi
v 1
minm1m y'y  (u'u   2 )
( u , , y )R 2 2
dengan kendala D( K ( A, A')Du - e )  y  e (15)
y0
Data yang diperoleh akan diolah menggunakan metode RSVM dengan menggunakan
software Matlab. Pendekatan machine learning dengan seleksi parameter dilakukan dalam
penelitian ini untuk mendapatkan model terbaik menggunakan Uniform Design (UD) dan K-fold
Cross Validation (KCV). Dalam penelitian ini dilakukan perbandingan penggunaan fungsi
kernel Gaussian dan Linear dengan nilai K sebesar 3,4,5, dan 10 pada KCV untuk mendapatkan
model terbaik. Langkah-langkah dan metodenya adalah sebagai berikut
1. Analisis Deskriptif
2. Memperoleh klasifikasi status ketertinggalan desa/kelurahan di Provinsi Jawa Timur
dengan metode RSVM menggunakan fungsi kernel dan teknik KCV dengan nilai K yang
memiliki tingkat akurasi tertinggi
i. Membangkitkan atau membentuk subset matriks dari elemen full matriks secara
random untuk menggantikan / representasi dari full matriks
ii. Menerapkan fungsi kernel RBF/Gaussian, dan Linear dalam model RSVM
iii. Membuat partisi data dengan KCV dengan nilai k sebesar 3,4,5, dan 10 dalam
mendapatkan parameter untuk membangun model RSVM
iv. Menentukan kombinasi parameter yang paling tepat untuk model fungsi kernel
Gaussian, dan Linear dengan teknik KCV berdasarkan tingkat akurasi tertinggi
v. Membangun model RSVM menggunakan fungsi kernel Gaussian, dan Linear
berdasarkan teknik KCV yang mempunyai tingkat akurasi tertinggi
3. Membandingkan tingkat akurasi ketepatan klasifikasi untuk status ketertinggalan
desa/kelurahan di Provinsi Jawa Timur dengan pendekatan RSVM dengan fungsi kernel

Gaussian, dan Linear berdasarkan teknik KCV dengan nilai K yang mempunyai tingkat
akurasi tertinggi

Data klasifikasi desa menunjukkan dari total 8.502 desa/kelurahan di Provinsi Jawa Timur
pada tahun 2011, sebanyak 4.273 desa/kelurahan (50,26 persen) diklasifikasikan sebagai desa
tertinggal dan sisanya sebanyak 4.229 desa/kelurahan (49,74 persen) termasuk desa tidak
tertinggal. Hal tersebut menunjukkan bahwa separuh desa/kelurahan di Provinsi Jawa Timur
masih tergolong desa tertinggal.
RSVM diterapkan untuk mengklasifikasikan desa/kelurahan tersebut untuk mendapatkan
klasifikasi status ketertinggalan desa. Desa/kelurahan diklasifikasikan ke dalam dua kelas, kelas
+1 untuk desa tertinggal dan kelas -1 untuk desa tidak tertinggal dengan hyperplane tunggal
pada ruang berdimensi banyak yang membentuk partisi yang kemudian diselesaikan secara non
linier dengan memasukkan konsep kernel trick (Vapnik, 1995; Vapnik and Cortez, 1995). Jarak
yang paling optimum antara hyperplane dengan pola terdekat masing-masing kelas disebut
margin.
Penelitian ini ingin membandingkan kernel Linear yang sesuai untuk data dalam jumlah
besar, dan kernel Gaussian/RBF yang dianggap efisien (Hsu, et.al, 2008) untuk klasifikasi status
ketertinggalan desa di Provinsi Jawa Timur dengan metode seleksi parameter UD dan teknik
estimasi error menggunakan KCV. Nilai K yang digunakan dalam penelitian ini adalah 3,4,5,
dan 10, dengan alasan seperti yang telah dijelaskan sebelumnya. Dalam hal ini, ingin didapatkan
model terbaik untuk klasifikasi status ketertinggalan desa di Provinsi Jawa Timur dengan
menggunakan metode RSVM berdasarkan tingkat akurasi tertinggi yang diukur melalui training
error maupun akurasi model.
Tabel 1. Perbandingan Training Error dan Akurasi RSVM
Number of K Kernel Function
Measure
of KCV RBF/Gaussian Linear
Training error 0,36 0,26
3
Akurasi 0,58 0,72
4
Akurasi 0,55 0,74
5
Akurasi 0,60 0,73
10
Akurasi 0,60 0,74

Tabel di atas menunjukkan secara umum, kernel linear memberikan hasil yang lebih
baik dibandingkan dengan kernel RBF, hal tersebut ditunjukkan dengan training error yang
lebih kecil dan tingkat akurasi yang lebih besar.
Apabila dilihat dari teknik KCV, 10-fold CV ternyata memang memberikan hasil yang
paling baik dibandingkan ketiga nilai K yang lain baik dari sisi training error pada kedua fungsi
kernel yaitu berturut-turut sebesar 0,34 persen dan 0,25 persen. Tingkat akurasi pada
penggunaan 10-fold CV juga paling tinggi yaitu sebesar 0,60 persen dan 0,74 persen.
Berdasarkan uraian di atas terlihat bahwa penggunaan fungsi kernel Linear dan 10-fold
CV pada metode RSVM akan memberikan training error terendah dan tingkat akkurasi tertinggi
pada klasifikasi status ketertinggalan desa di Provinsi Jawa Timur.
SIMPULAN DAN SARAN

RSVM adalah salah satu metode yang dapat digunakan untuk mengklasifikasikan data
dalam jumlah besar. Hasil penelitian menunjukkan bahwa penggunaan kedua fungsi kernel
menunjukkan fungsi kernel Linear menunjukkan hasil yang lebih baik dibandingkan fungsi
kernel RBF. Selanjutnya seperti penelitian yang sudah dilakukan sebelumnya (Kohavi, 1995)
10-fold CV adalah teknik terbaik. Berdasarkan hasil tersebut dapat dikatakan bahwa fungsi
kernel Linear dan teknik 10-fold CV merupakan metode terbaik dalam pengklasifikasian status
ketertinggalan desa di Provinsi Jawa Timur.
DAFTAR PUSTAKA
Agresti, A., 1996, An Introduction to Categorical Data Analysis, John Willey and Son, Inc,
United States of America
Andari, S., 2012, Smooth Support Vector Machine dan Multivariate Adaptive Regression
Splines Untuk Mendiagnosis Kanker Payudara, Tesis, Mahasiswa Jurusan Statistika
Fakultas MIPA ITS, Surabaya.
Anguita, D., Gelardoni, L., Ghio, A., Oneto, L., and Ridella, S., (2012), The K in K-fold Cross
Validation, European Symposium on Artificial Neural Networks, Computational
Intelligence and Machine Learning (ESANN 2012) Proceedings, Bruges (Belgium), 25-
27 April 2012 .
Badan Pusat Statistik, 2005, Identifikasi dan Penentuan Desa Tertinggal 2002, Badan Pusat
Statistik, Jakarta.
Badan Pusat Statistik, 2011, Pedoman Pendataan PODES 2011, Badan Pusat Statistik, Jakarta.
Badan Pusat Statistik, 2012, Profil Kemiskinan Indonesia September 2011, Berita Resmi
Statistik No. 06/01/Th. XV, 2 Januari 2012, Badan Pusat Statistik, Jakarta
BAPPENAS, 1993, Panduan Pelaksanaan Program IDT 1994-1999, Jakarta.

Chien, L.J., Chang, C.C. and Lee, Y.J., 2010, Variant methods of reduced set selection for
reduced support vector machines, Journal of Information Science and Engineering, Vol.
26 (1).
Cortes, C. And Vapnik, V., 1995, Support vector networks, Machine Learning, 20, 273-297.
Dimulyo S., 2009, Penggunaan Geographically Weighted Regression-Kriging untuk
Klasifikasi Desa Tertinggal, dalam Seminar Nasional Aplikasi Teknologi Informasi
(SNATI) 2009, Yogyakarta.
Dirjen Pemberdayaan Masyarakat Desa (PMD) Kemendagri, (2012), Profil Desa dan
Kelurahan 2011 : Data Dasar Tipologi, Klasifikasi, Kategori Desa dan Kelurahan
Menurut Provinsi,Dirjen PMD Kemendagri, Jakarta.
Djuraidah, A., 2009, Analisis Status Ketertinggalan Daerah dengan Analisis Diskriminan,
Seminar Nasional Matematika dan Pendidikan Matematika, UNY, Yogyakarta.
Edy, L., 2009, Pencapaian Pembangunan Daerah Tertinggal Lima Tahun Terakhir, Jurnal
Sekretariat Negara, No : 13, Agustus 2009.
Gunn, S., 1998, Support Vector Machines for Clasification and Regression, Technical Report,
ISIS.
Hidayat, S., 2008, Permodelan Desa Tertinggal di Jawa Barat Tahun 2005 dengan Pendekatan
Mars, Tesis Mahasiswa Jurusan Statistika Fakultas MIPA ITS, Surabaya
Hsu, C.W., Chang, C. C., & Lin, C. J., 2008. A practical guide to Support Vector Classification,
Taipe: Information Engineering National Taiwan University.
Huang, C.M., Lee, Y.J., Lin, D.K.J. and Huang, S.Y., 2007, “Model selection for support
vector machines via uniform design”, A Special issue on Machine Learning and Robust
DataMining of Computational Statisticsand Data Analysis, Vol. 52, pp. 335-346.
Kementrian Pembangunan Daerah Tertinggal, 2011, Indikator Primer Daerah Tertinggal Tahun
2011, KPDT : kpdt.bps.go.id/index.php?AnalisisData/ analisa1#, Jakarta (diakses 5 Juli
2013).
Kohavi, R., 1995, A study of cross-validation and bootstrap for accuracy estimation and model
selection. InInternational joint Conference on artificial intelligence, volume 14, pages
1137–1145, 1995.
Lee, Y. J., 2001, Support vector machines in data mining, PhD thesis, University of Wisconsin-
Madison, USA.
Lee, Y.J., & Mangasarian, O.L., 2001, A Smooth Support Vector Machine, Jurnal of
Computational Optimization and applications 20:5-22.
Lee, Y.J., & Mangasarian, O.L., 2001 “RSVM: Reduced Support Vector Machines”, In
Proceedings of the First SIAM International Conference on Data Mining.
Lee, Y.J. and Huang, S.Y., 2007, “Reduced Support Vector Machines: A Statistical Theory”,
IEEE Trans.Neural Network, Vol.18, no. 1.

Lin, K.M and Lin, C.J., 2003, “A study on reduced supportvector machines”, IEEE
Trans.Neural Network, Vol.14,no.6, pp.1449-1459.
Menteri Negara Pembangunan Daerah Tertinggal Republik Indonesia, 2005, Strategi Nasional
Pembangunan Daerah Tertinggal, Kementerian Negara Pembangunan Daerah Tertinggal
Republik Indonesia, Jakarta
Menteri Koordinator Kesejahteraan Masyarakat, 2009, Membangun Kesejahteraan dan
Kemandirian Bangsa, Kemenkesra
http://www.setneg.go.id/index.php?option=com_content&task=view&id=2263&Itemid=
219 (diakses tanggal 24 Agustus 2013).
Mubyarto, 1994, Keswadayaan Masyarakat Desa Tertinggal, Aditya Media,
Yogyakarta.
Narayan, D., Patel, R., Schafft, K., Rademacher, A., Schulte, S.K, 1999, Can Anyone Hear Us?
Voice From 47 Countries. Poverty Group, PREM. World Banks.
Nugroho, A.S., Witarto, A.A., Handoko, Dwi, Support Vector Machine : Teori dan Aplikasinya
dalam Bioinformatika, http://ilmukomputer.com (diakses 4 Juli 2013).
Purnami, S.W., Zain, J.M., Heriawan, T., (2011), An alternative algorithm for classification
large categorical dataset: k-mode clustering reduced support vector machine.
International Journal of Database Theory and Application Vol. 4, No. 1, March 2011.
Putra, A.S., 2013, Daerah Tertinggal, Perdesaan Swadaya/Tertinggal dan Kecamatan Tertinggal,
http://opentrade2222.blogspot.com/2013/05/daerah-tertinggal-perdesaan.html (diakses
tanggal 24 Agustus 2013).
Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Buku Saku PNPM
Mandiri, TNP2K, Jakarta.
Tim Nasional Percepatan Penanggulangan Kemiskinan (TNP2K), 2012, Daftar Indikatif Lokasi
dan Alokasi BLM Program PNPM Mandiri 2012, TNP2K, Jakarta.
Vapnik, V., 1995, The Nature of Statistical Learning Theory, Springer-Verlag, New York.
Wahyuningsih, D., 2009, Analisis Karakteristik Desa Tertinggal dengan Stuctural Equation
Modelling, Tesis Jurusan Statistika Fakultas MIPA ITS, Surabaya.

PERBANDINGAN UJI KENORMALAN

PADA KATEGORI FUNGSI DISTRIBUSI EMPIRIS
MENGGUNAKAN METODE SIMULASI MONTE CARLO
Sugiyanto1, Etik Zukhronah2, dan Sri Sulistijowati H3
1
Sugiy50@yahoo.co.id
2
etikzukhronah@yahoo.co.id
3
ssulistijowati@yahoo.co.id
Abstrak
Uji kenormalan berdasarkan pada kategori fungsi distribusi empiris ada empat yaitu
uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling.
Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya
perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk
dibandingkan. Hasil perbandingan dari uji-uji tersebut menggunakan simulasi Monte
Carlo bahwa uji Anderson-Darling mempunyai kepekaan paling tinggi untuk menolak
ketidaknormalan suatu data.
Kata kunci : uji Kolmogorov-Smirnov, uji Kuiper, uji Cramer-von Mises, uji
Anderson-Darling,Simulasi Monte Carlo.
1. LATAR BELAKANG MASALAH
Asumsi kenormalan diperlukan dalam banyak porsedur statistika. Pemeriksaan asumsi

kenormalan dapat menggunakan metode grafik maupun uji kenormalan. Metode grafik yang
dapat digunakan antara lain quantile-quantile plot (q-q plot), histogram, box-plot, dan diagram
batang dan daun. Namun demikian metode grafik tersebut masih belum cukup untuk
memberikan bukti yang menyakinkan.
Uji kenormalan pada kategori fungsi distribusi empiris menurut Arshad dkk. [4] ada
empat macam yaitu uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-
Darling. Keempat uji tersebut memiliki statistik uji yang berbeda. Hal ini menyebabkan adanya
perbedaan kesimpulan diantara keempat uji tersebut sehingga perlu untuk dibandingkan.
Pernyataan ini dikuatkan oleh Razali dan Wah [4] yang mengatakan bahwa antara uji
kenormalan yang satu dengan yang lain menghasilkan kesimpulan yang berbeda. Beberapa uji
menolak hipotesis nol (H0) sedangkan uji yang lain gagal menolak H0 dengan H0 adalah sampel
acak berasal dari populasi berdistribusi normal.
Conover [2] menyatakan bahwa beberapa uji statistik dapat dibandingkan berdasarkan
kekuatan uji masing-masing. Kekuatan uji yaitu besarnya probabilitas menolak H0 ketika H0
salah. Untuk mengetahui kepekaan uji masing-masing untuk menolak H0ketika H0 salah,
dilakukan metode simulasi Monte Carlo.
Stephens [5] pada tahun 1974 melakukan penelitian mengenai perbandingan uji
kenormalan pada kategori fungsi distribusi empiris menggunakan metode simulasi Monte Carlo
sebanyak 1.000 kali pengulangan dengan ukuran sampel yaitu 10,20 dan 30. Hasil perbandingan
uji-uji tersebut disajikan dalam bentuk tabel persentase menolak H0. Penelitian Stephens
menyimpulkan bahwa uji Cramer-von Mises dan Anderson-Darling sama kuat dalam menguji

kenormalan data.
Selanjutnya, dalam penelitian ini dilakukan pengembangan terhadap hasil penelitian
Stephens yaitu perbandingan menggunakan metode simulasi Monte Carlo dengan 10.000 kali
pengulangan dan ukuran sampel 10, 20,...,100. Hasil perbandingan keempat uji tersebut
disajikan dalam bentuk grafik persentase menolak H0.
2. PEMBAHASAN
2.1 Prosedural. Prosedural merupakan langkah-langkah pengujian hipotesis untuk mengetahui
sampel acak berasal dari populasi berdistribusi normal atau tidak. Berikut langkah-langkah
pengujian hipotesis.
(1) Hipotesis
H0 : sampel acak berasal dari populasi berdistribusi normal
H1 : sampel acak tidak berasal dari populasi berdistribusi normal
(2) Tingkat signifikansi ()
(3) Daerah kritis
H0 ditolak jika statistik uji > nilai kritis.
Nilai kritis bergantung pada  yang diambil.
(4) Statistik uji
Modifikasi statistik Kolmogorov-Smirnov dinyatakan
0,85
𝐷∗ = 𝑛 − 0,01 + 𝐷
𝑛
𝑖 (𝑖−1)
dengan 𝐷 + = max𝑖=1,2,…,𝑛 − 𝑧𝑖 , 𝐷 − = max𝑖=1,2,…,𝑛 𝑧𝑖 − , dan
𝑛 𝑛
𝐷 = max 𝐷 +, 𝐷 −
Dimana 𝐷 adalah statistik Kolmogorov-Smirnov, 𝑛 adalah banyaknya sampel acak dan
(𝑥 𝑖 −𝑥 )
𝑧𝑖 adalah distribusi probabilitas kumulatif normal standar untuk 𝑤𝑖 = dengan 𝑥𝑖
𝑠
merupakan statistik terurut.

Stephens [5] mendefinisikan modifikasi statistik Kuiper 𝑉 ∗ sebagai
0,82
𝑉∗ = 𝑛 + 0,05 + 𝑛
𝑉.
Notasi 𝑉 menunjukkan statistik Kuiper yang nilainya merupakan kombinasi dari

statistik Kolmogorov-Smirnov yaitu 𝐷+ dan 𝐷− sehingga
𝑉 = 𝐷 + + 𝐷 −.
Modifikasi statistik Cramer-von Mises adalah
∗ 0,5
𝑊2 = 1 + 𝑊2
𝑛
1 𝑛 2𝑖−1 2
dengan 𝑊 2 = 12𝑛 + 𝑖=1 𝑧𝑖 − 2𝑛
. Notasi 𝑊 2 merupakan statistik Cramer-von
Mises.
Modifikasi statistik Anderson-Darling ditentukan dengan

∗ 0,75 2,25 2
𝐴2 = 1 + + 2 𝐴
𝑛 𝑛
1 𝑛
dengan 𝐴2 = −𝑛 − 𝑛 𝑖=1 2𝑖 − 1 ln 𝑧𝑖 + ln(1 − 𝑧𝑛+1−𝑖 ) .
Notasi 𝐴2 adalah statistik Anderson-Darling.

(5) Kesimpulan
2.2 Simulasi Monte Carlo untuk Keempat Uji. Langkah awal dari simulasi ini adalah
membangkitkan bilangan acak dari distribusi eksponensial, chi-kuadrat, gamma, beta, dan
uniform. Bilangan acak yang dibangkitkan tersebut dipandang sebagai sampel acak.
2.2.1 Sampel Berdistribusi Eksponensial. Pada simulasi pertama, sampel dibangkitkan dari
distribusi eksponensial dengan parameter 𝜃 = 7. Hasil simulasi disajikan dalam grafik
persentase menolak H0 dengan bervariasi ukuran sampel yang tampak dalam Gambar 1. Gambar
1 menunjukkan semakin besar ukuran sampel, persentase menolak H0 untuk keempat uji
tersebut juga semakin besar.
100
90
80
Persentase menolak H0
70
60
50
Kolmogorov-Smirnov
40 Kuiper
Cramer-von Mises
Anderson-Darling
30
10 20 30 40 50 60 70 80 90 100
n
Gambar 1. Persentase menolak H0 dari sampel berdistribusi eksponensial dengan parameter

𝜃 = 7 untuk 𝑛 = 10,20, … ,100
Uji Anderson-Darling memiliki persentase menolak H0 yang lebih besar dari uji Kuiper
dan Cramer-von Mises. Namun, perbedaan persentase menolak H0 untuk ketiga uji tersebut
tidak signifikan sehingga dianggap memiliki kepekaan yang sama. Sedangkan uji Kolmogorov-
Smirnov memiliki persentase menolak H0 yang paling kecil diantara ketiga uji tersebut. Tetapi
mulai 𝑛 = 50, uji Kolmogorov-Smirnov sudah memiliki kepekaan yang sama dengan ketiga
uji yang lain. Ini artinya keempat uji tersebut sama kuat dalam menguji kenormalan sehingga
dapat memberikan kesimpulan yang sama.

2.2.2 Sampel Berdistribusi Chi-Kuadrat. Simulasi kedua ini, sampel yang dibangkitkan
berasal dari distribusi chi-kuadrat dengan derajat bebas 𝜐 = 3. Hasil simulasi disajikan dalam
grafik persentase menolak H0 dengan 𝑛 = 10,20, … ,100 yang tampak dalam Gambar 2. Pada
Gambar 2, menunjukkan bahwa hasil simulasi kedua ini hampir sama dengan hasil simulasi
yang pertama. Ketika sampel dibangkitkan dari distribusi chi-kuadrat dengan ukuran sampel
semakin besar, persentase menolak H0 untuk keempat uji tersebut juga semakin besar.
100
90
80
70
60
50
40
Kolmogorov-Smirnov
Kuiper
30
Cramer-von Mises
Anderson-Darling
20
10 20 30 40 50 60 70 80 90 100
n
Gambar 2. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi chi-

kuadrat dengan derajat bebas 𝜐 = 3
Persentase penolakan H0 untuk uji Anderson-Darling lebih besar dibandingkan dengan

uji Cramer-von Mises tetapi selisihnya tidak signifikan sehingga kedua uji tersebut dikatakan
memiliki kepekaan yang sama. Ini berarti uji Cramer-von Mises dan Anderson-Darling sama-
sama kuat untuk menguji kenormalan.
Sebaliknya, uji Kolmogorov-Smirnov memiliki persentase penolakan H0 yang paling
kecil diantara keempat uji tersebut. Uji Kuiper, Cramer-von Mises, dan Anderson-Darling
memiliki kepekaan yang sama pada saat ukuran sampel mendekati 60. Sedangkan, ketika
ukuran sampel mendekati 80, uji Kolmogorov-Smirnov dapat dikatakan mempunyai kepekaan
yang sama seperti ketiga uji yang lain.
2.2.3 Sampel Berdistribusi Gamma. Pada simulasi ketiga ini, sampel yang digunakan
dibangkitkan dari distribusi gamma dengan parameter 𝜃 = 3 dan 𝜅 = 5. Hasil simulasi
ditunjukkan dengan grafik persentase penolakan H0 yang tampak dalam Gambar 3. Pada gambar
tersebut tampak bahwa hasil simulasi ini memberikan gambaran yang berbeda dengan hasil
simulasi yang sebelumnya. Namun, hasil simulasi ini juga menunjukkan bahwa jika ukuran
sampelnya semakin besar maka persentase penolakan H0 untuk keempat uji tersebut juga
semakin besar.

100
90
Persentase menolak H0 80
70
60
50
40
30 Kolmogorov-Smirnov
Kuiper
20 Cramer-von Mises
Anderson-Darling
10
10 20 30 40 50 60 70 80 90 100
n
Gambar 3. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi gamma

dengan parameter 𝜃 = 3 dan 𝜅 = 5
Uji Kolmogorov-Smirnov dan Kuiper memiliki persentase penolakan H0 hampir sama

dan lebih kecil dari uji Cramer-von Mises dan Anderson-Darling. Hal ini menunjukkan uji
Kolmogorov-Smirnov dan Kuiper memiliki kepekaan yang sama untuk menolak H0 ketika H0
salah.
Sebaliknya, uji Cramer-von Mises dan Anderson-Darling mempunyai selisih persentase
penolakan H0 yang tidak signifikan sehingga kedua uji tersebut dianggap memiliki kepekaan
yang sama. Hal ini berarti apabila sampel berasal dari distribusi gamma, baik uji Cramer-von
Mises maupun uji Anderson-Darling akan sama-sama kuat dalam menguji kenormalan sehingga
keduanya dapat memberikan kesimpulan yang sama.
2.2.4 Sampel Berdistribusi Beta. Hasil simulasi keempat tampak pada Gambar 4, yang
mana sampel dibangkitkan dari distribusi beta dengan parameter a = 3 dan b = 1. Dari gambar
tersebut, uji Anderson-Darling yang memiliki persentase menolak H0 paling besar daripada
ketiga uji yang lain. Namun, ketika ukuran sampel sebesar 100, persentase menolak H0 untuk
keempat uji tersebut hampir sama dan selisihnya tidak signifikan. Oleh karena itu, keempat uji
tersebut dapat dianggap memiliki kepekaan yang sama untuk menolak H0 ketika H0 salah
sehingga sama kuat dalam menguji kenormalan dan dapat menghasilkan kesimpulan yang sama
pula.

100
90
80
70
60
50
40
Kuiper
20 Cramer-von Mises
Anderson-Darling
10
10 20 30 40 50 60 70 80 90 100
n
Gambar 4. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi beta

dengan parameter a = 3 dan b = 1
2.2.5 Sampel Berdistribusi Uniform. Hasil simulasi kelima disajikan dalam Gambar 5. Pada
simulasi kelima ini, sampel yang dibangkitkan berasal dari distribusi uniform dengan interval a
=-3 dan b =3. Dari gambar tersebut, ketika ukuran sampel diambil kecil, dalam hal ini n = 10
tampak bahwa uji Kolmogorov-Smirnov, Kuiper, Cramer-von Mises, dan Anderson-Darling
dapat memberikan kesimpulan yang sama. Hal ini karena keempat uji tersebut memiliki
perbedaan persentase menolak H0 yang tidak signifikan. Tetapi, ketika ukuran sampel diambil
besar, yaitu 100, terlihat bahwa uji Anderson-Darling memiliki persentase menolak H0 yang
paling besar diantara keempat uji tersebut sedangkan uji Kolmogrov-Smirnov mempunyai
persentase menolak H0 yang paling kecil. Selain itu, tampak bahwa uji Kuiper dan Cramer-von
Mises memiliki selisih persentase menolak H0 yang tidak signifikan sehingga kepekaan kedua
uji tersebut sama. Dengan demikian, Gambar 5 menunjukkan bahwa semakin besar sampel yang
diambil, uji Anderson-Darling akan semakin kuat untuk menolak H0 ketika H0 salah.
100
90
80
70
60
50
40
30
Kuiper
10 Cramer-von Mises
Anderson-Darling
0
10 20 30 40 50 60 70 80 90 100
n

Gambar 5. Persentase menolak H0 untuk 𝑛 = 10,20, … ,100dari sampel berdistribusi uniform

dengan interval a =-3 dan b =3
3. KESIMPULAN
Berdasarkan hasil simulasi Monte Carlo, diperoleh kesimpulan bahwa uji Anderson-
Darling memiliki kepekaan tertinggi untuk menguji ketidaknormalan suatu data. Sebaliknya, uji
Kolmogorov-Smirnov merupakan uji yang paling lemah dalam menguji ketidaknormalan suatu
data.
DAFTAR PUSTAKA
[1] Arshad, M., M. T. Rsool and M. I. Ahmad, Anderson darling and modified anderson darling
test for generalized pareto distribution, Pakistan Journal of Applied Sciences 3 (2003), no.
2, 85-88.
[2] Conover, W. J., Practical nonparametric statistics, Third Edition, John Wiley and Sons, Inc,
1999.
[3] Daniel, W. W., Statistika nonparametrik terapan, Gramedia, Jakarta, 1989.
[4] Razali, N. M. and Y. B. Wah, Power comparisons of shapiro-wilk, kolmogorov-smrinov,
liliefors, and anderson-darling tests, Journal of Statistical Modelling and Analytics 2
(2011), 21-33.
[5] Stephens, M. A., Edf statistics for goodness of _t and some comparisons, Journal of the
American Statistical Association 69 (1974), 730-737.

DETEKSI POLA PENYEBARAN DEMAM BERDARAH DENGUE DI

KOTA SURAKARTA MENGGUNAKAN
INDEKS MORAN
Etik Zukhronah1, Sugiyanto2, Respatiwulan3

Jurusan Matematika FMIPA UNS
1
etikzukhronah@yahoo.co.id,2sugiyanto@yahoo.
co.id, 3resditra06@yahoo.com
Abstrak
Penyakit demam berdarah dengue disebabkan oleh virus dengue yang disebarkan
oleh nyamuk Aedes Aegypti. Sebagian besar kelurahan di Kota Surakarta merupakan
daerah endemis demam berdarah. Penelitian ini bertujuan untuk mendeteksi pola
penyebaran penyakit demam berdarah secara spasial di Kota Surakarta menggunakan
Indeks Moran. Data diambil dari Dinas Kesehatan Surakarta pada tahun 2012. Hasil
penelitian menunjukkan bahwa terdapat autokorelasi spasial dalam penyebaran
penyakit demam berdarah di Kota Surakarta dan kejadiannya berpola clustered.
Kata kunci: demam berdarah dengue, indeks Moran
PENDAHULUAN
Demam berdarah dengue atau dalam istilah kedokteran Dengue Hemorrhagik Fever
(DHF) adalah suatu penyakit yang disebabkan oleh infeksi virus Dengue dan ditularkan melalui
gigitan nyamuk Aedes Aegypti betina dan beberapa spesies Aedes lainnya. Populasi nyamuk ini
akan meningkat pesat pada saat musim hujan. Namun nyamuk Aedes Aegypti juga dapat hidup
dan berkembang biak pada bak-bak penampungan air sepanjang tahun
(http://www.blogdokter.net).
Demam berdarah banyak ditemukan di daerah tropis dan subtropis. Asia menempati
urutan pertama dalam jumlah penderita demam Dengue setiap tahun.
(http://www.blogdokter.net). Kasus demam berdarah di Indonesia tercatat masih tinggi bahkan
paling tinggi dibanding Negara lain di ASEAN (http://health.detik.com).
Sebagian besar kecamatan di Kota Surakarta, Jawa Tengah merupakan daerah endemis
demam berdarah dengan jumlah penderita hampir meningkat setiap tahunnya.
(http://www.mediaindonesia.com). Dari 51 kelurahan yang ada, terdapat 40 kelurahan yang
merupakan daerah endemis dengan jumlah penderita 826 orang dan 12 orang diantaranya
meninggal pada tahun 2008 (Dinas Kesehatan Kota Surakarta, 2009). Terdapat 46 kelurahan
yang merupakan daerah endemis pada tahun 2009 dengan jumlah penderita 684 orang dan 7
diantaranya meninggal ( Dinas Kesehatan Kota Surakarta, 2010). Sedangkan pada tahun
2010 terdapat 49 kelurahan yang merupakan daerah endemis dengan jumlah penderita 533
orang dan 9 diantaranya meninggal (Dinas Kesehatan Kota Surakarta, 2011)
Melihat tingginya angka kasus DBD di Kota Surakarta, maka perlu dilakukan penelitian
yang berhubungan dengan komponen ruang guna menentukan pola epidemi kasus demam

berdarah. Epidemi demam berdarah bervariasi dari satu tempat ke tempat lain, sehingga
komponen ruang juga harus diperhatikan. Autokorelasi spasial merupakan teknik untuk
mengukur tingkat hubungan dalam data yang dipengaruhi oleh keadaan geografis (data spasial)
(Griffith, 2003). Data spasial (ruang) merupakan suatu data yang dipengaruhi oleh ruang
ataupun posisi relatif suatu objek yang diamati (Anselin, 1992).
Untuk mengukur hubungan spasial antar daerah dapat digunakan indeks global dan
indeks local (Wen etal. 2010). Indeks Moran merupakan indeks global yang digunakan
untuk mengukur adanya hubungan spasial dalam penyebaran penyakit. Hubungan spasial ini
diperlukan untuk mengetahui apakah terdapat autokorelasi spasial dalam penyebaran penyakit
demam berdarah yang terjadi di Kota Surakarta.
Penelitian yang berkaitan dengan penyebaran penyakit demam berdarah telah
dilakukan oleh Nakhapakorn dan Supet (2006), kemudian oleh Astutik et al. (2011).
Nakhapakorn dan Supet (2006) meneliti tentang distribusi spasial kasus demam berdarah
yang terjadi di Thailand. Dalam penelitiannya, ia menggunakan indeks Moran, Geary dan
LISA untuk mengukur hubungan spasial antar daerah. Sedangkan Astutik et al. (2011)
mendeteksi hubungan spasial temporal kasus demam berdarah yang terjadi di provinsi Jawa
Timur menggunakan multivariat Moran dan multivariat LISA. Berdasarkan penelitian yang
telah dilakukan oleh Nakhapakorn dan Supet (2006), dan Astutik et al.(2011), maka kasus
kejadian DBD di Kota Surakarta dapat dianalisis secara spasial.
METODE PENELITIAN
Data Penelitian
Data yang digunakan dalam penelitian ini adalah data jumlah penderita DBD di
Surakarta tahun 2012 yang meliputi 51 kelurahan yang berada di 5 kecamatan.Data tersebut
diambil dari di Dinas Kesehatan Kota Surakarta. Data dianalisis menggunakan bantuan software
OpenGeoda dengan melakukan input data ke file shp (shape file) daerah Surakarta.
Metode Analisis Data

1. Langkah awal dalam analisis spasial temporal adalah menyusun matriks pembobotan 𝑊
yang elemen-elemennya 𝑤𝑖𝑗 merupakan spatial weight measure untuk daerah yang
berbatasan. Jika daerah i berbatasan dengan daerah j maka dinotasikan 1 dan jika tidak
berbatasan maka dinotasikan 0.
2. Langkah selanjutnya adalah menghitung nilai indeks Moran dari data jumlah penderita
tiap-tiap kelurahan. Indeks Moran dihitung dengan menggunakan rumus
𝑛 𝑛𝑖=1 𝑛𝑗=1 𝑤 𝑖𝑗 𝑥 𝑖 −𝑥 𝑥 𝑗 −𝑥
𝐼= 𝑊 𝑛𝑖=1 𝑥 𝑖 −𝑥 2
.................................... (1)
dengan

𝑛 𝑛
𝑊= 𝑖=1 𝑗 =1 𝑤𝑖𝑗
𝐼 menyatakan indeks Moran,

n menyatakan banyak lokasi kejadian,
𝑥𝑖 menyatakan jumlah penderita demam berdarah pada daerah i,
𝑥𝑗 menyatakan jumlah penderita demam berdarah pada daerah j,
𝑥 menyatakan rata rata dari jumlah penderita demam berdarah,
𝑤𝑖𝑗 menyatakan elemen pada bobot matriks antara daerah 𝑖 dan 𝑗,
W menyatakan jumlah darisemua nilaiselpada bobot matriks
Menurut Pfeiffer et al. (2008), nilai-nilai yang dihasilkan dalam perhitungan indeks
Moran adalah dalam range berkisar antara -1 <I < 1, dengan I merupakan autokorelasi
spasial berdasarkan indeks Moran. Indeks Moran digunakan untuk menentukan apakah
terdapat hubungan spasial yang mempengaruhi terhadap penyebaran penyakit DBD
dengan menentukan adanya autokorelasi spasial atau tidak.
3. Setelah diperoleh indeks Moran, dilakukan uji signifikansi untuk mengetahui apakah
terdapat autokorelasi spasial dalam penyebaran DBD. Uji signifikansi dapat dilakukan
dengan menggunakan p-value yang ada pada output OpenGeoda dan membandingkannya
dengan tingkat signifikansi α = 0,05.
4. Pola penyebaran penyakit DBD di Kota Surakarta dapat ditunjukkan dengan
membandingkan nilai indeks Moran terhadap nilai E I = −1/(n − 1) . Jika nilai indeks
Moran lebih kecil dari E I maka autokorelasi spasial negatif dan jika lebih besar E I
maka autokorelasi spasial positif. Bila autokorelasi spasial positif berarti kelurahan yang
mempunyai jumlah penderita DBD yang tinggi terletak berdekatan dengan kelurahan
yang mempunyai jumlah penderita DBD yang tinggi juga, dan kelurahan yang memiliki
jumlah penderita DBD yang rendah berdekatan dengan kelurahan yang memiliki jumlah
penderita DBD yang rendah.
HASIL DAN PEMBAHASAN

Indeks Moran dihitung menggunakan persamaan 1. Misalkan x1 menyatakan jumlah
penderita demam berdarah di kelurahan Nusukan untuk i=1, xj menyatakan jumlah penderita
demam berdarah di kelurahan j dengan j berjalan dari 1, 2, ..., 51dalam hal ini j menyatakan
kelurahan yang ada di Kota Surakarta. Dengan menggunakan cara yang sama untuk pemilihan i
yang lain. Penghitungan indeks Moran menggunakan bantuan software OpenGeoda dan
diperoleh nilai sebesar 0,123 dengan p value sebesar 0,041. Diperoleh nilai p value kurang dari
α=5%, sehingga dapat disimpulkan bahwa terdapat hubungan spasial yang mempengaruhi
penyebaran penyakit demam berdarah di Kota Surakarta.

Selanjutnya membandingkan nilai indeks Moran dengan nilai E[I] untuk mengetahui
1
pola penyebaran penyakit demam berdarah. Nilai 𝐸 𝐼 = − 𝑛−1 = −0,02 dengan n merupakan
jumlah kelurahan yang ada di Kota Surakarta sebanyak 51 kelurahan. Jika nilai indeks Moran
kurang dari -0,02, maka terdapat autokorelasi spasial negatif dan jika nilai indeks Moran lebih
dari -0,02, maka terdapat autokorelasi spasial positif. Ternyata nilai indeks Moran yang
diperoleh lebih besar dari -0,02, sehingga dapat disimpulkan bahwa terdapat autokorelasi spasial
positif dengan pola penyebaran Clustered. Gambar 1 merupakan Moran scatterplot dan nilai
indeks Moran hasil outputOpenGeoda 9.15.
Gambar 1a. Moran Scatterplot tahun2012
Gambar 1b. Indeks Moran tahun 2012

Pada Gambar 1a. terlihat garis ungu yang menggambarkan indeks Moran miring dari
bawah sebelah kiri ke atas sebelah kanan yang menunjukkan autokorelasi spasial positif dan
pada Gambar 1b. terlihat bahwa indeks Moran berada di sebelah kanan rata-rata. Hal ini

menunjukkan bahwa daerah yang mempunyai jumlah penderita demam berdarah tinggi
berdekatan dengan daerah yang mempunyai jumlah penderita demam berdarah tinggi dan
daerah yang mempunyai jumlah penderita demam berdarah rendah berdekatan dengan daerah
yang mempunyai jumlah penderita demam berdarah rendah.
KESIMPULAN
Berdasarkan hasil analisis menggunakan bantuan Software OpenGeoda diperoleh nilai indeks
Moran yang signifikan, yang berarti bahwa pada tahun 2012 terdapat hubungan spasial yang
mempengaruhi penyebaran penyakit demam berdarah dengan pola penyebaran bersifat
clustered.
DAFTAR PUSTAKA
Anselin, L. (1992). Spatial Data Analysis with GIS : An Introduction to Aplicationin the Social
Sciences. National Center for Geographic Information and Analysis of California
Santa Barbara, CA93106.
________. (1995). Local Indicator of Spatial Association. Geographical Analysis27: 93-115.
Astutik, S , B. Rahayudi, A. Iskandar, R. Fitriani, and S. Murtini. (2011). Detection of
Spatial –Temporal Autocorrelation using Multivariate Moran and LISA Method on
Dengue Haemorrhagic Fever (DHF) Incidence, East Java, Indonesia. European
Journal of Scientific Research Vol (49:2) page 279-285.
Dinas Kesehatan Kota Surakarta. (2009). Profil Kesehatan Kota Surakarta Tahun 2008.
Surakarta.
________. (2010). Profil Kesehatan Kota Surakarta Tahun 2009. Surakarta.
________. (2011). Profil Kesehatan Kota Surakarta Tahun 2010. Surakarta.
Griffith, D. (2003). Spatial Autocorrelation Concept. Department of Geography. Syracuse
University.
Nakhapakorn, K. and Supet J. (2006). Temporal and Spatial Autocorrelation Statistics of

Dengue Fever. Dengue Buletin, Vol. 30, pp: 177-183.
Pfeiffer, D. et al. (2008). Spatial Analysis in Epidemiologi. Oxford University Press. New York.

PENERAPAN FUZZY MODEL TAHANI

UNTUK PEMILIHAN KENDARAAN BERMOTOR RODA DUA
BERDASARKAN KRITERIA LINGUISTIK
Yosep Bungkus F. M.1), Lilik Linawati2), Tundjung Mahatma3)

1)
Mahasiswa Program Studi Matematika FSM UKSW
2),3)
DosenProgram Studi Matematika FSM UKSW
Fakultas Sains dan Matematika, Universitas Kristen Satya Wacana
Jl. Diponegoro 52-60 Salatiga 50711
1)
662010004@student.uksw.edu, 2)lina.utomo@yahoo.com, 3)t.mahatma@staff.uksw.edu
Abstrak
Dalam makalah ini diterapkan pemodelan data fuzzy Model Tahani untuk membantu
merekomendasikan pemilihan kendaraan bermotor roda dua dengan kriteria linguistik
terhadap data kendaraan yang memiliki spesifikasi secara pasti. Dengan menggunakan
model ini dihasilkan nilai fire strength yang menjadi dasar pembuatan rekomendasi. Tiga
kemungkinan rekomendasi yang dihasilkan yakni: tidak terdapat hasil rekomendasi,
terdapat satu hasil rekomendasi dan terdapat lebih dari satu rekomendasi kendaraan
bermotor. Ketiga kemungkinan rekomendasi ini dihasilkan berdasar pada nilai fire strength
yang diperoleh menurut kriteria linguistik tertentu.
Kata kunci : Himpunan Fuzzy, Model Tahani, Kriteria Linguistik.
PENDAHULUAN
Dalam kegiatan jual-beli suatu barang atau jasa, merepresentasi kebutuhan pelanggan
merupakan salah satu faktor penting, dimana pembeli memiliki kriteria akan barang atau jasa
yang diinginkannya. Dalam kehidupan sehari-hari kriteria yang dikemukakan pembeli sering
kali bersifat ambigu dikarenakan setiap individu pembeli memiliki persepsi yang berbeda,
sebagai contoh kriteria harga adalah mahal, murah. Kriteria seperti ini disebut sebagai kriteria
linguistik. Pada kenyataannya kriteria suatu barang biasanya dinyatakan secara pasti atau
deterministik, misalnya harga sebesar tiga belas juta rupiah. Dalam hal ini proses pengambilan
keputusan akan sulit jika seseorang menyebutkan kriteria-kriteria dalam bentuk linguistik.
Data dalam bentuk kualitatif atau linguistik dapat dikelola menggunakan konsep
himpunan fuzzy. Kriteria-kriteria seperti harga, suhu, kecepatan dalam teori himpunan fuzzy
direpresentasikan sebagai variabel fuzzy, yang mana masing-masing variabel fuzzy dinyatakan
dalam beberapa himpunan fuzzy sesuai dengan domain yang ditentukan berdasarkan data crisp.
Sebagai contoh variabel fuzzy harga dikaitkan pada himpunan fuzzy murah, sedang dan mahal
dengan batas-batas domain tertentu.
Bila terdapat beberapa kriteria linguistik dan dimiliki data spesifikasi barang dalam
bentuk crisp, maka untuk menentukan barang yang sesuai kriteria linguistik yang ditentukan,
dapat menggunakan metode pengambilan inferensi yang didasarkan pada pemodelan data fuzzy
Model Tahani. Beberapa penerapan fuzzy Model Tahani yaitu dalam pengambilan keputusan

pembelian mobil (Eliyani, 2009) dan pengambilan keputusan pembelian handphone (Amalia,
2010).
Dalam penelitian ini dikaji bagaimana menentukan rekomendasi pemilihan suatu barang
berdasarkan kriteria linguistik terhadap sejumlah barang yang memiliki spesifikasi pasti, dalam
hal ini adalah kendaraan bermotor roda dua. Seperti diketahui bahwa terdapat banyak sekali
merk dan tipe kendaraan bermotor roda dua, yang mana masing-masing mempunyai spesifikasi
berbeda. Dengan menggunakan fuzzy Model Tahani diharapkan dapat dihasilkan suatu
keputusan atau rekomendasi jenis kendaraan yang sesuai dengan kriteria linguistik yang
ditentukan.
METODE PENELITIAN
Penelitian ini merupakan penerapan fuzzy Model Tahani untuk pemilihan kendaraan
bermotor roda dua berdasarkan kriteria linguistik yang dinyatakan sebagai variabel fuzzy dan
dikaitkan dengan himpunan fuzzy yang sesuai, didasarkan pada spesifikasi data berbagai
kendaraan bermotor roda dua yang diperoleh dari internet yang diakses pada tanggal 10
September 2013.
Landasan teori yang akan digunakan sebagai dasar pengkajian akan dipaparkan secara
singkat yaitu tentang himpunan fuzzy dan fuzzy Model Tahani.
Himpunan Fuzzy
Himpunan crisp memiliki definisi secara tegas, artinya bahwa setiap elemen dalam
himpunannya selalu dapat ditentukan secara tegas apakah ia merupakan anggota dari himpunan
atau tidak. Pada kenyataanya tidak semua himpunan terdefinisi secara tegas, misalnya himpunan
kendaraan murah. Pada himpunan kendaraan murah kita tidak dapat menyatakan secara tegas
apakah kendaraan itu murah atau tidak, sebagai contoh didefinisikan kendaraan murah memiliki
harga kurang dari atau sama dengan Rp 13.000.000,- maka kendaraan dengan harga Rp
13.150.000,- atau Rp. 15.000.000,- menurut definisi tersebut tidak termasuk kendaraan yang
murah. Namun harga Rp.13.150.000,- dapat dipandang sebagai harga yang masih murah karena
lebih dekat dengan nilai 13 juta dibanding 15 juta ke 13 juta, hal ini menimbulkan kekabur pada
arti murah. Untuk mengatasi hal ini maka Zadeh mengaitkan elemen-elemen pada himpunan
tersebut dengan suatu fungsi yang dapat menyatakan derajat kesesuaian elemen-elemen dalam
semestanya. Pada contoh di atas misalkan kendaraan seharga Rp.13.150.000,- dikaitkan dengan
suatu fungsi dan mempunyai nilai fungsi sebesar 0,2.
Misalkan dimiliki himpunan A yang dikaitkan dengan himpunan fuzzy𝐴, maka secara
matematis himpunan fuzzy 𝐴 dalam semesta X dapat dinyatakan sebagai himpunan pasangan
terurut yang didefinisikan oleh :
𝐴= 𝑥, 𝜇𝐴 𝑥 |𝑥 ∈ 𝑋

Dengan 𝜇𝐴 adalah fungsi keanggotaan yang memetakan x anggota himpunan semesta X

ke selang tertutup [0,1]. Nilai 𝜇𝐴 𝑥 adalah nilai fungsi keanggotaan dari x, yang disebut juga
sebagai derajat keanggotaan (Susilo, 2003).
Terdapat beberapa fungsi keanggotaan dalam himpunan fuzzy, di antaranya adalah:

fungsi keanggotaan linear seperti direpresentasikan pada Gambar 1. dan fungsi keanggotaan
segitiga seperti direpresentasikan pada Gambar 2. (Kusumadewi, 2004). Gambar 1.(a)
merepresentasikan fungsi keanggotaan fuzzylinearnaik danGambar 1.(b) menyatakan fungsi
linear turun.
(a) (b)
Gambar 1. Representasi Fungsi Keanggotaan FuzzyLinear.
Rumus fungsi keanggotaan linear naik dinyatakan seperti pada persamaan (1),
sedangkan fungsi keanggotaan linear turun dinyatakan seperti pada persamaan (2).
0; 𝑥 ≤ 𝑎
𝑥−𝑎
𝜇 𝑥 = 𝑏−𝑎
; 𝑎≤𝑥≤𝑏 (1)
1; 𝑥 ≥ 𝑏
1; 𝑥 ≤ 𝑎
𝑏−𝑥
; 𝑎≤𝑥≤𝑏 (2)
0; 𝑥 ≥ 𝑏

Fungsi segitiga direpresentasikan seperti pada Gambar 2. dengan rumus fungsinya

dinyatakan sebagai persamaan (3). Fungsi keanggotaan fuzzy ini merupakan gabungan dari
fungsi keanggotaan linear naik danfungsi keanggotaan linear turun.
Gambar 2. Representasi Fungsi Keanggotaan Fuzzy Segitiga.
0; 𝑥 ≤ 𝑎 𝑎𝑡𝑎𝑢 𝑥 ≥ 𝑏
𝑥−𝑎
; 𝑎≤𝑥≤𝑏 (3)
𝑐−𝑥
; 𝑏≤𝑥≤𝑐
𝑐−𝑏
Operasi Himpunan Fuzzy

Terdapat tiga operasi dasar untuk mengkombinasikan dan memodifikasi beberapa
himpunan fuzzy yang dikemukakan oleh Zadeh. Operasi tersebut adalah komplemen pada suatu
himpunan fuzzy serta gabungan dan irisan pada himpunan-himpunan fuzzy (Wang,1997).
Operasi komplemen pada suatu himpunan fuzzy𝐴, hasilnya dinyatakan sebagai
himpunan fuzzy 𝐴′ dengan fungsi keanggotaan seperti persamaan (4).
𝜇𝐴′ 𝑥 = 1 − 𝜇𝐴 𝑥 (4)
Operasi gabungan antara dua himpunan fuzzy𝐴 dan himpunan fuzzy𝐵 yang ditulis 𝐴 ∪
𝐵dengan fungsi keanggotaan seperti persamaan (5).
𝜇𝐴∪𝐵 𝑥 = 𝑚𝑎𝑥 𝜇𝐴 𝑥 , 𝜇𝐵 𝑥 (5)
Operasi irisan antara dua himpunan fuzzy𝐴 dan himpunan fuzzy𝐵 yang ditulis 𝐴 ∩
𝐵dengan fungsi keanggotaan seperti persamaan (6).
𝜇𝐴∩𝐵 𝑥 = 𝑚𝑖𝑛 𝜇𝐴 𝑥 , 𝜇𝐵 𝑥 (6)
Fuzzy Model Tahani

Fuzzy Model Tahani dideskripsikan sebagai suatu model yang digunakan untuk
memproses pencarian data, hanya saja model ini didasarkan pada operasi-operasi dalam teori
himpunan fuzzy untuk mendapatkan informasi yang sesuai dengan kriteria pencarian datanya,
sehingga fuzzy Model Tahani sangat tepat digunakan dalam proses pencarian data yang akurat
(Bojadziev, 2007). Dalam pencarian data, fuzzy Model Tahani menggunakan nilai fire strength

sebagai dasar pengambilan keputusan. Nilai fire strength merupakan nilai derajat keanggotaan
hasil dari operasi-operasi himpunan fuzzy, sehingganilai fire strength berada pada interval [0,1].
Sebagai contoh, seseorang ingin memilih kendaraan bermotor roda dua dengan kriteria :
“harga murah dan kapasitas silinder besar, atau panjang-kendaraan pendek dan harga sedang”.
Maka berdasarkan kriteria tersebut dibentuk himpunan fuzzy hasil operasi dari masing-masing
himpunan fuzzy dengan fungsi keanggotaannya seperti dibawah ini :
𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 = 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 ∩ 𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅 ∪ 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾 ∩ 𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺
Dengan fungsi keanggotaan diatas untuk mendapatkan nilai fire strength untuk setiap
kendaraan dapat dicari dengan rumus dibawah ini :
𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 𝑥
= 𝑚𝑎𝑥 𝑚𝑖𝑛 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 𝑥 , 𝜇𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐵𝐸𝑆𝐴𝑅 𝑥 , 𝑚𝑖𝑛 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑃𝐸𝑁𝐷𝐸𝐾 𝑥 , 𝜇𝐻𝑎𝑟𝑔𝑎𝑆𝐸𝐷𝐴𝑁𝐺 𝑥
Kendaraan roda dua yang mempunyai nilai fire strength lebih besar dari 0 merupakan
kendaraan roda dua yang direkomendasikan karena memenuhi kriteria linguistik yang
diinginkan.
Data
Dalam penelitian ini dikaji data 17 kendaraan bermotor roda dua dari berbagai merk dan
tipe yang dinyatakan sebagai kode A, B, C, dst. Variabel- variabel fuzzy yang digunakan sebagai
kriteria adalah harga, kapasitas-silinder, panjang-kendaraan, volume-tangki-bbm dan jarak-
mesin-ke-tanah. Data tersaji pada Tabel 1.
Tabel 1. Spesifikasi Kendaraan Bermotor Roda Dua *
No. Kode Harga Kapasitas Panjang Tangki Bahan Jarak Mesin
(Jutaan Rupiah) Silinder (mm) Bakar (lt) ke Tanah
(cc) (mm)
1 A 13.125 109 1919 3.7 135
2 B 13.150 108 1863 3.7 140
3 C 22.750 150 2008 12 148
4 D 17.300 124 1923 4.1 130
5 E 17.500 134 1960 4 140
6 F 19.850 149 2050 12 152
7 G 24.000 149 2000 12 167
8 H 12.550 113 1850 3.5 135
9 I 18.875 147 1945 4.2 140
10 J 15.250 124 1895 4.1 135
11 K 12.450 113 1910 4 145
12 L 13.715 124 1900 4 155

13 M 11.900 113 1930 4.3 140

14 N 14.650 125 1889 3.7 138
15 O 15.550 125 1918 5.5 128
16 P 17.150 150 2056 12.2 156
17 Q 15.000 113 1880 4.8 152
Keterangan :* Data diambil dari berbagai sumber di internet yang diakses pada 10 September
2013.
Langkah-Langkah Pengolahan Data

Berikut disajikan langkah-langkah pengolahan data kendaraan bermotor roda dua
berdasarkan fuzzy Model Tahani.
1. Penentuan variabel dan himpunan fuzzy serta fungsi keanggotaannya.

Variabel fuzzy yang digunakan sebagai kriteria pemilihan, yaitu harga, kapasitas silinder,
panjang, tangki bahan bakar dan jarak mesin ke tanah. Pada setiap variabel fuzzy ditentukan
3 himpunan fuzzy yang akan digunakan sebagai nilai kriteria linguistiknya. Pada setiap
himpunan fuzzy ditentukan pula fungsi keanggotaannya. Tabel 2. menyajikan daftar variabel
fuzzy, himpunan fuzzy dan fugsi keanggotaan masing-masing himpunan yang digunakan
sebagai dasar pengolahan data.
2. Perhitungan nilai keanggotaan setiap himpunan.
Menggunakan fungsi keanggotaan yang telah ditentukan pada Tabel 2, setiap nilai x yang
merupakan data crisp pada masing-masing variabel fuzzy terkait dipetakan menjadi derajat
keanggotaan (𝜇 𝑥 ). Misalkan motor J dengan variabel fuzzy harga dimana nilai x adalah
Rp15.250.000,- maka derajat keanggotaan pada himpunan fuzzy murah dengan
menggunakan fungsi keanggotaan pada persamaan (1) didapat hasil 0.21.
Tabel 2. Daftar Variabel Fuzzy, Himpunan Fuzzy dan Fungsi Keanggotaannya.

Variabel Himpunan Fungsi Keanggotaan
MURAH Linear Naik
Harga SEDANG Segitiga
MAHAL Linear Turun
KECIL Linear Naik
Kapasitas Silinder SEDANG Segitiga
BESAR Linear Turun
PENDEK Linear Naik
Panjang Kendaraan SEDANG Segitiga
PANJANG Linear Turun

SEDIKIT Linear Naik

Volume Tangki SEDANG Segitiga
BANYAK Linear Turun
PENDEK Linear Naik
Jarak Mesin ke Tanah SEDANG Segitiga
PANJANG Linear Turun
3. Penyusunan kriteria.
Kriteria linguistik sering kali memuat kata penghubung “atau” dan “dan”. Kata “atau”
dikaitkan dengan operasi gabungan pada himpunan fuzzy, “dan” dikaitkan dengan operasi
irisan pada himpunan fuzzy. Data crisp pada setiap kriteria (x) dipetakan sesuai dengan
fungsi keanggotaan pada variabel dan himpunan fuzzynya seperti pada Tabel 2, sehingga
setiap data akan diperoleh derajat keanggotaannya. Kriteria pemilihan disusun berdasarkan
kombinasi operasi-operasi antara himpunan-himpunan fuzzy dan variabelnya, sehingga
banyaknya kriteria yang terbentuk bergantung pada banyaknya variabel fuzzy yang
digunakan dan himpunan fuzzy masing-masing variabelnya. Pada penelitian ini terdapat
sebanyak lima variabel fuzzy dan setiap variabel fuzzy mempunyai tiga himpunan fuzzy
ditambah kemungkinan tidak memilih satupun himpunan fuzzy pada variabel tersebut,
sehingga setiap variabel fuzzy memiliki 4 kemungkinan dipilih. Jadi, banyaknya kombinasi
pilihan dari kelima variabel fuzzy tersebut adalah 45 = 512 kombinasi pilihan.
4. Penentuan nilai fire stregth.
Pada tahap ini kriteria yang dinyatakan dalam variabel dan himpunan fuzzy akan diolah
dengan menggunakan operasi himpunan fuzzy gabungan dan irisan. Dengan rumus seperti
pada persamaan (5) dan (6) atau kombinasi dari keduanya.
5. Penentuan hasil rekomendasi.
Nilai fire strength yang diperoleh pada langkah sebelumnya akan menjadi dasar
pengambilan keputusan rekomendasi. Kendaraan dengan nilai fire strength lebih besar dari 0
(nol) merupakan kendaraan yang direkomendasikan. Apabila terdapat beberapa kendaraan
dengan nilai fire strength lebih besar dari 0 (nol), maka kendaraan dengan fire strength
terbesar merupakan hasil rekomendasi terbaik.

Berdasarkan Tabel 1. dan Tabel 2. serta menerapkan persamaan (1), (2) dan (3)
diperoleh derajat keanggotaan untuk setiap himpunan fuzzy yang tampak pada Tabel 3.
Kriteria pemilihan kendaraan bermotor roda dua ini sangat bervariasi yaitu diantara 512
kombinasi kriteria. Pada penelitian diambil beberapa beberapa contoh kriteria sebagai
penerapannya, yaitu sebagai berikut :

a. Kriteria-1 = Diinginkan kendaraan yang harganya mahal dan kapasitas-silindernya

kecil.
b. Kriteria-2 = Diinginkan kendaraan yang harganya murah dan volume-tangki-bbm
banyak atau panjang-kendaraan sedang dan jarak-mesin-ke-tanah panjang.
Tabel 3. Derajat Keanggotaan Setiap Kendaraan menurut Variabel dan Himpunan Fuzzynya.
Harga (Rp) Kapasitas Silinder (cc) Panjang Kendaraan (mm) Volume Tangki Bahan Bakar (lt) Jarak Mesin ke Tanah (mm)
Kode
Murah Sedang Mahal Kecil Sedang Besar Pendek Sedang Panjang Sedikit Sedang Banyak Pendek Sedang Panjang
A 0.71 0.29 0.00 0.95 0.05 0.00 0.19 0.81 0.00 0.92 0.08 0.00 0.54 0.46 0.00
B 0.71 0.29 0.00 1.00 0.00 0.00 0.85 0.15 0.00 0.92 0.08 0.00 0.22 0.78 0.00
C 0.00 0.16 0.84 0.00 0.00 1.00 0.00 0.40 0.60 0.00 0.03 0.97 0.00 0.80 0.20
D 0.00 0.85 0.15 0.19 0.81 0.00 0.14 0.86 0.00 0.76 0.24 0.00 0.87 0.13 0.00
E 0.00 0.83 0.17 0.00 0.72 0.28 0.00 0.79 0.21 0.80 0.20 0.00 0.22 0.78 0.00
F 0.00 0.53 0.47 0.00 0.04 0.96 0.00 0.05 0.95 0.00 0.03 0.97 0.00 0.63 0.37
G 0.00 0.00 1.00 0.00 0.04 0.96 0.00 0.46 0.54 0.00 0.03 0.97 0.00 0.00 1.00
H 0.85 0.15 0.00 0.75 0.25 0.00 1.00 0.00 0.00 1.00 0.00 0.00 0.54 0.46 0.00
I 0.00 0.65 0.35 0.00 0.13 0.87 0.00 0.92 0.08 0.72 0.28 0.00 0.22 0.78 0.00
J 0.21 0.79 0.00 0.19 0.81 0.00 0.47 0.53 0.00 0.76 0.24 0.00 0.54 0.46 0.00
K 0.87 0.13 0.00 0.75 0.25 0.00 0.29 0.71 0.00 0.80 0.20 0.00 0.00 0.93 0.07
L 0.57 0.43 0.00 0.19 0.81 0.00 0.41 0.59 0.00 0.80 0.20 0.00 0.00 0.51 0.49
M 1.00 0.00 0.00 0.75 0.25 0.00 0.06 0.94 0.00 0.68 0.32 0.00 0.22 0.78 0.00
N 0.35 0.65 0.00 0.13 0.87 0.00 0.54 0.46 0.00 0.92 0.08 0.00 0.35 0.65 0.00
O 0.14 0.86 0.00 0.13 0.87 0.00 0.20 0.80 0.00 0.20 0.80 0.00 1.00 0.00 0.00
P 0.00 0.87 0.13 0.00 0.00 1.00 0.00 0.00 1.00 0.00 0.00 1.00 0.00 0.46 0.54
Q 0.27 0.73 0.00 0.75 0.25 0.00 0.65 0.35 0.00 0.48 0.52 0.00 0.00 0.63 0.37
Berdasarkan Kriteria-1 dan Kriteria-2 dibentuk fungsi keanggotaan dari kombinasi

operasi himpunan fuzzy yang sesuai, yaitu :
a. 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 1 𝑥 = 𝑚𝑖𝑛 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝐴𝐻𝐴𝐿 𝑥 , 𝜇𝑆𝑖𝑙𝑖𝑛𝑑𝑒𝑟𝐾𝐸𝐶𝐼𝐿 𝑥

b. 𝜇𝐾𝑟𝑖𝑡𝑒𝑟𝑖𝑎 2 𝑥 =
𝑚𝑎𝑥 min 𝜇𝐻𝑎𝑟𝑔𝑎𝑀𝑈𝑅𝐴𝐻 𝑥 , 𝜇𝑇𝑎𝑛𝑔𝑘𝑖𝐵𝐴𝑁𝑌𝐴𝐾 𝑥 , min 𝜇𝑃𝑎𝑛𝑗𝑎𝑛𝑔𝑆𝐸𝐷𝐴𝑁𝐺 𝑥 , 𝜇𝐽𝑎𝑟𝑎𝑘𝑃𝐴𝑁𝐽𝐴𝑁𝐺 𝑥
Nilai fire strength untuk Kriteria-1 disajikan pada Tabel 4, hanya terdapat satu nilai fire
strength yang lebih besar dari 0 (nol), yaitu bernilai 0.15 yang merupakan kode kendaraan D.
Jadi kendaraan yang direkomendasikan sesuai dengan Kriteria-1 adalah kendaran D.
Tabel 4. Nilai Fire strength untuk Kriteria-1.

Derajat Keanggotaan Nilai Fire Strength
Kode HargaMAHAL ∩
HargaMAHAL SilinderKECIL
SilinderKECIL
D 0.15 0.19 0.15
A 0.00 0.95 0.00
B 0.00 1.00 0.00
C 0.84 0.00 0.00
E 0.17 0.00 0.00
F 0.47 0.00 0.00
G 1.00 0.00 0.00

H 0.00 0.75 0.00

I 0.35 0.00 0.00
J 0.00 0.19 0.00
K 0.00 0.75 0.00
L 0.00 0.19 0.00
M 0.00 0.75 0.00
N 0.00 0.13 0.00
O 0.00 0.13 0.00
P 0.13 0.00 0.00
Q 0.00 0.75 0.00
Tabel 5. Nilai fire strength untuk Kriteria-2.

Nilai Keanggotaan Nilai Fire Strength
(a1 ∩
a1 b1
Kode HargaMURAH TangkiBANYAK PanjangSEDANG JarakPANJANG a2) ∩
∩ ∩
(a1) (a2) (b1) (b2) (b1 ∩
a2 b2
b2)
L 0.57 0.00 0.59 0.49 0.00 0.49 0.49
G 0.00 0.97 0.46 1.00 0.00 0.46 0.46
Q 0.27 0.00 0.35 0.37 0.00 0.35 0.35
C 0.00 0.97 0.40 0.20 0.00 0.20 0.20
K 0.87 0.00 0.71 0.07 0.00 0.07 0.07
F 0.00 0.97 0.05 0.37 0.00 0.05 0.05
A 0.71 0.00 0.81 0.00 0.00 0.00 0.00
B 0.71 0.00 0.15 0.00 0.00 0.00 0.00
D 0.00 0.00 0.86 0.00 0.00 0.00 0.00
E 0.00 0.00 0.79 0.00 0.00 0.00 0.00
H 0.85 0.00 0.00 0.00 0.00 0.00 0.00
I 0.00 0.00 0.92 0.00 0.00 0.00 0.00
J 0.21 0.00 0.53 0.00 0.00 0.00 0.00
M 1.00 0.00 0.94 0.00 0.00 0.00 0.00
N 0.35 0.00 0.46 0.00 0.00 0.00 0.00
O 0.14 0.00 0.80 0.00 0.00 0.00 0.00
P 0.00 1.00 0.00 0.54 0.00 0.00 0.00
Hasil nilai fire strength untuk Kriteria-2 dapat dilihat pada Tabel 5. Kombinasi kriteria
harga murah dan volume-tangki-bbm banyak memberikan hasil semua nilai fire strength sama
dengan 0 (nol), seperti terlihat pada kolom-6 Tabel 5. Hal ini berarti tidak ada kendaraan yang
direkomendasikan untuk kriteria tersebut. Sedangkan untuk Kriteria-2, terdapat enam nilai fire
strength yang lebih besar dari 0 (nol), yaitu bernilai : 0.05, 0.07, 0.20, 0.35, 0.46, 0.49 pada
kode kendaraan : F, K, C, Q, G, L , ini berarti 6 kendaraan tersebut memenuhi Kriteria-2 .

Kendaraan dengan fire strength terbesar, yaitu 0.49 untuk kode kendaraan L merupakan
kendaraan yang mendapat rekomendasi terbaik untuk Kriteria-2.
SIMPULAN DAN SARAN

Dari pembahasan diatas dapat diambil simpulan bahwa penerapan fuzzy model Tahani
untuk kendaraan bermotor roda dua terdapat tiga kemungkinan hasil rekomendasi, yaitu tidak
ada hasil rekomendasi, terdapat satu hasil rekomendasi atau terdapat lebih dari satu rekomendasi
kendaraan bermotor yang dipilih. Apabila terdapat lebih dari satu hasil rekomendasi, maka
kendaraan bermotor roda dua yang mempunyai nilai fire strength tertinggi merupakan
rekomendasi terbaik.
Kemungkinan kriteria pemilihan kendaraan bermotor roda dua dapat berkembang
sesuai dengan variabel dan himpunan fuzzy yang dirumuskan, serta banyaknya jenis dan tipe
kendaraannya, maka perlu adanya pengembangan pada pengelolaan dan pengolahan datanya
dengan memanfaatkan basisdata dan aplikasi yang berbasis pada basisdata, agar proses
pengolahan datanya dapat lebih cepat dan efisien.
DAFTAR PUSTAKA
Amalia, L. 2010. Model Fuzzy Tahani Untuk Pemodelan Sistem Pendukung Keputusan (SPK).
Seminar Nasional Aplikasi Teknologi Informasi 2010, Yogyakarta.
Eliyani. 2009. Decision Support System Untuk Pembelian Mobil Menggunakan Fuzzy Database
Model Tahani. Seminar Nasional Aplikasi Teknologi Informasi 2009., Yogyakarta.
Bojadziev, M & Bojadziev, G. 2007. Fuzzy Logic for Business, Finance, and Management 2nd
Edition.,World Scientific. Singapore.
Kusumadewi, S & Purnomo, H. 2004. Aplikasi Logika Fuzzy Untuk Pendukung
Keputusan.,Graha Ilmu. Yogyakarta.
Susilo, F. 2003. Penghantar Himpunan & Logika Kabur Serta Aplikasinya. Universitas Sanata
Dharma. Yogyakarta.
Wang, L-X. 1997. A Course in Fuzzy System and Control., Prentice Hall Internasional.
Amerika.
http://www.suzuki.co.id/suzuki_motorcycle.htm. Diakses tanggal 10 September 2013.

Prosiding Uns 2013 PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Prosiding Uns 2013 PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Prosiding SNMPM Universitas Sebelas Maret 2013 Volume 2

ANOVA UNTUK ANALISIS RATA-RATA RESPON MAHASISWA KELAS

Kata Kunci:One-way repeated measures, two-way repeated measures

Makalah Pendamping: Matematika 3 233

234 Makalah Pendamping: Matematika 3

Makalah Pendamping: Matematika 3 235

dengan 𝑝 : banyaknya variabel; 𝑔 : banyaknya grup; 𝑛 : banyaknya partisipan.

dimana 𝑣1 = 𝑝𝑞1 dan 𝑣2 = 𝑛 − 𝑝 − 1 𝑚𝑖𝑛 𝑝, 𝑞1 , dengan p : akar-akar karakteristik dari matriks

 Roy’s Largest Root

236 Makalah Pendamping: Matematika 3

Makalah Pendamping: Matematika 3 237

c. Pengukuran Pengaruh atau Dampak

238 Makalah Pendamping: Matematika 3

HASIL PENELITIAN DAN PEMBAHASAN

Makalah Pendamping: Matematika 3 239

𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = 0.4290 + 0.0001 = 0.4291; 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.4290.

240 Makalah Pendamping: Matematika 3

Kemudian mengukur pengaruh rata-rata respon mahasiswa tersebut menggunakan

Makalah Pendamping: Matematika 3 241

Tabel 3b menunjukkan semua pairwise comparisons (dengan interval konfidensi

Selanjutnya diuji variabel Rata-rata respon mahasiswa.Padates MauchlydariSphericity

Tabel 4d. Rata-rata respon mahasiswa

242 Makalah Pendamping: Matematika 3

𝐻𝑜𝑡𝑒𝑙𝑙𝑖𝑛𝑔 = −0.0003 + 0.3784 = 0.3781; 𝑅𝑜𝑦 ′ 𝑠 𝐿𝑎𝑟𝑔𝑒𝑠𝑡 𝑅𝑜𝑜𝑡 = 0.3784.

Makalah Pendamping: Matematika 3 243

Gambar 1. Grafik rata-rata respon mahasiswa pada Kelas A dan Kelas B

Gambar 1 menunjukkan bahwa rata-rata respon mahasiswa yang diberikan pada 3

244 Makalah Pendamping: Matematika 3

Makalah Pendamping: Matematika 3 245

246 Makalah Pendamping: Matematika 3

ANALISIS BIPLOT PADA PEMETAAN KARAKTERISTIK KEMISKINAN

Desy Komalasari 1), Mustika Hadijati 2), Marwan 3)

Kata kunci: Analisis Biplot, Singular Value Decomposition, Karakteristik Kemiskinan.

Makalah Pendamping: Matematika 3 247

Waktu dan Tempat Penelitian

248 Makalah Pendamping: Matematika 3

Teknik Analisis Data

Makalah Pendamping: Matematika 3 249

Persamaan di atas dapat dibentuk sebagai berikut :

𝒎𝒚𝒊𝒋 = 𝒖𝒊𝒌 𝝀𝜶𝒌 𝟐 𝝀𝟏−𝜶

250 Makalah Pendamping: Matematika 3

Makalah Pendamping: Matematika 3 251

HASIL DAN PEMBAHASAN

Penduduk Miskin (X1) 10 11.69 39.27 19.9220 7.46983 55.798

AMH (X2) 10 72.57 91.63 84.3240 6.12581 37.526

APS (X3) 10 92.58 100.00 96.3380 2.54088 6.456

Tidak Bekerja (X4) 10 31.22 47.67 37.2530 5.46294 29.844

Bekerja Informal (X5) 10 36.38 68.34 54.7690 9.49724 90.197

Bekerja Formal (X6) 10 .45 15.95 7.9810 4.85856 23.606

Bekerja Sektor Pertanian (X7) 10 1.78 55.85 39.6360 16.41475 269.444

Bekerja Bukan Pertanian (X8) 10 12.40 50.54 23.1140 11.71297 137.194

Pengeluaran Makanan (X9) 10 59.69 73.21 67.2390 4.13745 17.118

Luas Lantai (X10) 10 41.12 79.19 59.3520 12.71368 161.638

Pada tabel 1 terlihat Gambaran karakteristik kemiskinan di provinsi NTB, rata-rata

Hasil Analisis Biplot

252 Makalah Pendamping: Matematika 3

Gambar 1. Pemetaan Biplot data karakteristik kemiskinan di provinsi NTB

b. Interpretasi Informasi Biplot

Makalah Pendamping: Matematika 3 253

c. Kedekatan Antar Objek (Kabupaten/kota)

d. Interpretasi Nilai Variabel Pada Suatu Objek

254 Makalah Pendamping: Matematika 3

e. Keragaman Variabel (Karakteristik Kemiskinan)